Родственные заявки и включение при помощи ссылки

Данная заявка заявляет приоритет предварительных заявок на патент США 61/736527, 61/748427, 61/768959, 61/791409 и 61/835931 с общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, BI-2011/008/WSGR, номер в реестре 44063-701.102, общей ссылкой BI-2011/008/VP, номер в реестре 44790.01.2003, BI-2011/008/VP, номер в реестре 44790.02.2003, и BI-2011/008/VP, номер в реестре 44790.03.2003, соответственно, все из которых озаглавлены "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданных 12 декабря 2012 г., 2 января 2013 г., 25 февраля 2013 г., 15 марта 2013 г. и 17 июня 2013 г., соответственно.

Делается ссылка на предварительные заявки на патент США 61/758468; 61/769046; 61/802174; 61/806375; 61/814263; 61/819803 и 61/828130, каждая из которых озаглавлена "КОНСТРУИРОВАНИЕ И ОПТИМИЗАЦИЯ СИСТЕМ, СПОСОБОВ И КОМПОЗИЦИЙ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 30 января 2013 г.; 25 февраля 2013 г.; 15 марта 2013 г.; 28 марта 2013 г.; 20 апреля 2013 г.; 6 мая 2013 г. и 28 мая 2013 г., соответственно. Также делается ссылка на предварительные заявки на патенты США 61/835936, 61/836127, 61/836101, 61/836080, 61/836123 и 61/835973, каждая из которых подана 17 июня 2013 г. Также делается ссылка на предварительную заявку на патент США 61/842322 и заявку на патент США 14/054414, каждая с общей ссылкой BI-2011/008A, озаглавленные "СИСТЕМЫ CRISPR-CAS И СПОСОБЫ ДЛЯ ИЗМЕНЕНИЯ ЭКСПРЕССИИ ПРОДУКТОВ ГЕНА" (CRISPR-CAS SYSTEMS AND METHODS FOR ALTERING EXPRESSION OF GENE PRODUCTS), поданные 2 июля 2013 г. и 15 октября 2013 г., соответственно.

Вышеупомянутые заявки и все документы, упомянутые в них или во время их делопроизводства (“упомянутые в заявке документы”), и все документы, упомянутые или на которые ссылаются в упомянутых в заявке документах, и все документы, упомянутые или на которые ссылаются в данном документе (“документы, упомянутые в данном документе”), и все документы, упомянутые или на которые ссылаются в документах, упомянутых в данном документе, наравне с любыми инструкциями производителя, описаниями, характеристиками продуктов и описаниями продуктов для любых продуктов, упомянутых в данном документе или в любом документе, включенном при помощи ссылки в данный документ, таким образом, включены в данный документ при помощи ссылки и могут быть использованы при осуществлении на практике настоящего изобретения. Более конкретно, все документы, на которые ссылаются, включены при помощи ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен при помощи ссылки.

Область техники

Настоящее изобретение в целом относится к системам, способам и композициям, применяемым для контроля экспрессии генов, включающего целенаправленное воздействие на последовательность, такое как внесение изменений в геном или редактирование гена, при котором можно использовать векторные системы, близкие к коротким палиндромным повторам, регулярно расположенным группами (CRISPR), и их компонентам.

Утверждение касательно финансируемого из федерального бюджета исследования

Настоящее изобретение было разработано при правительственной поддержке согласно NIH Pioneer Award DP1MH100706, выданному национальными институтами здравоохранения. Правительство обладает определенными правами на настоящее изобретение.

Предпосылки изобретения

Недавние достижения в технологиях секвенирования генома и способах анализа значительно ускорили возможность каталогизирования и картирования генетических факторов, ассоциированных с широким спектром биологических функций и заболеваний. Точные технологии целенаправленного воздействия на геном необходимы для обеспечения систематичного обратного конструирования казуальных генетических изменений путем обеспечения возможности селективного внесения изменений в отдельные генетические элементы, а также для продвижения применений в области синтетической биологии, биотехнологии и медицины. Несмотря на то, что технологии редактирования генома, такие как конструктор доменов "цинковые пальцы", подобные транскрипционным активаторам эффекторы (TALE) или хоминг мегануклеазы, доступны для осуществления внесений изменений в целевой геном, все еще существует необходимость в новых технологиях конструирования генома, которые являются доступными, простыми в осуществлении, масштабируемыми и поддающимися целенаправленному воздействию на несколько положений в эукариотическом геноме.

Краткое описание изобретения

Существует острая необходимость в альтернативных и функциональных системах и технологиях для целенаправленного воздействия на последовательности с широким спектром применений. Настоящее изобретение удовлетворяет этой необходимости и предусматривает связанные с этим преимущества. CRISPR/Cas или система CRISPR-Cas (оба выражения используют взаимозаменяемо по всей данной заявке) не предусматривает получение индивидуализированных белков для целенаправленного воздействия на конкретные последовательности, но скорее один фермент Cas может быть запрограммирован короткой молекулой РНК для узнавания специфичной ДНК-мишени, другими словами, фермент Cas может связываться со специфичной ДНК-мишенью при помощи указанной короткой молекулы РНК. Добавление системы CRISPR-Cas к спектру технологий секвенирования генома и способам анализа может значительно упростить методику и ускорить возможность каталогизирования и картирования генетических факторов, ассоциированных с широким спектром биологических функций и заболеваний. Для того, чтобы эффективно использовать систему CRISPR-Cas для редактирования генома без вредного действия, важно понимать аспекты конструирования и оптимизации этих средств для конструирования генома, которые являются аспектами заявленного изобретения.

В одном аспекте настоящее изобретение предусматривает векторную систему, содержащую один или несколько векторов. В некоторых вариантах осуществления система содержит (a) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации; где компоненты (a) и (b) находятся в одном и том же или в различных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления система содержит tracr-последовательность под контролем третьего регуляторного элемента, такого как промотор полимеразы III. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. Определение оптимального выравнивания находится в компетенции специалиста в данной области. Например, существуют публично и коммерчески доступные алгоритмы и программы выравнивания, такие как, без ограничения, ClustalW, Smith-Waterman в matlab, Bowtie, Geneious, Biopython и SeqMan. В некоторых вариантах осуществления комплекс CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного комплекса CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. Не желая быть связанными теорией, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR у эукариот, но что включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновых кислот в ядре. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину. В целом и по всему данному описанию выражение “вектор” относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают, без ограничения, молекулы нуклеиновых кислот, которые являются одноцепочечными, двухцепочечными или частично двухцепочечными; молекулы нуклеиновых кислот, которые содержат один или несколько свободных концов, не содержат свободных концов (к примеру, кольцевые); молекулы нуклеиновых кислот, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известных в уровне техники. Одним типом вектора является “плазмида”, которая означает кольцевую петлю двухцепочечной ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, при помощи стандартных технологий молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (к примеру, ретровирусы, ретровирусы с дефективной системой репликации, аденовирусы, аденовирусы с дефективной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусами для трансфекции клетки-хозяина. Определенные векторы способны к саморегулируемой репликации в клетке-хозяине, в которую они введены (к примеру, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы млекопитающих). Другие векторы (к примеру, неэписомные векторы млекопитающих) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются наряду с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе называют “векторами экспрессии”. Общепринятые пригодные в технологиях рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту согласно настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается использовать для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии выражение “функционально связанный” предназначено означать, что представляющая интерес нуклеотидная последовательность связана с регуляторным(и) элементом(ами) таким образом, при котором обеспечивается возможность экспрессии нуклеотидной последовательности (к примеру, в in vitro системе транскрипции/трансляции или в клетке-хозяине, когда вектор вводят в клетку-хозяина).

Выражение “регуляторный элемент” предназначено включать промоторы, энхансеры, внутренние сайты связывания рибосомы (IRES) и другие контролирующие экспрессию элементы (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (к примеру, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который может быть или может не быть также тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают, без ограничения, промоторы U6 и H1. Примеры промоторов pol II включают, без ограничения, ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al., Cell, 41:521-530 (1985)], промотор SV40, промотор дигидрофолатредуктазы, промотор β-актина, промотор глицерофосфаткиназы (PGK) и промотор EF1α. Также выражением “регуляторный элемент” охвачены энхансерные элементы, такие как WPRE; энхансеры CMV; сегмент R-U5’ в LTR HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; и интронная последовательность между экзонами 2 и 3 β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области будет понятно, что структура вектора экспрессии может зависеть от таких факторов, как выбор клетки хозяина, подлежащей трансформации, желательный уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (к примеру, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).

Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для целенаправленного воздействия на определенные типы клеток.

В одном аспекте настоящее изобретение предусматривает вектор, содержащий регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации. В некоторых вариантах осуществления указанный регуляторный элемент управляет транскрипцией фермента CRISPR в эукариотической клетке, так что указанный фермент CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК.

В одном аспекте настоящее изобретение предусматривает фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления у фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.

В одном аспекте настоящее изобретение предусматривает эукариотическую клетку-хозяина, содержащую (a) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрируются в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления эукариотическая клетка-хозяин дополнительно содержит третий регуляторный элемент, такой как промотор полимеразы III, функционально связанный с указанной tracr-последовательностью. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину. В одном аспекте настоящее изобретение предусматривает отличный от человека эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина согласно любому из описанных вариантов осуществления. В других аспектах настоящее изобретение предусматривает эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина согласно любому из описанных вариантов осуществления. Организм в некоторых вариантах осуществления данных аспектов может быть животным, например, млекопитающим. Также организмом может быть членистоногое, как, например, насекомое. Организмом также может быть растение. Кроме того, организмом может быть гриб.

В одном аспекте настоящее изобретение предусматривает набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или в различных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления система дополнительно содержит третий регуляторный элемент, такой как промотор полимеразы III, функционально связанный с указанной tracr-последовательностью. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину.

В одном аспекте настоящее изобретение предусматривает способ модификации целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида. В некоторых вариантах осуществления указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности. В некоторых вариантах осуществления указанные векторы доставляют в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанная модификация имеет место в указанной эукариотической клетке в клеточной культуре. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из субъекта перед указанной модификацией. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, полученных из субъекта, указанному субъекту.

В одном аспекте настоящее изобретение предусматривает способ модификации экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности.

В одном аспекте настоящее изобретение предусматривает способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, таким образом, получая модельную эукариотическую клетку, содержащую мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида. В некоторых вариантах осуществления указанная мутация приводит к одной или нескольким аминокислотным заменам при экспрессии белка с гена, содержащего целевую последовательность.

В одном аспекте настоящее изобретение предусматривает способ получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестового соединения в контакт с модельной клеткой по любому одному из описанных вариантов осуществления и (b) обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением, таким образом, указанного биологически активного средства, которое модулирует указанный процесс передачи сигнала в клетке, ассоциированный с указанным геном, ответственным за развитие заболевания.

В одном аспекте настоящее изобретение предусматривает рекомбинантный полинуклеотид, содержащий направляющую последовательность выше парной tracr-последовательности, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность является вирусной последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность является протоонкогеном или онкогеном.

В одном аспекте настоящее изобретение предусматривает способ отбора одной или нескольких прокариотических клеток путем введения одной или нескольких мутаций в ген в одной или нескольких прокариотических клетках, при этом способ включает введение одного или нескольких векторов в прокариотическую(ие) клетку(и), где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, tracr-последовательности и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые прекращают расщепление фермента CRISPR; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в отбираемой(ых) клетке(ах); обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, где связывание комплекса CRISPR с целевым полинуклеотидом индуцирует гибель клеток, с обеспечением тем самым отбора одной или нескольких прокариотических клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления фермент CRISPR представляет собой Cas9. В другом аспекте настоящего изобретения отбираемая клетка может быть эукариотической клеткой. Аспекты настоящего изобретения обеспечивают возможность отбора конкретных клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.

Соответственно, целью настоящего изобретения не является охват в пределах настоящего изобретения любого ранее известного продукта, способа получения продукта или способа применения продукта, так что заявители оставляют за собой право и настоящим раскрывают отказ от прав на любой ранее известный продукт, процесс или способ. Следует дополнительно отметить, что настоящее изобретение не предназначено охватывать в пределах объема настоящего изобретения любой продукт, способ получения продукта или способ применения продукта, который не соответствует письменному описанию и требованиям достаточного раскрытия сути изобретения USPTO (первый пункт § 112 статьи 35 USC) или EPO (статья 83 EPC), так что заявители оставляют за собой право и настоящим раскрывают отказ от прав на любой ранее описанный продукт, способ получения продукта или способ применения продукта.

Следует отметить, что в данном раскрытии и особенно в формуле изобретения и/или параграфах такие выражения, как "содержит", "содержащийся", "содержащий" и т.п., могут иметь значение, приписываемое им в патентном законодательстве США, например, они могут означать "включает", "включенный", "включающий" и т.п., и что такие выражения, как "состоящий, по сути, из" и "состоит, по сути, из" имеют значение, приписываемое им в патентном законодательстве США, например, они допускают не указанные прямо элементы, но исключают элементы, которые имеются в известном уровне техники или которые влияют на основные или новые характеристики настоящего изобретения. Эти и другие варианты осуществления раскрыты или являются очевидными, исходя из следующего подробного описания, и охвачены им.

Краткое описание графических материалов

Новые признаки настоящего изобретения изложены с характерными особенностями в прилагаемой формуле изобретения. Лучшее понимание признаков и преимуществ настоящего изобретения будет доступно благодаря ссылке на следующее подробное описание, в котором изложены показательные варианты осуществления, в которых используют принципы настоящего изобретения, и на сопутствующие графические материалы.

На фигуре 1 показана схематическая модель системы CRISPR. Нуклеаза Cas9 из Streptococcus pyogenes (желтый) нацелена на геномную ДНК при помощи синтетической направляющей РНК (sgRNA), состоящей из 20-нуклеотидной направляющей последовательности (голубой) и каркаса (красный). Направляющая последовательность образует пары оснований с ДНК-мишенью (голубой) непосредственно выше необходимого мотива, смежного с протоспейсером (PAM; пурпурный) 5’-NGG, и Cas9 опосредует двухцепочечный разрыв (DSB) на ~3 п.о. выше PAM (красный треугольник).

На фигурах 2A-F изображена показательная система CRISPR, возможный механизм действия, иллюстративная адаптация для экспрессии в эукариотических клетках и результаты тестов, оценивающих ядерную локализацию и активность CRISPR.

На фигуре 3 изображена показательная кассета экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках, предсказанные структуры иллюстративных направляющих последовательностей и активность системы CRISPR, которая измерена в эукариотических и прокариотических клетках.

На фигурах 4A-D показаны результаты оценивания специфичности SpCas9 в отношении иллюстративной мишени.

На фигурах 5A-G изображена показательная векторная система и результаты ее применения при управлении гомологичной рекомбинацией в эукариотических клетках.

На фигуре 6 представлена таблица последовательностей протоспейсеров и обобщены результаты касательно эффективности модификаций для протоспейсеров-мишеней, разработанных на основе иллюстративных систем CRISPR S. pyogenes и S. thermophilus с соответствующими PAM к локусам в геномах человека и мыши. Клетки трансфицировали Cas9 и либо pre-crRNA/tracrRNA, либо химерной РНК и анализировали через 72 часа после трансфекции. Процент вставок/делеций рассчитывали на основе результатов анализа с помощью Surveyor с указанными линиями клеток (N=3 для всех протоспейсеров-мишеней, ошибки представляют собой стандартные ошибки среднего, N.D. означает "не обнаружено при помощи анализа с помощью Surveyor", и N.T. означает "не тестировали в данном исследовании").

На фигурах 7A-C показано сравнение различных транскриптов tracrRNA для опосредованного Cas9 целенаправленного воздействия на ген.

На фигуре 8 показано схематическое изображение анализа с помощью нуклеазы Surveyor для обнаружения индуцированных двухцепочечным разрывом микровставок и микроделеций.

На фигурах 9A-B изображены показательные бицистронные векторы экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках.

На фигуре 10 показан анализ интерференции при трансформации бактериальной плазмидой, кассеты экспрессии и плазмиды, используемые в нем, и показатели эффективности трансформации клеток, используемых в нем.

На фигурах 11A-C показаны гистогораммы расстояний между смежными PAM (NGG) локуса 1 S. pyogenes SF370 (фигура 10A) и PAM (NNAGAAW) локуса 2 LMD9 S. thermophilus (фигура 10B) в геноме человека и расстояние для каждого PAM в хромосомах (Chr) (фигура 10C).

На фигурах 12A-C изображена показательная система CRISPR, иллюстративная адаптация для экспрессии в эукариотических клетках и результаты тестов, оценивающих активность CRISPR.

На фигурах 13A-C показаны иллюстративные манипуляции с системой CRISPR для целенаправленного воздействия на локусы генома в клетках млекопитающего.

На фигурах 14A-B показаны результаты анализа нозерн блоттинга процессинга crRNA в клетках млекопитающего.

На фигуре 15 изображен показательный отбор протоспейсеров в локусах PVALB человека и Th мыши.

На фигуре 16 показан иллюстративный протоспейсер и соответствующие представляющие собой мишени последовательности PAM системы CRISPR S. thermophilus в локусе EMX1 человека.

На фигуре 17 представлена таблица последовательностей для праймеров и зондов, используемых для Surveyor, RFLP, геномного секвенирования и анализов нозерн блоттинга.

На фигурах 18A-C показана иллюстративная манипуляция с системой CRISPR с химерными РНК и результаты анализов с помощью SURVEYOR в отношении активности системы в эукариотических клетках.

На фигурах 19A-B представлено графическое изображение результатов анализов с помощью SURVEYOR в отношении активности системы CRISPR в эукариотических клетках.

На фигуре 20 представлено показательное отображение некоторых целевых сайтов Cas9 S. pyogenes в геноме человека, полученное с использованием геномного браузера UCSC.

На фигуре 21 показаны предсказанные вторичные структуры для показательных химерных РНК, содержащих направляющую последовательность, парную tracr-последовательность и tracr-последовательность.

На фигуре 22 показаны иллюстративные бицистронные векторы экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках.

На фигуре 23 показано, что активность нуклеазы Cas9 по отношению к эндогенным мишеням можно использовать для редактирования генома. (a) Концепция редактирования генома при помощи системы CRISPR. Конструкция CRISPR целенаправленного воздействия управляла расщеплением хромосомного локуса и была котрансформирована матрицей редактирования, которая рекомбинировала с мишенью для предотвращения расщепления. Устойчивые к канамицину трансформанты, которые выдерживали воздействие CRISPR, содержали модификации, введенные с помощью матрицы редактирования. tracr, трансактивирующую РНК CRISPR; aphA-3, ген устойчивости к кантамицину. (b) Трансформация ДНК crR6M в клетках R6^8232.5 без матрицы редактирования, srtA R6 дикого типа или матрицами редактирования R6370.1. Рекомбинация srtA либо R6, либо R6^370.1предотвращала расщепление с помощью Cas9. Эффективность трансформации подсчитывали как колониеобразующие единицы (cfu) на мкг ДНК crR6M; показаны средние значения со среднеквадратическими отклонениями от по меньшей мере трех независимых экспериментов. ПЦР анализ выполняли на 8 клонах при каждой трансформации. “Un.” означает нередактированный локус srtA штамма R6^8232.5; “Ed.” показывает матрицу редактирования. Мишени R6^8232.5и R6^370.1различаются по рестрикции EaeI.

На фигуре 24 показан анализ PAM и затравочных последовательностей, которые исключают расщепление Cas9. (a) ПЦР-продуктами с рандомизированными последовательностями PAM или рандомизированными затравочными последовательностями трансформировали клетки crR6. Эти клетки экспрессировали Cas9, загруженную crRNA, которая была нацелена на хромосомный участок клеток R6^8232.5 (выделен розовым), отсутствующий в геноме R6. Более, чем 2×105 устойчивых к хлорамфениколу трансформантов, несущих неактивные PAM или затравочные последовательности, объединяли для амплификации и глубокого секвенирования целевого участка. (b) Относительная доля количества считываемых фрагментов после трансформации случайными конструкциями PAM клеток crR6 (по сравнению с количеством считываемых фрагментов в трансформантах R6). Показана относительная распространенность каждой 3-нуклеотидной последовательности PAM. Крайне недостаточно представленные последовательности (NGG) показаны красным; частично недостаточно представленные оранжевым (NAG). (c) Относительная доля количества считываемых фрагментов после трансформации конструкциями случайных затравочных последовательностей клеток crR6 (по сравнению с количеством считываемых фрагментов в трансформантах R6). Показана относительная распространенность каждого нуклеотида по каждому положению первых 20 нуклеотидов последовательности протоспейсера. Высокая распространенность указывает на отсутствие расщепления Cas9, т.e. CRISPR-инактивирующую мутацию. Серая линия показывает уровень последовательности WT. Пунктирная линия представляет уровень, выше которого мутация значительно нарушает расщепление (см. раздел “анализ данных глубокого секвенирования” в примере 5)

На фигуре 25 показано введение одиночной и множественных мутаций с применением системы CRISPR в S. pneumoniae. (a) Нуклеотидные и аминокислотные последовательности bgaA дикого типа и редактированного bgaA (зеленые нуклеотиды; подчеркнутые аминокислотные остатки). Показаны протоспейсер, PAM и сайты рестрикции. (b) Эффективность трансформации клеток, трансформированных конструкциями для целенаправленного воздействия, в присутствии матрицы редактирования или контроля. (c) ПЦР анализ 8 трансформантов каждого эксперимента редактирования с последующим расщеплением BtgZI (R→A) и TseI (NE→AA). Делеция bgaA была выявлена как ПЦР-продукт меньшего размера. (d) Анализ Миллера для измерения активности β-галактозидазы штаммов WT и редактированных. (e) Для одностадийной, двойной делеции конструкция для целенаправленного воздействия содержала два спейсера (в этом случае совпадающие srtA и bgaA), и ее котрансформировали двумя различными матрицами редактирования. (f) ПЦР анализ 8 трансформантов для выявления делеций в локусах srtA и bgaA. 6/8 трансформантов содержали делеции обоих генов.

На фигуре 26 представлены механизмы, лежащие в основе редактирования с применением системы CRISPR. (a) Стоп-кодон вводили в ген устойчивости к эритромицину ermAM для создания штамма JEN53. Последовательность дикого типа можно восстанавливать путем целенаправленного воздействия на стоп-кодон конструкцией CRISPR::ermAM(stop) и с использованием последовательности ermAM дикого типа в качестве матрицы редактирования. (b) Последовательности ermAM мутантные и дикого типа. (c) Фракция эритромицин-устойчивых (erm^R) КОЕ, вычисленная по общим или устойчивым к канамицину (kan^R) КОЕ. (d) Фракция общего количества клеток, получивших и конструкцию CRISPR, и матрицу редактирования. Котрансформация конструкцией CRISPR для целенаправленного воздействия обеспечивала больше трансформантов (t-тест, p=0,011). Во всех случаях значения показывают среднее ± среднеквадратическое отклонение для трех независимых экспериментов.

На фигуре 27 проиллюстрировано редактирование генома системой CRISPR в E. coli. (a) Плазмидой устойчивости к канамицину, несущей массив CRISPR (pCRISPR), целенаправленно воздействующий на ген с целью редактирования, можно трансформировать сконструированный штамм HME63, содержащий плазмиду устойчивости к хлорамфениколу, несущую cas9 и tracr (pCas9), совместно с олигонуклеотидом, определяющим мутацию. (b) Мутацию K42T, обеспечивающую устойчивость к стрептомицину, вводили в ген rpsL. (c) Фракцию устойчивых к стрептомицину (strep^R) КОЕ подсчитывали по общим или устойчивым к канамицину (kan^R) КОЕ. (d) Фракция всех клеток, получивших и плазмиду pCRISPR, и редактированный олигонуклеотид. Котрансформация плазмидой рCRISPR для целенаправленного воздействия обеспечивала больше трансформантов (t-тест, p=0,004). Во всех случаях значения показывают среднее ± среднеквадратическое отклонение для трех независимых экспериментов.

На фигуре 28 показано, что трансформация геномной ДНК crR6 приводит к редактированию локуса целенаправленного воздействия. (a) Элемент IS1167 R6 S. pneumoniae замещали локусом CRISPR01 SF370 S. pyogenes для создания штамма crR6. Этот локус кодирует для нуклеазы Cas9 массив CRISPR с шестью спейсерами, tracrRNA, необходимую для биогенеза crRNA, и белки Cas1, Cas2 и Csn2, которые не являются необходимыми для целенаправленного воздействия. Штамм crR6M содержит минимальную функциональную систему CRISPR без cas1, cas2 и csn2. Ген aphA-3 кодирует устойчивость к кантамицину. Протоспейсеры стрептококковых бактериофагов R6^8232.5 и R6^370.1 гибридизировали с геном устойчивости к хлорамфениколу (cat) и интегрировали в ген srtA штамма R6 для создания штаммов R68232.5 и R6370.1. (b) Левая панель: трансформация геномной ДНК crR6 и crR6M в R6^8232.5и R^6370.1. В качестве контроля компетенции клеток также трансформировали геном устойчивости к стрептомицину. Правая панель: ПЦР анализ 8 трансформантов R6^8232.5с геномной ДНК crR6. Для ПЦР использовали праймеры, обеспечивающие амплифицикацию локуса srtA. В 7/8 генотипированных колоний локус srtA R68232.5 был замещен локусом WT из геномной ДНК crR6.

На фигуре 29 представлены хроматограммы последовательностей ДНК редактированных клеток, полученных в этом исследовании. Во всех случаях выявляли последовательности дикого типа и мутантные последовательности протоспейсера и PAM (или их обратную комплементарную нить). В случае необходимости обеспечивается аминокислотная последовательность, кодируемая протоспейсером. Для каждого эксперимента редактирования секвенировали все штаммы, для которых ПЦР и рестрикционный анализы подтвердили введение желаемой модификации. Показана репрезентативная хроматограмма. (a) Хроматограмма введения мутации PAM в мишень R6^8232.5 (фигура 23d). (b) Хроматограммы введения мутаций R>A и NE>AA в ген β-галактозидазы (bgaA) (фигура 25c). (c) Хроматограмма введения делеции 6664 п.о. в ORF bgaA (фигуры 25c и 25f). Пунктирная линия указывает границы делеции. (d) Хроматограмма введения делеции 729 п.о. в ORF srtA (фигура 25f). Пунктирная линия указывает границы делеции. (e) Хроматограммы образования преждевременного стоп-кодона в ermAM (фигура 33). (f) Редактирование rpsL в E. coli (фигура 27).

На фигуре 30 проиллюстрирована устойчивость CRISPR к случайным мишеням S. pneumoniae, содержащим различные PAM. (a) Положение 10 случайных мишеней в геноме R6 S. pneumoniae. Выбранные мишени содержат различные PAM и находятся на обеих нитях. (b) Спейсеры, соответствующие мишеням, клонировали в минимальный массив CRISPR плазмиды pLZ12 и трансформировали ими штамм crR6Rc, который обеспечивает процессинг и механизм целенаправленного воздействия в трансформантах. (c) Эффективность трансформации различными плазмидами штаммов R6 и crR6Rc. Не было выделено колоний по трансформации pDB99-108 (T1-T10) в crR6Rc. Пунктирной линией представлен предел обнаружения анализа.

На фигуре 31 представлена общая схема целенаправленного редактирования генома. Для обеспечения целенаправленного редактирования генома crR6M дополнительно подвергали конструированию так, чтобы он содержал tracrRNA, Cas9 и только один повтор массива CRISPR, за которым находится маркер устойчивости к кантамицину (aphA-3), создавая штамм crR6Rk. ДНК этого штамма использовали в качестве матрицы для ПЦР с праймерами, сконструированными для введения нового спейсера (зеленый блок, обозначенный N). ПЦР с левыми и правыми праймерами объединяли с применением метода Гибсона для создания конструкции для целенаправленного воздействия. Конструкциями и для целенаправленного воздействия, и для редактирования затем трансформировали штамм crR6Rc, который является штаммом, эквивалентным crR6Rk, но содержит маркер устойчивости к кантамицину, замещенный маркером устойчивости к хлорамфениколу (cat). Приблизительно 90% устойчивых к канамицину трансформантов содержали желаемую мутацию.

На фигуре 32 проиллюстрировано распределение расстояний между PAM. NGG и CCN, которые считаются допустимыми PAM. Данные представлены по геному R6 S. pneumoniae, а также по случайным последовательностям такой же длины и с таким же содержанием GC (39,7%). Пунктирная линия представляет среднее расстояние (12) между PAM в геноме R6.

На фигуре 33 проиллюстрировано опосредованное CRISPR редактирование локуса ermAM с использованием геномной ДНК в качестве конструкции для целенаправленного воздействия. Для использования геномной ДНК в качестве конструкции для целенаправленного воздействия необходимо избегать аутоиммунной активности на CRISPR, и, таким образом, должен быть использован спейсер, соответствующий последовательности, не присутствующей в хромосоме (в этом случае ген устойчивости к эритромицину ermAM). (a) Нуклеотидная и аминокислотная последовательности гена ermAM дикого типа и мутированного (красные буквы). Приведены протоспейсер и последовательности PAM. (b) Схематическое изображение опосредованного CRISPR редактирования локуса ermAM с применением геномной ДНК. Конструкцию, несущую ermAM-целенаправленно воздействующий спейсер (голубой блок), получали с помощью ПЦР и сборки по методу Гибсона, трансформировали ею штамм crR6Rc, создавая штамм JEN37. Геномную ДНК JEN37 использовали в качестве конструкции для целенаправленного воздействия и ею вместе с матрицей редактирования котрансформировали JEN38, штамм, в котором ген srtA замещен копией ermAM дикого типа. Устойчивые к канамицину трансформанты содержат редактированный генотип (JEN43). (c) Количество устойчивых к канамицину клеток получали после котрансформации матрицами целенаправленного воздействия и редактирования или контрольными. В присутствии контрольной матрицы получали 5,4×10³ КОЕ/мл и 4,3×10⁵КОЕ/мл при использовании матрицы редактирования. Это различие указывает на приблизительно 99% эффективность редактирования [(4,3×10⁵-5,4×10³)/4,3×10⁵]. (d) Для проверки на наличие редактированных клеток семь устойчивых к канамицину клонов и JEN38 высевали штрихом на чашки с агаровой средой с эритромицином (erm+) или без (erm-) эритромицина. Только положительный контроль отображал устойчивость к эритромицину. Мутированный генотип ermAM одного из этих трансформантов также подтверждали путем секвенирования ДНК (фигура 29e).

На фигуре 34 проиллюстрировано последовательное введение мутаций путем опосредованного CRISPR редактирования генома. (a) Схематическое изображение последовательного введения мутаций путем опосредованного CRISPR редактирования генома. Прежде всего, R6 конструировали для создания crR6Rk. crR6Rk котрансформировали конструкцией для целенаправленного воздействия srtA, гибридизированной с cat для отбора по хлорамфениколу редактированных клеток, совместно с конструкцией для редактирования с делецией ΔsrtA внутри рамки считывания. Штамм ΔsrtA crR6 получали путем отбора по хлорамфениколу. Затем штамм ΔsrtA котрансформировали конструкцией для целенаправленного воздействия bgaA, гибридизированной с aphA-3 для отбора по канамицину редактированных клеток, и конструкцией для редактирования, содержащей делецию ΔbgaA внутри рамки считывания. И наконец, сконструированный локус CRISPR можно удалять из хромосомы путем сначала котрансформации ДНК R6, содержащей локус IS1167 дикого типа, и плазмидой, несущей протоспейсер bgaA (pDB97), а также отбором по спектиномицину. (b) ПЦР анализ 8 устойчивых к хлорамфениколу (Cam) трансформантов для выявления делеции в локусе srtA. (c) Активность β-галактозидазы, которую измеряли с помощью анализа Миллера. У S. pneumoniae этот фермент прикреплен к клеточной стенке сортазой A. Делеция гена srtA проявляется в высвобождении β-галактозидазы в супернатант. Мутанты ΔbgaA не проявляют активности. (d) ПЦР анализ 8 устойчивых к спектиномицину (Spec) трансформантов для выявления замещения локуса CRISPR IS1167 дикого типа.

На фигуре 35 показан фон частоты мутации CRISPR у S. pneumoniae. (a) Трансформация JEN53 конструкциями для целенаправленного воздействия CRISPR::∅ или CRISPR::erm(stop) с матрицей редактирования ermAM или без нее. Различие в kan^R КОЕ между CRISPR::∅ и CRISPR::erm(stop) указывает на то, что расщепление Cas9 уничтожает нередактированные клетки. Мутантов, избегающих интерференции CRISPR при отсутствии матрицы редактирования, наблюдали с частотой 3×10^-3. (b) ПЦР анализ локуса CRISPR клеток, избежавших воздействия, указывает на то, что 7/8 содержат делецию спейсера. (c) Клетка, избежавшая воздействия, № 2 несет точковую мутацию в cas9.

На фигуре 36 показано, что важные элементы локуса 1 CRISPR S. pyogenes воспроизводили в E. coli с применением pCas9. Плазмида содержала tracrRNA, Cas9, а также лидерную последовательность, управляющую массивом crRNA. Плазмиды pCRISPR содержали только лидерную последовательность и массив. Спейсеры могут быть вставлены в массив crRNA между сайтами BsaI с применением отожженных олигонуклеотидов. Структура олигонуклеотида показана внизу. pCas9 несет устойчивость к хлорамфениколу (CmR) и основана на остове низкокопийной плазмиды pACYC184. pCRISPR основана на большом количестве копий плазмиды pZE21. Требовалось две плазмиды, поскольку плaзмида pCRISPR, содержащая спейсер, целенаправленно воздействующий на хромосому E. coli, не может быть сконструирована с применением этого организма как хозяина для клонирования, если Cas9 также присутствует (это приведет к гибели хозяина).

На фигуре 37 показано редактирование в MG1655 E.coli под управлением CRISPR. Олигонуклеотидом (W542), несущим точковую мутацию, что и обеспечивает устойчивость к стрептомицину, и ликвидирует иммунную активность CRISPR, совместно с плазмидой, целенаправленно воздействующей на rpsL (pCRISPR::rpsL), или контрольной плазмидой (pCRISPR::∅) котрансформировали штамм дикого типа MG1655 E.coli, содержащий pCas9. Трансформантов отбирали на среде, содержащей либо стрептомицин, либо канамицин. Пунктирной линией указан предел детекции анализа трансформации.

На фигуре 38 показан фон частоты мутации CRISPR в HME63 E. coli. (a) Трансформация компетентных клеток HME63 плазмидами pCRISPR::∅ или pCRISPR::rpsL. Мутантов, избежавших интерференции CRISPR, наблюдали с частотой 2,6×10^-4. (b) Амплификация массива CRISPR клеток, избежавших воздействия, показала, что у 8/8 спейсер был удален.

На фигуре 39A-D показано круговое изображение филогенетического анализа, выявляющего пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот).

На фигуре 40A-F показано линейное отображение филогенетического анализа, выявляющего пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот).

На фигуре 41A-M показаны последовательности, где точки мутаций расположены в гене SpCas9.

На фигуре 42 показано схематическое изображение конструкции, в которой домен активации транскрипции (VP64) слит с Cas9 с двумя мутациями в каталитических доменах (D10 и H840).

На фигуре 43A-D показано редактирование генома посредством гомологичной рекомбинации. (a) Схематическое изображение никазы SpCas9 с мутацией D10A в каталитическом домене RuvC I. (b) Схематическое представление гомологичной рекомбинации (HR) в локусе EMX1 человека при использовании смысловых или антисмысловых однонитевых олигонуклеотидов в качестве матриц для репарации. Красная стрелка вверху указывает на сайт расщепления для sgRNA; праймеры для ПЦР для генотипирования (таблицы J и K) обозначены стрелками в правой панели. (c) Последовательность участка, модифицированного с помощью HR. d, Анализ вставок/делеций в целевом локусе 1 EMX1 (n = 3), опосредованных SpCas9 дикого типа (wt) и никазой SpCas9 (D10A), с помощью SURVEYOR. Стрелки указывают положения фрагментов ожидаемого размера.

На фигуре 44A-B показаны одиночные векторные структуры для SpCas9.

На фигуре 45 показан количественный анализ расщепления конструкций NLS-Csn1, Csn1, Csn1-NLS, NLS-Csn1-NLS, NLS-Csn1-GFP-NLS и UnTFN.

На фигуре 46 показан индекс частоты NLS-Cas9, Cas9, Cas9-NLS и NLS-Cas9-NLS.

На фигуре 47 представлен анализ в геле, демонстрирующий, что SpCas9 с мутациями никазы (в отдельности) не индуцирует двухцепочечные разрывы.

На фигуре 48 показана структура олигонуклеотидной ДНК, используемой в качестве матрицы гомологичной рекомбинации (HR) в этом эксперименте, и сравнение эффективности HR, индуцированной различными комбинациями белка Cas9 и матрицы HR.

На фигуре 49A показана карта вектора для целенаправленного воздействия с зависимой от условий экспрессией Cas9, Rosa26.

На фигуре 49B показана карта вектора для целенаправленного воздействия с конститутивной экспрессией Cas9, Rosa26.

На фигуре 50A-H показаны последовательности для каждого элемента, присутствующего на картах векторов фигур 49A-B.

На фигуре 51 показано схематическое изображение важных элементов в конструкциях для конститутивной и зависимой от условий экспрессии Cas9.

На фигуре 52 показано подтверждение функции конструкций для конститутивной и зависимой от условий экспрессии Cas9.

На фигуре 53 показано подтверждение нуклеазной активности Cas9 с помощью Surveyor.

На фигуре 54 показан количественный анализ нуклеазной активности Cas9.

На фигуре 55 показана структура конструкции и стратегия гомологичной рекомбинации (HR).

На фигуре 56 показаны результаты ПЦР генотипирования генома конструкций для констутивной (правая) и зависимой от условий (левая) экспрессии при двух разных длительностях воздействия (верхний ряд в течение 3 мин и нижний ряд в течение 1 мин.).

На фигуре 57 показана активация Cas9 в mESC.

На фигуре 58 показано схематическое изображение стратегии, использованной для опосредования нокаута гена через NHEJ с применением никазного варианта Cas9 совместно с двумя направляющими РНК.

На фигуре 59 показано, как репарация двухцепочечного разрыва (DSB) ДНК способствует редактированию генов. В пути склонного к ошибкам негомологичного соединения концов (NHEJ) концы DSB подвергаются обработке посредством эндогенных механизмов репарации ДНК и соединяются вместе, что может приводить к случайным мутациям по типу вставки или делеции (вставки/делеции) в месте соединения. Мутации по типу вставки/делеции, имеющие место в кодирующем участке гена, могут обуславливать сдвиг рамки считывания и появление преждевременного стоп-кодона, что приводит к нокауту гена. Альтернативно, матрицу для репарации в форме плазмиды или однонитевых олигодезоксинуклеотидов (ssODN) можно предоставлять для эффективного использования пути репарации с участием гомологичной рекомбинации (HDR), что обеспечивает высокое качество и точное редактирование.

На фигуре 60 показаны временная шкала и общее описание экспериментов. Стадии разработки, создания, подтверждения реагента и размножения клеточной линии. Индивидуальные sgRNA (светло-голубые метки) для каждой мишени, а также праймеры для генотипирования конструировали in silico посредством онлайн-инструмента конструирования (доступен на веб-сайте genome-engineering.org/tools). Векторы экспрессии sgRNA затем клонировали в плазмиду, содержащую Cas9 (PX330), и проверяли посредством секвенирования ДНК. Готовыми плазмидами (pCRISPR) и необязательными матрицами для репарации для облегчения гомологично направленной репарации затем трансфицировали клетки и анализировали на возможность опосредовать целенаправленное расщепление. И наконец, можно осуществлять клональное размножение трансфицированных клеток для получения изогенных клеточных линий с определенными мутациями.

На фигуре 61A-C показан выбор мишени и приготовление реагентов. (a) Для Cas9 S. pyogenes, за мишенями из 20 п.о. (выделены голубым) должна находиться 5’-NGG, которая может встречаться в любой нити геномной ДНК. Рекомендовано использование онлайн-инструмента, описанного в этом протоколе для помощи в выборе мишени (www.genome-engineering.org/tools). (b) Схематическое изображение котрансфекции экспрессионной плазмиды Cas9 (PX165) и амплифицированной с помощью ПЦР управляемой U6 кассетой экспрессии sgRNA. С применением промотора U6, содержащего матрицу ПЦР и фиксированный прямой праймер (U6 Fwd), sgRNA-кодирующие ДНК могут присоединяться к обратному праймеру U6 (U6 Rev) и синтезироваться в виде удлиненного олигонуклеотида ДНК (Ultramer oligos от IDT). Следует отметить, что направляющая последовательность (голубые N) в U6 Rev является обратно-комплементарной фланкирующей целевой последовательностью 5’-NGG. (c) Схематическое изображение scarless-клонирования направляющей последовательности олигонуклеотидов в плазмиду, содержащую Cas9 и каркас sgRNA (PX330). Направляющие олигонуклеотиды (голубые N) содержат липкие концы для лигирования в пару сайтов BbsI в PS330 с ориентацией на верхнюю и нижнюю нить, совпадающие с данными мишенями генома (т.e. верхний олигонуклеотид находится на 20 п.о. перед последовательностью 5’-NGG в геномной ДНК). Расщепление PX330 BbsI обеспечивает замещение сайтов рестрикции типа IIs (голубой контур) с прямой вставкой отожженных олигонуклеотидов. Стоит отметить, что дополнительный G размещали перед первым основанием направляющей последовательности. Заявители обнаружили, что дополнительный G перед направляющей последовательностью не влияет отрицательно на эффективность целенаправленного воздействия. В случаях, когда выбранная 20-нт направляющая последовательность не начинается с гуанина, дополнительный гуанин обеспечит эффективное транскрибирование sgRNA с помощью промотора U6, для которого предпочтительным является гуанин в первом основании транскрипта.

На фигуре 62A-D показаны ожидаемые результаты мультиплексного NHEJ. (a) Схематическое изображение анализа с помощью SURVEYOR, использованного для определения процентной доли вставок/делеций. В первую очередь, геномную ДНК из гетерогенной популяции клеток с целенаправленно воздействующей Cas9 амплифицировали с помощью ПЦР. Затем ампликоны медленно повторно отжигали для создания гетеродуплексов. Повторно отожженные гетеродуплексы расщепляли с помощью нуклеазы SURVEYOR, в то время как гомодуплексы оставались интактными. Эффективность опосредованного Cas9 расщепления (% вставок/делеций) рассчитывали на основании фракции расщепленной ДНК, которую определяли с помощью интегральной интенсивности полос в геле. (b) Две sgRNA (оранжевая и голубая метки) конструировали для целенаправленного воздействия на локусы GRIN2B и DYRK1A человека. Анализ в геле с помощью SURVEYOR показывал модификации в обоих локусах в трансфицированных клетках. Цветные стрелки указывали на ожидаемые размеры фрагментов для каждого локуса. (c) Пару sgRNA (светло-голубая и зеленая метки) конструировали для вырезания экзона (темно-голубой) в локусе EMX1 человека. Целевые последовательности и PAM (красный) показаны соответствующими цветами, и сайты расщепления отмечены с помощью красного треугольника. Прогнозируемое место соединения показано ниже. Отдельные клоны выделяли из клеточных популяций, трансфицированных sgRNA, 3, 4 или и тот, и другой также анализировали с помощью ПЦР (OUT Fwd, OUT Rev), отображая делецию ~270 п.о. Показаны типичные клоны без модификации (12/23), с моноаллельными (10/23) и биаллельными (1/23) модификациями. IN Fwd и IN Rev праймеры использовали для отображения событий инверсии (фиг. 6d). (d) Количественный анализ клональных линий с делецией в экзоне EMX1. Две пары sgRNA (sgRNA 3.1, 3.2, фланкирующих слева; sgRNA 4.1, 4.2, фланкирующих справа) использовали для опосредования делеций различных размеров возле экзона EMX1. Трансфицированные клетки клонально выделяли и размножали для анализа генотипирования по событиям делеций и инверсий. Из 105 клонов, для которых проводили скрининг, 51 (49%) и 11 (10%) несли гетерозиготные и гомозиготные делеции, соответственно. Даны приблизительные размеры делеций, поскольку места соединения могут различаться.

На фигуре 63A-C показано применение ssODN и вектора для целенаправленного воздействия для опосредования HR и с Cas9 дикого типа, и с мутантной никазой Cas9 в клетках HEK293FT и HUES9 с эффективностями в диапазоне от 1,0 до 27%.

На фигуре 64 показано схематическое изображение способа на основе ПЦР для быстрого и эффективного целенаправленного воздействия CRISPR в клетках млекопитающих. Плазмиду, содержащую промотор U6 РНК-полимеразы III человека, амплифицировали с использованием ПЦР, применяя U6-специфичный прямой праймер и обратный праймер, несущий обратную комплементарную нить части промотора U6, каркас sgRNA(+85) с направляющей последовательностью и 7 T-нуклеотидов для терминации транскрипции. Полученный ПЦР-продукт очищали и доставляли совместно с плазмидой, несущей Cas9, управляемый промотором CBh.

На фигуре 65 показаны результаты использования набора для обнаружения мутаций SURVEYOR от Transgenomics для каждой направляющей РНК и соответствующие контроли. Положительный результат анализа с помощью SURVEYOR представляет собой одну большую полосу, соответствующую геномной ПЦР, и две полосы поменьше, которые являются продуктами нуклеазы SURVEYOR, производящей двухцепочечный разрыв в сайте мутации. Каждую направляющую РНК оценивали в клеточной линии мыши, Neuro-N2a, с помощью липосомальной неустойчивой котрансфекции hSpCas9. Через 72 часа после трансфекции геномную ДНК очищали с применением QuickExtract DNA от Epicentre. ПЦР выполняли для амплификации локуса, представляющего интерес.

На фигуре 66 показаны результаты анализа с помощью Surveyor для 38 живых детенышей (дорожки 1-38),1 мертвого детеныша (дорожка 39) и 1 детеныша дикого типа для сравнения (дорожка 40). Детенышам 1-19 инъецировали gRNA Chd8.2, а детенышам 20-38 инъецировали gRNA Chd8.3. Из 38 живых детенышей 13 были положительными по мутации. У одного мертвого детеныша также была мутация. В образце дикого типа не было обнаружено мутации. ПЦР секвенирование генома соответствовало данным анализа с помощью SURVEYOR.

На фигуре 67 показана структура различных конструкций Cas9-NLS. Все Cas9 представляли собой кодон-оптимизированный для человека вариант Sp Cas9. Последовательности NLS связаны с геном cas9 либо на N-конце, либо на С-конце. Все варианты Cas9 с различными структурами NLS клонировали в вектор, содержащий остов, так что он управлялся промотором EF1a. В этом же векторе находилась химерная РНК, целенаправленно воздействующая на локус EMX1 человека, управляемый промотором U6, формирующим вместе с ней двухкомпонентную систему.

На фигуре 68 показана эффективность расщепления генома, индуцированная вариантами Cas9, несущими различные структуры NLS. Процентная доля указывает часть геномной ДНК EMX1 человека, которая подвергалась расщеплению каждой конструкцией. Все эксперименты получены из 3 биологических повторностей. n = 3, ошибка означает стандартную ошибку среднего.

На фигуре 69A показана структура CRISPR-TF (фактора транскрипции), обладающего функцией активации транскрипции. Химерная РНК экспрессируется с помощью промотора U6, a кодон-оптимизированный для человека вариант двойного мутанта белка Cas9 (hSpCas9m), функционально связанного с трехкомпонентной NLS и функциональным доменом VP64, экспрессируется с помощью промотора EF1a. Двойные мутации, D10A и H840A, делают белок Cas9 неспособным вносить какое-либо расщепление, но поддерживают его способность связываться с целевой ДНК при направлении химерной РНК.

На фигуре 69B показана активация транскрипции гена SOX2 человека системой CRISPR-TF (химерная РНК и слитый белок Cas9-NLS-VP64). Клетки 293FT трансфицировали плазмидами, несущей два компонента: (1) управляемые U6 различные химерные РНК, целенаправленно воздействующие на последовательности из 20 п.о. в локусе генома человека SOX2 или рядом с ним, и (2) управляемый EF1 hSpCas9m (двойной мутант)-слитый белок NLS-VP64. Через 96 часа после трансфекции клетки 293FT собирали и измеряли уровень активации посредством индукции экспрессии мРНК с применением анализа qRT-PCR. Все уровни экспрессии нормированы по сравнению с контрольной группой (серый столбец), представляющей результаты клеток, трансфицированных плазмидой с остовом CRISPR-TF без химерной РНК. Зонды qRT-PCR использовали для выявления мРНК SOX2 при анализе экспрессии генов Taqman Human (Life Technologies). Представлены данные всех экспериментов 3 биологических повторностей, n=3, планки погрешностей показывают стандартную ошибку среднего.

На фигуре 70 изображена оптимизация строения NLS для SpCas9.

На фигуре 71 показана диаграмма "квантиль-квантиль" для последовательностей NGGNN.

На фигуре 72 показана гистограмма плотности данных с подобранным нормальным распределением (черная линия) и квантилем 0,99 (пунктирная линия).

На фигуре 73A-C показана РНК-направляемая репрессия экспрессии bgaA с помощью dgRNA::cas9**. a. Белок Cas9 связывается с tracrRNA и с предшественником РНК CRISPR, который подвергается процессингу РНКазой III с образованием crRNA. crRNA управляет связыванием Cas9 с промотором bgaA и репрессирует транскрипцию. b. Представлены мишени, использованные для направления Cas9** к промотору bgaA. Предполагаемые кодоны -35, -10, а также стартовый кодон bgaA представлены жирным шрифтом. c. Бета-галактозидазная активность как мера в анализе Миллера при отсутствии целенаправленного воздействия и для четырех различных мишеней.

На фигуре 74A-E показана характеристика опосредованной Cas9** репрессии. a. Ген gfpmut2 и его промотор, включающий сигналы -35 и -10, представлены совместно с положением различных целевых сайтов, использованных в данном исследовании. b. Относительная флюоресценция при целенаправленном воздействии на кодирующую нить. c. Относительная флюоресценция при целенаправленном воздействии на некодирующую нить. d. Нозерн-блоттинг с зондами B477 и B478 РНК, экстрагированной из T5, T10, B10 или контрольного штамма без мишени. e. Эффект увеличения количества мутаций на 5’-конце crRNA B1, T5 и B10.

Фигуры приведены в данном документе только в целях иллюстрации, и они не обязательно должны быть изображены в масштабе.

Пдробное описание изобретения

Выражения “полинуклеотид”, “нуклеотид”, “нуклеотидная последовательность”, “нуклеиновая кислота” и “олигонуклеотид” используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующе участки гена или фрагмента гена, локусы (локус), определенные в результате анализа сцепления, экзоны, интроны, информационная РНК (иРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенные ДНК любой последовательности, выделенные РНК любой последовательности, зонды для нуклеиновых кислот и праймеры. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем конъюгации с компонентом для мечения.

В аспектах настоящего изобретения выражения “химерная РНК”, “химерная направляющая РНК”, “направляющая РНК”, “одиночная направляющая РНК” и “синтетическая направляющая РНК” используют взаимозаменяемо, и они обозначают полинуклеотидную последовательность, содержащую направляющую последовательность, tracr-последовательность и парную tracr-последовательность. Выражение “направляющая последовательность” обозначает последовательность из приблизительно 20 п.о. в пределах направляющей РНК, которая определяет целевой сайт, и ее можно использовать взаимозаменяемо с выражениями “гид” или “спейсер”. Выражение “парная tracr-последовательность” также можно использовать взаимозаменяемо с выражением “прямой(ые) повтор(ы)”.

Используемое в данном документе выражение “дикий тип” является выражением из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которые встречаются в природе в отличие от мутантных или вариантных форм.

Используемое в данном документе выражение “вариант” следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от такового, встречающегося в природе.

Выражение “не встречающийся в природе” или “сконструированный” используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один отличный компонент, с которым они естественным образом связаны в природе и встречаются в природе.

“Комплементарность” означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты при помощи либо традиционного спаривания оснований по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). “Точная комплементарность” означает, что все граничащие остатки последовательности нуклеиновой кислоты будут связаны водородными связями с тем же количеством граничащих остатков во второй последовательности нуклеиновой кислоты. Выражение “практически комплементарный”, используемое в данном документе, означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибиридизируются при жестких условиях.

Используемые в данном документе “жесткие условия” в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с нецелевыми последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. В общем, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется с целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter “Overview of principles of hybridization and the strategy of nucleic acid probe assay”, Elsevier, N.Y.

“Гибридизация” означает реакцию, при которой один или несколько полинуклеотидов реагируют с образованием комплекса, который стабилизируется посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или любым другим специфичным к последовательности образом. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида при помощи фермента. Последовательность, способную гибридизироваться с данной последовательностью, называют “комплементарной последовательностью” данной последовательности.

Используемое в данном документе выражение “экспрессия” означает процесс, при котором полинуклеотид транскрибируется с ДНК-матрицы (как, например, в иРНК или другой РНК-транскрипт), и/или способ, при помощи которого транскрибированная иРНК далее транслируется в пептиды, полипептиды или белки. Транскрипты и закодированные полипептиды можно в совокупности называть “продуктом гена”. Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг иРНК в эукариотической клетке.

Выражения “полипептид”, “пептид” и “белок” используют взаимозаменяемо в данном документе для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Выражения также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, такой как соединение с компонентом для мечения. Используемое в данном документе выражение “аминокислота” включает природные и/или неприродные или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналоги аминокислот, и пептидомиметики.

Выражения “субъект”, “индивидуум” и “пациент” используют взаимозаменяемо в данном документе для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают, без ограничения, мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro.

Выражения “терапевтическое средство”, “оказывающее терапевтический эффект средство” или “средство для лечения” используют взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает осуществление диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.

Используемые в данном документе выражения “лечение”, или “осуществление лечения”, или “временное ослабление”, или “облегчение” используют взаимозаменяемо. Эти выражения означают подход для получения благоприятных или желательных результатов, в том числе, без ограничения, терапевтического эффекта и/или профилактического эффекта. Под терапевтическим эффектом понимают любые терапевтически значимые улучшение или действие в отношении одного или нескольких заболеваний, состояний или симптомов при лечении. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.

Выражение “эффективное количество” или “терапевтически эффективное количество” означает количество средства, которого достаточно для обеспечения благоприятных или желательных результатов. Терапевтически эффективное количество может изменяться в зависимости от одного или нескольких из: субъекта и болезненного состояния, которые подлежат лечению, веса и возраста субъекта, тяжести болезненного состояния, способа введения и подобного, что специалист в данной области легко может определить. Выражение также применимо к дозе, с помощью которой можно получить изображение для определения любым одним из способов визуализации, описанных в данном документе. Конкретная доза может изменяться в зависимости от одного или нескольких из: конкретного выбранного средства, режима дозирования, которому следуют, того, вводят ли его в комбинации с другими средствами, выбора времени введения, визуализируемой ткани и физической системы доставки, в которой оно заключено.

Практическое применение настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2^nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL и ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).

Некоторые аспекты настоящего изобретения касаются векторных систем, содержащих один или несколько векторов, или векторов как таковых. Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, как, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). В качестве альтернативы рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, при помощи регуляторных последовательностей промотора T7 и полимеразы T7.

Векторы можно вводить и размножать в прокариоте. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяин. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с векторами, содержащими конститутивные или индуцибельные промоторы, управляющие экспрессией либо слитых белков, либо отличных от слитых белков. Слитые векторы добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка путем функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолитического расщепления вводят в место соединения фрагмента слияния и рекомбинантного белка для облегчения отделения рекомбинантного белка от фрагмента слияния после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Xa, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRIT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых глутатион-S-трансфераза (GST), мальтоза-связывающий белок E или белок A, соответственно, слиты с целевым рекомбинантным белком.

Примеры подходящих индуцибельных не являющихся слитыми векторов экспрессии E. coli включают pTrc (Amrann et al., (1988) Gene 69:301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89).

В некоторых вариантах осуществления вектор является дрожжевым вектором экспрессии. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния).

В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых с помощью бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).

В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих при помощи вектора экспрессии млекопитающих. Примеры векторов экспрессии млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании клеток млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, вируса обезьян 40 и других, раскрыты в данном документе и известны в уровне техники. Что качается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2^nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.

В некоторых вариантах осуществления рекомбинантные векторы экспрессии млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны в уровне техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (печень-специфичный; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов T-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США № 4873316 и публикация европейской заявки № 264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Gruss, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537-546).

В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR с тем, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (прерываемые спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у E. coli (Ishino et al., J. Bacteriol., 169:5429-5433 [1987]; and Nakata et al., J. Bacteriol., 171:3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см., Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]; и Mojica et al., Mol. Microbiol., 17:85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]; и Mojica et al., Mol. Microbiol., 36:244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182:2393-2401 [2000]). Локусы CRISPR были идентифицированы у более чем 40 видов прокариот (см., к примеру, Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]; и Mojica et al., [2005]), в том числе, без ограничения, Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.

В целом, “система CRISPR” означает в совокупности транскрипты и другие элементы, участвующие в экспрессии CRISPR-ассоциированных (“Cas”) генов или управлении их активностью, в том числе последовательности, кодирующие ген Cas, tracr (транс-активируемую CRISPR) последовательность (к примеру, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую “прямой повтор” и tracrRNA-процессированный неполный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также называемую “спейсером” в контексте эндогенной системы CRISPR) или другие последовательности и транскрипты с локуса CRISPR. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из системы CRISPR I типа, II типа или III типа. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из определенного организма, содержащего эндогенную систему CRISPR, как, например, Streptococcus pyogenes. В целом, система CRISPR характеризуется элементами, которые способствуют образованию комплекса CRISPR на сайте целевой последовательности (также называемой протоспейсером в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR “целевая последовательность” означает последовательность, по отношению к которой направляющая последовательность разработана так, чтобы обладать комплементарностью, где гибридизация между целевой последовательностью и направляющей последовательностью способствует образованию комплекса CRISPR. Полная комплементарность не обязательна при условии, что имеет место достаточная комплементарность для осуществления гибридизации и способствования образованию комплекса CRISPR. Целевая последовательность может содержать любой полинуклеотид, как, например, ДНК- или РНК-полинуклеотиды. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления целевая последовательность может находиться в органелле эукариотической клетки, например, митохондрии или хлоропласте. Последовательность или матрицу, которую можно применять для рекомбинации в целевом локусе, содержащем целевые последовательности, называют “матрицей редактирования”, или “полинуклеотидом для редактирования”, или “последовательностью для редактирования”. В аспекте настоящего изобретения экзогенный матричный полинуклеотид можно называть матрицей редактирования. В одном аспекте настоящего изобретения рекомбинация является гомологичной рекомбинацией.

Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизирующуюся с целевой последовательностью и образующую комплекс с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в или около (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований от) целевой последовательности. Не желая быть связанными теорией, полагают, что tracr-последовательность, которая может содержать или состоять из всей или части tracr-последовательности дикого типа (к примеру, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также образовывать часть комплекса CRISPR, как, например, путем гибридизации вдоль по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью. В некоторых вариантах осуществления tracr-последовательность обладает достаточной комплементарностью с парной tracr-последовательностью для гибридизации и участия в образовании комплекса CRISPR. Как и в случае с целевой последовательностью, полагают, что полная комплементарность не является необходимой при условии, что она является достаточной для выполнения функции. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы CRISPR, вводят в клетку-хозяина, так что экспрессия элементов системы CRISPR управляет образованием комплекса CRISPR на одном или нескольких целевых сайтах. Например, каждое из фермента Cas, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности может быть функционально связано с отдельными регуляторными элементами в отдельных векторах. В качестве альтернативы, два или более элементов, экспрессируемых с одних и тех же или различных регуляторных элементов, можно объединять в одном векторе, с одним или несколькими дополнительными векторами, обеспечивая любые компоненты системы CRISPR, не включенные в первый вектор. Элементы системы CRISPR, которые объединены в один вектор, могут быть расположены в любой удобной ориентации, как, например, один элемент, расположенный 5’ (“выше”) относительно или 3’ (“ниже”) относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на той же или противоположной нити кодирующей последовательности второго элемента и направлена в том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего фермент CRISPR, и одной или нескольких из направляющей последовательности, парной tracr-последовательности (необязательно функционально связанной с направляющей последовательностью) и tracr-последовательности, встроенных в одну или несколько интронных последовательностей (к примеру, каждая в разном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления фермент CRISPR, направляющая последовательность, парная tracr-последовательность и tracr-последовательность функционально связаны с одним и тем же промотором и экспрессируются с него.

В некоторых вариантах осуществления вектор содержит один или несколько сайтов встраивания, как, например, последовательность узнавания рестрикционной эндонуклеазой (также называемая “сайтом клонирования”). В некоторых вариантах осуществления один или несколько сайтов встраивания (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов встраивания) расположены выше и/или ниже одного или нескольких элементов последовательности одного или нескольких векторов. В некоторых вариантах осуществления вектор содержит сайт встраивания выше парной tracr-последовательности и необязательно ниже регуляторного элемента, функционально связанного с парной tracr-последовательностью, так что после встраивания направляющей последовательности в сайт встраивания и при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления вектор содержит два или более сайта встраивания, при этом каждый сайт встраивания расположен между двумя парными tracr-последовательностями с тем, чтобы обеспечить возможность встраивания направляющей последовательности в каждый сайт. В таком расположении две или более направляющие последовательности могут содержать две или более копий одной направляющей последовательности, две или более различных направляющих последовательностей или их комбинации. В тех случаях, когда применяют несколько различных направляющих последовательностей, может быть использована одна экспрессирующая конструкция для целенаправленного воздействия активности CRISPR на несколько различных соответствующих целевых последовательностей в клетке. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или более направляющих последовательностей. В некоторых вариантах осуществления приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более таких содержащих направляющие последовательности векторов могут быть предусмотрены и необязательно доставлены в клетку.

В некоторых вариантах осуществления вектор содержит регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, как, например, белок Cas. Неограничивающие примеры белков Cas включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известный как Csn1 и Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, их гомологи или их модифицированные варианты. Эти ферменты известны; например, аминокислотную последовательность белка Cas9 S. pyogenes можно найти в базе данных SwissProt под номером доступа Q99ZW2. В некоторых вариантах осуществления немодифицированный фермент CRISPR обладает активностью для расщепления ДНК, как, например, Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой Cas9, и им может быть Cas9 из S. pyogenes или S. pneumoniae. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или обеих нитей в определенной точке целевой последовательности, как, например, в пределах целевой последовательности и/или в пределах комплементарной последовательности целевой последовательности. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или обеих нитей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления вектор кодирует фермент CRISPR, который является мутированным по отношению к соответствующему ферменту дикого типа, так что у мутированного фермента CRISPR отсутствует способность расщеплять одну или обе нити целевого полинуклеотида, содержащего целевую последовательность. Например, замена аспартата на аланин (D10A) в каталитическом домене RuvC I Cas9 из S. pyogenes трансформирует Cas9 из нуклеазы, которая расщепляет обе нити, в никазу (расщепляет одну нить). Другие примеры мутаций, которые превращают Cas9 в никазу, включают, без ограничения, H840A, N854A и N863A. В некоторых вариантах осуществления никазу Cas9 можно использовать в комбинации с направляющей(ими) последовательностью(ями), к примеру, двумя направляющими последовательностями, которые целенаправленно воздействуют, соответственно, на смысловую и антисмысловую нити ДНК-мишени. Эта комбинация позволяет надрезать обе нити и использовать их для индукции NHEJ. Авторы данной заявки показали (данные не показаны) эффективность двух мишеней для никаз (т.е. sgRNA, целенаправленно воздействующие на одну и ту же точку, но на различные нити ДНК) при индуцировании мутагенного NHEJ. Одиночная никаза (Cas9-D10A с одной sgRNA) не способна индуцировать NHEJ и создавать вставки/делеции, но авторы данной заявки показали, что двойная никаза (Cas9-D10A и две sgRNA, целенаправленно воздействующие на различные нити в одной и той же точке) способна делать это в эмбриональных стволовых клетках человека (hESC). Эффективность составляет приблизительно 50% таковой нуклеазы (т.е. нормального Cas9 без мутации D10) в hESC.

В качестве дополнительного примера два или более каталитических доменов Cas9 (RuvC I, RuvC II и RuvC III) можно подвергать мутациям с получением мутированного Cas9, у которого практически отсутствует вся активность для расщепления ДНК. В некоторых вариантах осуществления мутацию D10A объединяют с одной или несколькими из мутаций H840A, N854A или N863A с получением фермента Cas9, у которого практически отсутствует вся активность для расщепления ДНК. В некоторых вариантах осуществления фермент CRISPR рассматривают как такой, у которого практически отсутствует вся активность для расщепления ДНК, в случаях, когда активность для расщепления ДНК мутированного фермента составляет менее приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше по отношению к его не мутированной форме. Могут быть целесообразными другие мутации; в тех случаях, когда Cas9 или другой фермент CRISPR получен из вида, отличного от S. pyogenes, могут быть произведены мутации в соответствующих аминокислотах для достижения подобных эффектов.

В некоторых вариантах осуществления кодирующая фермент последовательность, кодирующая фермент CRISPR, является кодон-оптимизированной для экспрессии в определенных клетках, как, например, эукариотических клетках. Эукариотические клетки могут быть клетками определенного организма или полученными из него, как, например, млекопитающего, в том числе, без ограничения, человека, мыши, крысы, кролика, собаки или отличного от человека примата. В целом, оптимизация кодонов означает способ модификации последовательности нуклеиновой кислоты для повышения экспрессии в представляющих интерес клетках-хозяевах путем замещения по меньшей мере одного кодона (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности кодонами, которые чаще или наиболее часто используют в генах этой клетки-хозяина, в то же время сохраняя нативную аминокислотную последовательность. Разные виды проявляют определенное "предпочтение" в отношении конкретных кодонов определенной аминокислоты. "Предпочтение" кодонов (различия в частоте использования кодонов между организмами) часто соотносят с эффективностью трансляции информационной РНК (иРНК), которая, в свою очередь, как полагают, зависит, среди прочего, от свойств кодонов, которые транслируются, и доступности конкретных молекул транспортной РНК (тРНК). Преобладание выбранных тРНК в клетке, как правило, является отражением кодонов, используемых наиболее часто при синтезе пептидов. Соответственно, гены могут быть приспособлены для оптимальной экспрессии генов в данном организме с использованием оптимизации кодонов. Таблицы частоты использования кодонов общедоступны, например, в "Базе данных частот использования кодонов" (“Codon Usage Database”), и эти таблицы можно адаптировать различными способами. См. Nakamura, Y., et al. “Codon usage tabulated from the international DNA sequence databases: status for the year 2000” Nucl. Acids Res. 28:292 (2000). Также доступны компьютерные алгоритмы для оптимизации кодонов определенной последовательности для экспрессии в определенной клетке-хозяине, как, например, также доступный Gene Forge (Aptagen; Джакобус, Пенсильвания). В некоторых вариантах осуществления один или несколько кодонов (к примеру, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более или все кодоны) в последовательности, кодирующей фермент CRISPR, соответствуют наиболее часто используемому кодону для определенной аминокислоты.

В некоторых вариантах осуществления вектор кодирует фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации (NLS), как, например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. В некоторых вариантах осуществления фермент CRISPR содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на амино-конце или рядом с ним, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на карбокси-конце или рядом с ним или комбинацию этого (к примеру, одну или несколько NLS на амино-конце и одну или несколько NLS на карбокси-конце). В тех случаях, когда присутствуют несколько NLS, каждая может быть выбрана независимо от других, так что одна NLS может присутствовать в нескольких копиях и/или в комбинации с одной или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления настоящего изобретения фермент CRISPR содержит самое большее 6 NLS. В некоторых вариантах осуществления считают, что NLS находится рядом с N- или C-концом в тех случаях, когда самая близкая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот вдоль полипетидной цепи от N- или C-конца. Обычно, NLS состоит из одной или нескольких коротких последовательностей положительно заряженных молекул лизина или аргинина, расположенных на поверхности белка, но известны другие типы NLS. Неограничивающие примеры NLS включают NLS-последовательности, полученные из: NLS из большого Т-антигена вируса SV40 с аминокислотной последовательностью PKKKRKV; NLS из нуклеоплазмина (к примеру, двойной NLS из нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK); NLS из c-myc с аминокислотной последовательностью PAAKRVKLD или RQRRNELKRSP; NLS из hRNPA1 M9 с последовательностью NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; последовательность RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV домена IBB из импортина-альфа; последовательности VSRKRPRP и PPKKARED из Т-белка миомы; последовательность POPKKKPL из p53 человека; последовательность SALIKKKKKMAP из c-abl IV мыши; последовательности DRLRR и PKQKKRK из NS1 вируса гриппа; последовательность RKLKKKIKKL из дельта-антигена вируса гепатита; последовательность REKKKFLKRR из белка Mx1 мыши; последовательность KRKGDEVDGVDEVAKKKSKK из поли(АДФ-рибоза)-полимеразы человека и последовательность RKCLQAGMNLEARKTKK из рецепторов стероидных гормонов для глюкокортикоидов (человека).

В целом, одна или несколько NLS являются достаточно эффективными, чтобы управлять накоплением фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В целом, степень проявления активности ядерной локализации может быть результатом следующего: количества NLS в ферменте CRISPR, конкретных(ой) используемых(ой) NLS или комбинации этих факторов. Обнаружение накопления в ядре можно выполнять при помощи любой подходящей методики. Например, детектируемый маркер может быть слит с ферментом CRISPR, так что расположение в клетке может быть визуализировано, как, например, в комбинации со средствами для обнаружения расположения ядра (к примеру, окрашивающим средством, специфичным к ядру, таким как DAPI). Примеры детектируемых маркеров включают флуоресцентные белки (такие как зеленые флуоресцентные белки или GFP; RFP; CFP) и эпитопные метки (HA-метку, flag-метку, SNAP-метку). Ядра клеток также можно выделять из клеток, содержимое которых можно затем анализировать при помощи любого подходящего способа для обнаружения белка, как, например, иммуногистохимии, вестерн-блоттинга или анализа на активность фермента. Накопление в ядре также можно определить опосредованно, как, например, при помощи анализа действия образования комплекса CRISPR (к примеру, анализа на расщепление ДНК или мутацию в целевой последовательности или анализа на измененную при помощи образования комплекса CRISPR и/или активности фермента CRISPR активность экспрессии генов) по сравнению с контролем, который не подвергали воздействию фермента или комплекса CRISPR или подвергали воздействию фермента CRISPR, у которого отсутствуют одна или несколько NLS.

В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательностью, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или более. Оптимальное выравнивание можно определять при помощи любого подходящего алгоритма для выравниваемых последовательностей, неограничивающие примеры которого включают алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (к примеру, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на soap.genomics.org.cn) и Maq (доступный на maq.sourceforge.net). В некоторых вариантах осуществления направляющая последовательность составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов в длину. В некоторых вариантах осуществления направляющая последовательность составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов в длину. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить при помощи любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, которую необходимо исследовать, могут быть доставлены в клетку-хозяина с соответствующей целевой последовательностью, как, например, при помощи трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, при помощи анализа с помощью Surveyor, который описан в данном документе. Подобным образом, расщепление целевой полинуклеотидной последовательности может быть установлено в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, которую необходимо исследовать, и контрольной направляющей последовательности, отличной от тестовой направляющей последовательности, и сравнения воздействий тестовой и контрольной направляющей последовательности на связывание или скорость расщепления целевой последовательности. Другие анализы возможны и будут очевидны специалисту в данной области.

Направляющая последовательность может быть выбрана для целенаправленного воздействия на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки. Иллюстративные целевые последовательности включают те, которые являются уникальными в целевом геноме. Например, для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGG, где NNNNNNNNNNNNXGG (N представляет собой A, G, T или C; и X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGG, где NNNNNNNNNNNXGG (N представляет собой A, G, T или C; и X может быть любым) характеризуется единичным появлением в геноме. Для Cas9 CRISPR1 S. thermophilus уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; и W представляет собой A или T) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 CRISPR1 S. thermophilus в виде MMMMMMMMMNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; и W представляет собой A или T) характеризуется единичным появлением в геноме. Для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGGXG, где NNNNNNNNNNNNXGGXG (N представляет собой A, G, T или C; и X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGGXG, где NNNNNNNNNNNXGGXG (N представляет собой A, G, T или C; и X может быть любым) характеризуется единичным появлением в геноме. В каждой из этих последовательностей “M” может представлять собой A, G, T или C и не должен учитываться при идентификации последовательности как уникальной.

В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в направляющей последовательности. Вторичную структуру можно определить при помощи любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного метода (см., к примеру, A.R. Gruber et al., 2008, Cell 106(1): 23-24; and PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Дополнительные алгоритмы можно найти в заявке на патент США с серийным номером TBA (номер дела у патентного поверенного 44790.11.2022; общая ссылка BI-2013/004A); включенной в данный документ при помощи ссылки.

В общем, парная tracr-последовательность включает любую последовательность, которая характеризуется достаточной комплементарностью с tracr-последовательностью для содействия одному или нескольким из: (1) вырезания направляющей последовательности, фланкированной парными tracr-последовательностями, в клетке, содержащей соответствующую tracr-последовательность; и (2) образования комплекса CRISPR на целевой последовательности, где комплекс CRISPR содержит парную tracr-последовательность, гибридизирующуюся с tracr-последовательностью. В общем, степень комплементарности указана на основании оптимального выравнивания парной tracr-последовательности и tracr-последовательности по длине более короткой из двух последовательностей. Оптимальное выравнивание можно определить при помощи любого подходящего алгоритма выравнивания и можно дополнительно высчитать для вторичных структур, как, например, самокомплементарность в пределах либо tracr-последовательности, либо парной tracr-последовательности. В некоторых вариантах осуществления степень комплементарности между tracr-последовательностью и парной tracr-последовательностью по длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или более. Примерные иллюстрации оптимального выравнивания между tracr-последовательностью и парной tracr-последовательностью представлены на фигурах 12B и 13B. В некоторых вариантах осуществления tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов в длину. В некоторых вариантах осуществления tracr-последовательность и парная tracr-последовательность содержатся в одном транскрипте, так что гибридизация между ними двумя дает транскрипт со вторичной структурой, такой как "шпилька". Предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах составляют четыре нуклеотида в длину и наиболее предпочтительно имеют последовательность GAAA. Однако, можно использовать более короткие или длинные последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, C или G). Примеры петлеобразующих последовательностей включают CAAA и AAAG. В одном варианте осуществления настоящего изобретения траснкрипт или транскрибированная полинуклеотидная последовательность характеризуются по меньшей мере двумя или более "шпильками". В предпочтительных вариантах осуществления транскрипт характеризуется двумя, тремя, четырьмя или пятью "шпильками". В дополнительном варианте осуществления настоящего изобретения транскрипт характеризуется самое большее пятью "шпильками". В некоторых вариантах осуществления один транскрипт дополнительно включает последовательность терминации транскрипции; предпочтительно она является полиТ-последовательностью, например, из шести нуклеотидов T. Примерная иллюстрация такой "шпилечной" структуры представлена в нижней части фигуры 13B, где часть последовательности в 5’ направлении по отношению к концевому “N” и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3’ направлении по отношению к петле соответствует tracr-последовательности. Дополнительными неограничивающими примерами отдельных полинуклеотидов, содержащих направляющую последовательность, парную tracr-последовательность и tracr-последовательность, являются следующие (перечисленные от 5’ к 3’), где “N” представляет собой основание направляющей последовательности, первый блок букв нижнего регистра представляет собой парную tracr-последовательность, а второй блок букв нижнего регистра представляет собой tracr-последовательность, и конечная поли-T-последовательность представляет собой терминатор транскрипции: (1) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (2) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (3) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT; (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT; (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT и (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT. В некоторых вариантах осуществления последовательности (1)-(3) используют в комбинации с Cas9 из CRISPR1 S. thermophilus. В некоторых вариантах осуществления последовательности (4)-(6) используют в комбинации с Cas9 из S. pyogenes. В некоторых вариантах осуществления tracr-последовательность является транскриптом, отдельным от транскрипта, содержащего парную tracr-последовательность (как, например, показанная в верхней части фигуры 13B).

В некоторых вариантах осуществления также предусмотрена матрица для рекомбинации. Матрица для рекомбинации может быть компонентом другого вектора, который описан в данном документе, может содержаться в отдельном векторе или предусматриваться в качестве отдельного полинуклеотида. В некоторых вариантах осуществления матрица для рекомбинации разработана так, чтобы служить в качестве матрицы при гомологичной рекомбинации, как, например, в пределах или рядом с целевой последовательностью, надрезанной или расщепленной ферментом CRISPR, в качестве части комплекса CRISPR. Матричный полинуклеотид может быть любой подходящей длины, как, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 или более нуклеотидов в длину. В некоторых вариантах осуществления матричный полинуклеотид комплементарен части полинуклеотида, содержащего целевую последовательность. При оптимальном выравнивании матричный полинуклеотид может перекрываться с одним или несколькими нуклеотидами целевых последовательностей (к примеру, с приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 или более нуклеотидами). В некоторых вариантах осуществления при оптимальном выравнивании матричных последовательности и полинуклеотида, содержащего целевую последовательность, наиболее близкий нуклеотид матричного полинуклеотида находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от целевой последовательности.

В некоторых вариантах осуществления фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают, без ограничения, эпитопные метки, последовательности генов-репортеров и белковые домены с одним или несколькими из следующих видов активности: метилазной активности, деметилазной активности, активности для активации транскрипции, активности для репрессии транскрипции, активности фактора освобождения при транскрипции, активности для модификации гистонов, активности для расщепления ДНК и активности для связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гистидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (HA), Myc-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают, без ограничения, глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуорисцирующие белки, в том числе синий флуоресцентный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулой ДНК или связываются с другими клеточными молекулами, в том числе, без ограничения, связывающий мальтозу белок (MBP), S-метку, продукты слияния Lex A и ДНК-связывающего домена (DBD), продукты слияния GAL4 и ДНК-связывающего домена и продукты слияния белка BP16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US20110059502, включенном в данный документ при помощи ссылки. В некоторых вариантах осуществления меченный фермент CRISPR используют для идентификации расположения целевой последовательности.

В некоторых аспектах настоящее изобретение предусматривает способы, включающие доставку одного или нескольких полинуклеотидов, как, например, или одного, или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного белка или белков, транскрибируемых с них, в клетку-хозяина. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные при помощи таких способов, и организмы (такие как животные, растения или грибы), содержащие такие клетки или полученные из них. В некоторых вариантах осуществления фермент CRISPR в комбинации с (и необязательно образующий комплекс с) направляющей последовательностью доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы CRISPR, в клетки в культуре и в организме-хозяине. Системы доставки на основе отличных от вирусных векторов включают ДНК-плазмиды, РНК (к примеру, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, как, например, липосому. Системы доставки на основе вирусного вектора включают ДНК- и РНК-вирусы, которые имеют либо эписомальный, либо интегрированный геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., в Current Topics in Microbiology and Immunology, Doerfler and (eds) (1995); и Yu et al., Gene Therapy 1:13-26 (1994).

Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, нуклеофекцию, микроинъекцию, баллистическую трансфекцию, виросомы, липосомы, иммунолипосомы, поликатион или конъюгаты липид:нуклеиновая кислота, "оголенную" ДНК, искусственные вирионы и повышенное средством поглощение ДНК. Липофекция описана, например, в патентах США №№ 5049386, 4946787 и 4897355), и реагенты для липофекции продают в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции с узнаванием рецептора полинуклеотидов, включают таковые из Felgner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, in vitro или ex vivo введение) или целевые ткани (к примеру, in vivo введение).

Получение комплексов липид:нуклеиновая кислота, в том числе целенаправленно воздействующих липосом, как, например, иммунолипидных комплексов, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США №№ 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).

При применении систем на основе РНК- и ДНК-вирусов для доставки нуклеиновых кислот используют тщательно разработанные способы обеспечения целенаправленного воздействия вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo) или их можно использовать для обработки клеток in vitro и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса для переноса генов. Интеграция в геном хозяина возможна со способами переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.

Тропизм ретровирусов может быть изменен путем включения чужеродных белков оболочки, расширяя возможную целевую популяцию целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансфицировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 п.о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко применяемые ретровирусные векторы включают такие, основанные на вирусе лейкоза (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HIV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700). В применениях, в которых транзиентная экспрессия является предпочтительной, можно применять системы на основе аденовирусов. Векторы на основе аденовирусов способны проявлять очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С такими векторами были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе. Векторы на основе аденоассоциированного вируса (“AAV”) также можно использовать для трансдукции в клетки целевых нуклеиновых кислот, к примеру, при получении in vitro нуклеиновых кислот и пептидов и для процедур генной терапии in vivo и ex vivo (см., к примеру, West et al., Virology 160:38-47 (1987); патент США № 4797368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Создание рекомбинантных AAV-векторов описано в ряде публикаций, в том числе в патенте США № 5173414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); и Samulski et al., J. Virol. 63:03822-3828 (1989).

Упаковывающие клетки, как правило, используют для получения вирусных частиц, которые способны инфицировать клетку-хозяина. Такие клетки включают клетки 293, которые упаковывают аденовирус, и клетки Ψ2 или клетки PA317, которые упаковывают ретровирус. Вирусные векторы, используемые в генной терапии, как правило, создают путем получения линии клеток, которые упаковывают вектор на основе нуклеиновой кислоты в вирусную частицу. Векторы обычно содержат минимальные вирусные последовательности, необходимые для упаковки и последующей интеграции в хозяина, при этом другие вирусные последовательности замещены на кассету экспрессии для экспрессии полинуклеотида(ов). Отсутствующие вирусные функции, как правило, обеспечивают во вспомогательном объекте при помощи линии упаковывающих клеток. Например, AAV-векторы, применяемые в генной терапии, как правило, имеют только ITR-последовательности из генома AAV, которые необходимы для упаковки и интеграции в геном хозяина. Вирусная ДНК упакована в линии клеток, которая содержит вспомогательную плазмиду, кодирующую другие гены AAV, а именно rep и cap, но без ITR-последовательностей. Линия клеток также может быть инфицирована аденовирусом в качестве вируса-помощника. Вирус-помощник способствует репликации AAV-вектора и экспрессии генов AAV из вспомогательной плазмиды. Вспомогательная плазмида не упакована в значительном количестве в связи с отсутствием ITR-последовательностей. Инфицирование аденовирусом может быть снижено, к примеру, при помощи тепловой обработки, к которой аденовирус более чувствителен, чем AAV. Дополнительные способы доставки нуклеиновых кислот в клетки известны специалистам в данной области. См., например, US20030087817, включенный в данный документ при помощи ссылки.

В некоторых вариантах осуществления клетка-хозяин транзиентно или не транзиентно трасфицирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетка трансфицирована так, как это в естественных условиях происходит у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, взята из субъекта. В некоторых вариантах осуществления клетка получена из клеток, взятых из субъекта, как, например, линии клеток. Широкий спектр линий клеток для культуры тканей известен в уровне техники. Примеры линий клеток включают, без ограничения, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, клетки BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN / OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линия клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные варианты. Линии клеток доступны из ряда источников, известных специалистам в данной области (см., к примеру, Американскую коллекцию типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную одним или несколькими векторами, описанными в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную компонентами системы CRISPR, которая описана в данном документе (как, например, путем транзиентной трансфекции одним или несколькими векторами или трансфекции РНК), и модифицированную при помощи активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки, которые содержат модификацию, но у которых отсутствует любая другая экзогенная последовательность. В некоторых вариантах осуществления клетки, транзиентно или не транзиентно трансфицированные одним или несколькими векторами, описанными в данном документе, или линии клеток, полученные из таких клеток, использовали при оценивании одного или нескольких тестовых соединений.

В некоторых вариантах осуществления один или несколько векторов, описанных в данном документе, используют для получения отличного от человека трансгенного животного или трансгенного растения. В некоторых вариантах осуществления трансгенным животным является млекопитающее, как, например, мышь, крыса или кролик. В определенных вариантах осуществления организмом или субъектом является растение. В определенных вариантах осуществления организмом, или субъектом, или растением является водоросль. Способы получения трансгенных растений и животных известны в уровне техники и, как правило, начинаются со способа трансфекции клетки, такого как описанный в данном документе.

В одном аспекте настоящее изобретение предусматривает способы модификации целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.

В одном аспекте настоящее изобретение предусматривает способ модификации экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.

С учетом недавних достижений в области геномики сельскохозяйственных культур возможность применения системы CRISPR-Cas для осуществления эффективных и экономичных редактирования генов и манипуляции с ними обеспечит возможность быстрого отбора и сравнения одиночных и мультиплексных генетических манипуляций для трансформирования таких геномов в отношении повышенного производства и улучшенных признаков. В связи с этим делается ссылка на патенты США и публикации патентов США: патент США № 6603061 - опосредованный агробактериями способ трансформации растений (Agrobacterium-Mediated Plant Transformation Method); патент США № 7868149 - последовательности генома растений и их применение (Plant Genome Sequences and Uses Thereof) и US 2009/0100536 - трансгенные растения с улучшенными агротехническими признаками (Transgenic Plants with Enhanced Agronomic Traits), все содержания и раскрытия каждого из которых включены в данный документ при помощи ссылки в полном объеме. При осуществлении на практике настоящего изобретения содержание и раскрытие Morrell et al., “Crop genomics:advances and applications” Nat Rev Genet. 2011 Dec 29;13(2):85-96 также включены в данный документ при помощи ссылки в полном объеме. В преимущественном варианте осуществления настоящего изобретения систему CRISPR/Cas9 используют для конструирования микроводорослей (пример 15). Соответственно, в данном документе ссылка на клетки животных также может быть применима, с учетом необходимых изменений, по отношению к клеткам растений, если явно не следует иное.

В одном аспекте настоящее изобретение предусматривает способы модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает забор клетки или популяции клеток из человека, или отличного от человека животного, или растения (в том числе микроскопических водорослей) и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение (в том числе микроскопические водоросли).

У растений патогены часто являются специфичными по отношению к хозяину. Например, Fusarium oxysporum f. sp. lycopersici вызывает фузариозный вилт томата, но поражает только томат, а F. oxysporum f. dianthii и Puccinia graminis f. sp. tritici поражают только пшеницу. Растения обладают присущими и индуцированными защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может наблюдаться устойчивость видов-нехозяев, например, хозяин и патоген являются несовместимыми. Также может наблюдаться горизонтальная устойчивость, например, частичная устойчивость ко всем расам патогена, обычно контролируемая многими генами, и вертикальная устойчивость, например, полная устойчивость к некоторым расам патогена, но не к другим расам, обычно контролируемая несколькими генами. На уровне взаимодействия генов растения и патогены эволюционируют совместно, а генетические изменения одного уравновешивают изменения другого. Соответственно, используя естественную изменчивость, селекционеры комбинируют наиболее полезные гены для урожайности, качества, однородности, выносливости, устойчивости. Источники генов устойчивости включают нативные или чужеродные сорта, старинные сорта, родственные дикорастущие растения и индуцированные мутации, например, при обработке растительного материала мутагенными средствами. Применяя настоящее изобретение, селекционеры растений получают новый инструмент для индукции мутаций. Соответственно, специалист в данной области может проанализировать геном источников генов устойчивости, а в отношении сортов, имеющих желаемые характеристики или признаки, использовать настоящее изобретение для индукции появления генов устойчивости с большей точностью, чем в случае применявшихся ранее мутагенных средств, и, следовательно, для ускорения и улучшения программ селекции растений.

В одном аспекте настоящее изобретение предусматривает наборы, содержащие любой один или несколько из элементов, раскрытых в приведенных выше способах и композициях. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. Элементы могут быть предоставлены отдельно или в комбинациях и могут быть предоставлены в любом подходящем контейнере, как, например, пузырьке, флаконе или пробирке. В некоторых вариантах осуществления набор включает инструкции на одном или нескольких языках, например, на более чем одном языке.

В некоторых вариантах осуществления набор содержит один или несколько реагентов для применения в способе, в котором используется один или несколько элементов, описанных в данном документе. Реагенты могут быть предоставлены в любом подходящем контейнере. Например, набор может предусматривать один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, которая применима в конкретном анализе, или в форме, которая предусматривает добавление одного или нескольких других компонентов перед применением (к примеру, в форме концентрата или лиофилизированной форме). Буфер может быть любым буфером, в том числе без ограничения буфером с карбонатом натрия, буфером с бикарбонатом натрия, боратным буфером, Tris-буфером, буфером MOPS, буфером HEPES и их комбинациями. В некоторых вариантах осуществления буфер является щелочным. В некоторых вариантах осуществления буфер имеет значение pH от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для встраивания в вектор для того, чтобы имела место функциональная связь направляющей последовательности и регуляторного элемента. В некоторых вариантах осуществления набор содержит матричный полинуклеотид для гомологичной рекомбинации.

В одном аспекте настоящее изобретение предусматривает способы применения одного или нескольких элементов системы CRISPR. Комплекс CRISPR по настоящему изобретению обеспечивает эффективное средство модификации целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению характеризуется большим разнообразием полезных свойств, включая модификацию (например, делецию, вставку, транслокацию, инактивацию, активацию) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, к примеру, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде. Направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.

Целевой полинуклеотид комплекса CRISPR может быть любым полинуклеотидом, эндогенным или экзогенным по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Не желая быть связанными теорией, полагают, что целевая последовательность должна быть ассоциирована с PAM (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Определенные требования в отношении последовательности и длины PAM различаются в зависимости от применяемого фермента CRISPR, но PAM, как правило, является последовательностью в 2-5 пары оснований, прилегающей к протоспейсеру (то есть целевой последовательности). Примеры последовательностей PAM приведены в разделе "Примеры" ниже, и специалист в данной области сможет выявить дополнительные последовательности PAM для применения с данным ферментом CRISPR.

Целевой полинуклеотид комплекса CRISPR может включать некоторое количество ассоциированных с заболеваниями генов и полинуклеотидов, а также ассоциированных с биохимическими путями проведения сигнала генов и полинуклеотидов, которые перечислены в предварительных заявках на патент США 61/736527 и 61/748427 с общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, и BI-2011/008/WSGR, номер в реестре 44063-701.102, соответственно, обе озаглавленные "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИЯ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 12 декабря 2012 г. и 2 января 2013 г., соответственно, содержания всех из которых включены в данный документ при помощи ссылки в полном объеме.

Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическими путями проведения сигнала, к примеру, ассоциированные с биохимическими путями проведения сигнала геном или полинуклеотидом. Примеры целевых полинуклеотидов включают ассоциированные с заболеваниями гены или полинуклеотиды. “Ассоциированный с заболеванием” ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на отклоняющемся от нормы уровне или в отклоняющейся от нормы форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при ненормально высоком уровне; это может быть ген, который начинает экспрессироваться при ненормально низком уровне, где измененная экспрессия коррелирует с появлением и/или развитием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию(и) или генетическое изменение, который непосредственно ответственен или находится в неравновесном сцеплении с геном(ами), который(е) ответственен(ны) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут быть на нормальном уровне или на отклоняющемся от нормального уровне.

Примеры ассоциированных с заболеваниями генов и полинуклеотидов доступны от Института генетической медицины Маккьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information) при Национальной библиотеке медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет.

Примеры ассоциированных с заболеваниями генов и полинуклеотидов перечислены в таблицах A и B. Конкретная информация в отношении заболеваний доступна от Института генетической медицины Маккьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information), Национальной библиотеки медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет. Примеры ассоциированных с биохимическими путями проведения сигнала генов и полинуклеотидов перечислены в таблице C.

Мутации в этих генах и путях могут приводить к продуцированию неправильных белков или белков в несоответствующих количествах, которые воздействуют на функцию. Дополнительные примеры генов, заболеваний и белков, таким образом, включены при помощи ссылки из предварительной заявки на патент США 61/736527, поданной 12 декабря 2012 г., и 61/748427, поданной 2 февраля 2013 г. Такие гены, белки и пути могут быть целевым полинуклеотидом комплекса CRISPR.

Таблица A

ЗАБОЛЕВАНИЕ/НАРУШЕНИЯ ГЕН(Ы) Неоплазия PTEN; ATM; ATR; EGFR; ERBB2; ERBB3; ERBB4; Notch1; Notch2; Notch3; Notch4; AKT; AKT2; AKT3; HIF; HIF1a; HIF3a; Met; HRG; Bcl2; PPAR альфа; PPAR гамма; WT1 (опухоль Вильмса); представители семейства рецепторов FGF (5 представителей: 1, 2, 3, 4, 5); CDKN2a; APC; RB (ретинобластома); MEN1; VHL; BRCA1; BRCA2; AR (андрогеновый рецептор); TSG101; IGF; рецептор IGF; Igf1 (4 варианта); Igf2 (3 варианта); рецептор Igf 1; рецептор Igf 2; Bax; Bcl2; семейство каспаз (9 представителей: 1, 2, 3, 4, 6, 7, 8, 9, 12); Kras; Apc Возрастная дегенерация Abcr; Ccl2; Cc2; cp (церулоплазмин); Timp3; катепсин D; желтого пятна Vldlr; Ccr2 Шизофренические Нейрегулин 1 (Nrg1); Erb4 (рецептор для нейрегулина); Комплексин 1 (Cplx1); Tph1, триптофан-гидроксилаза; Tph2, триптофан-гидроксилаза 2; нейрексин 1; GSK3; GSK3a; GSK3b нарушения 5-HTT (Slc6a4); COMT; DRD (Drd1a); SLC6A3; DAOA; DTNBP1; Dao (Dao1) Связанные с тринуклеотидным повтором HTT (болезнь Гентингтона); SBMA/SMAX1/AR (синдром нарушения Кеннеди); FXN/X25 (атаксия Фридрейха); ATX3 (болезнь Мачадо- Джозефа); ATXN1 и ATXN2 (формы спинально-церебеллярной атаксии); DMPK (миотоническая дистрофия); атрофин-1 и Atn1 (заболевание DRPLA); CBP (Creb-BP - общая нестабильность); VLDLR (болезнь Альцгеймера); Atxn7; Atxn10 Синдром ломкой X-хромосомы FMR2; FXR1; FXR2; mGLUR5 Связанные с секретазой APH-1 (альфа и бета); пресенилин (Psen1); никастрин нарушения (Ncstn); PEN-2 Другие Nos1; Parp1; Nat1; Nat2 Связанные с прионами нарушения Prp ALS SOD1; ALS2; STEX; FUS; TARDBP; VEGF (VEGF-a; VEGF-b; VEGF-c) Привыкание к наркотическим средствам Prkce (алкоголь); Drd2; Drd4; ABAT (алкоголь); GRIA2; Grm5; Grin1; Htr1b; Grin2a; Drd3; Pdyn; Gria1 (алкоголь) Аутизм Mecp2; BZRAP1; MDGA2; Sema5A; нейрексин 1; ломкая X (FMR2 (AFF2); FXR1; FXR2; Mglur5) Болезнь Альцгеймера E1; CHIP; UCH; UBB; Tau; LRP; PICALM; кластерин; PS1; SORL1; CR1; Vldlr; Uba1; Uba3; CHIP28 (Aqp1, аквапорин 1); Uchl1; Uchl3; APP Воспаление IL-10; IL-1 (IL-1a; IL-1b); IL-13; IL-17 (IL-17a (CTLA8); IL- 17b; IL-17c; IL-17d; IL-17f); II-23; Cx3cr1; ptpn22; TNFa; NOD2/CARD15 для IBD; IL-6; IL-12 (IL-12a; IL-12b); CTLA4; Cx3cl1 болезнь Паркинсона x-синуклеин; DJ-1; LRRK2; паркин; PINK1

Таблица B

Заболевания и нарушения, связанные с кровеносной системой и свертыванием Анемия (CDAN1, CDA1, RPS19, DBA, PKLR, PK1, NT5C3, UMPH1, PSN1, RHAG, RH50A, NRAMP2, SPTB, ALAS2, ANH1, ASB, ABCB7, ABC7, ASAT); синдром "голых" лимфоцитов (TAPBP, TPSN, TAP2, ABCB3, PSF2, RING11, MHC2TA, C2TA, RFX5, RFXAP, RFX5), нарушения свертываемости крови (TBXA2R, P2RX1, P2X1); фактор H и фактор H-подобный 1 (HF1, CFH, HUS); фактор V и фактор VIII (MCFD2); недостаток фактора VII (F7); недостаток фактора X (F10); недостаток фактора XI (F11); недостаток фактора XII (F12, HAF); недостаток фактора XIIIA (F13A1, F13A); недостаток фактора XIIIB (F13B); синдром Фанкони (FANCA, FACA, FA1, FA, FAA, FAAP95, FAAP90, FLJ34064, FANCB, FANCC, FACC, BRCA2, FANCD1, FANCD2, FANCD, FACD, FAD, FANCE, FACE, FANCF, XRCC9, FANCG, BRIP1, BACH1, FANCJ, PHF9, FANCL, FANCM, KIAA1596); нарушения по типу гемофагоцитарного лимфогистиоцитоза (PRF1, HPLH2, UNC13D, MUNC13-4, HPLH3, HLH3, FHL3); гемофилия A (F8, F8C, HEMA); гемофилия B (F9, HEMB), геморрагические нарушения (PI, ATT, F5); связанные с лейкоцитами недостаточности и нарушения (ITGB2, CD18, LCAMB, LAD, EIF2B1, EIF2BA, EIF2B2, EIF2B3, EIF2B5, LVWM, CACH, CLE, EIF2B4); серповидно-клеточная анемия (HBB); талассемия (HBA2, HBB, HBD, LCRB, HBA1). Связанные с клеточной дисрегуляцией заболевания и нарушения и онкологические заболевания и нарушения B-клеточная неходжкинская лимфома (BCL7A, BCL7); лейкоз (TAL1, TCL5, SCL, TAL2, FLT3, NBS1, NBS, ZNFN1A1, IK1, LYF1, HOXD4, HOX4B, BCR, CML, PHL, ALL, ARNT, KRAS2, RASK2, GMPS, AF10, ARHGEF12, LARG, KIAA0382, CALM, CLTH, CEBPA, CEBP, CHIC2, BTL, FLT3, KIT, PBT, LPP, NPM1, NUP214, D9S46E, CAN, CAIN, RUNX1, CBFA2, AML1, WHSC1L1, NSD3, FLT3, AF1Q, NPM1, NUMA1, ZNF145, PLZF, PML, MYL, STAT5B, AF10, CALM, CLTH, ARL11, ARLTS1, P2RX7, P2X7, BCR, CML, PHL, ALL, GRAF, NF1, VRNF, WSS, NFNS, PTPN11, PTP2C, SHP2, NS1, BCL2, CCND1, PRAD1, BCL1, TCRA, GATA1, GF1, ERYF1, NFE1, ABL1, NQO1, DIA4, NMOR1, NUP214, D9S46E, CAN, CAIN). Связанные с воспалением и иммунной системой заболевания и нарушения AIDS (KIR3DL1, NKAT3, NKB1, AMB11, KIR3DS1, IFNG, CXCL12, SDF1); аутоиммунный лимфопролиферативный синдром (TNFRSF6, APT1, FAS, CD95, ALPS1A); комбинированный иммунодефицит (IL2RG, SCIDX1, SCIDX, IMD4); HIV-1 (CCL5, SCYA5, D17S136E, TCP228), восприимчивость к HIV или HIV-инфекция (IL10, CSIF, CMKBR2, CCR2, CMKBR5, CCCKR5 (CCR5)); типы иммунодефицита (CD3E, CD3G, AICDA, AID, HIGM2, TNFRSF5, CD40, UNG, DGU, HIGM4, TNFSF5, CD40LG, HIGM1, IGM, FOXP3, IPEX, AIID, XPID, PIDX, TNFRSF14B, TACI); воспаление (IL-10, IL-1 (IL-1a, IL-1b), IL-13, IL-17 (IL-17a (CTLA8), IL-17b, IL-17c, IL-17d, IL-17f), II-23, Cx3cr1, ptpn22, TNFa, NOD2/CARD15 for IBD, IL-6, IL-12 (IL-12a, IL-12b), CTLA4, Cx3cl1); типы тяжелого комбинированного иммунодефицита (SCID) (JAK3, JAKL, DCLRE1C, ARTEMIS, SCIDA, RAG1, RAG2, ADA, PTPRC, CD45, LCA, IL7R, CD3D, T3D, IL2RG, SCIDX1, SCIDX, IMD4). Метаболические, печеночные, почечные и связанные с обменом белка заболевания и нарушения Амилоидная невропатия (TTR, PALB); амилоидоз (APOA1, APP, AAA, CVAP, AD1, GSN, FGA, LYZ, TTR, PALB); цирроз (KRT18, KRT8, CIRH1A, NAIC, TEX292, KIAA1988); муковисцидоз (CFTR, ABCC7, CF, MRP7); болезни накопления гликогена (SLC2A2, GLUT2, G6PC, G6PT, G6PT1, GAA, LAMP2, LAMPB, AGL, GDE, GBE1, GYS2, PYGL, PFKM); аденома печени, 142330 (TCF1, HNF1A, MODY3), печеночная недостаточность, с ранним началом и с неврологическим нарушением (SCOD1, SCO1), недостаточность печеночной липазы (LIPC), гептобластома, рак и виды эпителиомы (CTNNB1, PDGFRL, PDGRL, PRLTS, AXIN1, AXIN, CTNNB1, TP53, P53, LFS1, IGF2R, MPRI, MET, CASP8, MCH5); заболевание по типу медуллярной кистозной нефропатии (UMOD, HNFJ, FJHN, MCKD2, ADMCKD2); фенилкетонурия (PAH, PKU1, QDPR, DHPR, PTS); поликистоз почек и печени (FCYT, PKHD1, ARPKD, PKD1, PKD2, PKD4, PKDTS, PRKCSH, G19P1, PCLD, SEC63). Мышечные/костные заболевания и нарушения Миопатия Беккера (DMD, BMD, MYF6), миопатия Дюшенна (DMD, BMD); мышечная дистрофия Эмери-Дрейфуса (LMNA, LMN1, EMD2, FPLD, CMD1A, HGPS, LGMD1B, LMNA, LMN1, EMD2, FPLD, CMD1A); плече-лопаточно-лицевая миопатия (FSHMD1A, FSHD1A); мышечная дистрофия (FKRP, MDC1C, LGMD2I, LAMA2, LAMM, LARGE, KIAA0609, MDC1D, FCMD, TTID, MYOT, CAPN3, CANP3, DYSF, LGMD2B, SGCG, LGMD2C, DMDA1, SCG3, SGCA, ADL, DAG2, LGMD2D, DMDA2, SGCB, LGMD2E, SGCD, SGD, LGMD2F, CMD1L, TCAP, LGMD2G, CMD1N, TRIM32, HT2A, LGMD2H, FKRP, MDC1C, LGMD2I, TTN, CMD1G, TMD, LGMD2J, POMT1, CAV3, LGMD1C, SEPN1, SELN, RSMD1, PLEC1, PLTN, EBS1); остеопороз (LRP5, BMND1, LRP7, LR3, OPPG, VBCH2, CLCN7, CLC7, OPTA2, OSTM1, GL, TCIRG1, TIRC7, OC116, OPTB1); мышечная атрофия (VAPB, VAPC, ALS8, SMN1, SMA1, SMA2, SMA3, SMA4, BSCL2, SPG17, GARS, SMAD1, CMT2D, HEXB, IGHMBP2, SMUBP2, CATF1, SMARD1). Неврологические и нейрональные заболевания и нарушения ALS (SOD1, ALS2, STEX, FUS, TARDBP, VEGF (VEGF-a, VEGF-b, VEGF-c); болезнь Альцгеймера (APP, AAA, CVAP, AD1, APOE, AD2, PSEN2, AD4, STM2, APBB2, FE65L1, NOS3, PLAU, URK, ACE, DCP1, ACE1, MPO, PACIP1, PAXIP1L, PTIP, A2M, BLMH, BMH, PSEN1, AD3); аутизм (Mecp2, BZRAP1, MDGA2, Sema5A, нейрексин 1, GLO1, MECP2, RTT, PPMX, MRX16, MRX79, NLGN3, NLGN4, KIAA1260, AUTSX2); синдром хрупкой X-хромосомы (FMR2, FXR1, FXR2, mGLUR5); болезнь Гентингтона и подобные этому заболеванию нарушения (HD, IT15, PRNP, PRIP, JPH3, JP3, HDL2, TBP, SCA17); болезнь Паркинсона (NR4A2, NURR1, NOT, TINUR, SNCAIP, TBP, SCA17, SNCA, NACP, PARK1, PARK4, DJ1, PARK7, LRRK2, PARK8, PINK1, PARK6, UCHL1, PARK5, SNCA, NACP, PARK1, PARK4, PRKN, PARK2, PDJ, DBH, NDUFV2); синдром Ретта (MECP2, RTT, PPMX, MRX16, MRX79, CDKL5, STK9, MECP2, RTT, PPMX, MRX16, MRX79, x-синуклеин, DJ-1); шизофрения (нейрегулин 1 (Nrg1), Erb4 (рецептор для нейрегулина), комплексин 1 (Cplx1), Tph1, триптофан-гидроксилаза, Tph2, триптофан-гидроксилаза 2, нейрексин 1, GSK3, GSK3a, GSK3b, 5-HTT (Slc6a4), COMT, DRD (Drd1a), SLC6A3, DAOA, DTNBP1, Dao (Dao1)); связанные с активностью секретазы нарушения (APH-1 (альфа и бета), пресенилин (Psen1), никастрин, (Ncstn), PEN-2, Nos1, Parp1, Nat1, Nat2); связанные с тринуклеотидным повтором нарушения (HTT (болезнь Гентингтона), SBMA/SMAX1/AR (болезнь Кеннеди), FXN/X25 (атаксия Фридрейха), ATX3 (болезнь Мачадо-Джозефа), ATXN1 и ATXN2 (формы спинально-церебеллярной атаксии), DMPK (миотоническая дистрофия), атрофин-1 и Atn1 (заболевание по типу DRPLA), CBP (Creb-BP - общая нестабильность), VLDLR (болезнь Альцгеймера), Atxn7, Atxn10). Глазные заболевания и нарушения Возрастная дегенерация желтого пятна (Abcr, Ccl2, Cc2, cp (церулоплазмин), Timp3, катепсин D, Vldlr, Ccr2); катаракта (CRYAA, CRYA1, CRYBB2, CRYB2, PITX3, BFSP2, CP49, CP47, CRYAA, CRYA1, PAX6, AN2, MGDA, CRYBA1, CRYB1, CRYGC, CRYG3, CCL, LIM2, MP19, CRYGD, CRYG4, BFSP2, CP49, CP47, HSF4, CTM, HSF4, CTM, MIP, AQP0, CRYAB, CRYA2, CTPP2, CRYBB1, CRYGD, CRYG4, CRYBB2, CRYB2, CRYGC, CRYG3, CCL, CRYAA, CRYA1, GJA8, CX50, CAE1, GJA3, CX46, CZP3, CAE3, CCM1, CAM, KRIT1); помутнение и дистрофия роговицы (APOA1, TGFBI, CSD2, CDGG1, CSD, BIGH3, CDG2, TACSTD2, TROP2, M1S1, VSX1, RINX, PPCD, PPD, KTCN, COL8A2, FECD, PPCD2, PIP5K3, CFD); врожденная плоская роговица (KERA, CNA2); глаукома (MYOC, TIGR, GLC1A, JOAG, GPOA, OPTN, GLC1E, FIP2, HYPL, NRP, CYP1B1, GLC3A, OPA1, NTG, NPG, CYP1B1, GLC3A); амавроз Лебера (CRB1, RP12, CRX, CORD2, CRD, RPGRIP1, LCA6, CORD9, RPE65, RP20, AIPL1, LCA4, GUCY2D, GUC2D, LCA1, CORD6, RDH12, LCA3); макулярная дистрофия (ELOVL4, ADMD, STGD2, STGD3, RDS, RP7, PRPH2, PRPH, AVMD, AOFMD, VMD2).

Таблица C

КЛЕТОЧНАЯ ФУНКЦИЯ ГЕНЫ Передача сигнала с участием PI3K/AKT PRKCE; ITGAM; ITGA5; IRAK1; PRKAA2; EIF2AK2; PTEN; EIF4E; PRKCZ; GRK6; MAPK1; TSC1; PLK1; AKT2; IKBKB; PIK3CA; CDK8; CDKN1B; NFKB2; BCL2; PIK3CB; PPP2R1A; MAPK8; BCL2L1; MAPK3; TSC2; ITGA1; KRAS; EIF4EBP1; RELA; PRKCD; NOS3; PRKAA1; MAPK9; CDK2; PPP2CA; PIM1; ITGB7; YWHAZ; ILK; TP53; RAF1; IKBKG; RELB; DYRK1A; CDKN1A; ITGB1; MAP2K2; JAK1; AKT1; JAK2; PIK3R1; CHUK; PDPK1; PPP2R5C; CTNNB1; MAP2K1; NFKB1; PAK3; ITGB3; CCND1; GSK3A; FRAP1; SFN; ITGA2; TTK; CSNK1A1; BRAF; GSK3B; AKT3; FOXO1; SGK; HSP90AA1; RPS6KB1 Передача сигнала с участием ERK/MAPK PRKCE; ITGAM; ITGA5; HSPB1; IRAK1; PRKAA2; EIF2AK2; RAC1; RAP1A; TLN1; EIF4E; ELK1; GRK6; MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8; CREB1; PRKCI; PTK2; FOS; RPS6KA4; PIK3CB; PPP2R1A; PIK3C3; MAPK8; MAPK3; ITGA1; ETS1; KRAS; MYCN; EIF4EBP1; PPARG; PRKCD; PRKAA1; MAPK9; SRC; CDK2; PPP2CA; PIM1; PIK3C2A; ITGB7; YWHAZ; PPP1CC; KSR1; PXN; RAF1; FYN; DYRK1A; ITGB1; MAP2K2; PAK4; PIK3R1; STAT3; PPP2R5C; MAP2K1; PAK3; ITGB3; ESR1; ITGA2; MYC; TTK; CSNK1A1; CRKL; BRAF; ATF4; PRKCA; SRF; STAT1; SGK Передача сигнала RAC1; TAF4B; EP300; SMAD2; TRAF6; PCAF; ELK1; с участием глюкокортикоидного рецептора MAPK1; SMAD3; AKT2; IKBKB; NCOR2; UBE2I; PIK3CA; CREB1; FOS; HSPA5; NFKB2; BCL2; MAP3K14; STAT5B; PIK3CB; PIK3C3; MAPK8; BCL2L1; MAPK3; TSC22D3; MAPK10; NRIP1; KRAS; MAPK13; RELA; STAT5A; MAPK9; NOS2A; PBX1; NR3C1; PIK3C2A; CDKN1C; TRAF2; SERPINE1; NCOA3; MAPK14; TNF; RAF1; IKBKG; MAP3K7; CREBBP; CDKN1A; MAP2K2; JAK1; IL8; NCOA2; AKT1; JAK2; PIK3R1; CHUK; STAT3; MAP2K1; NFKB1; TGFBR1; ESR1; SMAD4; CEBPB; JUN; AR; AKT3; CCL2; MMP1; STAT1; IL6; HSP90AA1 Передача сигнала для аксонального наведения PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; ADAM12; IGF1; RAC1; RAP1A; EIF4E; PRKCZ; NRP1; NTRK2; ARHGEF7; SMO; ROCK2; MAPK1; PGF; RAC2; PTPN11; GNAS; AKT2; PIK3CA; ERBB2; PRKCI; PTK2; CFL1; GNAQ; PIK3CB; CXCL12; PIK3C3; WNT11; PRKD1; GNB2L1; ABL1; MAPK3; ITGA1; KRAS; RHOA; PRKCD; PIK3C2A; ITGB7; GLI2; PXN; VASP; RAF1; FYN; ITGB1; MAP2K2; PAK4; ADAM17; AKT1; PIK3R1; GLI1; WNT5A; ADAM10; MAP2K1; PAK3; ITGB3; CDC42; VEGFA; ITGA2; EPHA8; CRKL; RND1; GSK3B; AKT3; PRKCA Передача сигнала с участием эфринового рецептора PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; IRAK1; PRKAA2; EIF2AK2; RAC1; RAP1A; GRK6; ROCK2; MAPK1; PGF; RAC2; PTPN11; GNAS; PLK1; AKT2; DOK1; CDK8; CREB1; PTK2; CFL1; GNAQ; MAP3K14; CXCL12; MAPK8; GNB2L1; ABL1; MAPK3; ITGA1; KRAS; RHOA; PRKCD; PRKAA1; MAPK9; SRC; CDK2; PIM1; ITGB7; PXN; RAF1; FYN; DYRK1A; ITGB1; MAP2K2; PAK4; AKT1; JAK2; STAT3; ADAM10; MAP2K1; PAK3; ITGB3; CDC42; VEGFA; ITGA2; EPHA8; TTK; CSNK1A1; CRKL; BRAF; PTPN13; ATF4; AKT3; SGK Передача сигнала ACTN4; PRKCE; ITGAM; ROCK1; ITGA5; IRAK1; на актиновый цитоскелет PRKAA2; EIF2AK2; RAC1; INS; ARHGEF7; GRK6; ROCK2; MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8; PTK2; CFL1; PIK3CB; MYH9; DIAPH1; PIK3C3; MAPK8; F2R; MAPK3; SLC9A1; ITGA1; KRAS; RHOA; PRKCD; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; ITGB7; PPP1CC; PXN; VIL2; RAF1; GSN; DYRK1A; ITGB1; MAP2K2; PAK4; PIP5K1A; PIK3R1; MAP2K1; PAK3; ITGB3; CDC42; APC; ITGA2; TTK; CSNK1A1; CRKL; BRAF; VAV3; SGK Передача сигнала PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4; TGM2; при болезни Гентингтона MAPK1; CAPNS1; AKT2; EGFR; NCOR2; SP1; CAPN2; PIK3CA; HDAC5; CREB1; PRKCI; HSPA5; REST; GNAQ; PIK3CB; PIK3C3; MAPK8; IGF1R; PRKD1; GNB2L1; BCL2L1; CAPN1; MAPK3; CASP8; HDAC2; HDAC7A; PRKCD; HDAC11; MAPK9; HDAC9; PIK3C2A; HDAC3; TP53; CASP9; CREBBP; AKT1; PIK3R1; PDPK1; CASP1; APAF1; FRAP1; CASP2; JUN; BAX; ATF4; AKT3; PRKCA; CLTC; SGK; HDAC6; CASP3 Передача сигнала при апоптозе PRKCE; ROCK1; BID; IRAK1; PRKAA2; EIF2AK2; BAK1; BIRC4; GRK6; MAPK1; CAPNS1; PLK1; AKT2; IKBKB; CAPN2; CDK8; FAS; NFKB2; BCL2; MAP3K14; MAPK8; BCL2L1; CAPN1; MAPK3; CASP8; KRAS; RELA; PRKCD; PRKAA1; MAPK9; CDK2; PIM1; TP53; TNF; RAF1; IKBKG; RELB; CASP9; DYRK1A; MAP2K2; CHUK; APAF1; MAP2K1; NFKB1; PAK3; LMNA; CASP2; BIRC2; TTK; CSNK1A1; BRAF; BAX; PRKCA; SGK; CASP3; BIRC3; PARP1 Передача сигнала с участием B-клеточного рецептора RAC1; PTEN; LYN; ELK1; MAPK1; RAC2; PTPN11; AKT2; IKBKB; PIK3CA; CREB1; SYK; NFKB2; CAMK2A; MAP3K14; PIK3CB; PIK3C3; MAPK8; BCL2L1; ABL1; MAPK3; ETS1; KRAS; MAPK13; RELA; PTPN6; MAPK9; EGR1; PIK3C2A; BTK; MAPK14; RAF1; IKBKG; RELB; MAP3K7; MAP2K2; AKT1; PIK3R1; CHUK; MAP2K1; NFKB1; CDC42; GSK3A; FRAP1; BCL6; BCL10; JUN; GSK3B; ATF4; AKT3; VAV3; RPS6KB1 Передача сигнала ACTN4; CD44; PRKCE; ITGAM; ROCK1; CXCR4; CYBA; при диапедезе лейкоцитов RAC1; RAP1A; PRKCZ; ROCK2; RAC2; PTPN11; MMP14; PIK3CA; PRKCI; PTK2; PIK3CB; CXCL12; PIK3C3; MAPK8; PRKD1; ABL1; MAPK10; CYBB; MAPK13; RHOA; PRKCD; MAPK9; SRC; PIK3C2A; BTK; MAPK14; NOX1; PXN; VIL2; VASP; ITGB1; MAP2K2; CTNND1; PIK3R1; CTNNB1; CLDN1; CDC42; F11R; ITK; CRKL; VAV3; CTTN; PRKCA; MMP1; MMP9 Передача сигнала с участием интегрина ACTN4; ITGAM; ROCK1; ITGA5; RAC1; PTEN; RAP1A; TLN1; ARHGEF7; MAPK1; RAC2; CAPNS1; AKT2; CAPN2; PIK3CA; PTK2; PIK3CB; PIK3C3; MAPK8; CAV1; CAPN1; ABL1; MAPK3; ITGA1; KRAS; RHOA; SRC; PIK3C2A; ITGB7; PPP1CC; ILK; PXN; VASP; RAF1; FYN; ITGB1; MAP2K2; PAK4; AKT1; PIK3R1; TNK2; MAP2K1; PAK3; ITGB3; CDC42; RND3; ITGA2; CRKL; BRAF; GSK3B; AKT3 Передача сигнала IRAK1; SOD2; MYD88; TRAF6; ELK1; MAPK1; PTPN11; при острофазном ответе AKT2; IKBKB; PIK3CA; FOS; NFKB2; MAP3K14; PIK3CB; MAPK8; RIPK1; MAPK3; IL6ST; KRAS; MAPK13; IL6R; RELA; SOCS1; MAPK9; FTL; NR3C1; TRAF2; SERPINE1; MAPK14; TNF; RAF1; PDK1; IKBKG; RELB; MAP3K7; MAP2K2; AKT1; JAK2; PIK3R1; CHUK; STAT3; MAP2K1; NFKB1; FRAP1; CEBPB; JUN; AKT3; IL1R1; IL6 Передача сигнала с участием PTEN ITGAM; ITGA5; RAC1; PTEN; PRKCZ; BCL2L11; MAPK1; RAC2; AKT2; EGFR; IKBKB; CBL; PIK3CA; CDKN1B; PTK2; NFKB2; BCL2; PIK3CB; BCL2L1; MAPK3; ITGA1; KRAS; ITGB7; ILK; PDGFRB; INSR; RAF1; IKBKG; CASP9; CDKN1A; ITGB1; MAP2K2; AKT1; PIK3R1; CHUK; PDGFRA; PDPK1; MAP2K1; NFKB1; ITGB3; CDC42; CCND1; GSK3A; ITGA2; GSK3B; AKT3; FOXO1; CASP3; RPS6KB1 Передача сигнала с участием p53 PTEN; EP300; BBC3; PCAF; FASN; BRCA1; GADD45A; BIRC5; AKT2; PIK3CA; CHEK1; TP53INP1; BCL2; PIK3CB; PIK3C3; MAPK8; THBS1; ATR; BCL2L1; E2F1; PMAIP1; CHEK2; TNFRSF10B; TP73; RB1; HDAC9; CDK2; PIK3C2A; MAPK14; TP53; LRDD; CDKN1A; HIPK2; AKT1; PIK3R1; RRM2B; APAF1; CTNNB1; SIRT1; CCND1; PRKDC; ATM; SFN; CDKN2A; JUN; SNAI2; GSK3B; BAX; AKT3 Передача сигнала HSPB1; EP300; FASN; TGM2; RXRA; MAPK1; NQO1; с участием арил-гидрокарбонового рецептора NCOR2; SP1; ARNT; CDKN1B; FOS; CHEK1; SMARCA4; NFKB2; MAPK8; ALDH1A1; ATR; E2F1; MAPK3; NRIP1; CHEK2; RELA; TP73; GSTP1; RB1; SRC; CDK2; AHR; NFE2L2; NCOA3; TP53; TNF; CDKN1A; NCOA2; APAF1; NFKB1; CCND1; ATM; ESR1; CDKN2A; MYC; JUN; ESR2; BAX; IL6; CYP1B1; HSP90AA1 Передача сигнала PRKCE; EP300; PRKCZ; RXRA; MAPK1; NQO1; при метаболизме ксенобиотиков NCOR2; PIK3CA; ARNT; PRKCI; NFKB2; CAMK2A; PIK3CB; PPP2R1A; PIK3C3; MAPK8; PRKD1; ALDH1A1; MAPK3; NRIP1; KRAS; MAPK13; PRKCD; GSTP1; MAPK9; NOS2A; ABCB1; AHR; PPP2CA; FTL; NFE2L2; PIK3C2A; PPARGC1A; MAPK14; TNF; RAF1; CREBBP; MAP2K2; PIK3R1; PPP2R5C; MAP2K1; NFKB1; KEAP1; PRKCA; EIF2AK3; IL6; CYP1B1; HSP90AA1 Передача сигнала с участием SAPK/JNK PRKCE; IRAK1; PRKAA2; EIF2AK2; RAC1; ELK1; GRK6; MAPK1; GADD45A; RAC2; PLK1; AKT2; PIK3CA; FADD; CDK8; PIK3CB; PIK3C3; MAPK8; RIPK1; GNB2L1; IRS1; MAPK3; MAPK10; DAXX; KRAS; PRKCD; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; TRAF2; TP53; LCK; MAP3K7; DYRK1A; MAP2K2; PIK3R1; MAP2K1; PAK3; CDC42; JUN; TTK; CSNK1A1; CRKL; BRAF; SGK Передача сигнала с участием PPAr/RXR PRKAA2; EP300; INS; SMAD2; TRAF6; PPARA; FASN; RXRA; MAPK1; SMAD3; GNAS; IKBKB; NCOR2; ABCA1; GNAQ; NFKB2; MAP3K14; STAT5B; MAPK8; IRS1; MAPK3; KRAS; RELA; PRKAA1; PPARGC1A; NCOA3; MAPK14; INSR; RAF1; IKBKG; RELB; MAP3K7; CREBBP; MAP2K2; JAK2; CHUK; MAP2K1; NFKB1; TGFBR1; SMAD4; JUN; IL1R1; PRKCA; IL6; HSP90AA1; ADIPOQ Передача сигнала с участием NF-KB IRAK1; EIF2AK2; EP300; INS; MYD88; PRKCZ; TRAF6; TBK1; AKT2; EGFR; IKBKB; PIK3CA; BTRC; NFKB2; MAP3K14; PIK3CB; PIK3C3; MAPK8; RIPK1; HDAC2; KRAS; RELA; PIK3C2A; TRAF2; TLR4; PDGFRB; TNF; INSR; LCK; IKBKG; RELB; MAP3K7; CREBBP; AKT1; PIK3R1; CHUK; PDGFRA; NFKB1; TLR2; BCL10; GSK3B; AKT3; TNFAIP3; IL1R1 Передача сигнала с участием нейрегулина ERBB4; PRKCE; ITGAM; ITGA5; PTEN; PRKCZ; ELK1; MAPK1; PTPN11; AKT2; EGFR; ERBB2; PRKCI; CDKN1B; STAT5B; PRKD1; MAPK3; ITGA1; KRAS; PRKCD; STAT5A; SRC; ITGB7; RAF1; ITGB1; MAP2K2; ADAM17; AKT1; PIK3R1; PDPK1; MAP2K1; ITGB3; EREG; FRAP1; PSEN1; ITGA2; MYC; NRG1; CRKL; AKT3; PRKCA; HSP90AA1; RPS6KB1 Передача сигнала CD44; EP300; LRP6; DVL3; CSNK1E; GJA1; SMO; с участием Wnt и бета-катенина AKT2; PIN1; CDH1; BTRC; GNAQ; MARK2; PPP2R1A; WNT11; SRC; DKK1; PPP2CA; SOX6; SFRP2; ILK; LEF1; SOX9; TP53; MAP3K7; CREBBP; TCF7L2; AKT1; PPP2R5C; WNT5A; LRP5; CTNNB1; TGFBR1; CCND1; GSK3A; DVL1; APC; CDKN2A; MYC; CSNK1A1; GSK3B; AKT3; SOX2 Передача сигнала с участием инсулинового рецептора PTEN; INS; EIF4E; PTPN1; PRKCZ; MAPK1; TSC1; PTPN11; AKT2; CBL; PIK3CA; PRKCI; PIK3CB; PIK3C3; MAPK8; IRS1; MAPK3; TSC2; KRAS; EIF4EBP1; SLC2A4; PIK3C2A; PPP1CC; INSR; RAF1; FYN; MAP2K2; JAK1; AKT1; JAK2; PIK3R1; PDPK1; MAP2K1; GSK3A; FRAP1; CRKL; GSK3B; AKT3; FOXO1; SGK; RPS6KB1 Передача сигнала с участием IL-6 HSPB1; TRAF6; MAPKAPK2; ELK1; MAPK1; PTPN11; IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK3; MAPK10; IL6ST; KRAS; MAPK13; IL6R; RELA; SOCS1; MAPK9; ABCB1; TRAF2; MAPK14; TNF; RAF1; IKBKG; RELB; MAP3K7; MAP2K2; IL8; JAK2; CHUK; STAT3; MAP2K1; NFKB1; CEBPB; JUN; IL1R1; SRF; IL6 Холестаз в печени PRKCE; IRAK1; INS; MYD88; PRKCZ; TRAF6; PPARA; RXRA; IKBKB; PRKCI; NFKB2; MAP3K14; MAPK8; PRKD1; MAPK10; RELA; PRKCD; MAPK9; ABCB1; TRAF2; TLR4; TNF; INSR; IKBKG; RELB; MAP3K7; IL8; CHUK; NR1H2; TJP2; NFKB1; ESR1; SREBF1; FGFR4; JUN; IL1R1; PRKCA; IL6 Передача сигнала с участием IGF-1 IGF1; PRKCZ; ELK1; MAPK1; PTPN11; NEDD4; AKT2; PIK3CA; PRKCI; PTK2; FOS; PIK3CB; PIK3C3; MAPK8; IGF1R; IRS1; MAPK3; IGFBP7; KRAS; PIK3C2A; YWHAZ; PXN; RAF1; CASP9; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; IGFBP2; SFN; JUN; CYR61; AKT3; FOXO1; SRF; CTGF; RPS6KB1 NRF2-опосредованный ответ на PRKCE; EP300; SOD2; PRKCZ; MAPK1; SQSTM1; окислительный стресс NQO1; PIK3CA; PRKCI; FOS; PIK3CB; PIK3C3; MAPK8; PRKD1; MAPK3; KRAS; PRKCD; GSTP1; MAPK9; FTL; NFE2L2; PIK3C2A; MAPK14; RAF1; MAP3K7; CREBBP; MAP2K2; AKT1; PIK3R1; MAP2K1; PPIB; JUN; KEAP1; GSK3B; ATF4; PRKCA; EIF2AK3; HSP90AA1 Фиброз печени/активация EDN1; IGF1; KDR; FLT1; SMAD2; FGFR1; MET; PGF; звездчатых клеток печени SMAD3; EGFR; FAS; CSF1; NFKB2; BCL2; MYH9; IGF1R; IL6R; RELA; TLR4; PDGFRB; TNF; RELB; IL8; PDGFRA; NFKB1; TGFBR1; SMAD4; VEGFA; BAX; IL1R1; CCL2; HGF; MMP1; STAT1; IL6; CTGF; MMP9 Передача сигнала с участием PPAR EP300; INS; TRAF6; PPARA; RXRA; MAPK1; IKBKB; NCOR2; FOS; NFKB2; MAP3K14; STAT5B; MAPK3; NRIP1; KRAS; PPARG; RELA; STAT5A; TRAF2; PPARGC1A; PDGFRB; TNF; INSR; RAF1; IKBKG; RELB; MAP3K7; CREBBP; MAP2K2; CHUK; PDGFRA; MAP2K1; NFKB1; JUN; IL1R1; HSP90AA1 Передача сигнала с участием Fc-эпсилон-RI PRKCE; RAC1; PRKCZ; LYN; MAPK1; RAC2; PTPN11; AKT2; PIK3CA; SYK; PRKCI; PIK3CB; PIK3C3; MAPK8; PRKD1; MAPK3; MAPK10; KRAS; MAPK13; PRKCD; MAPK9; PIK3C2A; BTK; MAPK14; TNF; RAF1; FYN; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; AKT3; VAV3; PRKCA Передача сигнала с участием рецептора, PRKCE; RAP1A; RGS16; MAPK1; GNAS; AKT2; IKBKB; связанного с G-белком PIK3CA; CREB1; GNAQ; NFKB2; CAMK2A; PIK3CB; PIK3C3; MAPK3; KRAS; RELA; SRC; PIK3C2A; RAF1; IKBKG; RELB; FYN; MAP2K2; AKT1; PIK3R1; CHUK; PDPK1; STAT3; MAP2K1; NFKB1; BRAF; ATF4; AKT3; PRKCA Метаболизм PRKCE; IRAK1; PRKAA2; EIF2AK2; PTEN; GRK6; инозитолфосфата MAPK1; PLK1; AKT2; PIK3CA; CDK8; PIK3CB; PIK3C3; MAPK8; MAPK3; PRKCD; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; DYRK1A; MAP2K2; PIP5K1A; PIK3R1; MAP2K1; PAK3; ATM; TTK; CSNK1A1; BRAF; SGK Передача сигнала с участием PDGF EIF2AK2; ELK1; ABL2; MAPK1; PIK3CA; FOS; PIK3CB; PIK3C3; MAPK8; CAV1; ABL1; MAPK3; KRAS; SRC; PIK3C2A; PDGFRB; RAF1; MAP2K2; JAK1; JAK2; PIK3R1; PDGFRA; STAT3; SPHK1; MAP2K1; MYC; JUN; CRKL; PRKCA; SRF; STAT1; SPHK2 Передача сигнала с участием VEGF ACTN4; ROCK1; KDR; FLT1; ROCK2; MAPK1; PGF; AKT2; PIK3CA; ARNT; PTK2; BCL2; PIK3CB; PIK3C3; BCL2L1; MAPK3; KRAS; HIF1A; NOS3; PIK3C2A; PXN; RAF1; MAP2K2; ELAVL1; AKT1; PIK3R1; MAP2K1; SFN; VEGFA; AKT3; FOXO1; PRKCA Передача сигнала с участием клеток натуральных киллеров PRKCE; RAC1; PRKCZ; MAPK1; RAC2; PTPN11; KIR2DL3; AKT2; PIK3CA; SYK; PRKCI; PIK3CB; PIK3C3; PRKD1; MAPK3; KRAS; PRKCD; PTPN6; PIK3C2A; LCK; RAF1; FYN; MAP2K2; PAK4; AKT1; PIK3R1; MAP2K1; PAK3; AKT3; VAV3; PRKCA Клеточный цикл: G1/S- HDAC4; SMAD3; SUV39H1; HDAC5; CDKN1B; BTRC; контрольной точки регуляция ATR; ABL1; E2F1; HDAC2; HDAC7A; RB1; HDAC11; HDAC9; CDK2; E2F2; HDAC3; TP53; CDKN1A; CCND1; E2F4; ATM; RBL2; SMAD4; CDKN2A; MYC; NRG1; GSK3B; RBL1; HDAC6 Передача сигнала с участием T-клеточного рецептора RAC1; ELK1; MAPK1; IKBKB; CBL; PIK3CA; FOS; NFKB2; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; RELA; PIK3C2A; BTK; LCK; RAF1; IKBKG; RELB; FYN; MAP2K2; PIK3R1; CHUK; MAP2K1; NFKB1; ITK; BCL10; JUN; VAV3 Передача сигнала с участием рецептора смерти CRADD; HSPB1; BID; BIRC4; TBK1; IKBKB; FADD; FAS; NFKB2; BCL2; MAP3K14; MAPK8; RIPK1; CASP8; DAXX; TNFRSF10B; RELA; TRAF2; TNF; IKBKG; RELB; CASP9; CHUK; APAF1; NFKB1; CASP2; BIRC2; CASP3; BIRC3 Передача сигнала с участием FGF RAC1; FGFR1; MET; MAPKAPK2; MAPK1; PTPN11; AKT2; PIK3CA; CREB1; PIK3CB; PIK3C3; MAPK8; MAPK3; MAPK13; PTPN6; PIK3C2A; MAPK14; RAF1; AKT1; PIK3R1; STAT3; MAP2K1; FGFR4; CRKL; ATF4; AKT3; PRKCA; HGF Передача сигнала с участием GM-CSF LYN; ELK1; MAPK1; PTPN11; AKT2; PIK3CA; CAMK2A; STAT5B; PIK3CB; PIK3C3; GNB2L1; BCL2L1; MAPK3; ETS1; KRAS; RUNX1; PIM1; PIK3C2A; RAF1; MAP2K2; AKT1; JAK2; PIK3R1; STAT3; MAP2K1; CCND1; AKT3; STAT1 Передача сигнала при амиотрофическом BID; IGF1; RAC1; BIRC4; PGF; CAPNS1; CAPN2; латеральном склерозе PIK3CA; BCL2; PIK3CB; PIK3C3; BCL2L1; CAPN1; PIK3C2A; TP53; CASP9; PIK3R1; RAB5A; CASP1; APAF1; VEGFA; BIRC2; BAX; AKT3; CASP3; BIRC3 Передача сигнала с участием JAK/Stat PTPN1; MAPK1; PTPN11; AKT2; PIK3CA; STAT5B; PIK3CB; PIK3C3; MAPK3; KRAS; SOCS1; STAT5A; PTPN6; PIK3C2A; RAF1; CDKN1A; MAP2K2; JAK1; AKT1; JAK2; PIK3R1; STAT3; MAP2K1; FRAP1; AKT3; STAT1 Метаболизм PRKCE; IRAK1; PRKAA2; EIF2AK2; GRK6; MAPK1; никатинола и никотинамида PLK1; AKT2; CDK8; MAPK8; MAPK3; PRKCD; PRKAA1; PBEF1; MAPK9; CDK2; PIM1; DYRK1A; MAP2K2; MAP2K1; PAK3; NT5E; TTK; CSNK1A1; BRAF; SGK Передача сигнала с участием хемокина CXCR4; ROCK2; MAPK1; PTK2; FOS; CFL1; GNAQ; CAMK2A; CXCL12; MAPK8; MAPK3; KRAS; MAPK13; RHOA; CCR3; SRC; PPP1CC; MAPK14; NOX1; RAF1; MAP2K2; MAP2K1; JUN; CCL2; PRKCA Передача сигнала с участием IL-2 ELK1; MAPK1; PTPN11; AKT2; PIK3CA; SYK; FOS; STAT5B; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; SOCS1; STAT5A; PIK3C2A; LCK; RAF1; MAP2K2; JAK1; AKT1; PIK3R1; MAP2K1; JUN; AKT3 Долговременное синаптическое PRKCE; IGF1; PRKCZ; PRDX6; LYN; MAPK1; GNAS; подавление PRKCI; GNAQ; PPP2R1A; IGF1R; PRKD1; MAPK3; KRAS; GRN; PRKCD; NOS3; NOS2A; PPP2CA; YWHAZ; RAF1; MAP2K2; PPP2R5C; MAP2K1; PRKCA Передача сигнала TAF4B; EP300; CARM1; PCAF; MAPK1; NCOR2; с участием эстрогенового рецептора SMARCA4; MAPK3; NRIP1; KRAS; SRC; NR3C1; HDAC3; PPARGC1A; RBM9; NCOA3; RAF1; CREBBP; MAP2K2; NCOA2; MAP2K1; PRKDC; ESR1; ESR2 Путь TRAF6; SMURF1; BIRC4; BRCA1; UCHL1; NEDD4; убиквитинирования белков CBL; UBE2I; BTRC; HSPA5; USP7; USP10; FBXW7; USP9X; STUB1; USP22; B2M; BIRC2; PARK2; USP8; USP1; VHL; HSP90AA1; BIRC3 Передача сигнала с участием IL-10 TRAF6; CCR1; ELK1; IKBKB; SP1; FOS; NFKB2; MAP3K14; MAPK8; MAPK13; RELA; MAPK14; TNF; IKBKG; RELB; MAP3K7; JAK1; CHUK; STAT3; NFKB1; JUN; IL1R1; IL6 Активация VDR/RXR PRKCE; EP300; PRKCZ; RXRA; GADD45A; HES1; NCOR2; SP1; PRKCI; CDKN1B; PRKD1; PRKCD; RUNX2; KLF4; YY1; NCOA3; CDKN1A; NCOA2; SPP1; LRP5; CEBPB; FOXO1; PRKCA Передача сигнала с участием TGF-бета EP300; SMAD2; SMURF1; MAPK1; SMAD3; SMAD1; FOS; MAPK8; MAPK3; KRAS; MAPK9; RUNX2; SERPINE1; RAF1; MAP3K7; CREBBP; MAP2K2; MAP2K1; TGFBR1; SMAD4; JUN; SMAD5 Передача сигнала с участием Toll-подобного рецептора IRAK1; EIF2AK2; MYD88; TRAF6; PPARA; ELK1; IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK13; RELA; TLR4; MAPK14; IKBKG; RELB; MAP3K7; CHUK; NFKB1; TLR2; JUN Передача сигнала с участием p38 MAPK HSPB1; IRAK1; TRAF6; MAPKAPK2; ELK1; FADD; FAS; CREB1; DDIT3; RPS6KA4; DAXX; MAPK13; TRAF2; MAPK14; TNF; MAP3K7; TGFBR1; MYC; ATF4; IL1R1; SRF; STAT1 Передача сигнала с участием нейротрофин/TRK NTRK2; MAPK1; PTPN11; PIK3CA; CREB1; FOS; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; PIK3C2A; RAF1; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; CDC42; JUN; ATF4 Активация FXR/RXR INS; PPARA; FASN; RXRA; AKT2; SDC1; MAPK8; APOB; MAPK10; PPARG; MTTP; MAPK9; PPARGC1A; TNF; CREBBP; AKT1; SREBF1; FGFR4; AKT3; FOXO1 Долговременное синаптическое PRKCE; RAP1A; EP300; PRKCZ; MAPK1; CREB1; потенцирование PRKCI; GNAQ; CAMK2A; PRKD1; MAPK3; KRAS; PRKCD; PPP1CC; RAF1; CREBBP; MAP2K2; MAP2K1; ATF4; PRKCA Передача сигнала с участием кальция RAP1A; EP300; HDAC4; MAPK1; HDAC5; CREB1; CAMK2A; MYH9; MAPK3; HDAC2; HDAC7A; HDAC11; HDAC9; HDAC3; CREBBP; CALR; CAMKK2; ATF4; HDAC6 Передача сигнала с участием EGF ELK1; MAPK1; EGFR; PIK3CA; FOS; PIK3CB; PIK3C3; MAPK8; MAPK3; PIK3C2A; RAF1; JAK1; PIK3R1; STAT3; MAP2K1; JUN; PRKCA; SRF; STAT1 Передача сигнала при гипоксии в EDN1; PTEN; EP300; NQO1; UBE2I; CREB1; ARNT; сердечно-сосудистой системе HIF1A; SLC2A4; NOS3; TP53; LDHA; AKT1; ATM; VEGFA; JUN; ATF4; VHL; HSP90AA1 LPS/IL-1 опосредованное ингибирование IRAK1; MYD88; TRAF6; PPARA; RXRA; ABCA1; функции RXR MAPK8; ALDH1A1; GSTP1; MAPK9; ABCB1; TRAF2; TLR4; TNF; MAP3K7; NR1H2; SREBF1; JUN; IL1R1 Активация LXR/RXR FASN; RXRA; NCOR2; ABCA1; NFKB2; IRF3; RELA; NOS2A; TLR4; TNF; RELB; LDLR; NR1H2; NFKB1; SREBF1; IL1R1; CCL2; IL6; MMP9 Переработка амилоида PRKCE; CSNK1E; MAPK1; CAPNS1; AKT2; CAPN2; CAPN1; MAPK3; MAPK13; MAPT; MAPK14; AKT1; PSEN1; CSNK1A1; GSK3B; AKT3; APP Передача сигнала с участием IL-4 AKT2; PIK3CA; PIK3CB; PIK3C3; IRS1; KRAS; SOCS1; PTPN6; NR3C1; PIK3C2A; JAK1; AKT1; JAK2; PIK3R1; FRAP1; AKT3; RPS6KB1 Клеточный цикл: регуляция G2/M-контрольной точки при EP300; PCAF; BRCA1; GADD45A; PLK1; BTRC; повреждении CHEK1; ATR; CHEK2; YWHAZ; TP53; CDKN1A; ДНК PRKDC; ATM; SFN; CDKN2A Передача сигнала с участием оксида азота в KDR; FLT1; PGF; AKT2; PIK3CA; PIK3CB; PIK3C3; сердечно-сосудистой системе CAV1; PRKCD; NOS3; PIK3C2A; AKT1; PIK3R1; VEGFA; AKT3; HSP90AA1 Метаболизм пуринов NME2; SMARCA4; MYH9; RRM2; ADAR; EIF2AK4; PKM2; ENTPD1; RAD51; RRM2B; TJP2; RAD51C; NT5E; POLD1; NME1 cAMP-опосредованная передача сигнала RAP1A; MAPK1; GNAS; CREB1; CAMK2A; MAPK3; SRC; RAF1; MAP2K2; STAT3; MAP2K1; BRAF; ATF4 Митохондриальная дисфункция SOD2; MAPK8; CASP8; MAPK10; MAPK9; CASP9; PARK7; PSEN1; PARK2; APP; CASP3 Передача сигнала Notch HES1; JAG1; NUMB; NOTCH4; ADAM17; NOTCH2; PSEN1; NOTCH3; NOTCH1; DLL4 Путь при стрессе, связанном с HSPA5; MAPK8; XBP1; TRAF2; ATF6; CASP9; ATF4; эндоплазматическим ретикулумом EIF2AK3; CASP3 Метаболизм пиримидинов NME2; AICDA; RRM2; EIF2AK4; ENTPD1; RRM2B; NT5E; POLD1; NME1 Передача сигнала при болезни Паркинсона UCHL1; MAPK8; MAPK13; MAPK14; CASP9; PARK7; PARK2; CASP3 Передача сигнала GNAS; GNAQ; PPP2R1A; GNB2L1; PPP2CA; PPP1CC; в сердце и с участием бета-адренергических рецепторов PPP2R5C Гликолиз/гликонеогенез HK2; GCK; GPI; ALDH1A1; PKM2; LDHA; HK1 Передача сигнала с участием интерферона IRF1; SOCS1; JAK1; JAK2; IFITM1; STAT1; IFIT3 Передача сигнала с участием Sonic Hedgehog ARRB2; SMO; GLI2; DYRK1A; GLI1; GSK3B; DYRK1B Метаболизм PLD1; GRN; GPAM; YWHAZ; SPHK1; SPHK2 глицерофосфолипидов Разрушение фосфолипидов PRDX6; PLD1; GRN; YWHAZ; SPHK1; SPHK2 Метаболизм триптофана SIAH2; PRMT5; NEDD4; ALDH1A1; CYP1B1; SIAH1 Разрушение лизина SUV39H1; EHMT2; NSD1; SETD7; PPP2R5C Путь эксцизионной репарации ERCC5; ERCC4; XPA; XPC; ERCC1 нуклеотидов Метаболизм UCHL1; HK2; GCK; GPI; HK1 крахмала и сахарозы Метаболизм аминосахаров NQO1; HK2; GCK; HK1 Метаболизм PRDX6; GRN; YWHAZ; CYP1B1 арахидоновой кислоты Передача сигнала с вовлечением циркадного ритма CSNK1E; CREB1; ATF4; NR1D1 Коагулирующая система BDKRB1; F2R; SERPINE1; F3 Передача сигнала PPP2R1A; PPP2CA; PPP1CC; PPP2R5C с участием допаминового рецептора Метаболизм глутатиона IDH2; GSTP1; ANPEP; IDH1 Метаболизм глицеролипидов ALDH1A1; GPAM; SPHK1; SPHK2 Метаболизм линолевой кислоты PRDX6; GRN; YWHAZ; CYP1B1 Метаболизм метионина DNMT1; DNMT3B; AHCY; DNMT3A Метаболизм пирувата GLO1; ALDH1A1; PKM2; LDHA Метаболизм ALDH1A1; NOS3; NOS2A аргинина и пролина Передача сигнала с участием эйкозаноидов PRDX6; GRN; YWHAZ Метаболизм HK2; GCK; HK1 фруктозы и маннозы Метаболизм галактозы HK2; GCK; HK1 Биосинтез стильбена, кумарина и PRDX6; PRDX1; TYR лигнина Путь CALR; B2M с презентацией антигена Биосинтез стероидов NQO1; DHCR7 Метаболизм бутаноата ALDH1A1; NLGN1 Цикл цитрата IDH2; IDH1 Метаболизм жирных кислот ALDH1A1; CYP1B1 Метаболизм PRDX6; CHKA глицерофосфолипидов Метаболизм гистидина PRMT5; ALDH1A1 Метаболизм инозитола ERO1L; APEX1 Метаболизм ксенобиотиков GSTP1; CYP1B1 Метаболизм метана с участием цитохрома p450 PRDX6; PRDX1 Метаболизм фенилаланина PRDX6; PRDX1 Метаболизм пропаноата ALDH1A1; LDHA Метаболизм PRMT5; AHCY селеноаминокислоты Метаболизм сфинголипидов SPHK1; SPHK2 Метаболизм PRMT5 аминофосфоната Метаболизм PRMT5 андрогена и эстрогена Метаболизм ALDH1A1 аскорбата и альдарата Биосинтез желчных кислот ALDH1A1 Метаболизм цистеина LDHA Биосинтез жирных кислот FASN Передача сигнала GNB2L1 с участием глутаматного рецептора NRF2-опосредованный ответ на PRDX1 окислительный стресс Пентозофосфатный GPI путь Взаимное превращение UCHL1 пентозы и глюкуроната Метаболизм ретинола ALDH1A1 Метаболизм рибофлавина TYR Метаболизм тирозина PRMT5, TYR Биосинтез убихинона PRMT5 Разрушение валина, лейцина и ALDH1A1 изолейцина Метаболизм глицина, серина и CHKA треонина Разрушение лизина ALDH1A1 Боль/вкус TRPM5; TRPA1 Боль TRPM7; TRPC5; TRPC6; TRPC1; Cnr1; cnr2; Grk2; Trpa1; Pomc; Cgrp; Crf; Pka; Era; Nr2b; TRPM5; Prkaca; Prkacb; Prkar1a; Prkar2a Митохондриальная функция AIF; CytC; SMAC (Diablo); Aifm-1; Aifm-2 Неврология развития BMP-4; хордин (Chrd); ноггин (Nog); WNT (Wnt2; Wnt2b; Wnt3a; Wnt4; Wnt5a; Wnt6; Wnt7b; Wnt8b; Wnt9a; Wnt9b; Wnt10a; Wnt10b; Wnt16); бета-катенин; Dkk-1; связанные с ожогом белки; Otx-2; Gbx2; FGF-8; Reelin; Dab1; unc-86 (Pou4f1 или Brn3a); Numb; Reln

Варианты осуществления настоящего изобретения также относятся к способам и композициям, связанным с нокаутированием генов, амплифицированием генов и репарацией конкретных мутаций, ассоциированных с нестабильностью ДНК-повторов и неврологическими нарушениями (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical). Как было обнаружено, определенные аспекты последовательностей тандемных повторов ответственны за более двадцати заболеваний человека (New insights into repeat instability: role of RNA⋅DNA hybrids. McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8). Система CRISPR-Cas может быть приспособлена для корректировки таких дефектов геномной нестабильности.

Дополнительный аспект настоящего изобретения относится к использованию системы CRISPR-Cas для корректирования дефектов в генах EMP2A и EMP2B, которые, как было обнаружено, ассоциированы с болезнью Лафора. Болезнь Лафора представляет собой аутосомно-рецессивное состояние, которое характеризуется прогрессирующей миоклонус-эпилепсией, которая может начинаться в виде эпелиптических приступов в подростковом возрасте. Некоторые случаи заболевания могут вызываться мутациями в генах, которые уже были выявлены. Заболевание вызывает приступы, мышечные спазмы, затрудненную ходьбу, слабоумие и, в конечном итоге, смерть. В настоящее время не существует терапии, которая показала эффективность против развития заболевания. На другие генетические расстройства, ассоциированные с эпилепсией, также можно целенаправленно воздействовать при помощи системы CRISPR-Cas, и лежащая в основе генетика дополнительно описана в Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009).

В еще одном аспекте настоящего изобретения систему CRISPR-Cas можно использовать для корректировки офтальмологических дефектов, которые являются результатом нескольких генетических мутаций, дополнительно описанных в Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.

Некоторые дополнительные аспекты настоящего изобретения связаны с корректированием дефектов, ассоциированных с широким спектром генетических заболеваний, которые дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания" ("Genetic Disorders") (веб-сайт по адресу health.nih.gov/topic/GeneticDisorders). Наследственные заболевания головного мозга могут включать, без ограничения, адренолейкодистрофию, агенезию мозолистого тела, синдром Айкарди, синдром Альперса, болезнь Альцгеймера, синдром Барта, болезнь Баттена, CADASIL, мозжечковую дегенерацию, болезнь Фабри, синдром Герстмана-Штраусслера-Шейнкера, болезнь Гентингтона и другие связанные с триплетным повтором нарушения, болезнь Лея, синдром Леша-Найхана, болезнь Менкеса, типы митохондриальной миопатии и кольпоцефалию по критериям NINDS. Такие заболевания дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания головного мозга" ("Genetic Brain Disorders").

В некоторых вариантах осуществления состоянием может быть неоплазия. В некоторых вариантах осуществления, где состоянием является неоплазия, гены, на которые целенаправленной воздействуют, являются любыми из перечисленных в таблице A (в данном случае PTEN и так далее). В некоторых вариантах осуществления состоянием может быть возрастная дегенерация желтого пятна. В некоторых вариантах осуществления состоянием может быть шизофреническое нарушение. В некоторых вариантах осуществления состоянием может быть связанное с тринуклеотидным повтором нарушение. В некоторых вариантах осуществления состоянием может быть синдром ломкой X-хромосомы. В некоторых вариантах осуществления состоянием может быть связанное с секретазой нарушение. В некоторых вариантах осуществления состоянием может быть связанное с прионами нарушение. В некоторых вариантах осуществления состоянием может быть ALS. В некоторых вариантах осуществления состоянием может быть привыкание к наркотическим средствам. В некоторых вариантах осуществления состоянием может быть аутизм. В некоторых вариантах осуществления состоянием может быть болезнь Альцгеймера. В некоторых вариантах осуществления состоянием может быть воспаление. В некоторых вариантах осуществления состоянием может быть болезнь Паркинсона.

Примеры белков, ассоциированных с болезнью Паркинсона, включают, без ограничения, α-синуклеин, DJ-1, LRRK2, PINK1, паркин, UCHL1, синфилин-1 и NURR1.

Примеры связанных с привыканием белков могут включать, например, ABAT.

Примеры связанных с воспалением белков могут включать, например, моноцитарный хемоаттрактантный белок-1 (monocyte chemoattractant protein-1) (MCP1), закодированный геном Ccr2, C-C рецептор хемокина 5 типа (C-C chemokine receptor type 5) (CCR5), закодированный геном Ccr5, IgG-рецептор IIB (IgG receptor IIB) (FCGR2b, также называемый CD32), закодированный геном Fcgr2b, или белок Fc-эпсилон-R1g (Fc epsilon R1g) (FCER1g), закодированный геном Fcer1g.

Примеры ассоциированных с заболеваниями сердечно-сосудистой системы белков могут включать, например, IL1B (интерлейкин 1, бета (interleukin 1, beta)), XDH (ксантиндегидрогеназу (xanthine dehydrogenase)), TP53 (опухолевый белок p53 (tumor protein p53)), PTGIS (простагландин-I2(простациклин)-синтазу (prostaglandin I2 (prostacyclin) synthase)), MB (миоглобин (myoglobin)), IL4 (интерлейкин 4 (interleukin 4)), ANGPT1 (ангиопоэтин 1 (angiopoietin 1)), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8 (ATP-binding cassette, sub-family G (WHITE), member 8)) или CTSK (катепсин K (cathepsin K)).

Примеры ассоциированных с болезнью Альцгеймера белков могут включать, например, белок, представляющий собой рецептор липопротеинов очень низкой плотности (very low density lipoprotein receptor protein) (VLDLR), закодированный геном VLDLR, убиквитин-подобный модификатор-активирующий фермент 1 (ubiquitin-like modifier activating enzyme 1) (UBA1), закодированный геном UBA1, или белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (NEDD8-activating enzyme E1 catalytic subunit protein) (UBE1C), закодированный геном UBA3.

Примеры белков, ассоциированных с расстройствами аутистического спектра, могут включать, например, белок 1, ассоциированный с периферическим бензодиазепиновым рецептором (benzodiazapine receptor (peripheral) associated protein 1) (BZRAP1), закодированный геном BZRAP1, белок, представитель 2 семейства AF4/FMR2 (AF4/FMR2 family member 2 protein) (AFF2), закодированный геном AFF2 (также называемый MFR2), белок-аутосомный гомолог 1, ассоциированный с умственной отсталостью, связанной с ломкой X-хромосомой (fragile X mental retardation autosomal homolog 1 protein) (FXR1), закодированный геном FXR1, или белок-аутосомный гомлог 2, ассоциированный с умственной отсталостью, связанной с ломкой X-хромосомой (fragile X mental retardation autosomal homolog 2 protein) (FXR2), закодированный геном FXR2.

Примеры белков, ассоциированных с дегенерацией желтого пятна, могут включать, например, АТФ-связывающую кассету, белок-представитель 4 подсемейства A (ABC1) (ATP-binding cassette, sub-family A (ABC1) member 4 protein) (ABCA4), закодированный геном ABCR, белок-аполипротеин E (apolipoprotein E protein) (APOE), закодированный геном APOE, или белок-лиганд 2 хемокина (C-C мотив) (chemokine (C-C motif) Ligand 2 protein) (CCL2), закодированный геном CCL2.

Примеры белков, ассоциированных с шизофренией, могут включать NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B и их комбинации.

Примеры белков, вовлеченных в подавление опухоли, могут включать, например, ATM (мутированный, атаксия-телеангиэктазия (ataxia telangiectasia mutated)), ATR (атаксия-телеангиэктазия- и Rad3-родственный (ataxia telangiectasia and Rad3 related)), EGFR (рецептор эпидермального фактора роста (epidermal growth factor receptor)), ERBB2 (гомолог 2 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 2)), ERBB3 (гомолог 3 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 3)), ERBB4 (гомолог 4 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 4)), Notch 1, Notch2, Notch 3 или Notch 4.

Примеры белков, ассоциированных с нарушением, связанным с активностью секретазы, могут включать, например, PSENEN (presenilin enhancer 2 homolog (C. elegans)), CTSB (катепсин B (cathepsin B)), PSEN1 (пресенилин 1 (presenilin 1)), APP (белок-предшественник бета-амилоида (A4) (amyloid beta (A4) precursor protein)), APH1B (anterior pharynx defective 1 homolog B (C. elegans)), PSEN2 (пресенилин 2 (болезнь Альцгеймера 4) (presenilin 2 (Alzheimer disease 4)) или BACE1 (APP-расщепляющий фермент 1 по бета-сайту (beta-site APP-cleaving enzyme 1)).

Примеры белков, ассоциированных с амиотрофическим латеральным склерозом, могут включать, например, SOD1 (супероксиддисмутазу 1 (superoxide dismutase 1)), ALS2 (белок, ассоциированный с амиотрофическим латеральным склерозом 2 (amyotrophic lateral sclerosis 2)), FUS (РНК-связывающий белок FUS (fused in sarcoma)), TARDBP (TAR-ДНК связывающий белок (TAR DNA binding protein)), VAGFA (фактор роста эндотелия сосудов A (vascular endothelial growth factor A)), VAGFB (фактор роста эндотелия сосудов B (vascular endothelial growth factor B)) и VAGFC (фактор роста эндотелия сосудов C (vascular endothelial growth factor C)) и любую их комбинацию.

Примеры белков, ассоциированных с прионными болезнями, могут включать SOD1 (супероксиддисмутазу 1), ALS2 (белок, ассоциированный с амиотрофическим латеральным склерозом 2 (amyotrophic lateral sclerosis 2)), FUS (РНК-связывающий белок FUS (fused in sarcoma)), TARDBP (TAR-ДНК связывающий белок (TAR DNA binding protein)), VAGFA (фактор роста эндотелия сосудов A (vascular endothelial growth factor A)), VAGFB (фактор роста эндотелия сосудов B (vascular endothelial growth factor B)) и VAGFC (фактор роста эндотелия сосудов C (vascular endothelial growth factor C)) и любую их комбинацию.

Примеры белков, связанных с нейродегенеративными состояниями при прионных болезнях, могут включать, например, A2M (альфа-2-макроглобулин (Alpha-2-Macroglobulin)), AATF (фактор транскрипции, противодействующий апоптозу (Apoptosis antagonizing transcription factor)), ACPP (простатоспецифическую кислую фосфатазу (Acid phosphatase prostate)), ACTA2 (альфа-актин 2 гладкой мускулатуры аорты (Actin alpha 2 smooth muscle aorta)), ADAM22 (ADAM, металлопептидазный домен (ADAM metallopeptidase domain)), ADORA3 (аденозиновый рецептор A3 типа (Adenosine A3 receptor)) или ADRA1D (альфа-1D адренергический рецептор для альфа-1D адренорецептора (Alpha-1D adrenergic receptor for Alpha-1D adrenoreceptor)).

Примеры белков, ассоциированных с иммунодефицитом, могут включать, например, A2M [альфа-2-макроглобулин (alpha-2-macroglobulin)]; AANAT [арилалкиламин-N-ацетилтрансферазу (arylalkylamine N-acetyltransferase)]; ABCA1 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1 (ATP-binding cassette, sub-family A (ABC1), member 1)]; ABCA2 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 2 (ATP-binding cassette, sub-family A (ABC1), member 2)] или ABCA3 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 3 (ATP-binding cassette, sub-family A (ABC1), member 3)].

Примеры белков, ассоциированных с нарушениями, связанными с тринуклеотидным повтором, включают, например, AR (андрогеновый рецептор (androgen receptor)), FMR1 (белок 1, ассоциированный с умственной отсталостью, связанной с ломкой X-хромосомой (fragile X mental retardation 1)), HTT (хантигтин (huntingtin)) или DMPK (протеинкиназу, ассоциированную с мышечной дистрофией (dystrophia myotonica-protein kinase)), FXN (фратаксин (frataxin)), ATXN2 (атаксин 2 (ataxin 2)).

Примеры белков, ассоциированных с нарушениями передачи нервных импульсов включают, например, SST (соматостатин (somatostatin)), NOS1 (синтазу оксида азота 1 (нейрональную) (nitric oxide synthase 1 (neuronal)), ADRA2A (адренергический, альфа-2A-, рецептор (adrenergic, alpha-2A-, receptor)), ADRA2C (адренергический, альфа-2C-, рецептор (adrenergic, alpha-2C-, receptor)), TACR1 (тахикининовый рецептор 1 (tachykinin receptor 1)) или HTR2c (5-гидрокситриптаминовый (серотониновый) рецептор 2C (5-hydroxytryptamine (serotonin) receptor 2C)).

Примеры последовательностей, ассоциированных с неврологическим развитием, включают, например, A2BP1 [атаксин 2-связывающий белок 1 (ataxin 2-binding protein 1)], AADAT [аминоадипатаминотрансферазу (aminoadipate aminotransferase)], AANAT [арилалкиламин-N-ацетилтрансферазу (arylalkylamine N-acetyltransferase)], ABAT [4-аминобутиратаминтрансферазу (4-aminobutyrate aminotransferase)], ABCA1 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1 (ATP-binding cassette, sub-family A (ABC1), member 1)] или ABCA13 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 13 (ATP-binding cassette, sub-family A (ABC1), member 13)].

Дополнительные примеры предпочтительных состояний, которые подлежат лечению с помощью данной системы, включают те, которые могут быть выбраны из синдрома Айкарди-Гутьереса; болезни Александера; синдрома Аллана-Херндона-Дадли; связанных с геном POLG нарушений; альфа-маннозидоза (II и III тип); синдрома Альстрема; синдрома Ангельмана; атаксии-телеангиэктазии; нейронного высоковидного липофусциноза; бета-талассемии; двусторонней атрофии зрительного нерва и (инфантильной) атрофии зрительного нерва 1 типа; ретинобластомы (двусторонней); болезни Канавана; церебро-окуло-фацио-скелетного синдрома 1 [COFS1]; церебротендинального ксантоматоза; синдрома Корнелии де Ланге; связанных с геном MAPT нарушений; наследственных прионных болезней; синдрома Драве; семейной болезни Альцгеймера с ранним началом; атаксии Фридрейха [FRDA]; синдрома Фринса; фукозидоза; врожденной мышечной дистрофии Фукуямы; галактосиалидоза; болезни Гоше; органической ацидемии; гемофагоцитарного лимфогистиоцитоза; синдрома прогерии Гетчинсона-Гилфорда; муколипидоза II; инфантильной болезни накопления свободной сиаловой кислоты; ассоциированной с геном PLA2G6 нейродегенерации; синдрома Джервелла-Ланге-Нильсена; узелкового врожденного буллезного эпидермолиза; болезни Гентингтона; болезни Краббе (инфантильной); ассоциированного с митохондриальной ДНК синдрома Ли и NARP; синдрома Леша-Найхана; ассоциированной с геном LIS1 лиссэнцефалии; синдрома Лоу; болезни "кленового сиропа"; синдрома дупликации MECP2; связанных с геном ATP7A нарушений обмена меди; связанной с геном LAMA2 мышечной дистрофии; недостаточности арилсульфатазы А; мукополисахаридоза I, II или III типов; связанных с биогенезом пероксисом нарушений, спектра заболеваний по типу синдрома Цельвегера; нарушений по типу нейродегенерации с накоплением железа в головном мозге; недостаточности кислой сфингомиелиназы; болезни Ниманна-Пика C типа; глициновой энцефалопатии; связанных с геном ARX нарушений; нарушений орнитинового цикла; связанного с геном COL1A1/2 несовершенного остеогенеза; синдромов удаления митохондриальной ДНК; связанных с геном PLP1 нарушений; синдрома Перри; синдрома Фелана-МакДермида; болезни накопления гликогена II типа (болезни Помпе) (инфантильной); связанных с геном MAPT нарушений; связанных с геном MECP2 нарушений; эпифизарной точечной хондродисплазии 1 типа костей верхних конечностей или бедренной кости; синдрома Робертса; болезни Сандхоффа; болезни Шиндлера - 1 типа; аденозиндезаминазной недостаточности; синдрома Смита-Лемли-Опитца; спинальной мышечной атрофии; спинально-церебеллярной атаксии с возникновением в младенческом возрасте; недостаточности гексозаминидазы; танатофорной дисплазии 1 типа; связанных с геном коллагена VI типа нарушений; синдрома Ашера I типа; врожденной мышечной дистрофии; синдрома Вольфа-Хиршхорна; недостаточности лизосомной кислой липазы и пигментной ксеродермы.

Как будет понятно, предусматривается, что настоящую систему можно использовать для целенаправленного воздействия на любую представляющую интерес полинуклеотидную последовательность. Некоторые состояния или заболевания, которые можно эффективно лечить с использованием настоящей системы, включены в таблицы выше, и примеры известных на данный момент генов, ассоциированных с такими состояниями, также предоставлены в них. Тем не менее, гены, приведенные в качестве примеров, не являются исчерпывающими.

Примеры

Следующие примеры приведены с целью иллюстрации различных вариантов осуществления настоящего изобретения, и не предполагается, что они ограничивают настоящее изобретение каким-либо образом. Данные примеры совместно со способами, описанными в данном документе, в настоящее время отражают предпочтительные варианты осуществления, являются иллюстративными и не предназначены для ограничения объема настоящего изобретения. Изменения в данном документе и другие применения, которые охватываются сущностью настоящего изобретения, как определено формулой изобретения, будут очевидны специалистам в данной области.

Пример 1: активность комплекса CRISPR в ядре эукариотической клетки

Примером системы CRISPR II типа является локус CRISPR II типа из Streptococcus pyogenes SF370, который содержит группу из 4 генов Cas9, Cas1, Cas2 и Csn1, а также 2 некодирующих элемента РНК, tracrRNA и характерный массив повторяющихся последовательностей (прямых повторов), чередующихся с короткими фрагментами неповторяющихся последовательностей (спейсерами, примерно 30 п.о. каждый). В этой системе двухцепочечный разрыв (DSB) целевой ДНК образовывается в ходе четырех последовательных стадий (фигура 2A). Во-первых, две некодирующих РНК, массив pre-crRNA и tracrRNA, транскрибируются с локуса CRISPR. Во-вторых, tracrRNA гибридизируется с прямыми повторами pre-crRNA, которая затем процессируется в зрелые crRNA, содержащие индивидуальные спейсерные последовательности. В-третьих, комплекс зрелая crRNA:tracrRNA направляет Cas9 к ДНК-мишени, состоящей из протоспейсера и соответствующего PAM, посредством образования гетеродуплекса между спейсерным участком crRNA и протоспейсерной ДНК. И наконец, Cas9 опосредует расщепление целевой ДНК выше PAM с образованием DSB внутри протоспейсера (фигура 2A). В этом примере описывается иллюстративный способ приспособления этой РНК-программируемой нуклеазной системы к управлению активностью комплекса CRISPR в ядрах эукариотических клеток.

Клеточная культура и трансфекция

Линию клеток почки человеческого эмбриона (HEK), HEK 293FT (Life Technologies), поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100 ед./мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% CO₂. Линию мышиных клеток neuro2A (N2A) (ATCC) поддерживали в DMEM, дополненной 5% фетальной бычьей сывороткой (HyClone), 2 мМ GlutaMAX (Life Technologies), 100 ед./мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с 5% CO₂.

Клетки HEK 293FT или N2A высевали в 24-луночные планшеты (Corning) за один день до трансфекции с плотностью 200000 клеток на лунку. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies), следуя рекомендованному производителем протоколу. Для каждой лунки 24-луночного планшета использовали в общей сложности 800 нг плазмид.

Анализ с помощью Surveyor и анализ с помощью секвенирования на предмет наличия модификации генома

Клетки HEK 293FT или N2A трансфицировали плазмидной ДНК, как описано выше. После трансфекции клетки инкубировали при 37°C в течение 72 часов перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью набора QuickExtract DNA extraction kit (Epicentre), следуя протоколу производителя. Вкратце, клетки ресуспендировали в растворе QuickExtract и инкубировали при 65°C в течение 15 минут и при 98°C в течение 10 минут. Экстрагированную геномную ДНК подвергали немедленной обработке или хранили при –20°C.

Геномный участок, окружающий целевой сайт CRISPR, для каждого гена подвергали ПЦР амплификации и продукты очищали с использованием колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10X ПЦР-буфера для Taq-полимеразы (Enzymatics) и водой сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой Surveyor и энхансером S Surveyor (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex TBE (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос в качестве единицы измерения фракции расщепленной ДНК. На фигуре 8 представлена схематическая иллюстрация данного анализа с помощью Surveyor.

Анализ полиморфизма длины рестрикционных фрагментов для обнаружения гомологичной рекомбинации.

Клетки HEK 293FT и N2A трансфицировали плазмидной ДНК и инкубировали при 37°C в течение 72 часов перед экстракцией геномной ДНК, как описано выше. Целевой геномный участок подвергали ПЦР амплификации с использованием праймеров за пределами гомологичных плеч матрицы для гомологичной рекомбинации (HR). ПЦР-продукты разделяли в 1% агарозном геле и экстрагировали с помощью набора MinElute GelExtraction Kit (Qiagen). Очищенные продукты расщепляли с помощью HindIII (Fermentas) и анализировали в 6% полиакриламидном геле Novex TBE (Life Technologies).

Прогнозирование и анализ вторичной структуры РНК

Прогнозирование вторичной структуры РНК осуществляли с использованием доступного в режиме онлайн веб-сервера RNAfold, разработанного в Институте теоретической химии при Венском университете, использующего алгоритм прогнозирования структуры на основе центроидного метода (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).

Анализ интерференции при трансформации бактериальными плазмидами

Элементы локуса 1 CRISPR S. pyogenes, достаточные для активности CRISPR, воспроизводили у E. coli с применением плазмиды pCRISPR (схематически изображенной на фигуре 10A). pCRISPR содержала tracrRNA, SpCas9 и лидерную последовательность, запускающую массив crRNA. Как показано, спейсеры (также упоминаются как “направляющие последовательности”) встраивали в массив crRNA между сайтами BsaI с применением гибридизированных олигонуклеотидов. Контрольные плазмиды, применяемые в анализе интерференции, создавали путем встраивания протоспейсерной последовательности (также упоминающейся как “целевая последовательность”) совместно со смежной последовательностью мотива CRISPR (PAM) в pUC19 (см. фигуру 10B). Контрольная плазмида содержала гены устойчивости к ампициллину. На фигуре 10С представлено схематическое изображение анализа интерференции. Химически компетентные штаммы E. coli, уже несущие pCRISPR и соответствующий спейсер, трансформировали контрольной плазмидой, содержащей соответствующую последовательность протоспейсер-PAM. pUC19 применяли для оценки эффективности трансформации каждого компетентного штамма, несущего pCRISPR. Активность CRISPR приводила к расщеплению плазмиды pPSP, несущей протоспейсер, что устраняло устойчивость к ампициллину, в противном случае обеспечиваемую pUC19, не имеющему протоспейсера. На фигуре 10D представлена компетенция каждого штамма E. coli, несущего pCRISPR, применяемого в анализах, которые изображены на фигуре 4C.

Очистка РНК

Клетки HEK 293FT поддерживали и трансфицировали, как указано выше. Клетки собирали путем трипсинизации с последующим промыванием в фосфатно-солевом буфере (PBS). Общую клеточную РНК экстрагировали с помощью реагента TRI (Sigma), следуя протоколу производителя. Выполняли количественный анализ общей экстрагированной РНК с использованием Naonodrop (Thermo Scientific) и данные нормализовали к такой же концентрации.

Анализ экспрессии crRNA и tracrRNA в клетках млекопитающих с помощью нозерн-блоттинга

РНК смешивали с равными объемами 2X загрузочного буфера (Ambion), нагревали до 95°C в течение 5 мин., охлаждали на льду в течение 1 мин, а затем загружали в 8% денатурирующие полиакриламидные гели (SequaGel, National Diagnostics) после предварительного прогона геля в течение по меньшей мере 30 минут. Образцы подвергали электрофорезу в течение 1,5 часа при предельной мощности 40 Вт. После этого РНК переносили на мембрану Hybond N+ (GE Healthcare) при силе тока 300 мA в устройстве полусухого переноса (Bio-rad) при комнатной температуре в течение 1,5 часа. РНК сшивали с мембраной с использованием кнопки "автоматического сшивания" на приборе для автоматического сшивания с помощью ультрафиолета Stratagene UV Crosslinker the Stratalinker (Stratagene). Мембрану подвергали предварительной гибридизации в буфере для гибридизации ULTRAhyb-Oligo Hybridization Buffer (Ambion) в течение 30 мин с вращением при 42°C, а затем добавляли зонды и проводили гибридизацию в течение ночи. Зонды заказывали у IDT и метили [гамма-³²P] ATP (Perkin Elmer) с использованием полинуклеотид-киназы T4 (New England Biolabs). Мембрану промывали один раз предварительно подогретым (42°C) 2xSSC, 0,5% SDS в течение 1 мин. с последующими двумя промываниями по 30 минут при 42°C. Мембрану экспонировали на люминесцентном экране в течение одного часа или в течение ночи при комнатной температуре, а затем сканировали с использованием устройства для формирования изображения на люминесцентном фосфорном покрытии (Typhoon).

Создание и оценка бактериальной системы CRISPR

Элементы локуса CRISPR, в том числе tracrRNA, Cas9 и лидерную последовательность, подвергали ПЦР амплификации из геномной ДНК Streptococcus pyogenes SF370 с фланкирующими гомологичными плечами для сборки по методу Гибсона. Два сайта BsaI типа IIS вводили между двумя прямыми повторами для обеспечения вставки спейсеров (фигура 9). ПЦР-продукты клонировали в расщепленный с помощью EcoRV pACYC184 ниже промотора tet с использованием мастер-микса для сборки по методу Гибсона Gibson Assembly Master Mix (NEB). Другие эндогенные элементы системы CRISPR пропускали, за исключением последних 50 п.о. Csn2. Олигонуклеотиды (Integrated DNA Technology), кодирующие спейсеры с комплементарными липкими концами клонировали в расщепленный с помощью BsaI вектор pDC000 (NEB), а затем лигировали с использованием лигазы T7 (Enzymatics) с получением плазмид pCRISPR. Контрольные плазмиды, содержащие спейсеры с последовательностями PAM (также называемыми в данном документе “последовательностями мотива CRISPR”), создавали путем лигирования гибридизированных олигонуклеотидов, несущих совместимые липкие концы (Integrated ДНК Technology), в расщепленный с помощью BamHI pUC19. Клонирование для всех конструкций выполняли в штамме JM109 E. coli (Zymo Research).

Клетки, несущие pCRISPR, делали компетентными с применением Z-Competent E. coli Transformation Kit и Buffer Set (Zymo Research, T3001) в соответствии с инструкциями производителя. При анализе трансформации производили оттаивание на льду 50 мкл аликвот компетентных клеток, несущих pCRISPR, и трансформировали 1 нг плазмиды со спейсером или pUC19 в течение 30 минут с последующим 45 секундами теплового шока при 42°C и 2 минутами на льду. Затем добавляли 250 мкл SOC (Invitrogen) с последующей инкубацией со встряхиванием при 37°C в течение 1 ч и высеивали 100 мкл клеток, полученных после SOC, на двойные планшеты для отбора (12,5 мкг/мл хлорамфеникола, 100 мкг/мл ампициллина). Для получения КОЕ/нг ДНК общее число колоний умножали на 3.

Для улучшения экспрессии компонентов CRISPR в клетках млекопитающих два гена из локуса 1 Streptococcus pyogenes SF370 (S. pyogenes) были кодон-оптимизированы, Cas9 (SpCas9) и РНКазы III (SpRNase III). Для обеспечения ядерной локализации клеточный сигнал ядерной локализации (NLS) включали в амино (N)- или карбоксильные (C)-терминальные области и SpCas9, и SpRNase III (фигура 2B). Для обеспечения визуализации экспрессии белков ген флуоресцентного белка в качестве маркера также включали в N- или C-терминальные области обоих белков (фигура 2B). Также был создан вариант SpCas9 с NLS, прикрепленной и к N-, и к C-терминальным областям (2xNLS-SpCas9). Конструкции, содержащие слитый с NLS SpCas9 и SpRNase III трансфицировали в клетки почки эмбриона человека (HEK) 293FT, и было обнаружено, что относительное положение NLS относительно SpCas9 и SpRNase III влияет на их эффективность ядерной локализации. Хотя C-терминальной NLS было достаточно для нацеливания SpRNase III в ядро, прикрепление одной копии этих конкретных NLS либо к N-, либо к C-терминальным областям SpCas9 не было способно обеспечить адекватную ядерную локализацию в этой системе. В этом примере C-терминальная NLS была из нуклеоплазмина (KRPAATKKAGQAKKKK), а C-терминальная NLS был из большого Т-антигена SV40 (PKKKRKV). Из тестируемых вариантов SpCas9 только 2xNLS-SpCas9 проявлял ядерную локализацию (фигура 2B).

tracrRNA из локуса CRISPR S. pyogenes SF370 содержал два сайта инициации транскрипции, дающие начало двум транскриптам из 89 нуклеотидов (нт) и 171 нт, которые затем подвергались процессингу в идентичные зрелые tracrRNA из 75 нт. Более короткие tracrRNA из 89 нт отбирали на предмет экспрессии в клетках млекопитающих (экспрессирующая конструкция изображена на фигуре 7A, с функциональностью, как определено по результатам анализа с помощью Surveyor, показанным на фигуре 7B). Сайты инициации транскрипции обозначены как +1, а также указаны терминатор транскрипции и последовательность, анализированная с помощью нозерн-блоттинга. Экспрессию подвергнутой процессингу tracrRNA также подтверждали с помощью нозерн-блоттинга. На фигуре 7C показаны результаты анализа с помощью нозерн-блоттинга общей РНК, экстрагированной из клеток 293FT, трансфицированных экспрессирующими конструкциями U6, несущими длинную или короткую tracrRNA, а также SpCas9 и DR-EMX1(1)-DR. Левая и правая секции получены с клетками 293FT, трансфицированными без SpRNase III или с таковой, соответственно. U6 являются показателем для контроля загрузки при блоттинге с зондом, нацеленным на малую ядерную РНК (snRNA) U6 человека. Трансфекция экспрессирующей конструкции с короткой tracrRNA приводила к высоким уровням подвергшейся процессингу формы tracrRNA (~75 п.о.). Очень низкие количества длинных tracrRNA обнаруживали при нозерн-блоттинге.

Для стимуляции точной инициации транскрипции промотор U6 на основе РНК-полимеразы III выбирали для управления экспрессией tracrRNA (фигура 2C). Подобным образом, конструкцию на основе промотора U6 разработали для экспрессии массива pre-crRNA, состоящего из одного спейсера, фланкированного двумя прямыми повторами (DR, также включены в выражение “парные tracr-последовательности”; фигура 2C). Исходный спейсер был разработан для нацеливания на целевой сайт из 33 пар оснований (п.о.) (протоспейсер из 30 п.о., а также последовательность мотива CRISPR (PAM) из 3 п.о., соответствующая мотиву узнавания NGG у Cas9) в локусе EMX1 человека (фигура 2C), ключевом гене в развитии коры головного мозга.

Клетки HEK 293FT трансфицировали комбинацией компонентов CRISPR для того, чтобы определить, можно ли при гетерологичной экспрессии системы CRISPR (SpCas9, SpRNase III, tracrRNA и pre-crRNA) в клетках млекопитающих достичь целенаправленного расщепления хромосом млекопитающего. Поскольку DSB в ядрах млекопитающих частично репарируются с помощью пути негомологичного соединения концов (NHEJ), которое приводит к формированию вставок/делеций, анализ с помощью SURVEYOR использовали для выявления потенциальной активности для расщепления в целевом локусе EMX1 (фигура 8) (см., например, Guschin et al., 2010, Methods Mol Biol 649: 247). Совместная трансфекция всех четырех компонентов CRISPR была способна индуцировать расщепление, составляющее до 5,0%, в протоспейсере (см. фигура 2D). Совместная трансфекция всех компонентов CRISPR, за исключением SpRNase III, также индуцировала образование вставок/делеций в протоспейсере на уровне до 4,7%, что указывало на то, что могут существовать эндогенные РНКазы млекопитающих, которые способны помогать созреванию crRNA, такие как, например, родственные ферменты Dicer и Drosha. Удаление любого из трех остальных компонентов ликвидировало активность системы CRISPR для расщепления генома (фигура 2D). Секвенирование по Сэнгеру ампликонов, содержащих целевой локус, подтверждало активность для расщепления: на 43 подвергшихся секвенированию клонов было обнаружено 5 мутированных аллелей (11,6%). В подобных экспериментах с использованием ряда направляющих последовательностей процентные значения содержания вставок/делеций составляли до 29% (см. фигуры 4-7, 12 и 13). Эти результаты определяют трехкомпонентную систему для эффективной опосредованной CRISPR модификации генома в клетках млекопитающих. Для оптимизации эффективности расщепления заявители также определяли, влияют ли различные изоформы tracrRNA на эффективность расщепления, и обнаружили, что в этой иллюстративной системе только короткая (89 п.о.) форма транскрипта была способна опосредовать расщепление локуса генома EMX1 человека (фигура 6B).

На фигуре 14 представлен дополнительный анализ процессинга crRNA в клетках млекопитающих с помощью нозерн-блоттинга. На фигуре 14A показано схематическое изображение вектора экспрессии для одного спейсера, фланкированного двумя прямыми повторами (DR-EMX1(1)-DR). Спейсер из 30 п.о., нацеленный на протоспейсер 1 локуса EMX1 человека (см. фигуру 6), и последовательности прямых повторов показаны в последовательности внизу фигуры 14A. Линия указывает на участок, обратно комплементарную последовательность которого использовали для создания зондов для нозерн-блоттинга для выявления crRNA EMX1(1). На фигуре 14B показаны результаты анализа с помощью нозерн-блоттинга общей РНК, экстрагированной из клеток 293FT, трансфицированных экспрессирующими конструкциями U6, несущими DR-EMX1(1)-DR. Левая и правая секции получены с клетками 293FT, трансфицированными без SpRNase III или с таковой, соответственно. DR-EMX1(1)-DR подвергался процессингу в зрелые crRNA только в присутствии SpCas9 и короткой tracrRNA и не зависел от присутствия SpRNase III. Зрелая crRNA, обнаруженная в общей РНК трансфицированных 293FT, имела длину ~33 п.о. и была короче, чем зрелая crRNA из S. pyogenes длиной 39-42 п.о. Эти результаты демонстрируют, что систему CRISPR можно переместить в эукариотические клетки и перепрограммировать для облегчения расщепления эндогенных целевых полинуклеотидов млекопитающих.

На фигуре 2 показана бактериальная система CRISPR, описанная в этом примере. На фигуре 2A показано схематическое изображение локуса 1 CRISPR из Streptococcus pyogenes SF370 и предполагаемый механизм опосредованного CRISPR расщепления ДНК с помощью этой системы. Зрелая crRNA, подвергшаяся процессингу из массива прямых повторов-спейсеров, направляет Cas9 к мишеням в геноме, состоящим из комплементарных протоспейсеров и протоспейсерного смежного мотива (PAM). При спаривании оснований мишень-спейсер Cas9 опосредует двухцепочечный разрыв в целевой ДНК. На фигуре 2B показано конструирование Cas9 S. pyogenes (SpCas9) и RNase III (SpRNase III) с клеточными сигналами ядерной локализации (NLS) для обеспечения импорта в ядро млекопитающих. На фигуре 2C показана экспрессия SpCas9 и SpRNase III у млекопитающих, управляемая конститутивным промотором EF1a, и массива tracrRNA и pre-crRNA (DR-спейсер-DR), управляемая промотором U6 РНК-полимеразы 3 для стимуляции точной инициации и терминации транскрипции. Протоспейсер из локуса EMX1 человека с удовлетворительной последовательностью PAM использовали в качестве спейсера в массиве pre-crRNA. На фигуре 2D показан анализ с помощью нуклеазы Surveyor для опосредованных SpCas9 минорных вставок и делеций. SpCas9 экспрессировался с SpRNase III, tracrRNA и массивом pre-crRNA, несущим целевой спейсер для EMX1, и без таковых. На фигуре 2E показано схематическое изображение спаривания оснований между целевым локусом и нацеленной на EMX1 crRNA, а также иллюстративная хроматограмма, на которой показана микроделеция, смежная по отношению к сайту расщепления SpCas9. На фигуре 2F показаны мутированные аллели, идентифицированные в результате анализа секвенирования 43 клональных ампликонов, показывающие разнообразие микровставок и микроделеций. Штрихами указаны удаленные основания, а невыровненные или несовпадающие основания указывают на вставки или мутации. Масштабная метка = 10 мкм.

Для дальнейшего упрощения трехкомпонентной системы адаптировали химерную crRNA-tracrRNA гибридную структуру, в которой зрелую crRNA (содержащую направляющую последовательность) сливали с частичной tracrRNA через структуру по типу стебель-петля для имитации естественного дуплекса crRNA:tracrRNA (фигура 3A). Для повышения эффективности совместной доставки создавали бицистронный вектор экспрессии для управления коэкспрессией химерной РНК и SpCas9 в трансфицированных клетках (фигуры 3A и 8). Параллельно, бицистронные векторы использовали для экспрессии pre-crRNA (DR-направляющая последовательность-DR) с SpCas9, чтобы индуцировать процессинг в crRNA с участием отдельно экспрессируемой tracrRNA (сравнение на фигуре 13B: верхняя часть и нижняя часть). На фигуре 9 представлены схематические иллюстрации бицистронных векторов экспрессии для массива pre-crRNA (фигура 9A) или химерных crRNA (представлено короткой линией ниже сайта встраивания направляющей последовательности и выше промотора EF1α на фигуре 9B) с hSpCas9, показывающие положение различных элементов и точки встраивания направляющей последовательности. Расширенная последовательность вокруг положения сайта встраивания направляющей последовательности на фигуре 9B также показывает частичную последовательность DR (GTTTAGAGCTA) и частичную последовательности tracrRNA (TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT). Направляющие последовательности можно встроить между сайтами BbsI с использованием гибридизированных олигонуклеотидов. Структуры последовательностей для олигонуклеотидов показаны ниже схематических иллюстраций на фигуре 9 с указанными подходящими адаптерами лигирования. WPRE представляет собой посттранскрипционный регуляторный элемент вируса гепатита сурков. Эффективность опосредованного химерной РНК расщепления исследовали путем целенаправленного воздействия на тот же локус EMX1, описанный выше. С использованием как анализа с помощью Surveyor, так и секвенирования ампликонов по Сэнгеру авторы настоящего изобретения подтвердили, что химерная структура РНК облегчает расщепление локуса EMX1 человека со степенью модификации примерно 4,7% (фигура 4).

Генерализованность опосредованного CRISPR расщепления в эукариотических клетках исследовали путем целенаправленного воздействия на дополнительные локусы генома как в человеческих, так и мышиных клетках путем конструирования химерных РНК, целенаправленно воздействующих на множественные сайты в EMX1 и PVALB человека, а также на локусы Th мыши. На фигуре 15 показан выбор некоторых дополнительных служащих в качестве мишени протоспейсеров в локусах PVALB человека (фигура 15A) и Th мыши (фигура 15B). Приведены схематические изображения локусов генов и положения трех протоспейсеров в последнем экзоне каждого из них. Подчеркнутые последовательности включают последовательность протоспейсера из 30 п.о. и 3 п.о. на 3’-конце, соответствующую последовательностям PAM. Протоспейсеры на смысловой и антисмысловой нитях указаны выше и ниже последовательностей ДНК, соответственно. Степень модификации для локусов PVALB человека и Th мыши достигали 6,3% и 0,75%, соответственно, демонстрируя широкую применимость системы CRISPR при модификации различных локусов у многих организмов (фигуры 3B и 6). Хотя при использовании химерных конструкций расщепление обнаруживали только с одним из трех спейсеров для каждого локуса, все целевые последовательности расщеплялись с эффективностью получения вставок/делеций, достигающей 27%, при использовании схемы с коэкспрессируемой pre-crRNA (фигура 6).

На фигуре 13 представлена дополнительная иллюстрация того, что SpCas9 можно перепрограммировать для целенаправленного воздействия на множественные локусы генома в клетках млекопитающих. На фигуре 13A представлено схематическое изображение локуса EMX1 человека, на котором показано положение пяти протоспейсеров, указанных с помощью подчеркнутых последовательностей. На фигуре 13B представлено схематическое изображение комплекса pre-crRNA/trcrRNA, на котором показана гибридизация между участком прямого повтора в pre-crRNA и tracrRNA (вверху), и схематическое изображение химерной структуры РНК, содержащей направляющую последовательность из 20 п.о. и парную tracr-последовательность и tracr-последовательность, состоящие из неполного прямого повтора и последовательностей tracrRNA, гибридизованных в "шпилечную" структуру (внизу). Результаты анализа с помощью Surveyor со сравнением эффективности опосредованного Cas9 расщепления в пяти протоспейсерах в локусе EMX1 человека показаны на фигуре 13C. Целенаправленное воздействие на каждый протоспейсер осуществляли либо с использованием подвергнутого процессингу комплекса pre-crRNA/tracrRNA (crRNA), либо с использованием химерной РНК (chiRNA).

Поскольку вторичная структура РНК может быть важной для межмолекулярных взаимодействий, алгоритм предсказания структуры на основе минимальной свободной энергии и ансамбля взвешенных структур по Больцману использовали для сравнения предполагаемой вторичной структуры всех направляющих последовательностей, используемых в эксперименте с целенаправленным воздействием на геном (фигура 3B) (см., например, Gruber et al., 2008, Nucleic Acids Research, 36: W70). Анализ выявил, что в большинстве случаев эффективные направляющие последовательности в контексте химерной crRNA, по сути, не содержали мотивов вторичной структуры, тогда как неэффективные направляющие последовательности с большей вероятностью образовывали внутренние вторичные структуры, которые могут препятствовать спариванию оснований с ДНК целевого протоспейсера. Следовательно, возможно, что вариабельность во вторичной структуре спейсера может оказывать воздействие на эффективность опосредованной CRISPR интерференции при использовании химерной crRNA.

На фигуре 3 показан пример векторов экспрессии. На фигуре 3A представлено схематическое изображение бицистронного вектора для управления экспрессией химерной синтетической конструкции crRNA-tracrRNA (химерной РНК), а также SpCas9. Химерная направляющая РНК содержит направляющую последовательность из 20 п.о., соответствующую протоспейсеру в геномном целевом сайте. На фигуре 3B представлено схематическое изображение, на котором показаны направляющие последовательности, нацеленные на локусы EMX1, PVALB человека и Th мыши, а также их предсказанные вторичные структуры. Эффективность модификации в каждом целевом сайте указана ниже рисунка вторичной структуры РНК (EMX1, n = 216 считываемых фрагментов при секвенировании ампликонов; PVALB, n = 224 считываемых фрагментов; Th, n = 265 считываемых фрагментов). Представлены результаты по алгоритму укладки каждого основания, окрашенного соответственно его возможности принятия предсказанной вторичной структуры, как указано с помощью цветной шкалы, воспроизведенной на фигуре 3B в виде серой шкалы.

Структуры дополнительных векторов для SpCas9 показаны на фигуре 44, на которой показаны отдельные векторы экспрессии, включающие промотор U6, сцепленный с сайтом встраивания для направляющего олигонуклеотида, и промотор Cbh, сцепленный с кодирующей последовательностью SpCas9. Вектор, показанный на фигуре 44b, включает кодирующую последовательность tracrRNA, сцепленную с промотором H1.

Для того, чтобы определить, способны ли спейсеры со вторичными структурами функционировать в прокариотических клетках, где в естественных условиях функционируют CRISPR, интерференцию при трансформации плазмидами, несущими протоспейсеры, исследовали в штамме E. coli, гетерологично экспрессирующем локус 1 CRISPR S. pyogenes SF370 (фигура 10). Локус CRISPR клонировали в низкокопийный вектор экспрессии E. coli и массив crRNA замещали одним спейсером, фланкированным парой DR (pCRISPR). Штаммы E. coli, несущие разные плазмиды pCRISPR, трансформировали контрольными плазмидами, содержащими соответствующий протоспейсер и последовательности PAM (фигура 10C). При анализе у бактерий все спейсеры способствовали эффективной CRISPR-интерференции (фигура 4C). Эти результаты указывают на то, что могут существовать дополнительные факторы, влияющие на эффективность активности CRISPR в клетках млекопитающих.

Для исследования специфичности опосредованного CRISPR расщепления эффект однонуклеотидных мутаций в направляющей последовательности в отношении расщепления протоспейсера в геноме млекопитающих анализировали с использованием ряда целенаправленно воздействующих на EMX1 химерных crRNA с единичными точковыми мутациями (фигура 4A). На фигуре 4B показаны результаты анализа с помощью нуклеазы Surveyor со сравнением эффективности расщепления Cas9 при спаривании с различными мутантными химерными РНК. Несовпадение одного основания в участке вплоть до 12 п.о. с 5’ в PAM, по сути, прекращало расщепление генома SpCas9, тогда как спейсеры с мутациями в положениях, расположенных в более отдаленных положениях выше относительно хода транскрипции сохраняли активность в отношении исходного протоспейсера-мишени (фигура 4B). В дополнение к PAM, SpCas9 характеризуется специфичностью в отношении одного основания в последних 12 п.о. спейсера. Кроме того, CRISPR способен опосредовать расщепление генома столь же эффективно, как и пара нуклеаз TALE (TALEN), целенаправленно воздействующих на тот же протоспейсер EMX1. На фигуре 4C представлено схематическое изображение, на котором показана структура TALEN, целенаправленно воздействующих на EMX1, и на фигуре 4D показано сравнение эффективности TALEN и Cas9 (n=3) при разгонке в геле продуктов, полученных в результате анализа с помощью Surveyor.

Установив набор компонентов для достижения опосредованного CRISPR редактирования генов в клетках млекопитающих посредством подверженного ошибкам механизма NHEJ, исследовали способность CRISPR к стимуляции гомологичной рекомбинации (HR), высокоточный путь репарации генов для создания точных редакционных изменений в геноме. SpCas9 дикого типа способен опосредовать сайт-специфические DSB, которые могут репарироваться как с помощью NHEJ, так и HR. Кроме того, замену аспартат-на-аланин (D10A) в каталитическом домене RuvC I в SpCas9 конструировали для превращения нуклеазы в никазу (SpCas9n; проиллюстрировано на фигуре 5A) (см., например, Sapranausaks et al., 2011, Nucleic Acids Resch, 39: 9275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109:E2579) так, чтобы надрезанная геномная ДНК подвергалась высокоточной репарации с участием гомологичной рекомбинации (HDR). Анализ с помощью Surveyor подтвердил, что SpCas9n не создает вставок/делеций в протоспейсере-мишени EMX1. Как показано на фигуре 5B, коэкспрессия целенаправленно воздействующей на EMX1 химерной crRNA с SpCas9 давала вставки/делеции в целевом сайте, тогда как коэкспрессия с SpCas9n - нет (n=3). Более того, секвенирование 327 ампликонов не обнаружило каких-либо вставок/делеций, индуцированных SpCas9n. Для исследования опосредованной CRISPR HR при совместной трансфекции клеток HEK 293FT химерной РНК, целенаправленно воздействующей на EMX1, hSpCas9 или hSpCas9n, выбирали тот же локус, также как и матрицу для HR для введения пары сайтов рестрикции (HindIII и NheI) возле протоспейсера. На фигуре 5C приведена схематическая иллюстрация стратегии HR с относительными положениями точек рекомбинации и последовательностей для гибридизации праймеров (стрелки). SpCas9 и SpCas9n действительно катализировали интеграцию матрицы HR в локус EMX1. ПЦР амплификация целевого участка с последующим рестрикционным расщеплением HindIII выявила продукты расщепления, соответствующие ожидаемым размерам фрагментов (стрелки на результатах анализа полиморфизма длин рестрикционных фрагментов с помощью гель-электрофореза, показанных на фигуре 5D), причем SpCas9 и SpCas9n опосредуют подобные уровни эффективности HR. Заявители дополнительно подтверждали HR с использованием секвенирования геномных ампликонов по Сэнгеру (фигура 5E). Эти результаты демонстрировали пригодность CRISPR для облегчения целенаправленной вставки генов в геном млекопитающего. С учетом специфичности целенаправленного воздействия в 14 п.о. (12 п.о. от спейсера и 2 п.о. от PAM) SpCas9 дикого типа, доступность никазы может значительно снизить вероятность нецелевых модификаций, поскольку одноцепочечные разрывы не являются субстратами для подверженного ошибкам пути NHEJ.

Экспрессирующие конструкции, имитирующие естественную архитектуру локусов CRISPR с собранными в массив спейсерами (фигура 2A), создавали для исследования возможности мультиплексного целенаправленного воздействия на последовательности. При использовании одного массива CRISPR, кодирующего пару спейсеров, нацеленных на EMX1 и PVALB, обнаруживали эффективное расщепление в обоих локусах (фигура 4F, на которой показаны как схематическая структура массива crRNA, так и блот, полученный после анализа с помощью Surveyor, показывающий эффективное опосредование расщепления). Также исследовали целенаправленную делецию геномных участков большего размера посредством одновременных DSB с использованием спейсеров против двух мишеней в EMX1, разделенных 119 п.о., и обнаруженная эффективность делеции составляла 1,6% (3 из 182 ампликонов; фигура 4G). Это демонстрирует, что система CRISPR может опосредовать мультиплексное редактирование в пределах одного генома.

Пример 2: модификации и альтернативы системы CRISPR

Возможность применения РНК для программирования специфичного к последовательности расщепления ДНК определяет новый класс инструментов для конструирования генома для разнообразных исследовательских и промышленных применений. Несколько аспектов системы CRISPR можно дополнительно улучшить для повышения эффективности и универсальности целенаправленного воздействия с помощью CRISPR. Оптимальная активность Cas9 может зависеть от доступности несвязанного Mg²⁺ на уровнях, которые превышают имеющиеся в ядре млекопитающего (см., например, Jinek et al., 2012, Science, 337:816), и предпочтение в отношении мотива NGG непосредственно ниже протоспейсера ограничивает способность к целенаправленному воздействию в среднем на каждые 12 п.о. в геноме человека (фигура 11, оценка как плюс-, так и минус-нитей в хромосомных последовательностях человека). Некоторые из этих затруднений можно преодолеть путем изучения разнообразия локусов CRISPR в микробном метагеноме (см., например, Makarova et al., 2011, Nat Rev Microbiol, 9:467). Другие локусы CRISPR можно переместить в микроокружение клетки млекопитающего с помощью способа, подобного описанному в примере 1. Например, на фигуре 12 показана адаптация системы CRISPR II типа из CRISPR 1 LMD-9 Streptococcus thermophilus для гетерологичной экспрессии в клетках млекопитающих, чтобы достичь опосредованного CRISPR редактирования генома. На фигуре 12A приведена схематическая иллюстрация CRISPR 1 из LMD-9 S. thermophilus. На фигуре 12B показана структура системы экспрессии для системы CRISPR S. thermophilus. Кодон-оптимизированный hStCas9 человека экспрессируется с помощью конститутивного промотора EF1α. Зрелые варианты tracrRNA и crRNA экспрессируются с помощью промотора U6 для стимуляции точной инициации транскрипции. Показаны последовательности из зрелых crRNA и tracrRNA. Одно основание, обозначенное буквой “a” в нижнем регистре в последовательности crRNA использовали для удаления последовательности polyU, которая служит в качестве терминатора транскрипции РНК polIII. На фигуре 12С представлено схематическое изображение, на котором показаны направляющие последовательности, нацеленные на локус EMX1 человека, а также их предсказанные вторичные структуры. Эффективность модификации в каждом целевом сайте указана ниже вторичных структур РНК. Алгоритм, генерирующий цвета структуры каждого основания соответственно его возможности принятия предсказанной вторичной структуры, которая указана с помощью цветной шкалы, воспроизведен на фигуре 12C в виде серой шкалы. На фигуре 12D показаны результаты опосредованного hStCas9 расщепления в целевом локусе с использованием анализа с помощью Surveyor. РНК направляющих спейсеров 1 и 2 индуцировали 14% и 6,4%, соответственно. Статистический анализ активности для расщепления по биологическим копиям в этих двух протоспейсерных сайтах также приведен на фигуре 6. На фигуре 16 приведено схематическое изображение дополнительного протоспейсера и соответствующих последовательностей PAM, являющихся мишенями для системы CRISPR S. thermophilus, в локусе EMX1 человека. Последовательности двух протоспейсеров выделены и их соответствующие последовательности PAM, удовлетворяющие мотиву NNAGAAW, обозначены путем подчеркивания в направлении 3’ относительно соответствующей выделенной последовательности. Оба протоспейсера нацелены на антисмысловую нить.

Пример 3: алгоритм выбора образцов целевой последовательности

Создали компьютерную программу для идентификации кандидатных целевых последовательностей CRISPR на обеих нитях вводимой последовательности ДНК на основе длины желаемой направляющей последовательности и последовательности мотива CRISPR (PAM) для определенного фермента CRISPR. Например, целевые сайты для Cas9 из S. pyogenes с последовательностями PAM NGG можно идентифицировать путем поиска в отношении 5’-N_x-NGG-3’ как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Подобным образом, целевые сайты для Cas9 CRISPR1 S. thermophilus с последовательностью PAM NNAGAAW, можно идентифицировать путем поиска в отношении 5’-N_x-NNAGAAW-3’ как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Подобным образом, целевые сайты для Cas9 CRISPR3 S. thermophilus с последовательностью PAM NGGNG можно идентифицировать путем поиска в отношении 5’-N_x-NGGNG-3’ как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Значение “x” в N_x может фиксироваться программой или может быть определено пользователем, как, например, 20.

Поскольку несколько случаев появления целевого сайта ДНК в геноме могут приводить к неспецифическому редактированию генома, после идентификации всех возможных сайтов программа профильтровывает последовательности, исходя из количества раз, когда они встречаются в соответствующем эталонном геноме. Для тех ферментов CRISPR, для которых специфичность к последовательности определяется "затравочной" последовательностью, такой как находящаяся в 11-12 п.о. в направлении 5’ от последовательности PAM, в том числе сама последовательность PAM, стадия фильтрования может основываться на затравочной последовательности. Следовательно, во избежание редактирования в дополнительных локусах генома результаты фильтруют, исходя из числа случаев обнаружения последовательности затравки:PAM в подходящем геноме. Пользователь может иметь возможность выбора длины затравочной последовательности. Пользователь также может иметь возможность определять число случаев обнаружения последовательности затравки:PAM в геноме применительно к прохождению фильтра. По умолчанию установлен скрининг в отношении уникальных последовательностей. Уровень фильтрования изменяют путем изменения как длины затравочной последовательности, так и числа случаев обнаружения последовательности в геноме. В качестве дополнения или альтернативы, программа может обеспечивать последовательность направляющей последовательности, комплементарную сообщенной(ым) целевой(ым) последовательности(ям) путем обеспечения последовательности, обратно комплементарной идентифицированной(ым) целевой(ым) последовательности(ям).

Дальнейшие детали способов и алгоритмов для оптимизации выбора последовательности можно найти в заявке на патент США с серийным номером 61/836080 (номер дела у патентного поверенного 44790.11.2022); включенной в данный документ при помощи ссылки.

Пример 4: оценка гибридов нескольких химерных crRNA-tracrRNA

В данном примере описаны результаты, полученные для химерных РНК (chiRNA; содержащие направляющую последовательность, парную tracr-последовательность и tracr-последовательность в одном транскрипте), имеющих tracr-последовательности, которые включают фрагменты последовательности tracrRNA дикого типа с разной длиной. На фигуре 18a показано схематическое изображение бицистронного вектора экспрессии для химерной РНК и Cas9. Cas9 управляется промотором CBh, а химерная РНК управляется промотором U6. Химерная направляющая РНК состоит из направляющей последовательности (Ns) из 20 п.о., соединенной с tracr-последовательностью (проходящей от первого “U” в нижней нити к концу транскрипта), которая усечена в разных указанных положениях. Направляющие и tracr-последовательности разделены парной tracr-последовательностью GUUUUAGAGCUA, за которой следует последовательность петли GAAA. Результаты анализов с помощью SURVEYOR в отношении опосредованных Cas9 вставок/делеций в локусах EMX1 и PVALB человека показаны на фигурах 18b и 18c, соответственно. Стрелки указывают на ожидаемые фрагменты, полученные в результате расщепления с помощью SURVEYOR. ChiRNA показаны путем обозначения их “+n”, а crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде раздельных транскриптов. Количественный анализ этих результатов, выполненный в трех повторностях, проиллюстрирован с помощью гистограмм на фигурах 19a и 19b, соответствующих фигурам 18b и 18c, соответственно (“N.D.” означает отсутствие обнаруженных вставок/делеций). ID (идентификационные данные) протоспейсеров и их соответствующей мишени в геноме, последовательность протоспейсера, последовательность PAM и положение нити приведены в таблице D. Направляющие последовательности разработаны так, чтобы они были комплементарны полной последовательности протоспейсера в случае отдельных транскриптов в гибридной системе или только подчеркнутой части в случае химерных РНК.

Таблица D:

ID
протоспейсера геномная
мишень последовательность протоспейсера (от 5’ к 3’) PAM нить 1 EMX1 GGACATCGATGTCACCTCCAATGACTAGGG TGG + 2 EMX1 CATTGGAGGTGACATCGATGTCCTCCCCAT TGG - 3 EMX1 GGAAGGGCCTGAGTCCGAGCAGAAGAAGAA GGG + 4 PVALB GGTGGCGAGAGGGGCCGAGATTGGGTGTTC AGG + 5 PVALB ATGCAGGAGGGTGGCGAGAGGGGCCGAGAT TGG +

Клеточная культура и трансфекция

Линию клеток почки человеческого эмбриона (HEK) 293FT (Life Technologies) поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100 ЕД/мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% CO₂. Клетки 293FT засевали в 24-луночные планшеты (Corning) за 24 часа до трансфекции при плотности 150000 клеток на лунку. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies), следуя рекомендованному производителем протоколу. Для каждой лунки 24-луночного планшета использовали в общей сложности 500 нг плазмид.

Анализ с помощью SURVEYOR на предмет наличия модификации генома

Клетки 293FT трансфицировали плазмидной ДНК, как описано выше. Клетки инкубировали при 37°C в течение 72 часов после трансфекции перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью раствора QuickExtract DNA Extraction Solution (Epicentre), следуя протоколу производителя. Вкратце, осажденные центрифугированием клетки ресуспендировали в растворе QuickExtract solution и инкубировали при 65°C в течение 15 минут и 98°C в течение 10 минут. Геномный участок, окружающий целевой сайт CRISPR, для каждого гена подвергали ПЦР амплификации (праймеры перечислены в таблице Е) и продукты очищали с использованием колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10X ПЦР-буфера для ДНК-полимеразы Taq (Enzymatics) и воды сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex TBE (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос.

Таблица E

название праймера Мишень в геноме последовательность праймера (от 5’ к 3’) Sp-EMX1-F EMX1 AAAACCACCCTTCTCTCTGGC Sp-EMX1-R EMX1 GGAGATTGGAGACACGGAGAG Sp-PVALB-F PVALB CTGGAAAGCCAATGCCTGAC Sp-PVALB-R PVALB GGCAGCAAACTCCTTGTCCT

Вычислительная идентификация уникальных целевых сайтов CRISPR

Для идентификации уникальных целевых сайтов для фермента Cas9 (SpCas9) S. pyogenes SF370 в геноме человека, мыши, крысы, данио, плодовой мухи и C. elegans был разработан пакет программ для сканирования обеих нитей последовательности ДНК и идентификации всех возможных целевых сайтов SpCas9. Для этого примера каждый целевой сайт SpCas9 был оперативно определен как последовательность из 20 п.о., за которой следует последовательность мотива, смежного с протоспейсером (PAM) NGG, при этом были определены все последовательности, удовлетворяющие определению 5’-N₂₀-NGG-3’ на всех хромосомах. Для предотвращения неспецифического редактирования генома после идентификации всех потенциальных сайтов все целевые сайты фильтровали, исходя из количества раз, когда они встречаются в соответствующем эталонном геноме. Для того, чтобы извлечь пользу из специфичности к последовательности активности Cas9, обеспечиваемой "затравочной" последовательностью, которой может быть, например, последовательность из приблизительно 11-12 п.о. 5’ от последовательности PAM, при этом последовательности 5’-NNNNNNNNNN-NGG-3’ выбирали как уникальные в соответствующем геноме. Все геномные последовательности загружали из геномного браузера UCSC (геном человека hg19, геном мыши mm9, геном крысы rn5, геном данио danRer7, геном D. melanogaster dm4 и геном C. elegans ce10). Все результаты поиска доступны для просмотра с использованием информации из геномного браузера UCSC. Иллюстративная визуализация некоторых целевых сайтов в геноме человека представлена на фигуре 21.

Первоначально целенаправленному воздействию подвергали три сайта в пределах локуса EMX1 в клетках HEK 293FT человека. Эффективность модификации генома каждой chiРНК оценивали с использованием анализа с помощью нуклеазы SURVEYOR, который позволяет обнаруживать мутации, возникающие в результате двухцепочечных разрывов (DSB) ДНК и их последующей репарации с помощью пути репарации повреждения ДНК за счет негомологичного соединения концов (NHEJ). В конструкциях, обозначенных chiRNA(+n), указывается, что нуклеотиды в количестве до +n нуклеотида tracrRNA дикого типа включены в химерную РНК-конструкцию, при этом для n используются значения 48, 54, 67 и 85. Химерные РНК, содержащие более длинные фрагменты tracrRNA дикого типа (chiRNA(+67) и chiRNA(+85)), опосредовали расщепление ДНК во всех трех целевых сайтах EMX1, причем chiRNA(+85), в частности, демонстрировал значительно более высокие уровни расщепления ДНК, чем соответствующие гибриды crRNA/tracrRNA, у которых направляющие и tracr-последовательности экспрессируются в отдельных транскриптах (фигуры 18b и 19a). Два сайта в локусе PVALB, которые не давали обнаруживаемого расщепления с использованием гибридной системы (направляющая последовательность и tracr-последовательность, экспрессируемые в виде отдельных транскриптов), также подвергались целенаправленному воздействию с использованием chiRNA. СhiRNA(+67) и chiRNA(+85) были способны опосредовать значительное расщепление в двух протоспейсерах в PVALB (фигуры 18c и 19b).

Для всех пяти мишеней в локусах EMX1 и PVALB наблюдали соответствующее повышение эффективности модификации генома с увеличением длины tracr-последовательности. Не вдаваясь в какую-либо теорию, вторичная структура, формируемая 3’-концом tracrRNA, может играть роль в увеличении скорости образования комплекса CRISPR. Иллюстрация предсказанных вторичных структур для каждой химерной РНК, использованной в этом примере, представлена на фигуре 21. Вторичную структуру предсказывали с применением RNAfold (http://RNA.tbi.univie.ac.at/cgi-bin/RNAfold.cgi) с использованием минимальной свободной энергии и алгоритма функции распределения. Псевдоцвет для каждого основания (воспроизведен в серой шкале) указывает на возможность спаривания. По причине того, что chiRNA с более длинными tracr-последовательностями были способны расщеплять мишени, которые не были расщеплены нативными гибридами crRNA/tracrRNA CRISPR, возможно, что химерная РНК может загружаться на Cas9 более эффективно, чем ее нативный гибридный аналог. Для обеспечения применения Cas9 для сайт-специфического редактирования генома в эукариотических клетках и организмах все предсказанные уникальные целевые сайты для Cas9 S. pyogenes определяли путем вычислений в геномах человека, мыши, крысы, данио, C. elegans и D. melanogaster. Химерные РНК можно разрабатывать для ферментов Cas9 из других микроорганизмов для расширения целевого пространства CRISPR РНК-программируемых нуклеаз.

На фигуре 22 показан примерный бицистронный вектор экспрессии для экспрессии химерной РНК, включающий tracr-последовательность РНК дикого типа вплоть до нуклеотида +85 и SpCas9 с последовательностями ядерной локализации. SpCas9 экспрессируется с промотора CBh и терминируется polyA-сигналом bGH (bGH pA). Расширенная последовательность, показанная непосредственно под схематическим изображением, соответствует участку, окружающему направляющую последовательность сайта встраивания, и включает от 5’ дo 3’, 3’-часть промотора U6 (первый заштрихованный участок), сайты расщепления BbsI (стрелки), неполный прямой повтор (парная tracr-последовательность GTTTTAGAGCTA, подчеркнутая), последовательность петли GAAA и +85 tracr-последовательность (подчеркнутая последовательность, следующая за последовательностью петли). Иллюстративное встраивание направляющей последовательности изображено ниже сайта встраивания направляющей последовательности, при этом нуклеотиды направляющей последовательности для выбранной мишени представлены как “N”.

Последовательности, описанные в приведенных выше примерах, представляют собой следующие (полинуклеотидные последовательности представлены от 5' к 3'):

U6-короткая tracrRNA (Streptococcus pyogenes SF370):

GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTT

T (жирный шрифт = последовательность tracrRNA; подчеркивание = терминаторная последовательность)

U6-длинная tracrRNA (Streptococcus pyogenes SF370):

GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGTAGTATTAAGTATTGTTTTATGGCTGATAAATTTCTTTGAATTTCTCCTTGATTATTTGTTATAAAAGTTATAAAATAATCTTGTTGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

U6-DR-BbsI-остов-DR (Streptococcus pyogenes SF370):

GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTTTTAGAGCTATGCTGTTTTGAATGGTCCCAAAACGGGTCTTCGAGAAGACGTTTTAGAGCTATGCTGTTTTGAATGGTCCCAAAAC

U6-химерная РНК-BbsI-остов (Streptococcus pyogenes SF370)

GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCG

NLS-SpCas9-EGFP:

MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDAAAVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK

SpCas9-EGFP-NLS:

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDAAAVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKKRPAATKKAGQAKKKK

NLS-SpCas9-EGFP-NLS:

MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDAAAVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKKRPAATKKAGQAKKKK

NLS-SpCas9-NLS:

MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDKRPAATKKAGQAKKKK

NLS-mCherry-SpRNase3:

MFLFLSLTSFLSSSRTLVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKGSKQLEELLSTSFDIQFNDLTLLETAFTHTSYANEHRLLNVSHNERLEFLGDAVLQLIISEYLFAKYPKKTEGDMSKLRSMIVREESLAGFSRFCSFDAYIKLGKGEEKSGGRRRDTILGDLFEAFLGALLLDKGIDAVRRFLKQVMIPQVEKGNFERVKDYKTCLQEFLQTKGDVAIDYQVISEKGPAHAKQFEVSIVVNGAVLSKGLGKSKKLAEQDAAKNALAQLSEV

SpRNase3-mCherry-NLS:

MKQLEELLSTSFDIQFNDLTLLETAFTHTSYANEHRLLNVSHNERLEFLGDAVLQLIISEYLFAKYPKKTEGDMSKLRSMIVREESLAGFSRFCSFDAYIKLGKGEEKSGGRRRDTILGDLFEAFLGALLLDKGIDAVRRFLKQVMIPQVEKGNFERVKDYKTCLQEFLQTKGDVAIDYQVISEKGPAHAKQFEVSIVVNGAVLSKGLGKSKKLAEQDAAKNALAQLSEVGSVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKKRPAATKKAGQAKKKK

NLS-SpCas9n-NLS (D10A мутация никазы представлена в нижнем регистре):

MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLaIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDKRPAATKKAGQAKKKK

hEMX1-HR-матрица-HindII-NheI:

GAATGCTGCCCTCAGACCCGCTTCCTCCCTGTCCTTGTCTGTCCAAGGAGAATGAGGTCTCACTGGTGGATTTCGGACTACCCTGAGGAGCTGGCACCTGAGGGACAAGGCCCCCCACCTGCCCAGCTCCAGCCTCTGATGAGGGGTGGGAGAGAGCTACATGAGGTTGCTAAGAAAGCCTCCCCTGAAGGAGACCACACAGTGTGTGAGGTTGGAGTCTCTAGCAGCGGGTTCTGTGCCCCCAGGGATAGTCTGGCTGTCCAGGCACTGCTCTTGATATAAACACCACCTCCTAGTTATGAAACCATGCCCATTCTGCCTCTCTGTATGGAAAAGAGCATGGGGCTGGCCCGTGGGGTGGTGTCCACTTTAGGCCCTGTGGGAGATCATGGGAACCCACGCAGTGGGTCATAGGCTCTCTCATTTACTACTCACATCCACTCTGTGAAGAAGCGATTATGATCTCTCCTCTAGAAACTCGTAGAGTCCCATGTCTGCCGGCTTCCAGAGCCTGCACTCCTCCACCTTGGCTTGGCTTTGCTGGGGCTAGAGGAGCTAGGATGCACAGCAGCTCTGTGACCCTTTGTTTGAGAGGAACAGGAAAACCACCCTTCTCTCTGGCCCACTGTGTCCTCTTCCTGCCCTGCCATCCCCTTCTGTGAATGTTAGACCCATGGGAGCAGCTGGTCAGAGGGGACCCCGGCCTGGGGCCCCTAACCCTATGTAGCCTCAGTCTTCCCATCAGGCTCTCAGCTCAGCCTGAGTGTTGAGGCCCCAGTGGCTGCTCTGGGGGCCTCCTGAGTTTCTCATCTGTGCCCCTCCCTCCCTGGCCCAGGTGAAGGTGTGGTTCCAGAACCGGAGGACAAAGTACAAACGGCAGAAGCTGGAGGAGGAAGGGCCTGAGTCCGAGCAGAAGAAGAAGGGCTCCCATCACATCAACCGGTGGCGCATTGCCACGAAGCAGGCCAATGGGGAGGACATCGATGTCACCTCCAATGACaagcttgctagcGGTGGGCAACCACAAACCCACGAGGGCAGAGTGCTGCTTGCTGCTGGCCAGGCCCCTGCGTGGGCCCAAGCTGGACTCTGGCCACTCCCTGGCCAGGCTTTGGGGAGGCCTGGAGTCATGGCCCCACAGGGCTTGAAGCCCGGGGCCGCCATTGACAGAGGGACAAGCAATGGGCTGGCTGAGGCCTGGGACCACTTGGCCTTCTCCTCGGAGAGCCTGCCTGCCTGGGCGGGCCCGCCCGCCACCGCAGCCTCCCAGCTGCTCTCCGTGTCTCCAATCTCCCTTTTGTTTTGATGCATTTCTGTTTTAATTTATTTTCCAGGCACCACTGTAGTTTAGTGATCCCCAGTGTCCCCCTTCCCTATGGGAATAATAAAAGTCTCTCTCTTAATGACACGGGCATCCAGCTCCAGCCCCAGAGCCTGGGGTGGTAGATTCCGGCTCTGAGGGCCAGTGGGGGCTGGTAGAGCAAACGCGTTCAGGGCCTGGGAGCCTGGGGTGGGGTACTGGTGGAGGGGGTCAAGGGTAATTCATTAACTCCTCTCTTTTGTTGGGGGACCCTGGTCTCTACCTCCAGCTCCACAGCAGGAGAAACAGGCTAGACATAGGGAAGGGCCATCCTGTATCTTGAGGGAGGACAGGCCCAGGTCTTTCTTAACGTATTGAGAGGTGGGAATCAGGCCCAGGTAGTTCAATGGGAGAGGGAGAGTGCTTCCCTCTGCCTAGAGACTCTGGTGGCTTCTCCAGTTGAGGAGAAACCAGAGGAAAGGGGAGGATTGGGGTCTGGGGGAGGGAACACCATTCACAAAGGCTGACGGTTCCAGTCCGAAGTCGTGGGCCCACCAGGATGCTCACCTGTCCTTGGAGAACCGCTGGGCAGGTTGAGACTGCAGAGACAGGGCTTAAGGCTGAGCCTGCAACCAGTCCCCAGTGACTCAGGGCCTCCTCAGCCCAAGAAAGAGCAACGTGCCAGGGCCCGCTGAGCTCTTGTGTTCACCTG

NLS-StCsn1-NLS:

MKRPAATKKAGQAKKKKSDLVLGLDIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINLNPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLRGDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGETLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKLLSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQVDELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSVRQAIKIVNAAIKEYGDFDNIVIEMARETNEDDEKKAIQKIQKANKDEKDAAMLKAANQYNGKAELPHSVFHGHKQLATKIRLWHQQGERCLYTGKTISIHDLINNSNQFEVDHILPLSITFDDSLANKVLVYATANQEKGQRTPYQALDSMDDAWSFRELKAFVRESKTLSNKKKEYLLTEEDISKFDVRKKFIERNLVDTRYASRVVLNALQEHFRAHKIDTKVSVVRGQFTSQLRRHWGIEKTRDTYHHHAVDALIIAASSQLNLWKKQKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFEDSILFSYQVDSKFNRKISDATIYATRQAKVGKDKADETYVLGKIKDIYTQDGYDAFMKIYKKDKSKFLMYRHDPQTFEKVIEPILENYPNKQINEKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLKYYDSKLGNHIDITPKDSNNKVVLQSVSPWRADVYFNKTTGKYEILGLKYADLQFEKGTGTYKISQEKYNDIKKKEGVDSDSEFKFTLYKNDLLLVKDTETKEQQLFRFLSRTMPKQKHYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKNEGDKPKLDFKRPAATKKAGQAKKKK

U6-St_tracrRNA(7-97):

GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTACTTAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAA

U6-DR-спейсер-DR (S. pyogenes SF370)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgggttttagagctatgctgttttgaatggtcccaaaacNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgttttagagctatgctgttttgaatggtcccaaaacTTTTTTT (нижний регистр, подчеркивание = прямой повтор; N = направляющая последовательность; жирный шрифт = терминатор)

Химерная РНК, содержащая +48 tracrRNA (S. pyogenes SF370)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgTTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Химерная РНК, содержащая +54 tracrRNA (S. pyogenes SF370)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaTTTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Химерная РНК, содержащая +67 tracrRNA (S. pyogenes SF370)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Химерная РНК, содержащая +85 tracrRNA (S. pyogenes SF370)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

CBh-NLS-SpCas9-NLS

CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGACGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCTGAGCAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGaccggtgccaccATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACTTTCTTTTTCTTAGCTTGACCAGCTTTCTTAGTAGCAGCAGGACGCTTTAA

(подчеркивание = NLS-hSpCas9-NLS)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgttattgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgttattgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgttattgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgttattgtactctcaagatttaGAAAtaaatcttgcagaagctacaatgataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgttattgtactctcaGAAAtgcagaagctacaatgataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)

NNNNNNNNNNNNNNNNNNNNgttattgtactctcaGAAAtgcagaagctacaatgataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Иллюстративная химерная РНК для Cas9 из CRISPR3 LMD-9 S. thermophilus (с PAM NGGNG)

NNNNNNNNNNNNNNNNNNNNgttttagagctgtgGAAAcacagcgagttaaaataaggcttagtccgtactcaacttgaaaaggtggcaccgattcggtgtTTTTTT (N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)

Кодон-оптимизированный вариант Cas9 из локуса CRISPR3 LMD-9 S. thermophilus (с NLS и на 5’- и на 3’-концах)

ATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGACCAAGCCCTACAGCATCGGCCTGGACATCGGCACCAATAGCGTGGGCTGGGCCGTGACCACCGACAACTACAAGGTGCCCAGCAAGAAAATGAAGGTGCTGGGCAACACCTCCAAGAAGTACATCAAGAAAAACCTGCTGGGCGTGCTGCTGTTCGACAGCGGCATTACAGCCGAGGGCAGACGGCTGAAGAGAACCGCCAGACGGCGGTACACCCGGCGGAGAAACAGAATCCTGTATCTGCAAGAGATCTTCAGCACCGAGATGGCTACCCTGGACGACGCCTTCTTCCAGCGGCTGGACGACAGCTTCCTGGTGCCCGACGACAAGCGGGACAGCAAGTACCCCATCTTCGGCAACCTGGTGGAAGAGAAGGCCTACCACGACGAGTTCCCCACCATCTACCACCTGAGAAAGTACCTGGCCGACAGCACCAAGAAGGCCGACCTGAGACTGGTGTATCTGGCCCTGGCCCACATGATCAAGTACCGGGGCCACTTCCTGATCGAGGGCGAGTTCAACAGCAAGAACAACGACATCCAGAAGAACTTCCAGGACTTCCTGGACACCTACAACGCCATCTTCGAGAGCGACCTGTCCCTGGAAAACAGCAAGCAGCTGGAAGAGATCGTGAAGGACAAGATCAGCAAGCTGGAAAAGAAGGACCGCATCCTGAAGCTGTTCCCCGGCGAGAAGAACAGCGGAATCTTCAGCGAGTTTCTGAAGCTGATCGTGGGCAACCAGGCCGACTTCAGAAAGTGCTTCAACCTGGACGAGAAAGCCAGCCTGCACTTCAGCAAAGAGAGCTACGACGAGGACCTGGAAACCCTGCTGGGATATATCGGCGACGACTACAGCGACGTGTTCCTGAAGGCCAAGAAGCTGTACGACGCTATCCTGCTGAGCGGCTTCCTGACCGTGACCGACAACGAGACAGAGGCCCCACTGAGCAGCGCCATGATTAAGCGGTACAACGAGCACAAAGAGGATCTGGCTCTGCTGAAAGAGTACATCCGGAACATCAGCCTGAAAACCTACAATGAGGTGTTCAAGGACGACACCAAGAACGGCTACGCCGGCTACATCGACGGCAAGACCAACCAGGAAGATTTCTATGTGTACCTGAAGAAGCTGCTGGCCGAGTTCGAGGGGGCCGACTACTTTCTGGAAAAAATCGACCGCGAGGATTTCCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCTACCAGATCCATCTGCAGGAAATGCGGGCCATCCTGGACAAGCAGGCCAAGTTCTACCCATTCCTGGCCAAGAACAAAGAGCGGATCGAGAAGATCCTGACCTTCCGCATCCCTTACTACGTGGGCCCCCTGGCCAGAGGCAACAGCGATTTTGCCTGGTCCATCCGGAAGCGCAATGAGAAGATCACCCCCTGGAACTTCGAGGACGTGATCGACAAAGAGTCCAGCGCCGAGGCCTTCATCAACCGGATGACCAGCTTCGACCTGTACCTGCCCGAGGAAAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGACATTCAATGTGTATAACGAGCTGACCAAAGTGCGGTTTATCGCCGAGTCTATGCGGGACTACCAGTTCCTGGACTCCAAGCAGAAAAAGGACATCGTGCGGCTGTACTTCAAGGACAAGCGGAAAGTGACCGATAAGGACATCATCGAGTACCTGCACGCCATCTACGGCTACGATGGCATCGAGCTGAAGGGCATCGAGAAGCAGTTCAACTCCAGCCTGAGCACATACCACGACCTGCTGAACATTATCAACGACAAAGAATTTCTGGACGACTCCAGCAACGAGGCCATCATCGAAGAGATCATCCACACCCTGACCATCTTTGAGGACCGCGAGATGATCAAGCAGCGGCTGAGCAAGTTCGAGAACATCTTCGACAAGAGCGTGCTGAAAAAGCTGAGCAGACGGCACTACACCGGCTGGGGCAAGCTGAGCGCCAAGCTGATCAACGGCATCCGGGACGAGAAGTCCGGCAACACAATCCTGGACTACCTGATCGACGACGGCATCAGCAACCGGAACTTCATGCAGCTGATCCACGACGACGCCCTGAGCTTCAAGAAGAAGATCCAGAAGGCCCAGATCATCGGGGACGAGGACAAGGGCAACATCAAAGAAGTCGTGAAGTCCCTGCCCGGCAGCCCCGCCATCAAGAAGGGAATCCTGCAGAGCATCAAGATCGTGGACGAGCTCGTGAAAGTGATGGGCGGCAGAAAGCCCGAGAGCATCGTGGTGGAAATGGCTAGAGAGAACCAGTACACCAATCAGGGCAAGAGCAACAGCCAGCAGAGACTGAAGAGACTGGAAAAGTCCCTGAAAGAGCTGGGCAGCAAGATTCTGAAAGAGAATATCCCTGCCAAGCTGTCCAAGATCGACAACAACGCCCTGCAGAACGACCGGCTGTACCTGTACTACCTGCAGAATGGCAAGGACATGTATACAGGCGACGACCTGGATATCGACCGCCTGAGCAACTACGACATCGACCATATTATCCCCCAGGCCTTCCTGAAAGACAACAGCATTGACAACAAAGTGCTGGTGTCCTCCGCCAGCAACCGCGGCAAGTCCGATGATGTGCCCAGCCTGGAAGTCGTGAAAAAGAGAAAGACCTTCTGGTATCAGCTGCTGAAAAGCAAGCTGATTAGCCAGAGGAAGTTCGACAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCCCTGAAGATAAGGCCGGCTTCATCCAGAGACAGCTGGTGGAAACCCGGCAGATCACCAAGCACGTGGCCAGACTGCTGGATGAGAAGTTTAACAACAAGAAGGACGAGAACAACCGGGCCGTGCGGACCGTGAAGATCATCACCCTGAAGTCCACCCTGGTGTCCCAGTTCCGGAAGGACTTCGAGCTGTATAAAGTGCGCGAGATCAATGACTTTCACCACGCCCACGACGCCTACCTGAATGCCGTGGTGGCTTCCGCCCTGCTGAAGAAGTACCCTAAGCTGGAACCCGAGTTCGTGTACGGCGACTACCCCAAGTACAACTCCTTCAGAGAGCGGAAGTCCGCCACCGAGAAGGTGTACTTCTACTCCAACATCATGAATATCTTTAAGAAGTCCATCTCCCTGGCCGATGGCAGAGTGATCGAGCGGCCCCTGATCGAAGTGAACGAAGAGACAGGCGAGAGCGTGTGGAACAAAGAAAGCGACCTGGCCACCGTGCGGCGGGTGCTGAGTTATCCTCAAGTGAATGTCGTGAAGAAGGTGGAAGAACAGAACCACGGCCTGGATCGGGGCAAGCCCAAGGGCCTGTTCAACGCCAACCTGTCCAGCAAGCCTAAGCCCAACTCCAACGAGAATCTCGTGGGGGCCAAAGAGTACCTGGACCCTAAGAAGTACGGCGGATACGCCGGCATCTCCAATAGCTTCACCGTGCTCGTGAAGGGCACAATCGAGAAGGGCGCTAAGAAAAAGATCACAAACGTGCTGGAATTTCAGGGGATCTCTATCCTGGACCGGATCAACTACCGGAAGGATAAGCTGAACTTTCTGCTGGAAAAAGGCTACAAGGACATTGAGCTGATTATCGAGCTGCCTAAGTACTCCCTGTTCGAACTGAGCGACGGCTCCAGACGGATGCTGGCCTCCATCCTGTCCACCAACAACAAGCGGGGCGAGATCCACAAGGGAAACCAGATCTTCCTGAGCCAGAAATTTGTGAAACTGCTGTACCACGCCAAGCGGATCTCCAACACCATCAATGAGAACCACCGGAAATACGTGGAAAACCACAAGAAAGAGTTTGAGGAACTGTTCTACTACATCCTGGAGTTCAACGAGAACTATGTGGGAGCCAAGAAGAACGGCAAACTGCTGAACTCCGCCTTCCAGAGCTGGCAGAACCACAGCATCGACGAGCTGTGCAGCTCCTTCATCGGCCCTACCGGCAGCGAGCGGAAGGGACTGTTTGAGCTGACCTCCAGAGGCTCTGCCGCCGACTTTGAGTTCCTGGGAGTGAAGATCCCCCGGTACAGAGACTACACCCCCTCTAGTCTGCTGAAGGACGCCACCCTGATCCACCAGAGCGTGACCGGCCTGTACGAAACCCGGATCGACCTGGCTAAGCTGGGCGAGGGAAAGCGTCCTGCTGCTACTAAGAAAGCTGGTCAAGCTAAGAAAAAGAAATAA

Пример 5: РНК-направляемое редактирование бактериальных геномов с применением систем CRISPR-Cas

Заявители использовали CRISPR-ассоциированную эндонуклеазу Cas9 для введения точных мутаций в геномы Streptococcus pneumoniae и Escherichia coli. Подход опирался на Cas9-направленное расщепление в целевом сайте для уничтожения немутированных клеток и устранял необходимость в селектируемых маркерах или системах негативного отбора. Специфичность Cas9 перепрограммировали путем изменения последовательности короткой CRISPR РНК (crRNA) для внесения одно- или многонуклеотидных изменений, переносимых на матрицах редактирования. Одновременное использование двух crRNA обеспечивало мультиплексный мутагенез. У S. pneumoniae около 100% клеток, выживших после расщепления Cas9, содержали желаемую мутацию, и 65% при использовании в комбинации с рекомбинационной инженерией в E. coli. Заявители тщательно анализировали плановые требования к Cas9 для определения диапазона последовательностей, представляющих собой мишени, и показали стратегии для редактирования сайтов, которые не отвечают данным требованиям, что указывает на универсальность этой методики для конструирования бактериального генома.

Понимание функции гена зависит от возможности изменения последовательностей ДНК в клетке контролируемым образом. Сайт-специфический мутагенез у эукариот достигается путем использования специфичных к последовательностям нуклеаз, которые активируют гомологичную рекомбинацию ДНК-матрицы, содержащей мутацию, представляющую интерес. Нуклеазы с "цинковыми пальцами" (ZFN), эффекторные нуклеазы, подобные активаторам транскрипции (TALEN), и хоминг-мегануклеазы можно программировать для расщепления геномов в конкретных местоположениях, но эти подходы требуют конструирования новых ферментов для каждой целевой последовательности. В прокариотических организмах способы мутагенеза или предусматривают введение маркера отбора в редактируемый локус, или требуют двухстадийного процесса, который включает систему негативного отбора. Совсем недавно для рекомбинационной инженерии использовали рекомбинантные белки фагов, методика, которая обеспечивает гомологичную рекомбинацию линейной ДНК или олигонуклеотидов. Однако, поскольку нет выбора мутаций, эффективность рекомбинационной инженерии может быть относительно низкой (от 0,1-10% для точковых мутаций вплоть до 10^-5-10^-6 для более обширных модификаций), во многих случаях требуя скрининга большего числа колоний. Таким образом, все еще требуются новые технологии, которые являются доступными, легкими в применении и эффективными для генетического конструирования как эукариотических, так и прокариотических организмов.

Недавние работы по CRISPR (коротким палиндромным повторам, регулярно расположенным группами) адаптивной иммунной системы прокариот привели к идентификации нуклеаз, у которых специфичность к последовательности программируется малыми РНК. Локусы CRISPR состоят из серий повторов, разделенных "спейсерными" последовательностями, которые соответствуют геномам бактериофагов и другим мобильным генетическим элементам. Массив повторов-спейсеров транскрибируется в виде длинного предшественника и подвергается процессингу в последовательностях повторов для создания малой crRNA, которая определяет целевые последовательности (также известные как протоспейсеры) расщепленных с помощью CRISPR систем. Важным для расщепления является наличие мотива последовательности непосредственно ниже целевого участка, известного как смежный с протоспейсером мотив (PAM). CRISPR-ассоциированные (cas) гены обычно фланкируют массив повторов-спейсеров и кодируют ферментативный механизм, ответственный за биогенез crRNA и целенаправленное воздействие. Cas9 является дцДНК-эндонуклеазой, которая использует crRNA-гид для определения сайта расщепления. Загрузка crRNA-гида на Cas9 происходит во время процессинга предшественника crRNA и требует наличия малой антисмысловой РНК на предшественнике, tracrRNA и RNAse III. В отличие от редактирования генома с помощью ZFN или TALEN, изменение специфичности целенаправленного воздействия Cas9 не требует конструирования белков, а только разработки короткой crRNA-гида.

Заявители в недавнее время показали на S. pneumoniae, что введение системы CRISPR, нацеленной на хромосомный локус, приводит к уничтожению трансформированных клеток. Было отмечено, что случайно выжившие клетки содержали мутации в целевом участке, что указывало на то, что эндонуклеазная активность, направленная на дцДНК, Cas9 по отношению к эндогенным мишеням может быть использована для редактирования генома. Заявители показали, что безмаркерные мутации можно вводить путем трансформации фрагмента ДНК-матрицы, который будет рекомбинировать в геноме и исключать распознавание мишеней Cas9. Управление специфичностью Cas9 с несколькими различными crRNA обеспечивает возможность введения многочисленных мутаций одновременно. Заявители также охарактеризовали в деталях требования к последовательности для направленного воздействия Cas9 и показали, что подход можно сочетать с рекомбинационной инженерией для редактирования генома у E. coli.

РЕЗУЛЬТАТЫ: редактирование генома с помощью расщепления Cas9 хромосомной мишени

Штамм crR6 S. Pneumoniae содержит систему CRISPR на основе Cas9, которая расщепляет целевую последовательность, присутствующую в бактериофаге R6^8232.5. Эту мишень интегрировали в хромосомный локус srtA второго штамма R6^8232.5. Измененную целевую последовательность, содержащую мутацию в участке PAM, интегрировали в локус srtA третьего штамма R6^370.1, делая этот штамм "устойчивым" к расщеплению с помощью CRISPR (фигура 28a). Заявители трансформировали клетки R6^8232.5 и R6^370.1 геномной ДНК из клеток crR6, ожидая, что успешная трансформация клеток R6^8232.5 должна привести к расщеплению целевого локуса и гибели клеток. Вопреки этому ожиданию, заявители выделили трансформантов R6^8232.5, хотя и с примерно в 10 раз меньшей эффективностью, чем трансформантов R6^370.1 (фигура 28b). Генетический анализ восьми трансформантов R6^8232.5 (фигура 28) выявил, что подавляющее большинство представляют собой продукт явления двойной рекомбинации, исключающей токсичность целенаправленного воздействия Cas9 путем замещения мишени R68232.5 локусом дикого типа srtA генома crR6, который не содержит протоспейсер, требуемый для распознавания Cas9. Эти результаты были доказательством того, что одновременное введение системы CRISPR, нацеленной на локус генома (конструкция для целенаправленного воздействия), вместе с матрицей для рекомбинации в целевом локусе (матрица редактирования), приводило к целенаправленному редактированию генома (фигура 23a).

Для создания упрощенной системы для редактирования генома заявители модифицировали локус CRISPR в штамме crR6 путем делеции генов cas1, cas2 и csn2, которые, как было показано, являются необязательными для целенаправленного воздействия CRISPR, с получением штамма crR6M (фигура 28a). Этот штамм сохранял те же свойства, что и crR6 (фигура 28b). Для того, чтобы повысить эффективность редактирования на основе Cas9 и продемонстрировать, что выбранная ДНК-матрица может быть использована для контроля введенных мутаций, заявители котрансформировали клетки R6^8232.5 с ПЦР-продуктами гена srtA дикого типа или мутантной мишенью R6^370.1, каждый из которых должен быть устойчивым к расщеплению Cas9. Это приводило к от 5- до 10-кратного повышения частоты трансформирования по сравнению с геномной ДНК crR6 в отдельности (фигура 23b). Эффективность редактирования также существенно увеличилась, при этом 8/8 тестированных трансформантов содержали копию srtA дикого типа, а 7/8 содержали PAM-мутацию, присутствующую в мишени R6^370.1 (фигура 23b и фигура 29a). Взятые вместе, эти результаты свидетельствуют о возможности редактирования генома при помощи Cas9.

Анализа плановых требований для Cas9. Для введения специфичных изменений в геном нужно использовать матрицу редактирования, несущую мутации, которые прекращают расщепление, опосредованное Cas9, тем самым предотвращая гибель клеток. Этого легко достичь, когда необходима делеция мишени или ее замещение другой последовательностью (вставка гена). Если целью является создание слияний генов или создание однонуклеотидных мутаций, ликвидирование нуклеазной активности Cas9 будет возможно только путем введения мутаций в матрицу редактирования, которые изменяют последовательности либо PAM, либо протоспейсера. Для определения затруднений опосредованного CRISPR редактирования заявители выполняли исчерпывающий анализ мутаций PAM и протоспейсера, которые подавляют целенаправленное воздействие CRISPR.

Предыдущие исследования предполагали, что Cas9 S. pyogenes требует наличия PAM NGG непосредственно ниже протоспейсера. Однако по причине того, что на настоящий момент было описано только очень ограниченное количество мутаций, инактивирующих PAM, заявители провели систематический анализ для обнаружения всех 5-нуклеотидных последовательностей, расположенных после протоспейсера, которые исключают расщепление с помощью CRISPR. Заявители использовали рандомизированные олигонуклеотиды для создания всех возможных 1024 последовательностей PAM в гетерогенном ПЦР-продукте, который трансформировали в клетки crR6 или R6. Ожидалось, что конструкции, несущие функциональные PAM, будут распознаваться и разрушаться Cas9 в клетках crR6, но не в клетках R6 (фигура 24a). Более чем 2×10⁵ колоний объединяли вместе с целью экстрагирования ДНК для использования в качестве матрицы для ко-амплификации всех мишеней. Поводили глубокое секвенирование ПЦР-продуктов, и было обнаружено, что они содержат все 1024 последовательности, с перекрыванием в диапазоне от 5 до 42472 считываемых фрагментов (см. раздел “Анализ данных глубокого секвенирования”). Функциональность каждого PAM оценивали по относительной доле его считываемых фрагментов в образце crR6 относительно образца R6. Анализ первых трех оснований PAM, усредненных по двум последним основаниям, ясно показал, что паттерн NGG был недостаточно представлен в трансформантах crR6 (фигура 24b). Кроме того, следующие два основания не имели заметного влияния на PAM NGG (см. раздел “Анализ данных глубокого секвенирования”), демонстрируя, что последовательность NGGNN была достаточной для разрешения проявления активности Cas9. Частичное целенаправленное воздействие наблюдалось для последовательностей PAM NAG (фигура 24b). Также паттерн NNGGN частично инактивировал целенаправленное воздействие CRISPR (таблица G), что указывало на то, что при сдвиге на 1 п.о. мотив NGG все еще мог узнаваться Cas9 с пониженной эффективностью. Эти данные пролили свет на молекулярный механизм распознавание мишеней Cas9, и было выявлено, что последовательности NGG (или CCN в комплементарной нити) являются достаточными для целенаправленного воздействия Cas9, и что следует избегать мутаций NGG на NAG или NNGGN в матрице редактирования. В связи с высокой частотой этих тринуклеотидных последовательностей (каждые 8 п.о.), это означает, что можно редактировать практически любое положение в геноме. Более того, заявители тестировали десять произвольно выбранных мишеней, несущих различные PAM, и было обнаружено, что все они являются функциональными (фигура 30).

Другим способом нарушения опосредованного Cas9 расщепления является введение мутаций в протоспейсерный участок матрицы редактирования. Известно, что точковые мутации в "затравочной последовательности" (от 8 дo 10 нуклеотидов протоспейсера, непосредственно смежных с PAM) могут прекращать расщепление с помощью нуклеаз CRISPR. Однако точная длина этого участка неизвестна, и не ясно, могут ли мутации в каком-либо нуклеотиде в затравке нарушать распознавание мишеней Cas9. Заявители следовали тому же подходу глубокого секвенирования, который описан выше, для рандомизирования целой протоспейсерной последовательности, участвующей в контактах пар оснований с crRNA, и для определения всех последовательностей, которые препятствуют целенаправленному воздействию. Каждое положение 20 совпадающих нуклеотидов (14) в мишени spc1, присутствующих в клетках R6^8232.5 (фигура 23a), рандомизировали и трансформировали в клетки crR6 и R6 (фигура 24a). В соответствии с наличием затравочной последовательности только мутации в 12 нуклеотидах непосредственно выше PAM подавляли расщепление с помощью Cas9 (фигура 24c). Тем не менее, различные мутации отображали весьма разные эффекты. Дистальные (от PAM) положения затравки (от 12 дo 7) выдерживали большинство мутаций, и только одно определенное замещение основания подавляло целенаправленное воздействие. В то же время, мутации в любом нуклеотиде в проксимальных положениях (от 6 до 1, за исключением 3) исключали активность Cas9, однако на разных уровнях для каждого конкретного замещения. В положении 3 только два замещения влияли на активность CRISPR и с разной силой. Заявители пришли к выводу, что хотя мутации затравочной последовательности могут предотвращать целенаправленное воздействие CRISPR, существуют ограничения в отношении изменений нуклеотидов, которые могут быть произведены в любом положении затравки. Более того, эти ограничения, наиболее вероятно, могут варьировать для разных спейсерных последовательностей. Таким образом, заявители полагают, что мутации в последовательности PAM, если это возможно, должны быть предпочтительной стратегией редактирования. Альтернативно, множественные мутации в затравочной последовательности можно вводить для предотвращения нуклеазной активности Cas9.

Опосредованное Cas9 редактирование генома у S. pneumonia. Для разработки быстрого и эффективного способа для целенаправленного редактирования генома заявители конструировали штамм crR6Rk, штамм, в котором спейсеры можно легко вводить с помощью ПЦР (фигура 33). Заявители решили редактировать ген β-галактозидазы (bgaA) S. pneumoniae, активность которого может быть легко измерена. Заявители вводили аминокислотные замены на аланин в активный сайт этого фермента: Мутации R481A (R→A) и N563A, E564A (NE→AA). Для иллюстрации различных стратегий редактирования заявители разрабатывали мутации как последовательности PAM, так и протоспейсера затравки. В обоих случаях использовали одну и ту же конструкцию для целенаправленного воздействия с crRNA, комплементарной участку гена β-галактозидазы, который является смежным с последовательностью PAM TGG (CCA в комплементарной нити, фигура 26). Матрица редактирования R→A производила трехнуклеотидное несовпадение в затравочной последовательности протоспейсера (CGT на GCA, также с введением сайта рестрикции BtgZI). В матрицу редактирования NE→AA заявители одновременно вводили синонимичную мутацию, которая производила неактивный PAM (TGG на TTG), совместно с мутациями, которые находились на 218 нуклеотидов ниже от участка протоспейсера (AAT GAA на GCT GCA, также с созданием сайта рестрикции TseI). Эта последняя стратегия редактирования демонстрировала возможность использования удаленного PAM для создания мутаций в местах, где подходящую мишень может быть сложно выбрать. Например, хотя геном R6 S. pneumoniae, который характеризуется содержанием GC 39,7%, содержит в среднем один мотив PAM на каждые 12 п.о., некоторые мотивы PAM разделены вплоть до 194 п.о. (фигура 33). К тому же заявители разработали делецию внутри рамки считывания ΔbgaA длиной 6664 п.о. Во всех трех случаях котрансформацией матриц целенаправленного воздействия и редактирования производили в 10 раз больше устойчивых к канамицину клеток, чем котрансформацией с контрольной матрицей редактирования, содержащей последовательности дикого типа bgaA (фигура 25b). Заявители генотипировали 24 трансформанта (8 для каждого эксперимента редактирования) и обнаружили, что все кроме одного включали желаемое изменение (фигура 25c). Секвенирование ДНК также подтверждало не только присутствие введенных мутаций, но и отсутствие вторичных мутаций в целевом участке (фигура 29b, c). И наконец, заявители измеряли активность β-галактозидазы для подтверждения того, что все редактированные клетки демонстрировали ожидаемый фенотип (фигура 25d).

Опосредованное Cas9 редактирование также может быть использовано для создания множественных мутаций для изучения биологических путей. Заявители решили проиллюстрировать это для сортаза-зависимого пути, посредством которого поверхностные белки прикрепляются к оболочке грамположительных бактерий. Заявители вводили делецию гена сортазы с помощью котрансформации устойчивой к хлорамфениколу конструкции для целенаправленного воздействия и матрицы редактирования ΔsrtA (фигура 33a, b) с последующей делецией ΔbgaA с применением устойчивой к канамицину конструкции для целенаправленного воздействия, которая замещала предыдущую. У S. pneumoniae β-галактозидаза ковалентно связывается с клеточной стенкой с помощью сортазы. Таким образом, делеция srtA приводит к высвобождению поверхностного белка в супернатант, в то время как двойная делеция не приводит к заметной активности β-галактозидазы (фигура 34c). Такой последовательный отбор можно повторять столько раз, сколько требуется для создания множественных мутаций.

Эти две мутации также можно вводить одновременно. Заявители разрабатывали конструкцию для целенаправленного воздействия, содержащую два спейсера, один, совпадающий с srtA, а другой, совпадающий с bgaA, и одновременно котрансформировали ее двумя матрицами редактирования (фигура 25e). Генетический анализ трансформантов показал, что редактирование происходило в 6/8 случаев (фигура 25f). В частности, каждый из двух оставшихся клонов содержал делецию ΔsrtA или ΔbgaA, что предполагало возможность выполнения комбинаторного мутагенеза с применением Cas9. И наконец, для ликвидации последовательностей CRISPR заявители вводили плазмиду, содержащую мишень bgaA и ген устойчивости к спектиномицину совместно с геномной ДНК из штамма дикого типа R6. Устойчивые к спектиномицину трансформанты, которые сохраняли плазмиду, ликвидировали последовательности CRISPR (фигура 34a, d).

Механизм и эффективность редактирования. Для понимания механизмов, лежащих в основе редактирования генома с помощью Cas9, заявители смоделировали эксперимент, в котором эффективность редактирования измеряли независимо от расщепления Cas9. Заявители интегрировали ген устойчивости к эритромицину ermAM в локус srtA и вводили преждевременный стоп-кодон с применением редактирования, опосредованного Cas9 (фигура 33). Полученный штамм (JEN53) содержит аллель ermAM(stop) и является чувствительным к эритромицину. Этот штамм можно использовать для оценки эффективности, с которой ген ermAM репарируется, с помощью количественного определения фракции клеток, у которых восстанавливается устойчивость к антибиотику с использованием или без использования расщепления Cas9. JEN53 трансформировали матрицей редактирования, которая восстанавливает аллель дикого типа, совместно либо с устойчивой к канамицину конструкцией CRISPR, нацеленной на аллель ermAM (stop) (CRISPR::ermAM(stop)), либо с контрольной конструкцией без спейсера (CRISPR::∅) (фигура 26a, b). При отсутствии отбора по канамицину фракция редактированных колоний составляла порядком 10^-2 (устойчивые к эритромицину КОЕ/все КОЕ) (фигура 26c), что представляло базовую частоту рекомбинации без опосредованного Cas9 отбора против нередактированных клеток. Однако, если применяли отбор по канамицину и котрансформировали контрольную конструкцию CRISPR, фракция редактированных колоний возрастала до около 10^-1 (устойчивые к канамицину и эритромицину КОЕ/устойчивые к канамицину КОЕ) (фигура 26c). Этот результат показывает,что отбор по рекомбинации локуса CRISPR проводили совместно с отбором по рекомбинации в локусе ermAM независимо от расщепления генома Cas9, что указывало на то, что субпопуляция клеток более подвержена трансформации и/или рекомбинации. Трансформация конструкции CRISPR::ermAM(stop) с последующим отбором по кантамицину приводила к увеличению фракции устойчивых к эритромицину редактированных клеток дo 99% (фигура 26c). Для определения, является ли это увеличение обусловленным нередактированными клетками, заявители сравнивали устойчивые к канамицину колониеобразующие единицы (КОЕ), полученные после котрансформации клеток JEN53 конструкциями CRISPR::ermAM(stop) или CRISPR::∅.

Заявители насчитывали в 5,3 раза меньше устойчивых к канамицину колоний после трансформации конструкцией ermAM(stop) (2,5×10⁴/4,7×10³, фигура 35a), результат, который подтверждает, что определенное целенаправленное воздействие Cas9 на хромосомный локус ведет к гибели нередактированных клеток. И наконец, поскольку введение разрывов дцДНК в бактериальную хромосому, как известно, запускает механизмы репарации, которые повышают уровень рекомбинации поврежденной ДНК, заявители исследовали, индуцирует ли расщепление с помощью Cas9 рекомбинацию матрицы редактирования. Заявители насчитывали в 2,2 раза больше колоний после котрансформации конструкцией CRISPR::erm(stop), чем конструкцией CRISPR::∅ (фигура 26d), что указывало на незначительную индукцию рекомбинации. Взятые вместе, эти результаты свидетельствуют о том, что и совместный отбор трансформируемых клеток, и индукция рекомбинации с помощью опосредованного Cas9 расщепления, и отбор против нередактированных клеток способствовали высокой эффективности редактирования генома у S. pneumoniae.

Поскольку расщепление генома с помощью Cas9 должно уничтожать нередактированные клетки, не ожидалось получение каких-либо клеток, получивших кассету устойчивости к канамицину, содержащую Cas9, но не матрицу редактирования. Однако при отсутствии матрицы редактирования заявители получали много устойчивых к канамицину колоний после трансформации конструкцией CRISPR::ermAM(stop) (фигура 35a). Эти клетки, которые "избежали" CRISPR-индуцированной гибели, создали фон, который определял предел способа. Эту фоновую частоту можно подсчитать в этом эксперименте как соотношение CRISPR::ermAM(stop)/CRISPR::∅ КОЕ, 2,6×10^-3 (7,1×10¹/2,7×10⁴), подразумевая, что если частота рекомбинации матрицы редактирования меньше этого значения, отбор с помощью CRISPR не может эффективно обеспечить получение желаемых мутантов в количестве, выше фонового. Для понимания происхождения этих клеток, заявители генотипировали 8 фоновых колоний и обнаружили, что 7 содержали делеции спейсера для целенаправленного воздействия (фигура 35b), и одна несла предположительно инактивирующую мутацию в Cas9 (фигура 35c).

Редактирование генома Cas9 у E. coli. Активация целенаправленного воздействия Cas9 через хромосомную интеграцию системы CRISPR-Cas является единственно возможной у организмов, у которых наблюдается высокая частота рекомбинации. Для разработки более общего способа, который является применимым к другим микроорганизмам, заявители решили выполнить редактирование генома у E. coli с применением системы на основе плазмиды CRISPR-Cas. Создавали две плазмиды: плазмиду pCas9, несущую tracrRNA, Cas9 и кассету устойчивости к хлорамфениколу (фигура 36), и плазмиду устойчивости к канамицину pCRISPR, несущую массив спейсеров CRISPR. Для оценки эффективности редактирования независимо от отбора с помощью CRISPR заявители стремились ввести трансверсию A на C в гене rpsL, вызывающую устойчивость к стрептомицину. Заявители создавали плазмиду pCRISPR::rpsL, несущую спейсер, который будет направлять расщепление Cas9 аллеля rpsL дикого типа, но не мутантного (фигура 27b). Сначала вводили плазмиду pCas9 E. coli MG1655 и полученный штамм котрансформировали плазмидой pCRISPR::rpsL и W542, олигонуклеотидом для редактирования, содержащим мутацию замены A на C. Устойчивые к стрептомицину колонии после трансформации плазмидой pCRISPR::rpsL были единственными полученными, что свидетельствует о том, что расщепление Cas9 индуцирует рекомбинацию данного олигонуклеотида (фигура 37). Однако количество устойчивых к стрептомицину колоний было на два порядка величины меньше, чем количество устойчивых к канамицину колоний, которые предположительно представляют собой клетки, избегающие расщепления с помощью Cas9. Таким образом, в данных условиях расщепление с помощью Cas9 облегчало введение мутации, но с эффективностью, которая была недостаточной для отбора мутантных клеток в количестве, выше фонового количества "клеток, избежавших воздействия".

Для повышения эффективности редактирования генома у E. coli, заявители применяли свою систему CRISPR с рекомбинационной инженерией с применением индуцированной Cas9 гибели клеток для отбора по желаемым мутациям. Плазмиду pCas9 вводили в штамм HME63 (31), который подвергали рекомбинационной инженерии, имеющего функции Gam, Exo и Beta фага □-red. Полученный штамм котрансформировали плазмидой pCRISPR::rpsL (или контрольной pCRISPR::∅) и олигонуклеотидом W542 (фигура 27a). Эффективность рекомбинационной инженерии, рассчитанная как фракция всех клеток, ставших устойчивыми к стрептомицину, при использовании контрольной плазмиды составляла 5,3×10^-5 (фигура 27c). В то же время трансформация плазмидой pCRISPR::rpsL повысила процентную долю мутантных клеток до 65 ± 14% (фигуры 27c и 29f). Заявители наблюдали, что количество КОЕ после трансформации плазмидой pCRISPR::rpsL было приблизительно на три порядка величины ниже, чем после трансформации контрольной плазмидой (4,8×10⁵/5,3×10², фигура 38a), что свидетельствовало о том, что отбор является следствием CRISPR-индуцированной смерти нередактированных клеток. Для измерения уровня, при котором инактивировалось расщепление Cas9, который является важным параметром способа заявителей, заявители трансформировали клетки либо pCRISPR::rpsL, либо контрольной плазмидой без олигонуклеотида для редактирования W542 (фигура 38a). Это фоновое количество "клеток, избежавших воздействия" CRISPR, которое измеряли как соотношение pCRISPR::rpsL/pCRISPR::∅ КОЕ, составляло 2,5×10^-4 (1,2×10²/4,8×10⁵). Генотипирование восьми из этих клеток, избежавших воздействия, выявило, что во всех случаях присутствовала делеция спейсера для целенаправленного воздействия (фигура 38b). Этот фоновое количество было выше значения эффективности рекомбинационной инженерии для мутации rpsL, 5,3×10^-5, что свидетельствовало о том, что для получения 65% редактированных клеток расщепление Cas9 должно индуцировать рекомбинацию олигонуклеотида. Для подтверждения этого заявители сравнили число устойчивых к канамицину и стрептомицину КОЕ после трансформации pCRISPR::rpsL или pCRISPR::∅ (фигура 27d). Как в случае для S. pneumoniae, заявители наблюдали незначительную индукцию рекомбинации, приблизительно 6,7-кратную (2,0×10^-4/3,0×10^-5). Взятые вместе, эти результаты свидетельствуют о том, что система CRISPR обеспечивала способ отбора мутаций, введенных путем рекомбинационной инженерии.

Заявители показали, что системы CRISPR-Cas можно использовать для целенаправленного редактирования генома у бактерий путем совместного введения конструкции для целенаправленного воздействия, которая уничтожала клетки дикого типа, и матрицы редактирования, которые совместно исключали расщепление с помощью CRISPR и обеспечивали введение желаемых мутаций. Можно создавать разные типы мутаций (вставки, делеции или scar-less однонуклеотидные замены). Множественные мутации можно вводить одновременно. Специфичность и универсальность редактирования с применением системы CRISPR основывались на нескольких уникальных свойствах эндонуклеазы Cas9: (i) ее специфичность целенаправленного воздействия можно программировать малыми РНК без необходимости конструировать фермент, (ii) специфичность целенаправленного воздействия, определенная с помощью взаимодействия РНК-ДНК на протяжении 20 п.о. с низкой вероятностью распознавания ложных мишеней, была очень высокой, (iii) практически любая последовательность может подвергаться целенаправленному воздействию, единственным требованием является наличие смежной последовательности NGG, (iv) практически любая мутация в последовательности NGG, а также мутации в затравочной последовательности протоспейсера исключают целенаправленное воздействие.

Заявители показали, что конструирование генома с применением системы CRISPR работало не только у бактерий, у которых наблюдается высокая частота рекомбинации, таких как S. pneumoniae, но также у E. coli. Результаты по E. coli свидетельствовали о том, что способ можно применять к другим микроорганизмам, которым можно вводить плазмиды. В E. coli данный подход дополняет рекомбинационную инженерию мутагенных олигонуклеотидов. Для использования этого метода в микроорганизмах, где рекомбинационная инженерия является невозможной, механизм гомологичной рекомбинации хозяина можно применять за счет обеспечения матрицы редактирования в плазмиде. К тому же, поскольку накопленные данные указывают на то, что опосредованное CRISPR расщепление приводит к гибели клеток многих бактерий и архей, можно предположить использование эндогенных систем CRISPR-Cas для целей редактирования.

И в S. pneumoniae, и в E. coli заявители наблюдали, что хотя редактированию способствовали совместный отбор трансформируемых клеток и незначительная индукция рекомбинации в целевом сайте за счет расщепления Cas9, механизмом, который способствовал редактированию в наибольшей степени, являлся отбор против нередактированных клеток. Таким образом, основным ограничением способа было наличие фона клеток, которые избежали CRISPR-индуцированной гибели клеток и не имели желаемой мутации. Заявители показали, что эти "клетки, избежавшие воздействия" возникли в основном путем делеции спейсера для целенаправленного воздействия, предположительно после рекомбинации последовательностей повторов, которые фланкируют спейсер для целенаправленного воздействия. Дальнейшее совершенствование можно сосредоточить на конструировании фланкирующих последовательностей для исключения рекомбинации, которые все еще могут поддерживать биогенез функциональных crRNA, но которые достаточно отличаются друг от друга. Альтернативно можно исследовать прямую трансформацию химерных crRNA. В частном случае E. coli создание системы CRISPR-Cas было невозможным, если этот организм также использовали в качестве хозяина для клонирования. Заявители решили эту проблему путем размещения Cas9 и tracrRNA на одной плазмиде, а CRISPR-массив на другой. Конструирование индуцибельной системы также может обойти это ограничение.

Хотя новые технологии синтеза ДНК обеспечивают возможность с оптимальными затратами создавать любую последовательность с высокой производительностью, остается проблема интегрирования синтетической ДНК в живые клетки для создания функциональных геномов. Недавно было показано, что стратегия совместного отбора MAGE повышает эффективность мутаций рекомбинационной инженерии путем отбора субпопуляции клеток, которые характеризуются повышенной вероятностью достижения рекомбинации в или возле данного локуса. В этом способе, введение селектируемых мутации используют для повышения вероятности создания расположенных поблизости неселектируемых мутаций. В отличие от непрямого отбора обеспечиваемого этой стратегией, использование системы CRISPR делает возможным производить прямой отбор по желаемой мутации и получать ее с высокой эффективностью. Эти технологии дополняют панель инструментов специалистов в области генной инженерии и совместно с синтезом ДНК они могут существенно увеличить как возможность расшифровки функции гена, так и осуществления манипуляции с организмами в биотехнологических целях. Два других исследования также относятся к конструированию с помощью CRISPR геномов млекопитающих. Ожидается, что эти crRNA-направленные технологии редактирования генома могут широко применяться в фундаментальных и медицинских науках.

Штаммы и условия культивирования. Штамм R6 S. pneumoniae был предоставлен д-ром Alexander Tomasz. Штамм crR6 получали в предыдущем исследовании. Культуры S. pneumoniae в жидкой среде выращивали в THYE (30 г/л агара Тодда-Хьюитта, 5 г/л дрожжевого экстракта). Клетки высевали на триптический соевый агар (TSA) с добавлением 5% дефибринированной овечьей крови. При необходимости добавляли следующие антибиотики: канамицин (400 мкг/мл), хлорамфеникол (5 мкг/мл), эритромицин (1 мкг/мл) стрептомицин (100 мкг/мл) или спектиномицин (100 мкг/мл). Измерения активности β-галактозидазы производили с применением анализа Миллера, как описано ранее.

Штаммы E. coli MG1655 и HME63 (полученные из MG1655, Δ(argF-lac) U169 λ cI857 Δcro-bioA galK tyr 145 UAG mutS<>amp) (31) были предоставлены Jeff Roberts и Donald Court, соответственно. Культуры E. coli в жидкой среде выращивали в среде LB (Difco). При необходимости добавляли следующие антибиотики: хлорамфеникол (25 мкг/мл), канамицин (25 мкг/мл) и стрептомицин (50 мкг/мл).

Трансформация S. pneumoniae. Компетентные клетки получали, как описано ранее (23). Для всех трансформаций для редактирования генома производили осторожное оттаивание клеток на льду и ресуспендировали их в 10 объемах среды M2 с добавлением 100 нг/мл стимулирующего компетенцию пептида CSP1(40) и с последующим добавлением конструкций для редактирования (конструкции для редактирования добавляли к клеткам при конечной концентрации от 0,7 нг/мкл дo 2,5 мкг/мкл). Клетки инкубировали 20 мин. при 37°C перед добавлением 2 мкл конструкций для целенаправленного воздействия и затем инкубировали 40 мин. при 37°C. Серийные разбавления клеток высевали на соответствующую среду для определения количества колониеобразующих единиц (КОЕ).

Рекомбинационная инженерия Lambda-red E. coli. Штамм HME63 использовали для всех экспериментов рекомбинационной инженерии. Клетки для рекомбинационной инженерии получали и обрабатывали в соответствии с ранее опубликованным протоколом (6). Кратко, 2 мл суточной культуры (среда LB), инокулированной из одной колонии, полученной из чашки, выращивали при 30°C. Суточную культуру разводили в 100 раз и выращивали при 30°C со встряхиванием (200 об/мин) до тех пор, пока OD₆₀₀ не составляло 0,4-0,5 (приблизительно 3 часа). Для индукции Lambda-red культуру переносили на водяную баню при 42°C для встряхивания при 200 об/мин в течение 15 мин. Сразу же после индукции культуру перемешивали в суспензии ледяной воды и охлаждали на льду в течение 5-10 мин. Клетки затем промывали и аликвотировали в соответствии с протоколом. Для электротрансформации 50 мкл клеток смешивали с 1 мМ обессоленных олигонуклеотидов (IDT) или 100-150 нг плазмидной ДНК (полученной с помощью QIAprep Spin Miniprep Kit, Qiagen). Клетки электропорировали с использованием 1 мм кюветы Gene Pulser (Bio-rad) при 1,8 кВ и сразу же ресуспендировали в 1 мл среды LB комнатной температуры. Клетки извлекали при 30°C в течение 1-2 часов перед высеванием на агар LB с соответствующей устойчивостью к антибиотику и инкубировали при 32°C на протяжении ночи.

Получение геномной ДНК S. pneumoniae. В целях трансформации геномную ДНК S. pneumoniae выделяли с применением набора для очистки геномной ДНК Wizard, следуя инструкциям, предоставляемым производителем (Promega). В целях генотипирования 700 мкл суточных культур S. pneumoniae осаждали центрифугированием, ресуспендировали в 60 мкл раствора лизоцима (2 мг/мл) и инкубировали 30 мин при 37°C. Геномную ДНК экстрагировали с применением набора QIAprep Spin Miniprep Kit (Qiagen).

Создание штамма. Все праймеры, использованные в данном исследовании, представлены в таблице G. Для создания crR6M S. pneumoniae создавали промежуточный штамм LAM226. В этом штамме ген aphA-3 (обеспечивающий устойчивость к канамицину), смежный с массивом CRISPR штамма crR6 S. pneumoniae, замещали геном cat (обеспечивающим устойчивость к хлорамфениколу). Кратко, геномную ДНК crR6 амплифицировали с применением праймеров L448/L444 и L447/L481, соответственно. Ген cat амплифицировали из плазмиды pC194 с применением праймеров L445/L446. Каждый ПЦР-продукт очищали в геле и осуществляли слияние всех трех с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L448/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6 S. pneumoniae и отбирали устойчивые к хлорамфениколу трансформанты. Для создания crR6M S. pneumoniae геномную ДНК crR6 S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L409/L488 и L448/L481, соответственно. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L409/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки LAM226 S. pneumoniae и отбирали устойчивые к канамицину трансформанты.

Для создания crR6Mc S. pneumoniae геномную ДНК crR6R S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L430/W286 и геномную ДНК LAM226 S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров W288/L481. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L430/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6M S. pneumoniae и отбирали устойчивые к хлорамфениколу трансформанты.

Для создания crR6Rk S. pneumoniae геномную ДНК crR6M S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L430/W286 и W287/L481, соответственно. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L430/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к канамицину трансформанты.

Для создания JEN37 геномную ДНК crR6Rk S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L430/W356 и W357/L481, соответственно. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L430/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к канамицину трансформанты.

Для создания JEN38 геномную ДНК R6 амплифицировали с применением праймеров L422/L461 и L459/L426, соответственно. Ген ermAM (определяющий устойчивость к эритромицину) из плазмиды pFW15⁴³ амплифицировали с применением праймеров L457/L458. Каждый ПЦР-продукт очищали в геле и осуществляли слияние всех трех с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L422/L426. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к эритромицину трансформанты.

JEN53 S. pneumoniae создавали в две стадии. Сначала JEN43 создавали, как проиллюстрировано на фигуре 33. JEN53 создавали путем трансформирования компетентных клеток JEN43 геномной ДНК JEN25 и отбора, как по хлорамфениколу, так и по эритромицину.

Для создания JEN62 S. pneumoniae геномную ДНК crR6Rk S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров W256/W365 и W366/L403, соответственно. Каждый ПЦР-продукт очищали и лигировали с помощью сборки по методу Гибсона. Продуктом сборки трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к канамицину трансформанты.

Создание плазмиды. pDB97 создавали посредством фосфорилирования и отжига олигонуклеотидов B296/B297 с последующим лигированием в pLZ12spec, расщепленный с помощью EcoRI/BamHI. Заявители полностью секвенировали pLZ12spec и депонировали его последовательность в Genbank (номер доступа: KC112384).

pDB98 получали после клонирования лидерной последовательности CRISPR совместно со структурной единицей повтор-спейсер-повтор в pLZ12spec. Этого достигали посредством амплификации ДНК crR6Rc с праймерами B298/B320 и B299/B321 с последующей ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) для обоих продуктов и клонированием в pLZ12spec с сайтами рестрикциии BamHI/EcoRI. Таким образом, последовательность спейсера в pDB98 конструировали так, чтобы она содержала два сайта рестрикции BsaI в противоположных направлениях, что обеспечивало возможность scar-less клонирования новых спейсеров.

От pDB99 до pDB108 создавали путем отжига олигонуклеотидов B300/B301 (pDB99), B302/B303 (pDB100), B304/B305 (pDB101), B306/B307 (pDB102), B308/B309 (pDB103), B310/B311 (pDB104), B312/B313 (pDB105), B314/B315 (pDB106), B315/B317 (pDB107), B318/B319 (pDB108) с последующим лигированием в pDB98, разрезанным с помощью BsaI.

Плазмиду pCas9 создавали следующим образом. Необходимые элементы CRISPR амплифицировали из геномной ДНК SF370 Streptococcus pyogenes с фланкирующими гомологичными плечами для сборки по методу Гибсона. tracrRNA и Cas9 амплифицировали с олигонуклеотидами HC008 и HC010. Лидерную последовательность и последовательности CRISPR амплифицировали с HC011/HC014 и HC015/HC009, так что два сайта BsaI типа IIS вводили между двумя прямыми повторами для обеспечения беспрепятственной вставки спейсеров.

pCRISPR создавали с помощью субклонирования массива CRISPR pCas9 в pZE21-MCS1 посредством амплификации с олигонуклеотидами B298+B299 и рестрикции EcoRI и BamHI. Спейсер для целенаправленного воздействия rpsL клонировали с помощью отжига олигонуклеотидов B352+B353 и клонирования в разрезанную BsaI pCRISPR с получением pCRISPR::rpsL.

Создание конструкций для целенаправленного воздействия и редактирования. Конструкций для целенаправленного воздействия, использованные для редактирования генома, получали с помощью сборки по методу Гибсона продуктов ПЦР с правыми и левыми праймерами (таблица G). Конструкции для редактирования получали посредством слияния ПЦР-продуктов A (ПЦР A), ПЦР-продуктов B (ПЦР B) и ПЦР-продуктов C (ПЦР C) при помощи ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR), при необходимости (таблица G). Конструкции CRISPR::∅ и CRISPR::ermAM(stop) для целенаправленного воздействия получали с помощью ПЦР амплификации геномной ДНК JEN62 и crR6, соответственно, с олигонуклеотидами L409 и L481.

Получение мишеней с рандомизированными PAM или последовательностями протоспейсеров. 5 нуклеотидов, следующих за мишенью спейсера 1, рандомизировали посредством амплификации геномной ДНК R6^8232.5 с праймерами W377/ L426. Этот ПЦР-продукт затем собирали с геном cat и участком srtA, находящимся выше, которые амплифицировали с той же матрицы с праймерами L422/W376. 80 нг собранной ДНК использовали для трансформации штаммов R6 и crR6. Образцы для рандомизированных мишеней получали с использованием следующих праймеров: B280-B290/L426 для рандомизирования оснований 1-10 мишени и B269-B278/L426 для рандомизирования оснований 10-20. Праймеры L422/B268 и L422/B279 использовали для амплификации гена cat и находящегося выше участка srtA для сборки с первыми и последними 10 ПЦР-продуктами, соответственно. Собранные конструкции объединяли вместе и с помощью 30 нг трансформировали R6 и crR6. После трансформации клетки высевали для отбора по хлорамфениколу. Для каждого образца более чем 2×10⁵ клеток объединяли вместе в 1 мл THYE и геномную ДНК экстрагировали с помощью набора Promega Wizard kit. Праймеры B250/B251 использовали для амплификации целевого участка. ПЦР-продукты метили и прогоняли на дорожке для секвенирования спаренных концов Illumina MiSeq с применением 300 циклов.

Анализ данных глубокого секвенирования

Рандомизированные PAM. Для эксперимента с рандомизированными PAM получали 3429406 считываемых фрагментов для crR6 и 3253998 для R6. Ожидалось, что только половина из них будет соответствовать мишени PAM, в то время как другая половина будет секвенировать другой конец ПЦР-продукта. 1623008 из считываемых фрагментов crR6 и 1537131 из считываемых фрагментов R6 несли лишенную ошибок целевую последовательность. Встречаемость каждого возможного PAM среди этих считываемых фрагментов показана в дополнительном файле. Для оценки функциональности PAM вычисляли его относительную долю в образце crR6 в сравнении с образцом R6 и обозначали r_ijklm, где I,j,k,l,m представляют собой одно из 4 возможных оснований. Создавали следующую статистическую модель:

log(r_ijklm) = μ + b2_i + b3_j + b4_k + b2b3_i,j+ b3b4_j,k+ ε_ijklm,

где ε представляет собой остаточную ошибку, b2 представляет собой эффект 2^го основания PAM, b3 - третьего, b4 - четвертого, b2b3 представляет собой взаимодействие между вторым и третьим основаниями, b3b4 - между третьим и четвертым основаниями. Выполняли дисперсионный анализ:

Таблица дисперсионного анализа

При добавлении в данную модель b1 или b5 оказываются незначимыми, и другие взаимодействия, кроме включенных, также можно исключать. Выбор модели осуществляли посредством последовательных сравнений более или менее полных моделей с применением метода дисперсионного анализа в R. Критерий подлинной значимости Тьюки использовали для определения, являются ли попарные различия между эффектами значимыми.

Паттерны NGGNN являлись достоверно отличными от всех других паттернов и имели самый сильный эффект (см. таблицу ниже).

Для того, чтобы показать, что положения 1, 4 или 5 не влияют на паттерн NGGNN, заявители рассматривали только эти последовательности. Оказывается, что их эффекты являются нормально распределенными (см. диаграмму "квантиль-квантиль" на фигуре 71), и сравнения моделей с применением метода дисперсионного анализа в R показывают, что нулевая модель является наилучшей, т. e. нет значимой роли b1, b4 и b5.

Сравнение моделей с применением метода дисперсионного анализа в R для последовательностей NGGNN

Частичная интерференция паттернов NAGNN и NNGGN

Паттерны NAGNN являются достоверно отличными от всех других паттернов, но несут намного меньший эффект, чем NGGNN (см. критерий подлинной значимости Тьюки ниже).

И наконец, паттерны NTGGN и NCGGN являются подобными и показывают значительно большую интерференцию CRISPR, чем паттерны NTGHN и NCGHN (где H представляет собой A,T или C), как показано с помощью парного критерия Стьюдента с поправкой Бониферрони.

Парные сравнения эффекта b4 на последовательности NYGNN с применением t-критериев с суммарным среднеквадратическим отклонением (SD)

Взятые вместе, эти результаты позволяют сделать вывод, что паттерны NNGGN в целом обеспечивают либо полную интерференцию, в случае NGGGN, либо частичную интерференцию, в случае NAGGN, NTGGN или NCGGN.

Множественные сравнения значений по Тьюки: уровень значимости с поправкой на эффект множественных сравнений 95%

Рандомизированная мишень

Для эксперимента с рандомизированными мишенями для crR6 получали 540726 считываемых фрагментов и 753,570 для R6. Как и прежде, ожидалось, что только половина считываемых фрагментов будет секвенировать конец ПЦР-продукта, представляющий интерес. После фильтрования для считываемых фрагментов, которые несут мишень, являющуюся лишенной ошибок или с одноточечной мутацией, оставалось 217656 и 353141 считываемых фрагментов для crR6 и R6, соответственно. Вычисляли относительную долю каждого мутанта в образце crR6 в сравнении с образцом R6 (фигура 24c). Все мутации вне затравочной последовательности (13-20 оснований от PAM) проявляли полную интерференцию. Эти последовательности использовали как идентификатор для определения, можно ли сказать, что мутации в затравочной последовательности значимо нарушают интерференцию. Нормальное распределение подбирали для этих последовательностей с использованием выравнивания функции распределения пакета MASS R. Квантиль 0,99 подобранного распределения показан как пунктирная линия на фигуре 24c. На фигуре 72 показана гистограмма плотности данных с подобранным нормальным распределением (черная линия) и квантилем 0,99 (пунктирная линия).

Таблица F. Относительная распространенность последовательностей PAM в образцах crR6/R6, усредненная по основаниям 1 и 5

Таблица G. Праймеры, использованные в данном исследовании

Таблица H. Структура конструкций для целенаправленного воздействия и редактирования, использованных в данном исследовании

Пример 6: оптимизация направляющей РНК для Cas9 Streptococcus pyogenes (называемого SpCas9)

Заявители вносили мутации в tracrRNA и последовательности прямых повторов или вносили мутации в химерную направляющую РНК для повышения экспрессии РНК в клетках.

Оптимизация основана на наблюдении, что присутствовали фрагменты тимина (Ts) в tracrRNA и направляющей РНК, которые могли приводить к ранней терминации транскрипции посредством промотора pol 3. Таким образом заявители создавали следующие оптимизированные последовательности. Оптимизированная tracrRNA и соответствующий оптимизированный прямой повтор представлены в парах.

Оптимизированная tracrRNA 1 (мутация подчеркнута):

GGAACCATTCAtAACAGCATAGCAAGTTAtAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTT

Оптимизированный прямой повтор 1 (мутация подчеркнута):

GTTaTAGAGCTATGCTGTTaTGAATGGTCCCAAAAC

Оптимизированная tracrRNA 2 (мутация подчеркнута):

GGAACCATTCAAtACAGCATAGCAAGTTAAtATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTT

Оптимизированный прямой повтор 2 (мутация подчеркнута):

GTaTTAGAGCTATGCTGTaTTGAATGGTCCCAAAAC

Заявители также оптимизировали химерную направляющую РНК для оптимальной активности в эукариотических клетках.

Исходная направляющая РНК:

NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Оптимизированная химерная направляющая последовательность РНК 1:

NNNNNNNNNNNNNNNNNNNNGTATTAGAGCTAGAAATAGCAAGTTAATATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Оптимизированная химерная направляющая последовательность РНК 2:

NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTATGCTGTTTTGGAAACAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Оптимизированная химерная направляющая последовательность РНК 3:

NNNNNNNNNNNNNNNNNNNNGTATTAGAGCTATGCTGTATTGGAAACAATACAGCATAGCAAGTTAATATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Заявители показали, что оптимизированная химерная направляющая РНК работает лучше, как показано на фигуре 3. Эксперимент проводили путем котрансфекции клеток 293FT Cas9 и ДНК-кассетой с U6-направляющей РНК для экспрессии одной из четырех форм РНК, показанных выше. Мишень направляющей РНК является таким же целевым сайтом в локусе EMX1 человека: “GTCACCTCCAATGACTAGGG”.

Пример 7: оптимизация Cas9 из CRISPR1 LMD-9 Streptococcus thermophiles (называемого St1Cas9)

Заявители разрабатывали направляющие химерные РНК, как показано на фигуре 4.

Направляющие РНК St1Cas9 можно подвергать такому же типу оптимизации, как и направляющие РНК SpCas9, путем разрушения политиминовых фрагментов (Ts).

Пример 8: разнообразие и мутации Cas9

Система CRISPR-Cas является адаптивным иммунным механизмом в отношении внедряющейся экзогенной ДНК, используемым разнообразными видами из числа бактерий и архей. Система CRISPR-Cas9 II типа состоит из набора генов, кодирующих белки, ответственные за “захват” чужеродной ДНК в локус CRISPR, а также из набора генов, кодирующих “выполнение” механизма расщепления ДНК; они включают ДНК-нуклеазу (Cas9), некодирующую транс-активирующую cr-RNA (tracrRNA) и массив полученных из чужеродной ДНК спейсеров, фланкированных прямыми повторами (crRNA). При созревании под действием Cas9 дуплекс tracRNA и crRNA направляет нуклеазу Cas9 к целевой последовательности ДНК, определенной спейсерными направляющими последовательностями и опосредует двухцепочечные разрывы в ДНК вблизи короткого мотива последовательности в целевой ДНК, которые требуются для расщепления и являются специфичными для каждой системы CRISPR-Cas. Системы CRISPR-Cas II типа обнаруживаются повсеместно в царстве бактерий и являются очень разнообразными по последовательности и размеру белка Cas9, последовательности прямого повтора tracrRNA и crRNA, организации этих элементов в геноме и требованиям к мотиву для целенаправленного расщепления. Один вид может иметь несколько отдельных систем CRISPR-Cas.

Заявители оценивали 207 предполагаемых Cas9 из видов бактерий, идентифицированных на основании гомологии последовательности с известными Cas9 и структурами, ортологичными известным субдоменам, в том числе домену эндонуклеазы HNH и доменам эндонуклеазы RuvC [информация от Eugene Koonin и Kira Makarova]. Филогенетический анализ, основанный на консервативности последовательности белка в этом наборе, позволил выявить пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот) (фигуры 39 и 40A-F).

В этом примере заявители показали, что следующие мутации могут превратить SpCas9 в надрезающий фермент: D10A, E762A, H840A, N854A, N863A, D986A.

Заявителями представлены последовательности, в которых показано, где локализованы точки мутаций в гене SpCas9 (фигура 41). Заявители также показывают, что никазы все еще могут опосредовать гомологичную рекомбинацию (анализ, указанный на фигуре 2). Более того, заявители показали, что SpCas9 с этими мутациями (отдельно) не индуцировал двухцепочечный разрыв (фигура 47).

Пример 9: дополнение специфичности целенаправленного воздействия в отношении ДНК РНК-направляемой нуклеазы Cas9

Клеточная культура и трансфекция

Линию клеток почки человеческого эмбриона (HEK) 293FT (Life Technologies) поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100 ЕД/мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% CO₂.

Клетки 293FT засевали или на 6-луночные планшеты, 24-луночные планшеты, или на 96-луночные планшеты (Corning) за 24 часа до трансфекции. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies) при 80-90% конфлуентности, следуя рекомендованному производителем протоколу. На каждую лунку 6-луночного планшета использовали в общей сложности 1 мкг плазмиды Cas9+sgRNA. На каждую лунку 24-луночного планшета использовали, если не указано иное, в общей сложности 500 нг плазмиды Cas9+sgRNA. На каждую лунку 96-луночного планшета использовали 65 нг плазмиды Cas9 при молярном соотношении ПЦР-продукта U6-sgRNA 1:1.

Клеточную линию эмбриональных стволовых клеток человека HUES9 (Harvard Stem Cell Institute core) поддерживали в условиях без подслоя на GelTrex (Life Technologies) в среде mTesR (Stemcell Technologies) с добавлением 100 мкг/мл Normocin (InvivoGen). Клетки HUES9 трансфицировали с помощью набора Amaxa P3 Primary Cell 4-D Nucleofector Kit (Lonza), следуя протоколу производителя.

Анализ с помощью SURVEYOR на предмет наличия модификации генома

Клетки 293FT трансфицировали плазмидной ДНК, как описано выше. Клетки инкубировали при 37°C в течение 72 часов после трансфекции перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью раствора QuickExtract DNA Extraction Solution (Epicentre), следуя протоколу производителя. Вкратце, осажденные центрифугированием клетки ресуспендировали в растворе QuickExtract solution и инкубировали при 65°C в течение 15 минут и 98°C в течение 10 минут.

Геномный участок, фланкирующий целевой сайт CRISPR каждого гена, амплифицировали с помощью ПЦР (праймеры перечислены в таблицах J и K) и продукты очищали с применением колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10X ПЦР-буфера для ДНК-полимеразы Taq (Enzymatics) и воды сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex TBE (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос.

Анализ экспрессии tracrRNA в клетках человека с помощью нозерн-блоттинга

Анализы нозерн-блоттинга выполняли, как описано ранее 1. Кратко, молекулы РНК нагревали до 95°C в течение 5 мин перед погружением в 8% денатурирующие полиакриламидные гели (SequaGel, National Diagnostics). После этого РНК переносили на предварительно гибридизированную мембрану Hybond N+ (GE Healthcare) и сшивали с помощью прибора для автоматического сшивания с помощью ультрафиолета Stratagene UV Crosslinker (Stratagene). Зонды метили [гамма-32P] АТФ (Perkin Elmer) с полинуклеотидкиназой T4 (New England Biolabs). После промывания мембрану экспонировали на люминисцентном экране в течение одного часа и сканировали с использованием устройства для формирования изображения на люминесцентном фосфорном покрытии (Typhoon).

Бисульфитное секвенирование для оценки статуса метилирования ДНК

Клетки HEK 293FT трансфицировали Cas9, как описано выше. Геномную ДНК выделяли с помощью набора DNeasy Blood & Tissue Kit (Qiagen) и подвергали бисульфитной модификации с помощью набора EZ DNA Methylation-Lightning Kit (Zymo Research). Бисульфитную ПЦР проводили с применением ДНК-полимеразы KAPA2G Robust HotStart (KAPA Biosystems) с праймерами, разработанными с применением Bisulfite Primer Seeker (Zymo Research, таблицы J и K). Полученные ПЦР-ампликоны очищали в геле, расщепляли EcoRI и HindIII и лигировали в остов pUC19 перед трансформацией. Отдельные клоны затем секвенровали по Сэнгеру для оценки статуса метилирования ДНК.

In vitro транскрипция и анализ расщепления

Клетки HEK 293FT трансфицировали Cas9, как описано выше. Цельноклеточные лизаты затем получали с применением лизирующего буфера (20 мМ HEPES, 100 мМ KCl, 5 мМ MgCl2, 1 мМ DTT, 5% глицерина, 0,1% Triton X-100) с добавлением смеси ингибиторов протеаз (Roche). Управляемые T7 sgRNA транскрибировали in vitro с применением специальных олигонуклеотидов (пример 10) и набора для транскрипции in vitro HiScribe T7 (NEB), следуя рекомендованному производителем протоколу. Для получения метилированных целевых сайтов плазмиду pUC19 метилировали с помощью M.SssI и затем проводили линеаризацию с помощью NheI. Анализ расщепления in vitro выполняли следующим образом: для реакции расщепления 20 мкл 10 мкл клеточного лизата инкубировали с 2 мкл буфера для расщепления (100 мМ HEPES, 500 мМ KCl, 25 мМ MgCl₂, 5 мМ DTT, 25% глицерина), транскрибированной in vitro РНК и 300 нг ДНК плазмиды pUC19.

Глубокое секвенирование для оценки специфичности целенаправленного воздействия

Клетки HEK 293FT, которые высевали в 96-луночные планшеты, трансфицировали ПЦР кассетой с плазмидной ДНК Cas9 и одиночной направляющей РНК (sgRNA) за 72 часа до экстракции геномной ДНК (фиг. 72). Геномный участок, фланкирующий целевой сайт CRISPR каждого гена, амплифицировали (фиг. 74, фиг. 80, (пример 10)) с помощью метода ПЦР с перекрывающимися праймерами для присоединения адаптеров Illumina P5, а также уникальных специфичных для каждого образца штрихкодов к целевым ампликонам (схематическое изображение, описанное на фиг. 73). ПЦР-продукты очищали с применением 96-луночных планшетов для фильтрования EconoSpin (Epoch Life Sciences), следуя рекомендованному производителем протоколу.

Очищенные образцы ДНК со штрихкодами количественно определяли с помощью набора для анализа Quant-iT PicoGreen dsDNA или Qubit 2.0 Fluorometer (Life Technologies) и объединяли в эквимолярном соотношении. С библиотеками секвенирования затем проводили глубокое секвенирование с использованием секвенсера Illumina MiSeq Personal Sequencer (Life Technologies).

Анализ данных секвенирования и обнаружение вставок/делеций

Считываемые фрагменты MiSeq фильтровали с требуемым средним качеством Phred (оценка Q), по меньшей мере 23, а также полными соответствиями последовательностей к штрихкодам и прямым праймерам ампликона. Считываемые фрагменты из целевых и нецелевых локусов анализировали сначала с помощью выполнения выравниваний Смита-Ватермана против последовательностей ампликонов, которые включали 50 нуклеотидов выше и ниже целевого сайта (в общей сложности 120 п.о.). При этом выравнивания анализировали по вставкам/делециям от 5 нуклеотидов выше до 5 нуклеотидов ниже целевого сайта (в общей сложности 30 п.о.). Анализированные целевые участки исключали, если часть их выравнивания выходила за пределы самого считываемого фрагмента MiSeq или если совпавшие пары оснований содержали меньше 85% их общей длины.

Отрицательные контроли для каждого образца представляли эталон включения или исключения вставок/делеций как предполагаемых событий разрезания. Для каждого образца вставку/делецию учитывали, только если ее показатель качества превышал , где представляло собой средний показатель качества отрицательного контроля, соответствующего образцу, и представляло собой его среднеквадратическое отклонение. Это дало соотношения всех вставок/делеций целевых участков, как для отрицательных контролей, так и их соответствующих образцов. С применением соотношений ошибок отрицательного контроля на-целевой-участок-на-считываемый фрагмент, , наблюдаемое количество вставок/делеций образцов и его количество считываемых фрагментов , оценку максимального правдоподобия для фракции считываемых фрагментов, содержащих целевые участки с верными вставками/делециями, , выявляли с помощью применения бионормальной модели ошибок, указанной ниже.

Допустив, что (неизвестное) количество считываемых фрагментов в образце, содержащих целевые участки, неправильно подсчитанные как такие, которые имеют по меньшей мере 1 вставку/делецию, равно , можно написать (без внесения каких-либо предположений о количестве верных вставок/делеций)

поскольку представляет собой количество считываемых фрагментов, содержащих целевые участки без верных вставок/делеций. При этом, поскольку количество считываемых фрагментов, наблюдаемых, как такие, которые содержат вставки/делеции, равно , , другими словами, количество считываемых фрагментов, содержащих целевые участки с ошибками, но без верных вставок/делеций, плюс количество считываемых фрагментов, чьи целевые участки содержат правильные вставки/делеции. Можно переписать указанное выше:

Принимая, что все значения частоты целевых участков с верными вставками/делециями априори являются равновероятными, . Оценка максимального правдоподобия (MLE) частоты целевых участков с верными вставками/делециями, таким образом, устанавливали как величину , которая максимизировала . Это оценивали в числовом отношении.

Для размещения границ ошибки относительно частот фрагментов считывания с верными вставками/делециями в их библиотеках секвенирования для каждого образца рассчитывали доверительные интервалы Вильсона (2), предоставляющие MLE-оценку целевых участков с верными вставками/делециями, , и количество считываемых фрагментов . Конкретно, нижнюю границу и верхнюю границу рассчитывали как

где , стандартный показатель достоверности, требуемый для нормального распределения дисперсии 1, устанавливали на 1,96, что означало достоверность 95%. Максимальные верхние границы и минимальные нижние границы для каждой биологической повторности перечислены на фигурах 80-83.

Анализ qRT-PCR относительной экспрессии Cas9 и sgRNA

Клетки 293FT, высеянные в 24-луночные планшеты, трансфицировали, как описано выше. Через 72 часа после трансфекции общую РНК собирали с помощью набора miRNeasy Micro Kit (Qiagen). Синтез минус-нити sgRNA выполняли c помощью набора qScript Flex cDNA kit (VWR) и специальных праймеров для синтеза первой нити (таблицы J и K). Анализ количественной ПЦР выполняли с использованием Fast SYBR Green Master Mix (Life Technologies) и специальных праймеров (таблицы J и K) с применением GAPDH в качестве эндогенного контроля. Относительный количественный анализ производили с помощью способа ΔCT.

Таблица I | Последовательности целевого сайта. Тестируемые целевые сайты для системы CRISPR II типа S. pyogenes с соответствующим PAM. Клетки трансфицировали Cas9 и либо crRNA-tracrRNA, либо химерной sgRNA для каждой мишени.

ID целевого сайта Мишень в геноме Последовательность целевого сайта (от 5’ к 3’) PAM Нить 1 EMX1 GTCACCTCCAATGACTAGGG TGG + 2 EMX1 GACATCGATGTCCTCCCCAT TGG - 3 EMX1 GAGTCCGAGCAGAAGAAGAA GGG + 6 EMX1 GCGCCACCGGTTGATGTGAT GGG - 10 EMX1 GGGGCACAGATGAGAAACTC AGG - 11 EMX1 GTACAAACGGCAGAAGCTGG AGG + 12 EMX1 GGCAGAAGCTGGAGGAGGAA GGG + 13 EMX1 GGAGCCCTTCTTCTTCTGCT CGG - 14 EMX1 GGGCAACCACAAACCCACGA GGG + 15 EMX1 GCTCCCATCACATCAACCGG TGG + 16 EMX1 GTGGCGCATTGCCACGAAGC AGG + 17 EMX1 GGCAGAGTGCTGCTTGCTGC TGG + 18 EMX1 GCCCCTGCGTGGGCCCAAGC TGG + 19 EMX1 GAGTGGCCAGAGTCCAGCTT GGG - 20 EMX1 GGCCTCCCCAAAGCCTGGCC AGG - 4 PVALB GGGGCCGAGATTGGGTGTTC AGG + 5 PVALB GTGGCGAGAGGGGCCGAGAT TGG + 1 SERPINB5 GAGTGCCGCCGAGGCGGGGC GGG + 2 SERPINB5 GGAGTGCCGCCGAGGCGGGG CGG + 3 SERPINB5 GGAGAGGAGTGCCGCCGAGG CGG +

Таблица J | Последовательности праймеров

Анализ с помощью SURVEYOR

Название праймера Мишень в геноме Последовательность праймера (от 5’ к 3’) Sp-EMX1-F1 EMX1 AAAACCACCCTTCTCTCTGGC Sp-EMX1-R1 EMX1 GGAGATTGGAGACACGGAGAG Sp-EMX1-F2 EMX1 CCATCCCCTTCTGTGAATGT Sp-EMX1-R2 EMX1 GGAGATTGGAGACACGGAGA Sp-PVALB-F PVALB CTGGAAAGCCAATGCCTGAC Sp-PVALB-R PVALB GGCAGCAAACTCCTTGTCCT

Анализ qRT-PCR экспрессии Cas9 и sgRNA

Название праймера Последовательность праймера (от 5’ к 3’) Синтез минус-нити sgRNA aagcaccgactcggtgccac EMX1.1 sgRNA qPCR F TCACCTCCAATGACTAGGGg EMX1.1 sgRNA qPCR R Caagttgataacggactagcct EMX1.3 sgRNA qPCR F AGTCCGAGCAGAAGAAGAAgttt EMX1.3 sgRNA qPCR R tttcaagttgataacggactagcct Cas9 qPCR F AAACAGCAGATTCGCCTGGA Cas9 qPCR R TCATCCGCTCGATGAAGCTC GAPDH qPCR F TCCAAAATCAAGTGGGGCGA GAPDH qPCR R TGATGACCCTTTTGGCTCCC

Бисульфитная ПЦР и секвенирование

Название праймера Последовательность праймера (от 5’ к 3’) Бисульфитная ПЦР F (локус SERPINB5) gaggaattcTTTTTTTGTTYGAATATGTTGGAGGTTTTTTGGAAG Бисульфитная ПЦР R
(локус SERPINB5) gagaagcttAAATAAAAAACRACAATACTCAACCCAACAACC Секвенирование pUC19 CAGGAAACAGCTATGAC

Таблица K | Последовательности праймеров для проверки строения sgRNA. Праймеры гибридизируют с минус-нитью промотора U6, если не указано иное. Праймирующий сайт U6 обозначен курсивом, направляющая последовательность обозначена как фрагмент Ns, последовательность прямого повтора выделена жирным шрифтом, а последовательность tracrRNA подчеркнута. Вторичная структура каждого строения sgRNA показана на фиг. 43.

Название праймера Последовательность праймера (от 5’ к 3’) U6-прямой gcctctagaggtacctgagggcctatttcccatgattcc I: sgRNA(DR +12, tracrRNA +85) acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAAcggactagccttattttaacttgCTATTTCTAGCTCTAAAACNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCACaag II: sgRNA(DR +12, tracrRNA +85) mut2 acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAAcggactagccttatAttaacttgCTATTTCTAGCTCTAAtACNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCACaag III: sgRNA(DR +22, tracrRNA +85) acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAAcggactagccttattttaacttgCTAtgctgttttgTTTCcaaaacagcaTAGCTCTAAAACNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCACaag IV: sgRNA(DR +22, tracrRNA +85) mut4 acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAAcggactagccttatAttaacttgCTAtgctgtAttgTTTCcaatacagcaTAGCTCTAAtACNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCACaag

Таблица L | Целевые сайты с альтернативными PAM для тестирования специфичности Cas9 в отношении PAM. Все целевые сайты для тестирования специфичности в отношении PAM найдены в локусе EMX1 человека.

Последовательность целевого сайта (от 5' к 3') PAM AGGCCCCAGTGGCTGCTCT NAA ACATCAACCGGTGGCGCAT NAT AAGGTGTGGTTCCAGAACC NAC CCATCACATCAACCGGTGG NAG AAACGGCAGAAGCTGGAGG NTA GGCAGAAGCTGGAGGAGGA NTT GGTGTGGTTCCAGAACCGG NTC AACCGGAGGACAAAGTACA NTG TTCCAGAACCGGAGGACAA NCA GTGTGGTTCCAGAACCGGA NCT TCCAGAACCGGAGGACAAA NCC CAGAAGCTGGAGGAGGAAG NCG CATCAACCGGTGGCGCATT NGA GCAGAAGCTGGAGGAGGAA NGT CCTCCCTCCCTGGCCCAGG NGC TCATCTGTGCCCCTCCCTC NAA GGGAGGACATCGATGTCAC NAT CAAACGGCAGAAGCTGGAG NAC GGGTGGGCAACCACAAACC NAG GGTGGGCAACCACAAACCC NTA GGCTCCCATCACATCAACC NTT GAAGGGCCTGAGTCCGAGC NTC CAACCGGTGGCGCATTGCC NTG AGGAGGAAGGGCCTGAGTC NCA AGCTGGAGGAGGAAGGGCC NCT GCATTGCCACGAAGCAGGC NCC ATTGCCACGAAGCAGGCCA NCG AGAACCGGAGGACAAAGTA NGA TCAACCGGTGGCGCATTGC NGT GAAGCTGGAGGAGGAAGGG NGC

Пример 10: дополнительные последовательности

Все последовательности представлены в направлении от 5’ к 3’. Для транскрипции U6 черта подчеркнутого целевого сайта (Ts) выступает как терминатор транскрипции.

U6 с короткой tracrRNA (Streptococcus pyogenes SF370):

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

(последовательность tracrRNA представлена жирным шрифтом)

>U6-DR-направляющая последовательность-DR (SF370 Streptococcus pyogenes)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccgggttttagagctatgctgttttgaatggtcccaaaacNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgttttagagctatgctgttttgaatggtcccaaaacTTTTTTT

(прямой повтор последовательности выделен серым, а направляющая последовательность N представлена жирным шрифтом)

> sgRNA, содержащая +48 tracrRNA (SF370 Streptococcus pyogenes)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgTTTTTTT

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)

> sgRNA, содержащая +54 tracrRNA (SF370 Streptococcus pyogenes)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaTTTTTTTT

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)

> sgRNA, содержащая +67 tracrRNA (SF370 Streptococcus pyogenes)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)

> sgRNA, содержащая +85 tracrRNA (SF370 Streptococcus pyogenes)

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTT

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)

> CBh-NLS-SpCas9-NLS

cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattacctggagcacctgcctgaaatcactttttttcaggttGGaccggtgccaccATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACTTTCTTTTTCTTAGCTTGACCAGCTTTCTTAGTAGCAGCAGGACGCTTTAA

(NLS-hSpCas9-NLS выделена жирным шрифтом)

> Ампликон секвенирования для гидов EMX1 1.1, 1.14, 1.17

CCAATGGGGAGGACATCGATGTCACCTCCAATGACTAGGGTGGGCAACCACAAACCCACGAGGGCAGAGTGCTGCTTGCTGCTGGCCAGGCCCCTGCGTGGGCCCAAGCTGGACTCTGGCCAC

> Ампликон секвенирования для гидов EMX1 1.2, 1.16

CGAGCAGAAGAAGAAGGGCTCCCATCACATCAACCGGTGGCGCATTGCCACGAAGCAGGCCAATGGGGAGGACATCGATGTCACCTCCAATGACTAGGGTGGGCAACCACAAACCCACGAG

> Ампликон секвенирования для гидов EMX1 1.3, 1.13, 1.15

GGAGGACAAAGTACAAACGGCAGAAGCTGGAGGAGGAAGGGCCTGAGTCCGAGCAGAAGAAGAAGGGCTCCCATCACATCAACCGGTGGCGCATTGCCACGAAGCAGGCCAATGGGGAGGACATCGAT

> Ампликон секвенирования для гидов EMX1 1.6

AGAAGCTGGAGGAGGAAGGGCCTGAGTCCGAGCAGAAGAAGAAGGGCTCCCATCACATCAACCGGTGGCGCATTGCCACGAAGCAGGCCAATGGGGAGGACATCGATGTCACCTCCAATGACTAGGGTGG

> Ампликон секвенирования для гидов EMX1 1.10

CCTCAGTCTTCCCATCAGGCTCTCAGCTCAGCCTGAGTGTTGAGGCCCCAGTGGCTGCTCTGGGGGCCTCCTGAGTTTCTCATCTGTGCCCCTCCCTCCCTGGCCCAGGTGAAGGTGTGGTTCCA

> Ампликон секвенирования для гидов EMX1 1.11, 1.12

TCATCTGTGCCCCTCCCTCCCTGGCCCAGGTGAAGGTGTGGTTCCAGAACCGGAGGACAAAGTACAAACGGCAGAAGCTGGAGGAGGAAGGGCCTGAGTCCGAGCAGAAGAAGAAGGGCTCCCATCACA

> Ампликон секвенирования для гидов EMX1 1.18, 1.19

CTCCAATGACTAGGGTGGGCAACCACAAACCCACGAGGGCAGAGTGCTGCTTGCTGCTGGCCAGGCCCCTGCGTGGGCCCAAGCTGGACTCTGGCCACTCCCTGGCCAGGCTTTGGGGAGGCCTGGAGT

> Ампликон секвенирования для гидов EMX1 1.20

CTGCTTGCTGCTGGCCAGGCCCCTGCGTGGGCCCAAGCTGGACTCTGGCCACTCCCTGGCCAGGCTTTGGGGAGGCCTGGAGTCATGGCCCCACAGGGCTTGAAGCCCGGGGCCGCCATTGACAGAG

> Промотор T7 праймера F для отжига с целевой нитью

gaaatTAATACGACTCACTATAGGG

>Олигонуклеотид, содержащий целевой сайт 1 pUC19 для метилирования (обратный T7)

aaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctatttctagctctaaaacaacgacgagcgtgacaccaccctatagtgagtcgtattaatttc

>Олигонуклеотид, содержащий целевой сайт 2 pUC19 для метилирования (обратный T7)

aaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctatttctagctctaaaacgcaacaattaatagactggacctatagtgagtcgtattaatttc

Пример 11: опосредованная олигонуклеотидами Cas9-индуцированная гомологичная рекомбинация

Тест олигонуклеотидной гомологичной рекомбинации представляет собой сравнение эффективности всех различных вариантов Cas9 и различных матриц HR (олигонуклеотид по сравнению с плазмидой).

Использовали клетки 293FT. SpCas9 = Cas9 дикого типа и SpCas9n = никаза Cas9 (D10A). Мишень химерной РНК представляет собой такую же протоспейсер-мишень 1 EMX1, как в примерах 5, 9 и 10, и олигонуклеотиды синтезированы с помощью IDT с применением очистки PAGE.

На фигуре 44 изображена структура олигонуклеотидной ДНК, использованной как матрица гомологичной рекомбинации (HR) в этом эксперименте. Длинные олигонуклеотиды содержат гомологичность 100 п.о. к локусу EMX1 и сайт рестрикции HindIII. Клетки 293FT котрансфицировали: во-первых, плазмидой, содержащей целевой локус EMX1 человека, химерную РНК и белок cas9 дикого типа, и, во-вторых, олигонуклеотидной ДНК в качестве матрицы HR. Образцы получены из клеток 293FT, собранных через 96 часов после трансфекции Lipofectamine 2000. Все продукты амплифицировали с праймером EMX1 HR Primer, очищали на геле с последующим расщеплением HindIII для выявления эффективности интеграции матрицы HR в геном человека.

На фигурах 45 и 46 изображено сравнение эффективности HR, индуцированной с помощью разных комбинаций белка Cas9 и матрицы HR. Использованной конструкцией Cas9 были или Cas9 дикого типа, или вариант никазы Cas9 (Cas9n). Использованной матрицей HR были: антисмысловая олигонуклеотидная ДНК (антисмысловой олигонуклеотид на фигуре выше), или смысловая олигонуклеотидная ДНК (смысловой олигонуклеотид на фигуре выше), или матрица HR плазмиды (матрица HR на фигуре выше). Определение "смысловая/антисмысловая" означает, что активно транскрибируемая нить с последовательностью, соответствующей транскрибированной мРНК, определяется как смысловая нить в геноме. Эффективность HR показана как процентная доля группы расщепления HindIII от всего амплифицированного с помощью ПЦР продукта генома (числа внизу).

Пример 12: мышь-аутист

Недавние широкомасштабные проекты по секвенированию представили большое количество генов, ассоциированных с заболеваниями. Выявление генов является только началом понимания, что делает ген и как это приводит к фенотипу заболеваний. Существующие технологии и подходы для изучения генов-кандидатов медленные и трудоемкие. Золотые стандарты, целенаправленное воздействие на ген и генные нокауты, требуют значительных инвестиций времени и ресурсов, как денежных, так и относительно исследовательского персонала. Заявители поставили задачу использовать нуклеазу hSpCas9 для целенаправленного воздействия на многие гены и сделать это с более высокой эффективностью и более низкой оборотностью по сравнению с любой другой технологией. По причине высокой эффективности hSpCas9 заявители могут производить инъекцию РНК в зиготы мышей и сразу же получать животных с модифицированным геномом без потребности в производстве каких-либо предварительных генов, целенаправленно воздействующих в mESC.

Ген хромодомен хеликазы ДНК-связывающего белка 8 (CHD8) является важнейшим геном, вовлеченным в раннее развитие позвоночных и морфогенез. Мыши без CHD8 умирают в ходе эмбрионального развития. Мутации в CHD8 ассоциировали с расстройством аутического спектра у людей. Эту ассоциацию проводили в трех разных статьях, опубликованных одновременно в Nature. В тех же трех исследованиях идентифицировали множество генов, ассоциированных с расстройством аутического спектра. Целью заявителей было создание нокаутных мышей по четырем генам, которые были обнаружены во всех статьях, Chd8, Katnal2, Kctd13 и Scn2a. К тому же заявители выбрали два других гена, ассоциированных с расстройством аутического спектра, шизофренией и ADHD, GIT1, CACNA1C и CACNB2. И наконец, в качестве положительного контроля заявители решили задать MeCP2.

Для каждого гена заявители разрабатывали три gRNA, которые, вероятно, нокаутировали бы гены. Нокаутирование происходило бы после того, как нуклеаза hSpCas9 произведет двухцепочечный разрыв, и подверженный ошибкам путь репарации ДНК, негомологичное соединение концов, устранит разрыв, создавая мутацию. Наиболее вероятным результатом является мутация со сдвигом рамки считывания, которая произвела бы нокаут гена. Стратегия целенаправленного воздействия включала нахождение протоспейсеров в экзонах гена, содержащего последовательность PAM, NGG, являющегося уникальным в геноме. Предпочтение отдавали протоспейсерам в первом экзоне, которые были бы наиболее разрушительными для гена.

Каждую gRNA оценивали в клеточной линии мыши, Neuro-N2a, с помощью липосомальной неустойчивой котрансфекции hSpCas9. Через 72 часа после трансфекции геномную ДНК очищали с применением QuickExtract DNA от Epicentre. ПЦР выполняли для амплификации локуса, представляющего интерес. Затем следовало использование набора для обнаружения мутаций SURVEYOR от Transgenomics. Результаты анализа с помощью SURVEYOR для каждой gRNA и соответствующие контроли показаны на фигуре A1. Положительный результат анализа с помощью SURVEYOR представляет собой одну большую полосу, соответствующую геномной ПЦР, и две полосы поменьше, которые являются продуктами нуклеазы SURVEYOR, производящей двухцепочечный разрыв в сайте мутации. Среднюю эффективность разрезания каждой gRNA также определяли для каждой gRNA. gRNA, которую выбирали для инъекции, представляла собой gRNA наивысшей эффективности, которая была наиболее уникальной в геноме.

РНК (hSpCas9+gRNA РНК) инъецировали в пронуклеус зиготы и позже пересаживали приемной матери. Матерей позволяли проходить полный срок беременности, а у детенышей отбирали пробы путем надреза хвоста через 10 дней после рождения. ДНК выделяли и использовали как матрицу для ПЦР, которую затем подвергали процессингу с помощью SURVEYOR. Кроме того, ПЦР-продукты отправляли на секвенирование. ПЦР-продукты генома животных, которых определяли как положительные либо при анализе с помощью SURVEYOR, либо при ПЦР секвенировании, клонировали в вектор pUC19 и секвенировали для определения предполагаемых мутаций каждого аллеля.

На сегодняшний день детенышей мышей из эксперимента целенаправленного воздействия Chd8 полностью подвергали обработке, до самого секвенирования аллеля. Результаты анализа с помощью Surveyor для 38 живых детенышей (дорожки 1-38), 1 мертвого детеныша (дорожка 39) и 1 детеныша дикого типа для сравнения (дорожка 40) показаны на фигуре A2. Детенышам 1-19 инъецировали gRNA Chd8.2, а детенышам 20-38 инъецировали gRNA Chd8.3. Из 38 живых детенышей 13 были положительными по мутации. У одного мертвого детеныша также была мутация. В образце дикого типа не было обнаружено мутации. ПЦР секвенирование генома соответствовало данным анализа с помощью SURVEYOR.

Пример 13: опосредованная CRISPR/Cas модуляция транскрипции

На фигуре 67 изображенa структура CRISPR-TF (транскрипционного фактора), обладающего функцией активации транскрипции. Химерная РНК экспрессируется с помощью промотора U6, a кодон-оптимизированный для человека вариант двойного мутанта белка Cas9 (hSpCas9m), функционально связанного с трехкомпонентной NLS и функциональным доменом VP64, экспрессируется с помощью промотора EF1a. Двойные мутации, D10A и H840A, делают белок Cas9 неспособным вносить какое-либо расщепление, но поддерживают его способность связываться с целевой ДНК при направлении химерной РНК.

На фигуре 68 изображена активация транскрипции гена SOX2 человека с помощью системы CRISPR-TF (химерная РНК и слитый белок Cas9-NLS-VP64). Клетки 293FT трансфицировали плазмидами, несущей два компонента: (1) управляемые U6 различные химерные РНК, целенаправленно воздействующие на последовательности из 20 п.о. в локусе генома человека SOX2 или рядом с ним, и (2) управляемый EF1 hSpCas9m (двойной мутант)-слитый белок NLS-VP64. Через 96 часа после трансфекции клетки 293FT собирали и измеряли уровень активации посредством индукции экспрессии мРНК с применением анализа qRT-PCR. Все уровни экспрессии нормированы по сравнению с контрольной группой (серый столбец), представляющей результаты клеток, трансфицированных плазмидой с остовом CRISPR-TF без химерной РНК. Зонды qRT-PCR использовали для выявления мРНК SOX2 при анализе экспрессии генов Taqman Human (Life Technologies). Представлены данные всех экспериментов 3 биологических повторностей, n=3, планки погрешностей показывают стандартную ошибку среднего.

Пример 14: NLS: Cas9-NLS

Клетки 293FT трансфицировали плазмидой, содержащей два компонента: (1) промотор EF1, управляющий экспрессией Cas9 (Sp Cas9 дикого типа, кодон-оптимизированный для человека) с различными структурами NLS, (2) промотор U6, управляющий тем же локусом EMX1 человека, подвергающимся целенаправленному воздействию химерной РНК.

Клетки собирали в момент времени 72 часа после трансфекции и затем экстрагировали 50 мкл раствора для экстракции геномной ДНК QuickExtract, следуя протоколу производителя. Целевую геномную ДНК EMX1 амплифицировали с помощью ПЦР и затем очищали в геле с 1% агарозного геля. Геномный ПЦР-продукт вторично отжигали и подвергали анализу с помощью SURVEYOR, следуя протоколу производителя. Эффективность расщепления различных конструкций генома измеряли с применением SDS-PAGE в 4-12% геле TBE-PAGE (Life Technologies), анализировали и количественно определяли с использованием программного обеспечения ImageLab (Bio-rad), следуя протоколу производителя.

На фигуре 69 изображена структура различных конструкций Cas9-NLS. Все Cas9 представляли собой кодон-оптимизированный для человека вариант Sp Cas9. Последовательности NLS связаны с геном cas9 либо на N-конце, либо на С-конце. Все варианты Cas9 с различными структурами NLS клонировали в вектор, содержащий остов, так что он управлялся промотором EF1a. В этом же векторе находилась химерная РНК, целенаправленно воздействующая на локус EMX1 человека, управляемый промотором U6, формирующим вместе с ней двухкомпонентную систему.

Таблица M. Результаты исследования структуры Cas9-NLS. Количественный анализ геномного расщепления различных конструкций cas9-nls посредством анализа с помощью Surveyor.

Процентная доля геномного расщепления, измеренная посредством анализа с помощью Surveyor Биологическая повторность 1
(%) Биологическая повторность 2 (%) Биологическая повторность 3 (%) Среднее (%) Ошибка (S.E.M., стандартная ошибка среднего) Cas9 (без NLS) 2,50 3,30 2,73 2,84 0,24 Cas9 с NLS на N-конце 7,61 6,29 5,46 6,45 0,63 Cas9 с NLS на C-конце 5,75 4,86 4,70 5,10 0,33 Cas9 с двойной NLS (на N-конце и С-конце) 9,08 9,85 7,78 8,90 0,60

На фигуре 70 изображена эффективность геномного расщепления, индуцированного вариантами Cas9, несущими разные структуры NLS. Процентная доля указывает часть геномной ДНК EMX1 человека, которая подвергалась расщеплению каждой конструкцией. Все эксперименты получены из 3 биологических повторностей. n = 3, ошибка означает S.E.M.

Пример 15: конструирование микроводорослей с использованием Cas9

Способы доставки Cas9

Способ 1: заявители доставляли Cas9 и направляющую РНК с использованием вектора, который экспрессирует Cas9 под контролем конститутивного промотора, такого как промотор Hsp70A-Rbc S2 или бета-2-тубулиновый промотор.

Способ 2: заявители доставляли Cas9 и полимеразу T7 с использованием векторов, которые экспрессируют Cas9 и полимеразу T7 под контролем конститутивного промотора, такого как промотор Hsp70A-Rbc S2 или бета-2-тубулиновый промотор. Направляющая РНК будет доставляться с использованием вектора, содержащего промотор T7, управляющий экспрессией направляющей РНК.

Способ 3: заявители доставляли мРНК Cas9 и in vitro транскрибировали направляющую РНК в клетках водорослей. РНК можно транскрибировать in vitro. мРНК Cas9 будет состоять из кодирующего участка для Cas9, а также 3’UTR из Cop1, чтобы обеспечивать стабилизацию мРНК Cas9.

Для гомологичной рекомбинации заявители обеспечивали дополнительную матрицу для репарации с участием гомологичной рекомбинации.

Последовательность для кассеты, управляющей экспрессией Cas9 под контролем бета-2-тубулинового промотора, за которой следует 3’ UTR Cop1.

TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT

Последовательность для кассеты, управляющей экспрессией полимеразы T7 под контролем бета-2-тубулинового промотора, за которой следует 3’ UTR Cop1:

TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACatgcctaagaagaagaggaaggttaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaaggacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggtcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggactgcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgacaaggttccgttccctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctacaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatctgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtacgattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaaGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT

Последовательность направляющей РНК, управляемая промотором T7 (промотор T7, N представляют нацеливающую последовательность):

gaaatTAATACGACTCACTATANNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt

Доставка генов

Штаммы CC-124 и CC-125 Chlamydomonas reinhardtii из Ресурсного центра Chlamydomonas (Chlamydomonas Resource Center) будут использоваться для электропорации. Протокол электропорации соответствует стандартному рекомендованному протоколу для набора GeneArt Chlamydomonas Engineering kit.

Заявители также получали линию Chlamydomonas reinhardtii, которая экспрессирует Cas9 конститутивно. Это можно выполнить при помощи pChlamy1 (линеаризованная с использованием PvuI) и отбора в отношении устойчивых к гигромицину колоний. Последовательность для pChlamy1, содержащая Cas9, приведена ниже. В данном пути для достижения нокаутирования гена необходимо просто доставить РНК для направляющей РНК. Для гомологичной рекомбинации заявители доставляли направляющую РНК, а также линеаризованную матрицу для гомологичной рекомбинации.

pChlamy1-Cas9:

TGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGTTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGTCGCTGAGGCTTGACATGATTGGTGCGTATGTTTGTATGAAGCTACAGGACTGATTTGGCGGGCTATGAGGGCGGGGGAAGCTCTGGAAGGGCCGCGATGGGGCGCGCGGCGTCCAGAAGGCGCCATACGGCCCGCTGGCGGCACCCATCCGGTATAAAAGCCCGCGACCCCGAACGGTGACCTCCACTTTCAGCGACAAACGAGCACTTATACATACGCGACTATTCTGCCGCTATACATAACCACTCAGCTAGCTTAAGATCCCATCAAGCTTGCATGCCGGGCGCGCCAGAAGGAGCGCAGCCAAACCAGGATGATGTTTGATGGGGTATTTGAGCACTTGCAACCCTTATCCGGAAGCCCCCTGGCCCACAAAGGCTAGGCGCCAATGCAAGCAGTTCGCATGCAGCCCCTGGAGCGGTGCCCTCCTGATAAACCGGCCAGGGGGCCTATGTTCTTTACTTTTTTACAAGAGAAGTCACTCAACATCTTAAAATGGCCAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGGAGATTCGAGGTACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAACATATGATTCGAATGTCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGACACAAGAATCCCTGTTACTTCTCGACCGTATTGATTCGGATGATTCCTACGCGAGCCTGCGGAACGACCAGGAATTCTGGGAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGCCGCTGGCCCGCCGAGCCCTGGAGGAGCTCGGGCTGCCGGTGCCGCCGGTGCTGCGGGTGCCCGGCGAGAGCACCAACCCCGTACTGGTCGGCGAGCCCGGCCCGGTGATCAAGCTGTTCGGCGAGCACTGGTGCGGTCCGGAGAGCCTCGCGTCGGAGTCGGAGGCGTACGCGGTCCTGGCGGACGCCCCGGTGCCGGTGCCCCGCCTCCTCGGCCGCGGCGAGCTGCGGCCCGGCACCGGAGCCTGGCCGTGGCCCTACCTGGTGATGAGCCGGATGACCGGCACCACCTGGCGGTCCGCGATGGACGGCACGACCGACCGGAACGCGCTGCTCGCCCTGGCCCGCGAACTCGGCCGGGTGCTCGGCCGGCTGCACAGGGTGCCGCTGACCGGGAACACCGTGCTCACCCCCCATTCCGAGGTCTTCCCGGAACTGCTGCGGGAACGCCGCGCGGCGACCGTCGAGGACCACCGCGGGTGGGGCTACCTCTCGCCCCGGCTGCTGGACCGCCTGGAGGACTGGCTGCCGGACGTGGACACGCTGCTGGCCGGCCGCGAACCCCGGTTCGTCCACGGCGACCTGCACGGGACCAACATCTTCGTGGACCTGGCCGCGACCGAGGTCACCGGGATCGTCGACTTCACCGACGTCTATGCGGGAGACTCCCGCTACAGCCTGGTGCAACTGCATCTCAACGCCTTCCGGGGCGACCGCGAGATCCTGGCCGCGCTGCTCGACGGGGCGCAGTGGAAGCGGACCGAGGACTTCGCCCGCGAACTGCTCGCCTTCACCTTCCTGCACGACTTCGAGGTGTTCGAGGAGACCCCGCTGGATCTCTCCGGCTTCACCGATCCGGAGGAACTGGCGCAGTTCCTCTGGGGGCCGCCGGACACCGCCCCCGGCGCCTGATAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT

Для всех модифицированных клеток Chlamydomonas reinhardtii заявители использовали ПЦР, анализ с помощью нуклеазы SURVEYOR и секвенирование ДНК для подтверждения успешной модификации.

Пример 16: использование Cas9 как репрессора транскрипции у бактерий

Возможность искусственно контролировать транскрипцию является важной как для изучения функции гена, так и для создания синтетических генных сетей с желаемыми свойствами. Заявители описывают в данном документе использование РНК-направляемого белка Cas9 как программируемого репрессора транскрипции.

Заявители ранее продемонстрировали, как белок Cas9 SF370 Streptococcus pyogenes можно использовать для направленного редактирования генома у Streptococcus pneumoniae. В данном исследовании заявители конструировали штамм crR6Rk, содержащий минимальную систему CRISPR, состоящую из cas9, tracrRNA и повтора. В этом штамме мутации D10A-H840 вводили в cas9 с получением штамма crR6Rk**. Четыре спейсера, целенаправленно воздействующие на различные положения промотора bgaA гена β-галактозидазы, клонировали в массив CRISPR, переносимый ранее описанной плазмидой pDB98. Заявители наблюдали X-Y-кратное снижение активности β-галактозидазы, зависящее от положения целенаправленного воздействия, демонстрирующее потенциал Cas9 как программируемого репрессора (фигура 73).

С целью обеспечения репрессии Cas9** у Escherichia coli конструировали репортерную плазмиду (pDB127) с зеленым флуоресцентным белком (GFP) для экспрессии гена gfpmut2 с конститутивного промотора. Разрабатывали промотор, несущий несколько NPP PAM на обеих нитях, для измерения эффекта Cas9**, связывающегося в разных положениях. Заявители вводили мутации D10A-H840 в pCas9, при этом плазмиду, описанную как несущую tracrRNA, cas9 и минимальный массив CRISPR, разрабатывали для удобного клонирования новых спейсеров. Двадцать два различных спейсера разрабатывали для целенаправленного воздействия на различные участки промотора gfpmut2 и открытой рамки считывания. Приблизительно 20-кратное снижение флюоресценции наблюдали при целенаправленном воздействии на участки, перекрывающиеся или смежные по отношению к -35 и -10 элементам промотора и к последовательности Шайна-Дальгарно. Мишени на обеих нитях показывали подобные уровни репрессии. Эти результаты предполагают, что связывание Cas9** с каким-либо положением участка промотора предотвращает инициацию транскрипции предположительно посредством стерического ингибирования связывания RNAP.

Для определения того, может ли Cas9** предотвращать элонгацию транскрипции, заявители направляли ее к рамке считывания gpfmut2. Снижение флюоресценции наблюдали при целенаправленном воздействии и на кодирующие, и на некодирующие нити, что указывало на то, что связывание Cas9 действительно достаточно сильное, чтобы представлять собой препятствие для прохождения RNAP. Тем не менее в то время как 40% снижение экспрессии наблюдали, когда кодирующая нить являлась мишенью, 20-кратное снижение наблюдали для некодирующей нити (фиг. 21b, сравнение T9, T10 и T11 с B9, B10 и B11). Для непосредственного определения эффектов связывания Cas9**при транскрипции заявители выделяли РНК из штаммов, несущих либо T5, T10, B10, либо контрольную конструкцию, которая не воздействует целенаправленно на pDB127, и подвергали ее нозерн-блоттингу с применением зонда, связывающегося либо до (B477), либо после (B510) целевых сайтов B10 и T10. В соответствии с флюоресцентными методами заявителей, не было обнаружено транскрипции gfpmut2 при направлении Cas9** к промоторному участку (мишень T5), и транскрипцию наблюдали после целенаправленного воздействия на участок T10. Интересно, что меньший транскрипт наблюдали с зондом B477. Эта полоса соответствует ожидаемому размеру транскрипта, который будет прерываться Cas9**, и является непосредственной индикацией терминации транскрипции, вызванной dgRNA::Cas9**, связывающейся с кодирующей нитью. На удивление, заявители не обнаружили транскрипт при целенаправленном воздействии на некодирующую нить (B10). Поскольку связывание Cas9** с участком B1 маловероятно препятствует инициации транскрипции, эти результаты предполагают, что мРНК была разрушена. Было показано, что DgRNA::Cas9 связывает ssРНК in vitro. Заявители предполагают, что связывание может запускать разрушение мРНК нуклеазами хозяина. Действительно, остановка рибосом может индуцировать расщепление на транслированной мРНК у E. coli.

Некоторые применения требуют точного регулирования экспрессии генов, а не ее абсолютной репрессии. Заявители стремились к достижению промежуточных уровней репрессии за счет введения несовпадений, которые ослабили бы взаимодействия crRNA/мишень. Заявители создавали серии спейсеров на основе конструкций B1, T5 и B10 с увеличением количества мутаций на 5’-конце crRNA. До 8 мутаций включительно в B1 и T5 не влияли на уровень репрессии, и прогрессивное повышение флюоресценции наблюдали для дополнительных мутации.

Наблюдаемая репрессия с совпадением только 8 нт между crRNA и ее мишенью ставит вопрос эффектов нецелевого воздействия при использовании Cas9** как регулятора транскрипции. Поскольку подходящий PAM (NGG) также требуется для связывания Cas9, количество нуклеотидов в соответствии с получением определенного уровня рестрикции составляет 10. Совпадение в 10 нт встречается случайным образом каждый ~1 м.п.о., и такие сайты, таким образом, вероятно, можно найти даже в небольших бактериальных геномах. Однако для эффективной репрессии транскрипции необходимо, чтоб такие сайты находились в промоторном участке гена, который осуществляет нецелевое воздействие с намного меньшей вероятностью. Заявители также показали, что экспрессия генов может быть нарушена, если некодирующая нить гена подвергается целенаправленному воздействию. Для того, чтобы это произошло, произвольная мишень должна находиться в правильной ориентации, но эти события происходят с относительно большей вероятностью. Фактически, в ходе этого исследования заявители не смогли сконструировать один из разработанных спейсеров в pCas9**. Заявители позже обнаружили этот спейсер, характеризующийся совпадением 12 п.о., рядом с соответствующим PAM в ключевом гене murC. Такого нецелевого воздействия можно легко избежать путем систематического повреждения разработанных спейсеров.

Аспекты настоящего изобретения дополнительно описаны в следующих пронумерованных параграфах.

1. Векторная система, содержащая один или несколько векторов, где система содержит

a. первый регуляторный элемент, функционально связанный с парной traer-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной traer-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной traer-последовательностью, которая гибридизируется с traer-последовательностью; и

b. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации;

где компоненты (a) и (b) находятся в одном и том же или в различных векторах системы.

2. Векторная система по параграфу 1, где компонент (a) дополнительно содержит traer-последовательность ниже парной traer-последовательности под контролем первого регуляторного элемента.

3. Векторная система по параграфу 1, где компонент (a) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке.

4. Векторная система по параграфу 1, где система содержит traer-последовательность под контролем третьего регуляторного элемента.

5. Векторная система по параграфу 1, где traer-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной traer-последовательности при оптимальном выравнивании.

6. Векторная система по параграфу 1, где фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки.

7. Векторная система по параграфу 1, где фермент CRISPR является ферментом системы CRISPR II типа.

8. Векторная система по параграфу 1, где фермент CRISPR является ферментом Cas9.

9. Векторная система по параграфу 1, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.

10. Векторная система по параграфу 1, где фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности.

11. Векторная система по параграфу 1, где у фермента CRISPR отсутствует активность для расщепления нитей ДНК.

12. Векторная система по параграфу 1, где первый регуляторный элемент является промотором полимеразы III.

13. Векторная система по параграфу 1, где второй регуляторный элемент является промотором полимеразы II.

14. Векторная система по параграфу 4, где третий регуляторный элемент является промотором полимеразы III.

15. Векторная система по параграфу 1, где направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.

16. Векторная система по параграфу 1, где менее 50% нуклеотидов направляющей последовательности участвует в самокомплементарном спаривании оснований при оптимальном сворачивании.

17. Вектор, содержащий регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, где указанный регуляторный элемент управляет транскрипцией фермента CRISPR в эукариотической клетке так, что указанный фермент CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки.

18. Вектор по параграфу 17, где указанный регуляторный элемент является промотором полимеразы II.

19. Вектор по параграфу 17, где указанный фермент CRISPR является ферментом системы CRISPR II типа.

20. Вектор по параграфу 17, где указанный фермент CRISPR является ферментом Cas9.

21. Вектор по параграфу 17, где у указанного фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.

22. Фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки.

23. Фермент CRISPR по параграфу 22, где указанный фермент CRISPR является ферментом системы CRISPR II типа.

24. Фермент CRISPR по параграфу 22, где указанный фермент CRISPR является ферментом Cas9.

25. Фермент CRISPR по параграфу 22, где у указанного фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.

26. Эукариотическая клетка-хозяин, содержащая

a. первый регуляторный элемент, функционально связанный с парной traer-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной traer-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибиридизируется с целевой последовательностью, и (2) парной traсr-последовательность, которая гибиридизируется с traer-последовательностью; и/или

b. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации.

27. Эукариотическая клетка-хозяин по параграфу 26, где указанная клетка-хозяин содержит компоненты (a) и (b).

28. Эукариотическая клетка-хозяин по параграфу 26, где компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрируются в геном эукариотической клетки-хозяина.

29. Эукариотическая клетка-хозяин по параграфу 26, где компонент (a) дополнительно содержит traer-последовательность ниже парной traer-последовательности под контролем первого регуляторного элемента.

30. Эукариотическая клетка-хозяин по параграфу 26, где компонент (a) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке.

31. Эукариотическая клетка-хозяин по параграфу 26, дополнительно содержащая третий регуляторный элемент, функционально связанный с указанной traer-последовательностью.

32. Эукариотическая клетка-хозяин по параграфу 26, где traer-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной traer-последовательности при оптимальном выравнивании.

33. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки.

34. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR является ферментом системы CRISPR II типа.

35. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR является ферментом Cas9.

36. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.

37. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности.

38. Эукариотическая клетка-хозяин по параграфу 26, где у фермента CRISPR отсутствует активность для расщепления нитей ДНК.

39. Эукариотическая клетка-хозяин по параграфу 26, где первый регуляторный элемент является промотором полимеразы III.

40. Эукариотическая клетка-хозяин по параграфу 26, где второй регуляторный элемент является промотором полимеразы II.

41. Эукариотическая клетка-хозяин по параграфу 31, где третий регуляторный элемент является промотором полимеразы III.

42. Эукариотическая клетка-хозяин по параграфу 26, где направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.

43. Эукариотическая клетка-хозяин по параграфу 26, где менее 50% нуклеотидов направляющей последовательности участвует в самокомплементарном спаривании оснований при оптимальном сворачивании.

44. Отличное от человека животное, содержащее эукариотическую клетку-хозяина по любому одному из параграфов 26-43.

45. Набор, содержащий векторную систему и инструкции по применению указанного набора, при этом векторная система содержит

a. первый регуляторный элемент, функционально связанный с парной traer-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной traer-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибиридизируется с целевой последовательностью, и (2) парной traсr-последовательность, которая гибиридизируется с traer-последовательностью; и/или

b. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации.

46. Набор по параграфу 45, где указанный набор содержит компоненты (a) и (b), находящиеся в одном и том же или в различных векторах системы.

47. Набор по параграфу 45, где компонент (a) дополнительно содержит traer-последовательность ниже парной traer-последовательности под контролем первого регуляторного элемента.

48. Набор по параграфу 45, где компонент (a) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке.

49. Набор по параграфу 45, где система содержит traer-последовательность под контролем третьего регуляторного элемента.

50. Набор по параграфу 45, где traer-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной traer-последовательности при оптимальном выравнивании.

51. Набор по параграфу 45, где фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в определяемом количестве в ядре эукариотической клетки.

52. Набор по параграфу 45, где фермент CRISPR является ферментом системы CRISPR II типа.

53. Набор по параграфу 45, где фермент CRISPR является ферментом Cas9.

54. Набор по параграфу 45, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.

55. Набор по параграфу 45, где фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности.

56. Набор по параграфу 45, где у фермента CRISPR отсутствует активность для расщепления нитей ДНК.

57. Набор по параграфу 45, где первый регуляторный элемент является промотором полимеразы III.

58. Набор по параграфу 45, где второй регуляторный элемент является промотором полимеразы II.

59. Набор по параграфу 49, где третий регуляторный элемент является промотором полимеразы III.

60. Набор по параграфу 45, где направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.

61. Набор по параграфу 45, где менее 50% нуклеотидов направляющей последовательности участвует в самокомплементарном спаривании оснований при оптимальном сворачивании.

62. Компьютерная система для отбора кандидатной целевой последовательности в пределах последовательности нуклеиновой кислоты в эукариотической клетке для целенаправленного воздействия комплекса CRISPR, при этом система содержит

a. блок памяти, выполненный с возможностью получения и/или хранения указанной последовательности нуклеиновой кислоты; и

b. один или несколько процессоров отдельно или в комбинации, запрограммированных с возможностью (i) определения местонахождения последовательности мотива CRISPR в пределах указанной последовательности нуклеиновой кислоты и (ii) выбора последовательности, смежной с указанной последовательностью мотива CRISPR с определенным местонахождением, в качестве кандидатной целевой последовательности, с которой связывается комплекс CRISPR.

63. Компьютерная система по параграфу 62, где указанная стадия определения местонахождения включает идентификацию последовательности мотива CRISPR, расположенной менее чем приблизительно в 500 нуклеотидах от указанной целевой последовательности.

64. Компьютерная система по параграфу 62, где указанная кандидатная целевая последовательность составляет по меньшей мере 10 нуклеотидов в длину.

65. Компьютерная система по параграфу 62, где нуклеотид на 3’-конце кандидатной целевой последовательности расположен не более чем приблизительно в 10 нуклеотидах выше последовательности мотива CRISPR.

66. Компьютерная система по параграфу 62, где последовательность нуклеиновой кислоты в эукариотической клетке является эндогенной по отношению к эукариотическому геному.

67. Компьютерная система по пункту 62, где последовательность нуклеиновой кислоты в эукариотической клетке является экзогенной по отношению к эукариотическому геному.

68. Машиночитаемый носитель, содержащий коды, которые при выполнении одним или несколькими процессорами реализуют способ выбора кандидатной целевой последовательности в пределах последовательности нуклеиновой кислоты в эукариотической клетке для целенаправленного воздействия комплекса CRISPR, при этом указанный способ включает (a) определение местонахождения последовательности мотива CRISPR в пределах указанной последовательности нуклеиновой кислоты и (b) выбор последовательности, смежной с указанной последовательностью мотива CRISPR с определенным местонахождением, в качестве кандидатной целевой последовательности, с которой связывается комплекс CRISPR.

69. Машиночитаемый носитель по параграфу 68, где указанное определение местонахождения включает определение местонахождения последовательности мотива CRISPR, которая находится менее чем приблизительно в 500 нуклеотидах от указанной целевой последовательности.

70. Машиночитаемый по параграфу 68, где указанная кандидатная целевая последовательность составляет по меньшей мере 10 нуклеотидов в длину.

71. Машиночитаемый по параграфу 68, где нуклеотид на 3’-конце кандидатной целевой последовательности расположен не более чем приблизительно в 10 нуклеотидах выше последовательности мотива CRISPR.

72. Машиночитаемый по параграфу 68, где последовательность нуклеиновой кислоты в эукариотической клетке является эндогенной по отношению к эукариотическому геному.

73. Машиночитаемый по параграфу 68, где последовательность нуклеиновой кислоты в эукариотической клетке является экзогенной по отношению к эукариотическому геному.

74. Способ модификации целевого полинуклеотида в эукариотической клетке, при этом способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной traer-последовательностью, которая, в свою очередь, гибридизируется с traer-последовательностью.

75. Способ по параграфу 74, где указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR.

76. Способ по параграфу 74, где указанное расщепление приводит к сниженной транскрипции целевого гена.

77. Способ по параграфу 74, дополнительно включающий репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида.

78. Способ по параграфу 77, где указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность.

79. Способ по параграфу 74, дополнительно включающий доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из следующих: фермента CRISPR, направляющей последовательности, связанной с парной traer-последовательностью, и traer-последовательности.

80. Способ по параграфу 79, где указанные векторы доставляют в эукариотическую клетку в субъекте.

81. Способ по параграфу 74, где указанная модификация имеет место в указанной эукариотической клетке в клеточной культуре.

82. Способ по параграфу 74, дополнительно включающий выделение указанной эукариотической клетки из субъекта перед указанной модификацией.

83. Способ по параграфу 82, дополнительно включающий возвращение указанной эукариотической клетки и/или клеток, полученных из субъекта, указанному субъекту.

84. Способ модификации экспрессии полинуклеотида в эукариотической клетке, при этом способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной traer-последовательностью, которая, в свою очередь, гибридизируется с traer-последовательностью.

85. Способ по параграфу 74, дополнительно включающий доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из следующих: фермента CRISPR, направляющей последовательности, связанной с парной traer-последовательностью, и traer-последовательности.

86. Способ получения модельной эукариотической клетки, содержащей мутантный ген, ответственный за развитие заболевания, при этом способ включает

a. введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной traer-последовательностью, и traer-последовательности; и

b. обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной traer-последовательностью, которая гибридизируется с traer-последовательностью, с получением, таким образом, модельной эукариотической клетки, содержащей мутантный ген, ответственный за развитие заболевания.

87. Способ по параграфу 86, где указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR.

88. Способ по параграфу 86, где указанное расщепление приводит к сниженной транскрипции целевого гена.

89. Способ по параграфу 86, дополнительно включающий репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида.

90. Способ по параграфу 89, где указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность.

91. Способ получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания, включающий

a. приведение тестового соединения в контакт с модельной клеткой по любому из параграфов 86-90 и

b. обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением, таким образом, указанного биологически активного средства, которое модулирует указанный процесс передачи сигнала в клетке, ассоциированный с указанным геном, ответственным за развитие заболевания.

92. Рекомбинантный полинуклеотид, содержащий направляющую последовательность выше парной traer-последовательности, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке.

93. Рекомбинантный полинуклеотид по параграфу 89, где целевая последовательность является вирусной последовательностью, присутствующей в эукариотической клетке.

94. Рекомбинантный полинуклеотид по параграфу 89, где целевая последовательность является протоонкогеном или онкогеном.

Несмотря на то, что предпочтительные варианты осуществления настоящего изобретения были показаны и описаны в данном документе, для специалиста в данной области будет очевидно, что такие варианты осуществления предоставлены только в качестве примера. Многочисленные вариации, изменения и замены теперь будут очевидны для специалиста в данной области без отступления от сути настоящего изобретения. Следует понимать, что различные альтернативные варианты вариантов осуществления настоящего изобретения, раскрытые в данном документе, можно применять при практическом осуществлении настоящего изобретения. Предполагают, что следующая формула изобретения определяет объем настоящего изобретения, и что, таким образом, охвачены способы и структуры в пределах объема данной формулы изобретения и их эквиваленты.

Библиографические ссылки

1. Urnov, F.D., Rebar, E.J., Holmes, M.C., Zhang, H.S. & Gregory, P.D. Genome editing with engineered zinc finger nucleases. Nat. Rev. Genet. 11, 636-646 (2010).

2. Bogdanove, A.J. & Voytas, D.F. TAL effectors: customizable proteins for DNA targeting. Science 333, 1843-1846 (2011).

3. Stoddard, B.L. Homing endonuclease structure and function. Q. Rev. Biophys. 38, 49-95 (2005).

4. Bae, T. & Schneewind, O. Allelic replacement in Staphylococcus aureus with inducible counter-selection. Plasmid 55, 58-63 (2006).

5. Sung, C.K., Li, H., Claverys, J.P. & Morrison, D.A. An rpsL cassette, janus, for gene replacement through negative selection in Streptococcus pneumoniae. Appl. Environ. Microbiol. 67, 5190-5196 (2001).

6. Sharan, S.K., Thomason, L.C., Kuznetsov, S.G. & Court, D.L. Recombineering: a homologous recombination-based method of genetic engineering. Nat. Protoc. 4, 206-223 (2009).

7. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).

8. Deveau, H., Garneau, J.E. & Moineau, S. CRISPR/Cas system and its role in phage-bacteria interactions. Annu. Rev. Microbiol. 64, 475-493 (2010).

9. Horvath, P. & Barrangou, R. CRISPR/Cas, the immune system of bacteria and archaea. Science 327, 167-170 (2010).

10. Terns, M.P. & Terns, R.M. CRISPR-based adaptive immune systems. Curr. Opin. Microbiol. 14, 321-327 (2011).

11. van der Oost, J., Jore, M.M., Westra, E.R., Lundgren, M. & Brouns, S.J. CRISPR-based adaptive and heritable immunity in prokaryotes. Trends. Biochem. Sci. 34, 401-407 (2009).

12. Brouns, S.J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321, 960-964 (2008).

13. Carte, J., Wang, R., Li, H., Terns, R.M. & Terns, M.P. Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes. Genes Dev. 22, 3489-3496 (2008).

14. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011).

15. Hatoum-Aslan, A., Maniv, I. & Marraffini, L.A. Mature clustered, regularly interspaced, short palindromic repeats RNA (crRNA) length is measured by a ruler mechanism anchored at the precursor processing site. Proc. Natl. Acad. Sci. U.S.A. 108, 21218-21222 (2011).

16. Haurwitz, R.E., Jinek, M., Wiedenheft, B., Zhou, K. & Doudna, J.A. Sequence- and structure-specific RNA processing by a CRISPR endonuclease. Science 329, 1355-1358 (2010).

17. Deveau, H. et al. Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. J. Bacteriol. 190, 1390-1400 (2008).

18. Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc. Natl. Acad. Sci. U.S.A. (2012).

19. Makarova, K.S., Aravind, L., Wolf, Y.I. & Koonin, E.V. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR-Cas systems. Biol. Direct. 6, 38 (2011).

20. Barrangou, R. RNA-mediated programmable DNA cleavage. Nat. Biotechnol. 30, 836-838 (2012).

21. Brouns, S.J. Molecular biology. A Swiss army knife of immunity. Science 337, 808-809 (2012).

22. Carroll, D. A CRISPR Approach to Gene Targeting. Mol. Ther. 20, 1658-1660 (2012).

23. Bikard, D., Hatoum-Aslan, A., Mucida, D. & Marraffini, L.A. CRISPR interference can prevent natural transformation and virulence acquisition during in vivo bacterial infection. Cell Host Microbe 12, 177-186 (2012).

24. Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic Acids Res. (2011).

25. Semenova, E. et al. Interference by clustered regularly interspaced short palindromic repeat (CRISPR) RNA is governed by a seed sequence. Proc. Natl. Acad. Sci. U.S.A. (2011).

26. Wiedenheft, B. et al. RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interactions. Proc. Natl. Acad. Sci. U.S.A. (2011).

27. Zahner, D. & Hakenbeck, R. The Streptococcus pneumoniae beta-galactosidase is a surface protein. J. Bacteriol. 182, 5919-5921 (2000).

28. Marraffini, L.A., Dedent, A.C. & Schneewind, O. Sortases and the art of anchoring proteins to the envelopes of gram-positive bacteria. Microbiol. Mol. Biol. Rev. 70, 192-221 (2006).

29. Motamedi, M.R., Szigety, S.K. & Rosenberg, S.M. Double-strand-break repair recombination in Escherichia coli: physical evidence for a DNA replication mechanism in vivo. Genes Dev. 13, 2889-2903 (1999).

30. Hosaka, T. et al. The novel mutation K87E in ribosomal protein S12 enhances protein synthesis activity during the late growth phase in Escherichia coli. Mol. Genet. Genomics 271, 317-324 (2004).

31. Costantino, N. & Court, D.L. Enhanced levels of lambda Red-mediated recombinants in mismatch repair mutants. Proc. Natl. Acad. Sci. U.S.A. 100, 15748-15753 (2003).

32. Edgar, R. & Qimron, U. The Escherichia coli CRISPR system protects from lambda lysogenization, lysogens, and prophage induction. J. Bacteriol. 192, 6291-6294 (2010).

33. Marraffini, L.A. & Sontheimer, E.J. Self versus non-self discrimination during CRISPR RNA-directed immunity. Nature 463, 568-571 (2010).

34. Fischer, S. et al. An archaeal immune system can detect multiple Protospacer Adjacent Motifs (PAMs) to target invader DNA. J. Biol. Chem. 287, 33351-33363 (2012).

35. Gudbergsdottir, S. et al. Dynamic properties of the Sulfolobus CRISPR/Cas and CRISPR/Cmr systems when challenged with vector-borne viral and plasmid genes and protospacers. Mol. Microbiol. 79, 35-49 (2011).

36. Wang, H.H. et al. Genome-scale promoter engineering by coselection MAGE. Nat Methods 9, 591-593 (2012).

37. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science в печати (2013).

38. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science в печати (2013).

39. Hoskins, J. et al. Genome of the bacterium Streptococcus pneumoniae strain R6. J. Bacteriol. 183, 5709-5717 (2001).

40. Havarstein, L.S., Coomaraswamy, G. & Morrison, D.A. An unmodified heptadecapeptide pheromone induces competence for genetic transformation in Streptococcus pneumoniae. Proc. Natl. Acad. Sci. U.S.A. 92, 11140-11144 (1995).

41. Horinouchi, S. & Weisblum, B. Nucleotide sequence and functional map of pC194, a plasmid that specifies inducible chloramphenicol resistance. J. Bacteriol. 150, 815-825 (1982).

42. Horton, R.M. In Vitro Recombination and Mutagenesis of DNA : SOEing Together Tailor-Made Genes. Methods Mol. Biol. 15, 251-261 (1993).

43. Podbielski, A., Spellerberg, B., Woischnik, M., Pohl, B. & Lutticken, R. Novel series of plasmid vectors for gene inactivation and expression analysis in group A streptococci (GAS). Gene 177, 137-147 (1996).

44. Husmann, L.K., Scott, J.R., Lindahl, G. & Stenberg, L. Expression of the Arp protein, a member of the M protein family, is not sufficient to inhibit phagocytosis of Streptococcus pyogenes. Infection and immunity 63, 345-348 (1995).

45. Gibson, D.G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods 6, 343-345 (2009).

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> THE BROAD INSTITUTE, INC.

<120> CRISPR-CAS COMPONENT SYSTEMS, METHODS AND COMPOSITIONS FOR

SEQUENCE MANIPULATION

<130> 44790.99.2003

<140> PCT/US2013/074611

<141> 2013-12-12

<150> 61/835,931

<151> 2013-06-17

<150> 61/791,409

<151> 2013-03-15

<150> 61/768,959

<151> 2013-02-25

<150> 61/748,427

<151> 2013-01-02

<150> 61/736,527

<151> 2012-12-12

<160> 529

<170> PatentIn version 3.5

<210> 1

<211> 7

<212> PRT

<213> Simian virus 40

<400> 1

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 2

<211> 16

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

Nucleoplasmin bipartite NLS sequence"

<400> 2

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 3

<211> 9

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

C-myc NLS sequence"

<400> 3

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 4

<211> 11

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

C-myc NLS sequence"

<400> 4

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 5

<211> 38

<212> PRT

<213> Homo sapiens

<400> 5

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 6

<211> 42

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

IBB domain from importin-alpha sequence"

<400> 6

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 7

<211> 8

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

Myoma T protein sequence"

<400> 7

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 8

<211> 8

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

Myoma T protein sequence"

<400> 8

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 9

<211> 8

<212> PRT

<213> Homo sapiens

<400> 9

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 10

<211> 12

<212> PRT

<213> Mus musculus

<400> 10

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 11

<211> 5

<212> PRT

<213> Influenza virus

<400> 11

Asp Arg Leu Arg Arg

1 5

<210> 12

<211> 7

<212> PRT

<213> Influenza virus

<400> 12

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 13

<211> 10

<212> PRT

<213> Hepatitus delta virus

<400> 13

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 14

<211> 10

<212> PRT

<213> Mus musculus

<400> 14

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 15

<211> 20

<212> PRT

<213> Homo sapiens

<400> 15

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 16

<211> 17

<212> PRT

<213> Homo sapiens

<400> 16

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 17

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(22)

<223> a, c, t, g, unknown or other

<400> 17

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 18

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t or g

<220>

<221> modified_base

<222> (13)..(14)

<223> a, c, t, g, unknown or other

<400> 18

nnnnnnnnnn nnnnagaaw 19

<210> 19

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(22)

<223> a, c, t, g, unknown or other

<400> 19

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 20

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t or g

<220>

<221> modified_base

<222> (12)..(13)

<223> a, c, t, g, unknown or other

<400> 20

nnnnnnnnnn nnnagaaw 18

<210> 21

<211> 137

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 21

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60

gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120

tcgttattta atttttt 137

<210> 22

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 22

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120

ttt 123

<210> 23

<211> 110

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 23

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110

<210> 24

<211> 102

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 24

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102

<210> 25

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 25

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt gttttttt 88

<210> 26

<211> 76

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 26

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcatt tttttt 76

<210> 27

<211> 12

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 27

gttttagagc ta 12

<210> 28

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 28

tagcaagtta aaataaggct agtccgtttt t 31

<210> 29

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(22)

<223> a, c, t, g, unknown or other

<400> 29

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 30

<211> 12

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 30

guuuuagagc ua 12

<210> 31

<211> 33

<212> DNA

<213> Homo sapiens

<400> 31

ggacatcgat gtcacctcca atgactaggg tgg 33

<210> 32

<211> 33

<212> DNA

<213> Homo sapiens

<400> 32

cattggaggt gacatcgatg tcctccccat tgg 33

<210> 33

<211> 33

<212> DNA

<213> Homo sapiens

<400> 33

ggaagggcct gagtccgagc agaagaagaa ggg 33

<210> 34

<211> 33

<212> DNA

<213> Homo sapiens

<400> 34

ggtggcgaga ggggccgaga ttgggtgttc agg 33

<210> 35

<211> 33

<212> DNA

<213> Homo sapiens

<400> 35

atgcaggagg gtggcgagag gggccgagat tgg 33

<210> 36

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 36

aaaaccaccc ttctctctgg c 21

<210> 37

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 37

ggagattgga gacacggaga g 21

<210> 38

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 38

ctggaaagcc aatgcctgac 20

<210> 39

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 39

ggcagcaaac tccttgtcct 20

<210> 40

<211> 335

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 40

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg gaaccattca aaacagcata gcaagttaaa ataaggctag tccgttatca 300

acttgaaaaa gtggcaccga gtcggtgctt ttttt 335

<210> 41

<211> 423

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 41

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg gtagtattaa gtattgtttt atggctgata aatttctttg aatttctcct 300

tgattatttg ttataaaagt tataaaataa tcttgttgga accattcaaa acagcatagc 360

aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 420

ttt 423

<210> 42

<211> 339

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 42

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggttttagag ctatgctgtt ttgaatggtc ccaaaacggg tcttcgagaa 300

gacgttttag agctatgctg ttttgaatgg tcccaaaac 339

<210> 43

<211> 309

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 43

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300

gctagtccg 309

<210> 44

<211> 1648

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 44

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Ala Ala Val Ser Lys

1400 1405 1410

Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu

1415 1420 1425

Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly

1430 1435 1440

Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

1445 1450 1455

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

1460 1465 1470

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met

1475 1480 1485

Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val

1490 1495 1500

Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr

1505 1510 1515

Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile

1520 1525 1530

Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly

1535 1540 1545

His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met

1550 1555 1560

Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg

1565 1570 1575

His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln

1580 1585 1590

Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn

1595 1600 1605

His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu

1610 1615 1620

Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly

1625 1630 1635

Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

1640 1645

<210> 45

<211> 1625

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 45

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ala Ala Ala Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val

1370 1375 1380

Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe

1385 1390 1395

Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu

1400 1405 1410

Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp

1415 1420 1425

Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser

1430 1435 1440

Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala

1445 1450 1455

Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp

1460 1465 1470

Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp

1475 1480 1485

Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu

1490 1495 1500

Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser

1505 1510 1515

His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys

1520 1525 1530

Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln

1535 1540 1545

Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

1550 1555 1560

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu

1565 1570 1575

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu

1580 1585 1590

Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr

1595 1600 1605

Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys

1610 1615 1620

Lys Lys

1625

<210> 46

<211> 1664

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 46

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Ala Ala Val Ser Lys

1400 1405 1410

Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu

1415 1420 1425

Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly

1430 1435 1440

Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

1445 1450 1455

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

1460 1465 1470

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met

1475 1480 1485

Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val

1490 1495 1500

Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr

1505 1510 1515

Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile

1520 1525 1530

Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly

1535 1540 1545

His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met

1550 1555 1560

Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg

1565 1570 1575

His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln

1580 1585 1590

Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn

1595 1600 1605

His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu

1610 1615 1620

Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly

1625 1630 1635

Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Lys Arg Pro Ala Ala

1640 1645 1650

Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1655 1660

<210> 47

<211> 1423

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 47

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr

1400 1405 1410

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1415 1420

<210> 48

<211> 483

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 48

Met Phe Leu Phe Leu Ser Leu Thr Ser Phe Leu Ser Ser Ser Arg Thr

1 5 10 15

Leu Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe

20 25 30

Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe

35 40 45

Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr

50 55 60

Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp

65 70 75 80

Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His

85 90 95

Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe

100 105 110

Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val

115 120 125

Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys

130 135 140

Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys

145 150 155 160

Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly

165 170 175

Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly

180 185 190

His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val

195 200 205

Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser

210 215 220

His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly

225 230 235 240

Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys Gly Ser Lys Gln

245 250 255

Leu Glu Glu Leu Leu Ser Thr Ser Phe Asp Ile Gln Phe Asn Asp Leu

260 265 270

Thr Leu Leu Glu Thr Ala Phe Thr His Thr Ser Tyr Ala Asn Glu His

275 280 285

Arg Leu Leu Asn Val Ser His Asn Glu Arg Leu Glu Phe Leu Gly Asp

290 295 300

Ala Val Leu Gln Leu Ile Ile Ser Glu Tyr Leu Phe Ala Lys Tyr Pro

305 310 315 320

Lys Lys Thr Glu Gly Asp Met Ser Lys Leu Arg Ser Met Ile Val Arg

325 330 335

Glu Glu Ser Leu Ala Gly Phe Ser Arg Phe Cys Ser Phe Asp Ala Tyr

340 345 350

Ile Lys Leu Gly Lys Gly Glu Glu Lys Ser Gly Gly Arg Arg Arg Asp

355 360 365

Thr Ile Leu Gly Asp Leu Phe Glu Ala Phe Leu Gly Ala Leu Leu Leu

370 375 380

Asp Lys Gly Ile Asp Ala Val Arg Arg Phe Leu Lys Gln Val Met Ile

385 390 395 400

Pro Gln Val Glu Lys Gly Asn Phe Glu Arg Val Lys Asp Tyr Lys Thr

405 410 415

Cys Leu Gln Glu Phe Leu Gln Thr Lys Gly Asp Val Ala Ile Asp Tyr

420 425 430

Gln Val Ile Ser Glu Lys Gly Pro Ala His Ala Lys Gln Phe Glu Val

435 440 445

Ser Ile Val Val Asn Gly Ala Val Leu Ser Lys Gly Leu Gly Lys Ser

450 455 460

Lys Lys Leu Ala Glu Gln Asp Ala Ala Lys Asn Ala Leu Ala Gln Leu

465 470 475 480

Ser Glu Val

<210> 49

<211> 483

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 49

Met Lys Gln Leu Glu Glu Leu Leu Ser Thr Ser Phe Asp Ile Gln Phe

1 5 10 15

Asn Asp Leu Thr Leu Leu Glu Thr Ala Phe Thr His Thr Ser Tyr Ala

20 25 30

Asn Glu His Arg Leu Leu Asn Val Ser His Asn Glu Arg Leu Glu Phe

35 40 45

Leu Gly Asp Ala Val Leu Gln Leu Ile Ile Ser Glu Tyr Leu Phe Ala

50 55 60

Lys Tyr Pro Lys Lys Thr Glu Gly Asp Met Ser Lys Leu Arg Ser Met

65 70 75 80

Ile Val Arg Glu Glu Ser Leu Ala Gly Phe Ser Arg Phe Cys Ser Phe

85 90 95

Asp Ala Tyr Ile Lys Leu Gly Lys Gly Glu Glu Lys Ser Gly Gly Arg

100 105 110

Arg Arg Asp Thr Ile Leu Gly Asp Leu Phe Glu Ala Phe Leu Gly Ala

115 120 125

Leu Leu Leu Asp Lys Gly Ile Asp Ala Val Arg Arg Phe Leu Lys Gln

130 135 140

Val Met Ile Pro Gln Val Glu Lys Gly Asn Phe Glu Arg Val Lys Asp

145 150 155 160

Tyr Lys Thr Cys Leu Gln Glu Phe Leu Gln Thr Lys Gly Asp Val Ala

165 170 175

Ile Asp Tyr Gln Val Ile Ser Glu Lys Gly Pro Ala His Ala Lys Gln

180 185 190

Phe Glu Val Ser Ile Val Val Asn Gly Ala Val Leu Ser Lys Gly Leu

195 200 205

Gly Lys Ser Lys Lys Leu Ala Glu Gln Asp Ala Ala Lys Asn Ala Leu

210 215 220

Ala Gln Leu Ser Glu Val Gly Ser Val Ser Lys Gly Glu Glu Asp Asn

225 230 235 240

Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val His Met Glu Gly

245 250 255

Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly Glu Gly Arg

260 265 270

Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr Lys Gly Gly

275 280 285

Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe Met Tyr Gly

290 295 300

Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro Asp Tyr Leu Lys

305 310 315 320

Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met Asn Phe Glu

325 330 335

Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu Gln Asp Gly

340 345 350

Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn Phe Pro Ser Asp

355 360 365

Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala Ser Ser Glu

370 375 380

Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu Ile Lys Gln Arg

385 390 395 400

Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala Glu Val Lys Thr Thr

405 410 415

Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn

420 425 430

Ile Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr Ile Val Glu

435 440 445

Gln Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly Gly Met Asp Glu

450 455 460

Leu Tyr Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys

465 470 475 480

Lys Lys Lys

<210> 50

<211> 1423

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 50

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr

1400 1405 1410

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1415 1420

<210> 51

<211> 2012

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 51

gaatgctgcc ctcagacccg cttcctccct gtccttgtct gtccaaggag aatgaggtct 60

cactggtgga tttcggacta ccctgaggag ctggcacctg agggacaagg ccccccacct 120

gcccagctcc agcctctgat gaggggtggg agagagctac atgaggttgc taagaaagcc 180

tcccctgaag gagaccacac agtgtgtgag gttggagtct ctagcagcgg gttctgtgcc 240

cccagggata gtctggctgt ccaggcactg ctcttgatat aaacaccacc tcctagttat 300

gaaaccatgc ccattctgcc tctctgtatg gaaaagagca tggggctggc ccgtggggtg 360

gtgtccactt taggccctgt gggagatcat gggaacccac gcagtgggtc ataggctctc 420

tcatttacta ctcacatcca ctctgtgaag aagcgattat gatctctcct ctagaaactc 480

gtagagtccc atgtctgccg gcttccagag cctgcactcc tccaccttgg cttggctttg 540

ctggggctag aggagctagg atgcacagca gctctgtgac cctttgtttg agaggaacag 600

gaaaaccacc cttctctctg gcccactgtg tcctcttcct gccctgccat ccccttctgt 660

gaatgttaga cccatgggag cagctggtca gaggggaccc cggcctgggg cccctaaccc 720

tatgtagcct cagtcttccc atcaggctct cagctcagcc tgagtgttga ggccccagtg 780

gctgctctgg gggcctcctg agtttctcat ctgtgcccct ccctccctgg cccaggtgaa 840

ggtgtggttc cagaaccgga ggacaaagta caaacggcag aagctggagg aggaagggcc 900

tgagtccgag cagaagaaga agggctccca tcacatcaac cggtggcgca ttgccacgaa 960

gcaggccaat ggggaggaca tcgatgtcac ctccaatgac aagcttgcta gcggtgggca 1020

accacaaacc cacgagggca gagtgctgct tgctgctggc caggcccctg cgtgggccca 1080

agctggactc tggccactcc ctggccaggc tttggggagg cctggagtca tggccccaca 1140

gggcttgaag cccggggccg ccattgacag agggacaagc aatgggctgg ctgaggcctg 1200

ggaccacttg gccttctcct cggagagcct gcctgcctgg gcgggcccgc ccgccaccgc 1260

agcctcccag ctgctctccg tgtctccaat ctcccttttg ttttgatgca tttctgtttt 1320

aatttatttt ccaggcacca ctgtagttta gtgatcccca gtgtccccct tccctatggg 1380

aataataaaa gtctctctct taatgacacg ggcatccagc tccagcccca gagcctgggg 1440

tggtagattc cggctctgag ggccagtggg ggctggtaga gcaaacgcgt tcagggcctg 1500

ggagcctggg gtggggtact ggtggagggg gtcaagggta attcattaac tcctctcttt 1560

tgttggggga ccctggtctc tacctccagc tccacagcag gagaaacagg ctagacatag 1620

ggaagggcca tcctgtatct tgagggagga caggcccagg tctttcttaa cgtattgaga 1680

ggtgggaatc aggcccaggt agttcaatgg gagagggaga gtgcttccct ctgcctagag 1740

actctggtgg cttctccagt tgaggagaaa ccagaggaaa ggggaggatt ggggtctggg 1800

ggagggaaca ccattcacaa aggctgacgg ttccagtccg aagtcgtggg cccaccagga 1860

tgctcacctg tccttggaga accgctgggc aggttgagac tgcagagaca gggcttaagg 1920

ctgagcctgc aaccagtccc cagtgactca gggcctcctc agcccaagaa agagcaacgt 1980

gccagggccc gctgagctct tgtgttcacc tg 2012

<210> 52

<211> 1153

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 52

Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys

1 5 10 15

Lys Ser Asp Leu Val Leu Gly Leu Asp Ile Gly Ile Gly Ser Val Gly

20 25 30

Val Gly Ile Leu Asn Lys Val Thr Gly Glu Ile Ile His Lys Asn Ser

35 40 45

Arg Ile Phe Pro Ala Ala Gln Ala Glu Asn Asn Leu Val Arg Arg Thr

50 55 60

Asn Arg Gln Gly Arg Arg Leu Ala Arg Arg Lys Lys His Arg Arg Val

65 70 75 80

Arg Leu Asn Arg Leu Phe Glu Glu Ser Gly Leu Ile Thr Asp Phe Thr

85 90 95

Lys Ile Ser Ile Asn Leu Asn Pro Tyr Gln Leu Arg Val Lys Gly Leu

100 105 110

Thr Asp Glu Leu Ser Asn Glu Glu Leu Phe Ile Ala Leu Lys Asn Met

115 120 125

Val Lys His Arg Gly Ile Ser Tyr Leu Asp Asp Ala Ser Asp Asp Gly

130 135 140

Asn Ser Ser Val Gly Asp Tyr Ala Gln Ile Val Lys Glu Asn Ser Lys

145 150 155 160

Gln Leu Glu Thr Lys Thr Pro Gly Gln Ile Gln Leu Glu Arg Tyr Gln

165 170 175

Thr Tyr Gly Gln Leu Arg Gly Asp Phe Thr Val Glu Lys Asp Gly Lys

180 185 190

Lys His Arg Leu Ile Asn Val Phe Pro Thr Ser Ala Tyr Arg Ser Glu

195 200 205

Ala Leu Arg Ile Leu Gln Thr Gln Gln Glu Phe Asn Pro Gln Ile Thr

210 215 220

Asp Glu Phe Ile Asn Arg Tyr Leu Glu Ile Leu Thr Gly Lys Arg Lys

225 230 235 240

Tyr Tyr His Gly Pro Gly Asn Glu Lys Ser Arg Thr Asp Tyr Gly Arg

245 250 255

Tyr Arg Thr Ser Gly Glu Thr Leu Asp Asn Ile Phe Gly Ile Leu Ile

260 265 270

Gly Lys Cys Thr Phe Tyr Pro Asp Glu Phe Arg Ala Ala Lys Ala Ser

275 280 285

Tyr Thr Ala Gln Glu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Thr

290 295 300

Val Pro Thr Glu Thr Lys Lys Leu Ser Lys Glu Gln Lys Asn Gln Ile

305 310 315 320

Ile Asn Tyr Val Lys Asn Glu Lys Ala Met Gly Pro Ala Lys Leu Phe

325 330 335

Lys Tyr Ile Ala Lys Leu Leu Ser Cys Asp Val Ala Asp Ile Lys Gly

340 345 350

Tyr Arg Ile Asp Lys Ser Gly Lys Ala Glu Ile His Thr Phe Glu Ala

355 360 365

Tyr Arg Lys Met Lys Thr Leu Glu Thr Leu Asp Ile Glu Gln Met Asp

370 375 380

Arg Glu Thr Leu Asp Lys Leu Ala Tyr Val Leu Thr Leu Asn Thr Glu

385 390 395 400

Arg Glu Gly Ile Gln Glu Ala Leu Glu His Glu Phe Ala Asp Gly Ser

405 410 415

Phe Ser Gln Lys Gln Val Asp Glu Leu Val Gln Phe Arg Lys Ala Asn

420 425 430

Ser Ser Ile Phe Gly Lys Gly Trp His Asn Phe Ser Val Lys Leu Met

435 440 445

Met Glu Leu Ile Pro Glu Leu Tyr Glu Thr Ser Glu Glu Gln Met Thr

450 455 460

Ile Leu Thr Arg Leu Gly Lys Gln Lys Thr Thr Ser Ser Ser Asn Lys

465 470 475 480

Thr Lys Tyr Ile Asp Glu Lys Leu Leu Thr Glu Glu Ile Tyr Asn Pro

485 490 495

Val Val Ala Lys Ser Val Arg Gln Ala Ile Lys Ile Val Asn Ala Ala

500 505 510

Ile Lys Glu Tyr Gly Asp Phe Asp Asn Ile Val Ile Glu Met Ala Arg

515 520 525

Glu Thr Asn Glu Asp Asp Glu Lys Lys Ala Ile Gln Lys Ile Gln Lys

530 535 540

Ala Asn Lys Asp Glu Lys Asp Ala Ala Met Leu Lys Ala Ala Asn Gln

545 550 555 560

Tyr Asn Gly Lys Ala Glu Leu Pro His Ser Val Phe His Gly His Lys

565 570 575

Gln Leu Ala Thr Lys Ile Arg Leu Trp His Gln Gln Gly Glu Arg Cys

580 585 590

Leu Tyr Thr Gly Lys Thr Ile Ser Ile His Asp Leu Ile Asn Asn Ser

595 600 605

Asn Gln Phe Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp

610 615 620

Asp Ser Leu Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn Gln Glu

625 630 635 640

Lys Gly Gln Arg Thr Pro Tyr Gln Ala Leu Asp Ser Met Asp Asp Ala

645 650 655

Trp Ser Phe Arg Glu Leu Lys Ala Phe Val Arg Glu Ser Lys Thr Leu

660 665 670

Ser Asn Lys Lys Lys Glu Tyr Leu Leu Thr Glu Glu Asp Ile Ser Lys

675 680 685

Phe Asp Val Arg Lys Lys Phe Ile Glu Arg Asn Leu Val Asp Thr Arg

690 695 700

Tyr Ala Ser Arg Val Val Leu Asn Ala Leu Gln Glu His Phe Arg Ala

705 710 715 720

His Lys Ile Asp Thr Lys Val Ser Val Val Arg Gly Gln Phe Thr Ser

725 730 735

Gln Leu Arg Arg His Trp Gly Ile Glu Lys Thr Arg Asp Thr Tyr His

740 745 750

His His Ala Val Asp Ala Leu Ile Ile Ala Ala Ser Ser Gln Leu Asn

755 760 765

Leu Trp Lys Lys Gln Lys Asn Thr Leu Val Ser Tyr Ser Glu Asp Gln

770 775 780

Leu Leu Asp Ile Glu Thr Gly Glu Leu Ile Ser Asp Asp Glu Tyr Lys

785 790 795 800

Glu Ser Val Phe Lys Ala Pro Tyr Gln His Phe Val Asp Thr Leu Lys

805 810 815

Ser Lys Glu Phe Glu Asp Ser Ile Leu Phe Ser Tyr Gln Val Asp Ser

820 825 830

Lys Phe Asn Arg Lys Ile Ser Asp Ala Thr Ile Tyr Ala Thr Arg Gln

835 840 845

Ala Lys Val Gly Lys Asp Lys Ala Asp Glu Thr Tyr Val Leu Gly Lys

850 855 860

Ile Lys Asp Ile Tyr Thr Gln Asp Gly Tyr Asp Ala Phe Met Lys Ile

865 870 875 880

Tyr Lys Lys Asp Lys Ser Lys Phe Leu Met Tyr Arg His Asp Pro Gln

885 890 895

Thr Phe Glu Lys Val Ile Glu Pro Ile Leu Glu Asn Tyr Pro Asn Lys

900 905 910

Gln Ile Asn Glu Lys Gly Lys Glu Val Pro Cys Asn Pro Phe Leu Lys

915 920 925

Tyr Lys Glu Glu His Gly Tyr Ile Arg Lys Tyr Ser Lys Lys Gly Asn

930 935 940

Gly Pro Glu Ile Lys Ser Leu Lys Tyr Tyr Asp Ser Lys Leu Gly Asn

945 950 955 960

His Ile Asp Ile Thr Pro Lys Asp Ser Asn Asn Lys Val Val Leu Gln

965 970 975

Ser Val Ser Pro Trp Arg Ala Asp Val Tyr Phe Asn Lys Thr Thr Gly

980 985 990

Lys Tyr Glu Ile Leu Gly Leu Lys Tyr Ala Asp Leu Gln Phe Glu Lys

995 1000 1005

Gly Thr Gly Thr Tyr Lys Ile Ser Gln Glu Lys Tyr Asn Asp Ile

1010 1015 1020

Lys Lys Lys Glu Gly Val Asp Ser Asp Ser Glu Phe Lys Phe Thr

1025 1030 1035

Leu Tyr Lys Asn Asp Leu Leu Leu Val Lys Asp Thr Glu Thr Lys

1040 1045 1050

Glu Gln Gln Leu Phe Arg Phe Leu Ser Arg Thr Met Pro Lys Gln

1055 1060 1065

Lys His Tyr Val Glu Leu Lys Pro Tyr Asp Lys Gln Lys Phe Glu

1070 1075 1080

Gly Gly Glu Ala Leu Ile Lys Val Leu Gly Asn Val Ala Asn Ser

1085 1090 1095

Gly Gln Cys Lys Lys Gly Leu Gly Lys Ser Asn Ile Ser Ile Tyr

1100 1105 1110

Lys Val Arg Thr Asp Val Leu Gly Asn Gln His Ile Ile Lys Asn

1115 1120 1125

Glu Gly Asp Lys Pro Lys Leu Asp Phe Lys Arg Pro Ala Ala Thr

1130 1135 1140

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1145 1150

<210> 53

<211> 340

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 53

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ttacttaaat cttgcagaag ctacaaagat aaggcttcat gccgaaatca 300

acaccctgtc attttatggc agggtgtttt cgttatttaa 340

<210> 54

<211> 360

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (288)..(317)

<223> a, c, t, g, unknown or other

<400> 54

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggttttagag ctatgctgtt ttgaatggtc ccaaaacnnn nnnnnnnnnn 300

nnnnnnnnnn nnnnnnngtt ttagagctat gctgttttga atggtcccaa aacttttttt 360

<210> 55

<211> 318

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (250)..(269)

<223> a, c, t, g, unknown or other

<400> 55

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300

aggctagtcc gttttttt 318

<210> 56

<211> 325

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (250)..(269)

<223> a, c, t, g, unknown or other

<400> 56

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300

aggctagtcc gttatcattt ttttt 325

<210> 57

<211> 337

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (250)..(269)

<223> a, c, t, g, unknown or other

<400> 57

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300

aggctagtcc gttatcaact tgaaaaagtg ttttttt 337

<210> 58

<211> 352

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (250)..(269)

<223> a, c, t, g, unknown or other

<400> 58

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca agttaaaata 300

aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tt 352

<210> 59

<211> 5101

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 59

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 360

cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 420

gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 480

aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 540

gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct 600

gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 660

ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 720

tgagcaagag gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc 780

tggagcacct gcctgaaatc actttttttc aggttggacc ggtgccacca tggactataa 840

ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg acgataagat 900

ggccccaaag aagaagcgga aggtcggtat ccacggagtc ccagcagccg acaagaagta 960

cagcatcggc ctggacatcg gcaccaactc tgtgggctgg gccgtgatca ccgacgagta 1020

caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa 1080

gaacctgatc ggagccctgc tgttcgacag cggcgaaaca gccgaggcca cccggctgaa 1140

gagaaccgcc agaagaagat acaccagacg gaagaaccgg atctgctatc tgcaagagat 1200

cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg aagagtcctt 1260

cctggtggaa gaggataaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga 1320

ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac tggtggacag 1380

caccgacaag gccgacctgc ggctgatcta tctggccctg gcccacatga tcaagttccg 1440

gggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt 1500

catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca acgccagcgg 1560

cgtggacgcc aaggccatcc tgtctgccag actgagcaag agcagacggc tggaaaatct 1620

gatcgcccag ctgcccggcg agaagaagaa tggcctgttc ggcaacctga ttgccctgag 1680

cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg ccaaactgca 1740

gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca 1800

gtacgccgac ctgtttctgg ccgccaagaa cctgtccgac gccatcctgc tgagcgacat 1860

cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga tcaagagata 1920

cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc agctgcctga 1980

gaagtacaaa gagattttct tcgaccagag caagaacggc tacgccggct acattgacgg 2040

cggagccagc caggaagagt tctacaagtt catcaagccc atcctggaaa agatggacgg 2100

caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgcggaagc agcggacctt 2160

cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcca ttctgcggcg 2220

gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga agatcctgac 2280

cttccgcatc ccctactacg tgggccctct ggccagggga aacagcagat tcgcctggat 2340

gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg tggacaaggg 2400

cgcttccgcc cagagcttca tcgagcggat gaccaacttc gataagaacc tgcccaacga 2460

gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtata acgagctgac 2520

caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg gcgagcagaa 2580

aaaggccatc gtggacctgc tgttcaagac caaccggaaa gtgaccgtga agcagctgaa 2640

agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg gcgtggaaga 2700

tcggttcaac gcctccctgg gcacatacca cgatctgctg aaaattatca aggacaagga 2760

cttcctggac aatgaggaaa acgaggacat tctggaagat atcgtgctga ccctgacact 2820

gtttgaggac agagagatga tcgaggaacg gctgaaaacc tatgcccacc tgttcgacga 2880

caaagtgatg aagcagctga agcggcggag atacaccggc tggggcaggc tgagccggaa 2940

gctgatcaac ggcatccggg acaagcagtc cggcaagaca atcctggatt tcctgaagtc 3000

cgacggcttc gccaacagaa acttcatgca gctgatccac gacgacagcc tgacctttaa 3060

agaggacatc cagaaagccc aggtgtccgg ccagggcgat agcctgcacg agcacattgc 3120

caatctggcc ggcagccccg ccattaagaa gggcatcctg cagacagtga aggtggtgga 3180

cgagctcgtg aaagtgatgg gccggcacaa gcccgagaac atcgtgatcg aaatggccag 3240

agagaaccag accacccaga agggacagaa gaacagccgc gagagaatga agcggatcga 3300

agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg aaaacaccca 3360

gctgcagaac gagaagctgt acctgtacta cctgcagaat gggcgggata tgtacgtgga 3420

ccaggaactg gacatcaacc ggctgtccga ctacgatgtg gaccatatcg tgcctcagag 3480

ctttctgaag gacgactcca tcgacaacaa ggtgctgacc agaagcgaca agaaccgggg 3540

caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact actggcggca 3600

gctgctgaac gccaagctga ttacccagag aaagttcgac aatctgacca aggccgagag 3660

aggcggcctg agcgaactgg ataaggccgg cttcatcaag agacagctgg tggaaacccg 3720

gcagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta agtacgacga 3780

gaatgacaag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc tggtgtccga 3840

tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc accacgccca 3900

cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc ctaagctgga 3960

aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag 4020

cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca tcatgaactt 4080

tttcaagacc gagattaccc tggccaacgg cgagatccgg aagcggcctc tgatcgagac 4140

aaacggcgaa accggggaga tcgtgtggga taagggccgg gattttgcca ccgtgcggaa 4200

agtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga caggcggctt 4260

cagcaaagag tctatcctgc ccaagaggaa cagcgataag ctgatcgcca gaaagaagga 4320

ctgggaccct aagaagtacg gcggcttcga cagccccacc gtggcctatt ctgtgctggt 4380

ggtggccaaa gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag agctgctggg 4440

gatcaccatc atggaaagaa gcagcttcga gaagaatccc atcgactttc tggaagccaa 4500

gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact ccctgttcga 4560

gctggaaaac ggccggaaga gaatgctggc ctctgccggc gaactgcaga agggaaacga 4620

actggccctg ccctccaaat atgtgaactt cctgtacctg gccagccact atgagaagct 4680

gaagggctcc cccgaggata atgagcagaa acagctgttt gtggaacagc acaagcacta 4740

cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc tggccgacgc 4800

taatctggac aaagtgctgt ccgcctacaa caagcaccgg gataagccca tcagagagca 4860

ggccgagaat atcatccacc tgtttaccct gaccaatctg ggagcccctg ccgccttcaa 4920

gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg tgctggacgc 4980

caccctgatc caccagagca tcaccggcct gtacgagaca cggatcgacc tgtctcagct 5040

gggaggcgac tttctttttc ttagcttgac cagctttctt agtagcagca ggacgcttta 5100

a 5101

<210> 60

<211> 137

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 60

nnnnnnnnnn nnnnnnnnnn gttattgtac tctcaagatt tagaaataaa tcttgcagaa 60

gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120

tcgttattta atttttt 137

<210> 61

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 61

nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120

ttt 123

<210> 62

<211> 110

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 62

nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110

<210> 63

<211> 137

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 63

nnnnnnnnnn nnnnnnnnnn gttattgtac tctcaagatt tagaaataaa tcttgcagaa 60

gctacaatga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120

tcgttattta atttttt 137

<210> 64

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 64

nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caatgataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120

ttt 123

<210> 65

<211> 110

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 65

nnnnnnnnnn nnnnnnnnnn gttattgtac tctcagaaat gcagaagcta caatgataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110

<210> 66

<211> 107

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 66

nnnnnnnnnn nnnnnnnnnn gttttagagc tgtggaaaca cagcgagtta aaataaggct 60

tagtccgtac tcaacttgaa aaggtggcac cgattcggtg ttttttt 107

<210> 67

<211> 4263

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 67

atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa gaccaagccc 60

tacagcatcg gcctggacat cggcaccaat agcgtgggct gggccgtgac caccgacaac 120

tacaaggtgc ccagcaagaa aatgaaggtg ctgggcaaca cctccaagaa gtacatcaag 180

aaaaacctgc tgggcgtgct gctgttcgac agcggcatta cagccgaggg cagacggctg 240

aagagaaccg ccagacggcg gtacacccgg cggagaaaca gaatcctgta tctgcaagag 300

atcttcagca ccgagatggc taccctggac gacgccttct tccagcggct ggacgacagc 360

ttcctggtgc ccgacgacaa gcgggacagc aagtacccca tcttcggcaa cctggtggaa 420

gagaaggcct accacgacga gttccccacc atctaccacc tgagaaagta cctggccgac 480

agcaccaaga aggccgacct gagactggtg tatctggccc tggcccacat gatcaagtac 540

cggggccact tcctgatcga gggcgagttc aacagcaaga acaacgacat ccagaagaac 600

ttccaggact tcctggacac ctacaacgcc atcttcgaga gcgacctgtc cctggaaaac 660

agcaagcagc tggaagagat cgtgaaggac aagatcagca agctggaaaa gaaggaccgc 720

atcctgaagc tgttccccgg cgagaagaac agcggaatct tcagcgagtt tctgaagctg 780

atcgtgggca accaggccga cttcagaaag tgcttcaacc tggacgagaa agccagcctg 840

cacttcagca aagagagcta cgacgaggac ctggaaaccc tgctgggata tatcggcgac 900

gactacagcg acgtgttcct gaaggccaag aagctgtacg acgctatcct gctgagcggc 960

ttcctgaccg tgaccgacaa cgagacagag gccccactga gcagcgccat gattaagcgg 1020

tacaacgagc acaaagagga tctggctctg ctgaaagagt acatccggaa catcagcctg 1080

aaaacctaca atgaggtgtt caaggacgac accaagaacg gctacgccgg ctacatcgac 1140

ggcaagacca accaggaaga tttctatgtg tacctgaaga agctgctggc cgagttcgag 1200

ggggccgact actttctgga aaaaatcgac cgcgaggatt tcctgcggaa gcagcggacc 1260

ttcgacaacg gcagcatccc ctaccagatc catctgcagg aaatgcgggc catcctggac 1320

aagcaggcca agttctaccc attcctggcc aagaacaaag agcggatcga gaagatcctg 1380

accttccgca tcccttacta cgtgggcccc ctggccagag gcaacagcga ttttgcctgg 1440

tccatccgga agcgcaatga gaagatcacc ccctggaact tcgaggacgt gatcgacaaa 1500

gagtccagcg ccgaggcctt catcaaccgg atgaccagct tcgacctgta cctgcccgag 1560

gaaaaggtgc tgcccaagca cagcctgctg tacgagacat tcaatgtgta taacgagctg 1620

accaaagtgc ggtttatcgc cgagtctatg cgggactacc agttcctgga ctccaagcag 1680

aaaaaggaca tcgtgcggct gtacttcaag gacaagcgga aagtgaccga taaggacatc 1740

atcgagtacc tgcacgccat ctacggctac gatggcatcg agctgaaggg catcgagaag 1800

cagttcaact ccagcctgag cacataccac gacctgctga acattatcaa cgacaaagaa 1860

tttctggacg actccagcaa cgaggccatc atcgaagaga tcatccacac cctgaccatc 1920

tttgaggacc gcgagatgat caagcagcgg ctgagcaagt tcgagaacat cttcgacaag 1980

agcgtgctga aaaagctgag cagacggcac tacaccggct ggggcaagct gagcgccaag 2040

ctgatcaacg gcatccggga cgagaagtcc ggcaacacaa tcctggacta cctgatcgac 2100

gacggcatca gcaaccggaa cttcatgcag ctgatccacg acgacgccct gagcttcaag 2160

aagaagatcc agaaggccca gatcatcggg gacgaggaca agggcaacat caaagaagtc 2220

gtgaagtccc tgcccggcag ccccgccatc aagaagggaa tcctgcagag catcaagatc 2280

gtggacgagc tcgtgaaagt gatgggcggc agaaagcccg agagcatcgt ggtggaaatg 2340

gctagagaga accagtacac caatcagggc aagagcaaca gccagcagag actgaagaga 2400

ctggaaaagt ccctgaaaga gctgggcagc aagattctga aagagaatat ccctgccaag 2460

ctgtccaaga tcgacaacaa cgccctgcag aacgaccggc tgtacctgta ctacctgcag 2520

aatggcaagg acatgtatac aggcgacgac ctggatatcg accgcctgag caactacgac 2580

atcgaccata ttatccccca ggccttcctg aaagacaaca gcattgacaa caaagtgctg 2640

gtgtcctccg ccagcaaccg cggcaagtcc gatgatgtgc ccagcctgga agtcgtgaaa 2700

aagagaaaga ccttctggta tcagctgctg aaaagcaagc tgattagcca gaggaagttc 2760

gacaacctga ccaaggccga gagaggcggc ctgagccctg aagataaggc cggcttcatc 2820

cagagacagc tggtggaaac ccggcagatc accaagcacg tggccagact gctggatgag 2880

aagtttaaca acaagaagga cgagaacaac cgggccgtgc ggaccgtgaa gatcatcacc 2940

ctgaagtcca ccctggtgtc ccagttccgg aaggacttcg agctgtataa agtgcgcgag 3000

atcaatgact ttcaccacgc ccacgacgcc tacctgaatg ccgtggtggc ttccgccctg 3060

ctgaagaagt accctaagct ggaacccgag ttcgtgtacg gcgactaccc caagtacaac 3120

tccttcagag agcggaagtc cgccaccgag aaggtgtact tctactccaa catcatgaat 3180

atctttaaga agtccatctc cctggccgat ggcagagtga tcgagcggcc cctgatcgaa 3240

gtgaacgaag agacaggcga gagcgtgtgg aacaaagaaa gcgacctggc caccgtgcgg 3300

cgggtgctga gttatcctca agtgaatgtc gtgaagaagg tggaagaaca gaaccacggc 3360

ctggatcggg gcaagcccaa gggcctgttc aacgccaacc tgtccagcaa gcctaagccc 3420

aactccaacg agaatctcgt gggggccaaa gagtacctgg accctaagaa gtacggcgga 3480

tacgccggca tctccaatag cttcaccgtg ctcgtgaagg gcacaatcga gaagggcgct 3540

aagaaaaaga tcacaaacgt gctggaattt caggggatct ctatcctgga ccggatcaac 3600

taccggaagg ataagctgaa ctttctgctg gaaaaaggct acaaggacat tgagctgatt 3660

atcgagctgc ctaagtactc cctgttcgaa ctgagcgacg gctccagacg gatgctggcc 3720

tccatcctgt ccaccaacaa caagcggggc gagatccaca agggaaacca gatcttcctg 3780

agccagaaat ttgtgaaact gctgtaccac gccaagcgga tctccaacac catcaatgag 3840

aaccaccgga aatacgtgga aaaccacaag aaagagtttg aggaactgtt ctactacatc 3900

ctggagttca acgagaacta tgtgggagcc aagaagaacg gcaaactgct gaactccgcc 3960

ttccagagct ggcagaacca cagcatcgac gagctgtgca gctccttcat cggccctacc 4020

ggcagcgagc ggaagggact gtttgagctg acctccagag gctctgccgc cgactttgag 4080

ttcctgggag tgaagatccc ccggtacaga gactacaccc cctctagtct gctgaaggac 4140

gccaccctga tccaccagag cgtgaccggc ctgtacgaaa cccggatcga cctggctaag 4200

ctgggcgagg gaaagcgtcc tgctgctact aagaaagctg gtcaagctaa gaaaaagaaa 4260

taa 4263

<210> 68

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 68

tcctagcagg atttctgata ttactgtcac gttttagagc tatgctgttt tga 53

<210> 69

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 69

gtgacagtaa tatcagaaat cctgctagga gttttgggac cattcaaaac agc 53

<210> 70

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 70

gggtttcaag tctttgtagc aagag 25

<210> 71

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 71

gccaatgaac gggaaccctt ggtc 24

<210> 72

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (1)..(4)

<223> a, c, t, g, unknown or other

<400> 72

nnnngacgag gcaatggctg aaatc 25

<210> 73

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (1)..(4)

<223> a, c, t, g, unknown or other

<400> 73

nnnnttattt ggctcatatt tgctg 25

<210> 74

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 74

ctttacacca atcgctgcaa cagac 25

<210> 75

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 75

caaaatttct agtcttcttt gcctttcccc ataaaaccct cctta 45

<210> 76

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 76

agggttttat ggggaaaggc aaagaagact agaaattttg atacc 45

<210> 77

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 77

cttacggtgc ataaagtcaa tttcc 25

<210> 78

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 78

tggctcgatt tcagccattg c 21

<210> 79

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (33)..(33)

<223> a, c, t, g, unknown or other

<400> 79

ctttgacgag gcaatggctg aaatcgagcc aanaaagcgc aag 43

<210> 80

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (34)..(34)

<223> a, c, t, g, unknown or other

<400> 80

ctttgacgag gcaatggctg aaatcgagcc aaanaagcgc aag 43

<210> 81

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (35)..(35)

<223> a, c, t, g, unknown or other

<400> 81

ctttgacgag gcaatggctg aaatcgagcc aaaanagcgc aag 43

<210> 82

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (36)..(36)

<223> a, c, t, g, unknown or other

<400> 82

ctttgacgag gcaatggctg aaatcgagcc aaaaangcgc aag 43

<210> 83

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (37)..(37)

<223> a, c, t, g, unknown or other

<400> 83

ctttgacgag gcaatggctg aaatcgagcc aaaaaancgc aag 43

<210> 84

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (38)..(38)

<223> a, c, t, g, unknown or other

<400> 84

ctttgacgag gcaatggctg aaatcgagcc aaaaaagngc aag 43

<210> 85

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (39)..(39)

<223> a, c, t, g, unknown or other

<400> 85

ctttgacgag gcaatggctg aaatcgagcc aaaaaagcnc aagaag 46

<210> 86

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (40)..(40)

<223> a, c, t, g, unknown or other

<400> 86

ctttgacgag gcaatggctg aaatcgagcc aaaaaagcgn aagaag 46

<210> 87

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (41)..(41)

<223> a, c, t, g, unknown or other

<400> 87

ctttgacgag gcaatggctg aaatcgagcc aaaaaagcgc nagaag 46

<210> 88

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 88

gcgctttttt ggctcgattt cag 23

<210> 89

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (31)..(31)

<223> a, c, t, g, unknown or other

<400> 89

caatggctga aatcgagcca aaaaagcgca ngaagaaatc 40

<210> 90

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (32)..(32)

<223> a, c, t, g, unknown or other

<400> 90

caatggctga aatcgagcca aaaaagcgca anaagaaatc 40

<210> 91

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (33)..(33)

<223> a, c, t, g, unknown or other

<400> 91

caatggctga aatcgagcca aaaaagcgca agnagaaatc 40

<210> 92

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (34)..(34)

<223> a, c, t, g, unknown or other

<400> 92

caatggctga aatcgagcca aaaaagcgca agangaaatc 40

<210> 93

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (35)..(35)

<223> a, c, t, g, unknown or other

<400> 93

caatggctga aatcgagcca aaaaagcgca agaanaaatc 40

<210> 94

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (36)..(36)

<223> a, c, t, g, unknown or other

<400> 94

caatggctga aatcgagcca aaaaagcgca agaagnaatc aacc 44

<210> 95

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (37)..(37)

<223> a, c, t, g, unknown or other

<400> 95

caatggctga aatcgagcca aaaaagcgca agaaganatc aacc 44

<210> 96

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (38)..(38)

<223> a, c, t, g, unknown or other

<400> 96

caatggctga aatcgagcca aaaaagcgca agaagaantc aacc 44

<210> 97

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (39)..(39)

<223> a, c, t, g, unknown or other

<400> 97

caatggctga aatcgagcca aaaaagcgca agaagaaanc aacc 44

<210> 98

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (40)..(40)

<223> a, c, t, g, unknown or other

<400> 98

caatggctga aatcgagcca aaaaagcgca agaagaaatn aaccagc 47

<210> 99

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (41)..(41)

<223> a, c, t, g, unknown or other

<400> 99

caatggctga aatcgagcca aaaaagcgca agaagaaatc naccagc 47

<210> 100

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 100

gatcctccat ccgtacaacc cacaaccctg g 31

<210> 101

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 101

aattccaggg ttgtgggttg tacggatgga g 31

<210> 102

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 102

catggatcct atttcttaat aactaaaaat atgg 34

<210> 103

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 103

catgaattca actcaacaag tctcagtgtg ctg 33

<210> 104

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 104

aaacattttt tctccattta ggaaaaagga tgctg 35

<210> 105

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 105

aaaacagcat cctttttcct aaatggagaa aaaat 35

<210> 106

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 106

aaaccttaaa tcagtcacaa atagcagcaa aattg 35

<210> 107

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 107

aaaacaattt tgctgctatt tgtgactgat ttaag 35

<210> 108

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 108

aaacttttca tcatacgacc aatctgcttt atttg 35

<210> 109

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 109

aaaacaaata aagcagattg gtcgtatgat gaaaa 35

<210> 110

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 110

aaactcgtcc agaagttatc gtaaaagaaa tcgag 35

<210> 111

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 111

aaaactcgat ttcttttacg ataacttctg gacga 35

<210> 112

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 112

aaacaatctc tccaaggttt ccttaaaaat ctctg 35

<210> 113

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 113

aaaacagaga tttttaagga aaccttggag agatt 35

<210> 114

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 114

aaacgccatc gtcaggaaga agctatgctt gagtg 35

<210> 115

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 115

aaaacactca agcatagctt cttcctgacg atggc 35

<210> 116

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 116

aaacatctct atacttattg aaatttcttt gtatg 35

<210> 117

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 117

aaaacataca aagaaatttc aataagtata gagat 35

<210> 118

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 118

aaactagctg tgatagtccg caaaaccagc cttcg 35

<210> 119

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 119

aaaacgaagg ctggttttgc ggactatcac agcta 35

<210> 120

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 120

aaacatcgga aggtcgagca agtaattatc ttttg 35

<210> 121

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 121

aaaacaaaag ataattactt gctcgacctt ccgat 35

<210> 122

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 122

aaacaagatg gtatcgcaaa gtaagtgaca ataag 35

<210> 123

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 123

aaaacttatt gtcacttact ttgcgatacc atctt 35

<210> 124

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 124

gagacctttg agcttccgag actggtctca gttttgggac cattcaaaac ag 52

<210> 125

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 125

tgagaccagt ctcggaagct caaaggtctc gttttagagc tatgctgttt tg 52

<210> 126

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 126

aaactacttt acgcagcgcg gagttcggtt ttttg 35

<210> 127

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 127

aaaacaaaaa accgaactcc gcgctgcgta aagta 35

<210> 128

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 128

atgccggtac tgccgggcct cttgcgggat tacgaaatca tcctg 45

<210> 129

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 129

gtgactggcg atgctgtcgg aatggacgat cacactactc ttctt 45

<210> 130

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 130

ttaagaaata atcttcatct aaaatatact tcagtcacct cctagctgac 50

<210> 131

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 131

attgatttga gtcagctagg aggtgactga agtatatttt agatgaag 48

<210> 132

<211> 85

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 132

gagacctttg agcttccgag actggtctca gttttgggac cattcaaaac agcatagctc 60

taaaacctcg tagactattt ttgtc 85

<210> 133

<211> 84

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 133

gagaccagtc tcggaagctc aaaggtctcg ttttagagct atgctgtttt gaatggtccc 60

aaaacttcag cacactgaga cttg 84

<210> 134

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 134

agtcatccca gcaacaaatg g 21

<210> 135

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 135

cgtggtaaat cggataacgt tccaagtgaa g 31

<210> 136

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 136

tgctcttctt cacaaacaag gg 22

<210> 137

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 137

aagccaaagt ttggcaccac c 21

<210> 138

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 138

gtagcttatt cagtcctagt gg 22

<210> 139

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 139

cgtttgttga actaatgggt gcaaattacg aatcttctcc tgacg 45

<210> 140

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 140

cgtcaggaga agattcgtaa tttgcaccca ttagttcaac aaacg 45

<210> 141

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 141

gatattatgg agcctatttt tgtgggtttt taggcataaa actatatg 48

<210> 142

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 142

catatagttt tatgcctaaa aacccacaaa aataggctcc ataatatc 48

<210> 143

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 143

attatttctt aataactaaa aatatgg 27

<210> 144

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 144

cgtgtacaat tgctagcgta cggc 24

<210> 145

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 145

gcaccggtga tcactagtcc tagg 24

<210> 146

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 146

cctaggacta gtgatcaccg gtgcaaatat gagccaaata aatatat 47

<210> 147

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 147

gccgtacgct agcaattgta cacgtttgtt gaactaatgg gtgc 44

<210> 148

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 148

ttcaaatttt cccatttgat tctcc 25

<210> 149

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 149

ccatattttt agttattaag aaataatacc agccatcagt cacctcc 47

<210> 150

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 150

agacgattca atagacaata agg 23

<210> 151

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 151

gttttgggac cattcaaaac agcatagctc taaaacctcg tagac 45

<210> 152

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 152

gctatgctgt tttgaatggt cccaaaacca ttattttaac acacgaggtg 50

<210> 153

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 153

gctatgctgt tttgaatggt cccaaaacgc acccattagt tcaacaaacg 50

<210> 154

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 154

aattcttttc ttcatcatcg gtc 23

<210> 155

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 155

aagaaagaat gaagattgtt catg 24

<210> 156

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 156

ggtactaatc aaaatagtga ggagg 25

<210> 157

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 157

gtttttcaaa atctgcggtt gcg 23

<210> 158

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 158

aaaaattgaa aaaatggtgg aaacac 26

<210> 159

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 159

atttcgtaaa cggtatcggt ttcttttaaa gttttgggac cattcaaaac agc 53

<210> 160

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 160

tttaaaagaa accgataccg tttacgaaat gttttagagc tatgctgttt tga 53

<210> 161

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 161

aaacggtatc ggtttctttt aaattcaatt gttttgggac cattcaaaac agc 53

<210> 162

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 162

aattgaattt aaaagaaacc gataccgttt gttttagagc tatgctgttt tga 53

<210> 163

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 163

gttccttaaa ccaaaacggt atcggtttct tttaaattc 39

<210> 164

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 164

gaaaccgata ccgttttggt ttaaggaaca ggtaaagggc atttaac 47

<210> 165

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 165

cgatttcagc cattgcctcg tc 22

<210> 166

<211> 56

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (29)..(33)

<223> a, c, t, g, unknown or other

<400> 166

gcctttgacg aggcaatggc tgaaatcgnn nnnaaaaagc gcaagaagaa atcaac 56

<210> 167

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 167

tccgtacaac ccacaaccct gctagtgagc gttttgggac cattcaaaac agc 53

<210> 168

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 168

gctcactagc agggttgtgg gttgtacgga gttttagagc tatgctgttt tga 53

<210> 169

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 169

ttgttgccac tcttccttct ttc 23

<210> 170

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 170

cagggttgtg ggttgttgcg atggagttaa ctcccatctc c 41

<210> 171

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 171

gggagttaac tccatcgcaa caacccacaa ccctgctagt g 41

<210> 172

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 172

gtggtatcta tcgtgatgtg ac 22

<210> 173

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 173

ttaccgaaac ggaatttatc tgc 23

<210> 174

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 174

aaagctagag ttccgcaatt gg 22

<210> 175

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 175

gtgggttgta cggattgagt taactcccat ctccttc 37

<210> 176

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 176

gatgggagtt aactcaatcc gtacaaccca caaccctg 38

<210> 177

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 177

gcttcaccta ttgcagcacc aattgaccac atgaagatag 40

<210> 178

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 178

gtggtcaatt ggtgctgcaa taggtgaagc taatggtgat g 41

<210> 179

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 179

ctgatttgta ttaattttga gacattatgc ttcaccttc 39

<210> 180

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 180

gcataatgtc tcaaaattaa tacaaatcag tgaaatcatg 40

<210> 181

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 181

gttttgggac cattcaaaac agcatagctc taaaacgtga cagtaatatc ag 52

<210> 182

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 182

gttttagagc tatgctgttt tgaatggtcc caaaacgctc actagcaggg ttg 53

<210> 183

<211> 59

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 183

atactttacg cagcgcggag ttcggttttg taggagtggt agtatataca cgagtacat 59

<210> 184

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 184

gctcactagc agggttgtgg gttgtacgga tgg 33

<210> 185

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 185

tcctagcagg atttctgata ttactgtcac tgg 33

<210> 186

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 186

tttaaaagaa accgataccg tttacgaaat tgg 33

<210> 187

<211> 84

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 187

ggaaccattc ataacagcat agcaagttat aataaggcta gtccgttatc aacttgaaaa 60

agtggcaccg agtcggtgct tttt 84

<210> 188

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 188

gttatagagc tatgctgtta tgaatggtcc caaaac 36

<210> 189

<211> 84

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 189

ggaaccattc aatacagcat agcaagttaa tataaggcta gtccgttatc aacttgaaaa 60

agtggcaccg agtcggtgct tttt 84

<210> 190

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 190

gtattagagc tatgctgtat tgaatggtcc caaaac 36

<210> 191

<211> 103

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 191

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttt 103

<210> 192

<211> 103

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 192

nnnnnnnnnn nnnnnnnnnn gtattagagc tagaaatagc aagttaatat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttt 103

<210> 193

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 193

nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttt tggaaacaaa acagcatagc 60

aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 120

ttt 123

<210> 194

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 194

nnnnnnnnnn nnnnnnnnnn gtattagagc tatgctgtat tggaaacaat acagcatagc 60

aagttaatat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 120

ttt 123

<210> 195

<211> 20

<212> DNA

<213> Homo sapiens

<400> 195

gtcacctcca atgactaggg 20

<210> 196

<211> 23

<212> DNA

<213> Homo sapiens

<400> 196

gacatcgatg tcctccccat tgg 23

<210> 197

<211> 23

<212> DNA

<213> Homo sapiens

<400> 197

gagtccgagc agaagaagaa ggg 23

<210> 198

<211> 23

<212> DNA

<213> Homo sapiens

<400> 198

gcgccaccgg ttgatgtgat ggg 23

<210> 199

<211> 23

<212> DNA

<213> Homo sapiens

<400> 199

ggggcacaga tgagaaactc agg 23

<210> 200

<211> 23

<212> DNA

<213> Homo sapiens

<400> 200

gtacaaacgg cagaagctgg agg 23

<210> 201

<211> 23

<212> DNA

<213> Homo sapiens

<400> 201

ggcagaagct ggaggaggaa ggg 23

<210> 202

<211> 23

<212> DNA

<213> Homo sapiens

<400> 202

ggagcccttc ttcttctgct cgg 23

<210> 203

<211> 23

<212> DNA

<213> Homo sapiens

<400> 203

gggcaaccac aaacccacga ggg 23

<210> 204

<211> 23

<212> DNA

<213> Homo sapiens

<400> 204

gctcccatca catcaaccgg tgg 23

<210> 205

<211> 23

<212> DNA

<213> Homo sapiens

<400> 205

gtggcgcatt gccacgaagc agg 23

<210> 206

<211> 23

<212> DNA

<213> Homo sapiens

<400> 206

ggcagagtgc tgcttgctgc tgg 23

<210> 207

<211> 23

<212> DNA

<213> Homo sapiens

<400> 207

gcccctgcgt gggcccaagc tgg 23

<210> 208

<211> 23

<212> DNA

<213> Homo sapiens

<400> 208

gagtggccag agtccagctt ggg 23

<210> 209

<211> 23

<212> DNA

<213> Homo sapiens

<400> 209

ggcctcccca aagcctggcc agg 23

<210> 210

<211> 23

<212> DNA

<213> Homo sapiens

<400> 210

ggggccgaga ttgggtgttc agg 23

<210> 211

<211> 23

<212> DNA

<213> Homo sapiens

<400> 211

gtggcgagag gggccgagat tgg 23

<210> 212

<211> 23

<212> DNA

<213> Homo sapiens

<400> 212

gagtgccgcc gaggcggggc ggg 23

<210> 213

<211> 23

<212> DNA

<213> Homo sapiens

<400> 213

ggagtgccgc cgaggcgggg cgg 23

<210> 214

<211> 23

<212> DNA

<213> Homo sapiens

<400> 214

ggagaggagt gccgccgagg cgg 23

<210> 215

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 215

ccatcccctt ctgtgaatgt 20

<210> 216

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 216

ggagattgga gacacggaga 20

<210> 217

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 217

aagcaccgac tcggtgccac 20

<210> 218

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 218

tcacctccaa tgactagggg 20

<210> 219

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 219

caagttgata acggactagc ct 22

<210> 220

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 220

agtccgagca gaagaagaag ttt 23

<210> 221

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 221

tttcaagttg ataacggact agcct 25

<210> 222

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 222

aaacagcaga ttcgcctgga 20

<210> 223

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 223

tcatccgctc gatgaagctc 20

<210> 224

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 224

tccaaaatca agtggggcga 20

<210> 225

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 225

tgatgaccct tttggctccc 20

<210> 226

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 226

gaggaattct ttttttgtty gaatatgttg gaggtttttt ggaag 45

<210> 227

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 227

gagaagctta aataaaaaac racaatactc aacccaacaa cc 42

<210> 228

<211> 17

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 228

caggaaacag ctatgac 17

<210> 229

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 229

gcctctagag gtacctgagg gcctatttcc catgattcc 39

<210> 230

<211> 133

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (92)..(111)

<223> a, c, t, g, unknown or other

<400> 230

acctctagaa aaaaagcacc gactcggtgc cactttttca agttgataac ggactagcct 60

tattttaact tgctatttct agctctaaaa cnnnnnnnnn nnnnnnnnnn nggtgtttcg 120

tcctttccac aag 133

<210> 231

<211> 133

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (92)..(111)

<223> a, c, t, g, unknown or other

<400> 231

acctctagaa aaaaagcacc gactcggtgc cactttttca agttgataac ggactagcct 60

tatattaact tgctatttct agctctaata cnnnnnnnnn nnnnnnnnnn nggtgtttcg 120

tcctttccac aag 133

<210> 232

<211> 153

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (112)..(131)

<223> a, c, t, g, unknown or other

<400> 232

acctctagaa aaaaagcacc gactcggtgc cactttttca agttgataac ggactagcct 60

tattttaact tgctatgctg ttttgtttcc aaaacagcat agctctaaaa cnnnnnnnnn 120

nnnnnnnnnn nggtgtttcg tcctttccac aag 153

<210> 233

<211> 153

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<220>

<221> modified_base

<222> (112)..(131)

<223> a, c, t, g, unknown or other

<400> 233

acctctagaa aaaaagcacc gactcggtgc cactttttca agttgataac ggactagcct 60

tatattaact tgctatgctg tattgtttcc aatacagcat agctctaata cnnnnnnnnn 120

nnnnnnnnnn nggtgtttcg tcctttccac aag 153

<210> 234

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 234

aggccccagt ggctgctctn aa 22

<210> 235

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 235

acatcaaccg gtggcgcatn at 22

<210> 236

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 236

aaggtgtggt tccagaaccn ac 22

<210> 237

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 237

ccatcacatc aaccggtggn ag 22

<210> 238

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 238

aaacggcaga agctggaggn ta 22

<210> 239

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 239

ggcagaagct ggaggaggan tt 22

<210> 240

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 240

ggtgtggttc cagaaccggn tc 22

<210> 241

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 241

aaccggagga caaagtacan tg 22

<210> 242

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 242

ttccagaacc ggaggacaan ca 22

<210> 243

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 243

gtgtggttcc agaaccggan ct 22

<210> 244

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 244

tccagaaccg gaggacaaan cc 22

<210> 245

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 245

cagaagctgg aggaggaagn cg 22

<210> 246

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 246

catcaaccgg tggcgcattn ga 22

<210> 247

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 247

gcagaagctg gaggaggaan gt 22

<210> 248

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 248

cctccctccc tggcccaggn gc 22

<210> 249

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 249

tcatctgtgc ccctccctcn aa 22

<210> 250

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 250

gggaggacat cgatgtcacn at 22

<210> 251

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 251

caaacggcag aagctggagn ac 22

<210> 252

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 252

gggtgggcaa ccacaaaccn ag 22

<210> 253

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 253

ggtgggcaac cacaaacccn ta 22

<210> 254

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 254

ggctcccatc acatcaaccn tt 22

<210> 255

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 255

gaagggcctg agtccgagcn tc 22

<210> 256

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 256

caaccggtgg cgcattgccn tg 22

<210> 257

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 257

aggaggaagg gcctgagtcn ca 22

<210> 258

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 258

agctggagga ggaagggccn ct 22

<210> 259

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 259

gcattgccac gaagcaggcn cc 22

<210> 260

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 260

attgccacga agcaggccan cg 22

<210> 261

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 261

agaaccggag gacaaagtan ga 22

<210> 262

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 262

tcaaccggtg gcgcattgcn gt 22

<210> 263

<211> 22

<212> DNA

<213> Homo sapiens

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, t, g, unknown or other

<400> 263

gaagctggag gaggaagggn gc 22

<210> 264

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 264

ccaatgggga ggacatcgat gtcacctcca atgactaggg tgggcaacca caaacccacg 60

agggcagagt gctgcttgct gctggccagg cccctgcgtg ggcccaagct ggactctggc 120

cac 123

<210> 265

<211> 121

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 265

cgagcagaag aagaagggct cccatcacat caaccggtgg cgcattgcca cgaagcaggc 60

caatggggag gacatcgatg tcacctccaa tgactagggt gggcaaccac aaacccacga 120

g 121

<210> 266

<211> 128

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 266

ggaggacaaa gtacaaacgg cagaagctgg aggaggaagg gcctgagtcc gagcagaaga 60

agaagggctc ccatcacatc aaccggtggc gcattgccac gaagcaggcc aatggggagg 120

acatcgat 128

<210> 267

<211> 130

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 267

agaagctgga ggaggaaggg cctgagtccg agcagaagaa gaagggctcc catcacatca 60

accggtggcg cattgccacg aagcaggcca atggggagga catcgatgtc acctccaatg 120

actagggtgg 130

<210> 268

<211> 125

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 268

cctcagtctt cccatcaggc tctcagctca gcctgagtgt tgaggcccca gtggctgctc 60

tgggggcctc ctgagtttct catctgtgcc cctccctccc tggcccaggt gaaggtgtgg 120

ttcca 125

<210> 269

<211> 129

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 269

tcatctgtgc ccctccctcc ctggcccagg tgaaggtgtg gttccagaac cggaggacaa 60

agtacaaacg gcagaagctg gaggaggaag ggcctgagtc cgagcagaag aagaagggct 120

cccatcaca 129

<210> 270

<211> 129

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 270

ctccaatgac tagggtgggc aaccacaaac ccacgagggc agagtgctgc ttgctgctgg 60

ccaggcccct gcgtgggccc aagctggact ctggccactc cctggccagg ctttggggag 120

gcctggagt 129

<210> 271

<211> 127

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 271

ctgcttgctg ctggccaggc ccctgcgtgg gcccaagctg gactctggcc actccctggc 60

caggctttgg ggaggcctgg agtcatggcc ccacagggct tgaagcccgg ggccgccatt 120

gacagag 127

<210> 272

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 272

gaaattaata cgactcacta taggg 25

<210> 273

<211> 126

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 273

aaaaaagcac cgactcggtg ccactttttc aagttgataa cggactagcc ttattttaac 60

ttgctatttc tagctctaaa acaacgacga gcgtgacacc accctatagt gagtcgtatt 120

aatttc 126

<210> 274

<211> 126

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 274

aaaaaagcac cgactcggtg ccactttttc aagttgataa cggactagcc ttattttaac 60

ttgctatttc tagctctaaa acgcaacaat taatagactg gacctatagt gagtcgtatt 120

aatttc 126

<210> 275

<211> 4677

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 275

tctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg 60

gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg gctgcatggg 120

cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg attgcaaaga 180

cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac ttctacacag 240

gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt cgtttcagtc 300

acaacccgca aacatgtacc catacgatgt tccagattac gcttcgccga agaaaaagcg 360

caaggtcgaa gcgtccgaca agaagtacag catcggcctg gacatcggca ccaactctgt 420

gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc aagaaattca aggtgctggg 480

caacaccgac cggcacagca tcaagaagaa cctgatcgga gccctgctgt tcgacagcgg 540

cgaaacagcc gaggccaccc ggctgaagag aaccgccaga agaagataca ccagacggaa 600

gaaccggatc tgctatctgc aagagatctt cagcaacgag atggccaagg tggacgacag 660

cttcttccac agactggaag agtccttcct ggtggaagag gataagaagc acgagcggca 720

ccccatcttc ggcaacatcg tggacgaggt ggcctaccac gagaagtacc ccaccatcta 780

ccacctgaga aagaaactgg tggacagcac cgacaaggcc gacctgcggc tgatctatct 840

ggccctggcc cacatgatca agttccgggg ccacttcctg atcgagggcg acctgaaccc 900

cgacaacagc gacgtggaca agctgttcat ccagctggtg cagacctaca accagctgtt 960

cgaggaaaac cccatcaacg ccagcggcgt ggacgccaag gccatcctgt ctgccagact 1020

gagcaagagc agacggctgg aaaatctgat cgcccagctg cccggcgaga agaagaatgg 1080

cctgttcggc aacctgattg ccctgagcct gggcctgacc cccaacttca agagcaactt 1140

cgacctggcc gaggatgcca aactgcagct gagcaaggac acctacgacg acgacctgga 1200

caacctgctg gcccagatcg gcgaccagta cgccgacctg tttctggccg ccaagaacct 1260

gtccgacgcc atcctgctga gcgacatcct gagagtgaac accgagatca ccaaggcccc 1320

cctgagcgcc tctatgatca agagatacga cgagcaccac caggacctga ccctgctgaa 1380

agctctcgtg cggcagcagc tgcctgagaa gtacaaagag attttcttcg accagagcaa 1440

gaacggctac gccggctaca ttgacggcgg agccagccag gaagagttct acaagttcat 1500

caagcccatc ctggaaaaga tggacggcac cgaggaactg ctcgtgaagc tgaacagaga 1560

ggacctgctg cggaagcagc ggaccttcga caacggcagc atcccccacc agatccacct 1620

gggagagctg cacgccattc tgcggcggca ggaagatttt tacccattcc tgaaggacaa 1680

ccgggaaaag atcgagaaga tcctgacctt ccgcatcccc tactacgtgg gccctctggc 1740

caggggaaac agcagattcg cctggatgac cagaaagagc gaggaaacca tcaccccctg 1800

gaacttcgag gaagtggtgg acaagggcgc ttccgcccag agcttcatcg agcggatgac 1860

caacttcgat aagaacctgc ccaacgagaa ggtgctgccc aagcacagcc tgctgtacga 1920

gtacttcacc gtgtataacg agctgaccaa agtgaaatac gtgaccgagg gaatgagaaa 1980

gcccgccttc ctgagcggcg agcagaaaaa ggccatcgtg gacctgctgt tcaagaccaa 2040

ccggaaagtg accgtgaagc agctgaaaga ggactacttc aagaaaatcg agtgcttcga 2100

ctccgtggaa atctccggcg tggaagatcg gttcaacgcc tccctgggca cataccacga 2160

tctgctgaaa attatcaagg acaaggactt cctggacaat gaggaaaacg aggacattct 2220

ggaagatatc gtgctgaccc tgacactgtt tgaggacaga gagatgatcg aggaacggct 2280

gaaaacctat gcccacctgt tcgacgacaa agtgatgaag cagctgaagc ggcggagata 2340

caccggctgg ggcaggctga gccggaagct gatcaacggc atccgggaca agcagtccgg 2400

caagacaatc ctggatttcc tgaagtccga cggcttcgcc aacagaaact tcatgcagct 2460

gatccacgac gacagcctga cctttaaaga ggacatccag aaagcccagg tgtccggcca 2520

gggcgatagc ctgcacgagc acattgccaa tctggccggc agccccgcca ttaagaaggg 2580

catcctgcag acagtgaagg tggtggacga gctcgtgaaa gtgatgggcc ggcacaagcc 2640

cgagaacatc gtgatcgaaa tggccagaga gaaccagacc acccagaagg gacagaagaa 2700

cagccgcgag agaatgaagc ggatcgaaga gggcatcaaa gagctgggca gccagatcct 2760

gaaagaacac cccgtggaaa acacccagct gcagaacgag aagctgtacc tgtactacct 2820

gcagaatggg cgggatatgt acgtggacca ggaactggac atcaaccggc tgtccgacta 2880

cgatgtggac catatcgtgc ctcagagctt tctgaaggac gactccatcg acaacaaggt 2940

gctgaccaga agcgacaaga accggggcaa gagcgacaac gtgccctccg aagaggtcgt 3000

gaagaagatg aagaactact ggcggcagct gctgaacgcc aagctgatta cccagagaaa 3060

gttcgacaat ctgaccaagg ccgagagagg cggcctgagc gaactggata aggccggctt 3120

catcaagaga cagctggtgg aaacccggca gatcacaaag cacgtggcac agatcctgga 3180

ctcccggatg aacactaagt acgacgagaa tgacaagctg atccgggaag tgaaagtgat 3240

caccctgaag tccaagctgg tgtccgattt ccggaaggat ttccagtttt acaaagtgcg 3300

cgagatcaac aactaccacc acgcccacga cgcctacctg aacgccgtcg tgggaaccgc 3360

cctgatcaaa aagtacccta agctggaaag cgagttcgtg tacggcgact acaaggtgta 3420

cgacgtgcgg aagatgatcg ccaagagcga gcaggaaatc ggcaaggcta ccgccaagta 3480

cttcttctac agcaacatca tgaacttttt caagaccgag attaccctgg ccaacggcga 3540

gatccggaag cggcctctga tcgagacaaa cggcgaaacc ggggagatcg tgtgggataa 3600

gggccgggat tttgccaccg tgcggaaagt gctgagcatg ccccaagtga atatcgtgaa 3660

aaagaccgag gtgcagacag gcggcttcag caaagagtct atcctgccca agaggaacag 3720

cgataagctg atcgccagaa agaaggactg ggaccctaag aagtacggcg gcttcgacag 3780

ccccaccgtg gcctattctg tgctggtggt ggccaaagtg gaaaagggca agtccaagaa 3840

actgaagagt gtgaaagagc tgctggggat caccatcatg gaaagaagca gcttcgagaa 3900

gaatcccatc gactttctgg aagccaaggg ctacaaagaa gtgaaaaagg acctgatcat 3960

caagctgcct aagtactccc tgttcgagct ggaaaacggc cggaagagaa tgctggcctc 4020

tgccggcgaa ctgcagaagg gaaacgaact ggccctgccc tccaaatatg tgaacttcct 4080

gtacctggcc agccactatg agaagctgaa gggctccccc gaggataatg agcagaaaca 4140

gctgtttgtg gaacagcaca agcactacct ggacgagatc atcgagcaga tcagcgagtt 4200

ctccaagaga gtgatcctgg ccgacgctaa tctggacaaa gtgctgtccg cctacaacaa 4260

gcaccgggat aagcccatca gagagcaggc cgagaatatc atccacctgt ttaccctgac 4320

caatctggga gcccctgccg ccttcaagta ctttgacacc accatcgacc ggaagaggta 4380

caccagcacc aaagaggtgc tggacgccac cctgatccac cagagcatca ccggcctgta 4440

cgagacacgg atcgacctgt ctcagctggg aggcgacagc cccaagaaga agagaaaggt 4500

ggaggccagc taaggatccg gcaagactgg ccccgcttgg caacgcaaca gtgagcccct 4560

ccctagtgtg tttggggatg tgactatgta ttcgtgtgtt ggccaacggg tcaacccgaa 4620

cagattgata cccgccttgg catttcctgt cagaatgtaa cgtcagttga tggtact 4677

<210> 276

<211> 3150

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 276

tctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg 60

gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg gctgcatggg 120

cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg attgcaaaga 180

cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac ttctacacag 240

gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt cgtttcagtc 300

acaacccgca aacatgccta agaagaagag gaaggttaac acgattaaca tcgctaagaa 360

cgacttctct gacatcgaac tggctgctat cccgttcaac actctggctg accattacgg 420

tgagcgttta gctcgcgaac agttggccct tgagcatgag tcttacgaga tgggtgaagc 480

acgcttccgc aagatgtttg agcgtcaact taaagctggt gaggttgcgg ataacgctgc 540

cgccaagcct ctcatcacta ccctactccc taagatgatt gcacgcatca acgactggtt 600

tgaggaagtg aaagctaagc gcggcaagcg cccgacagcc ttccagttcc tgcaagaaat 660

caagccggaa gccgtagcgt acatcaccat taagaccact ctggcttgcc taaccagtgc 720

tgacaataca accgttcagg ctgtagcaag cgcaatcggt cgggccattg aggacgaggc 780

tcgcttcggt cgtatccgtg accttgaagc taagcacttc aagaaaaacg ttgaggaaca 840

actcaacaag cgcgtagggc acgtctacaa gaaagcattt atgcaagttg tcgaggctga 900

catgctctct aagggtctac tcggtggcga ggcgtggtct tcgtggcata aggaagactc 960

tattcatgta ggagtacgct gcatcgagat gctcattgag tcaaccggaa tggttagctt 1020

acaccgccaa aatgctggcg tagtaggtca agactctgag actatcgaac tcgcacctga 1080

atacgctgag gctatcgcaa cccgtgcagg tgcgctggct ggcatctctc cgatgttcca 1140

accttgcgta gttcctccta agccgtggac tggcattact ggtggtggct attgggctaa 1200

cggtcgtcgt cctctggcgc tggtgcgtac tcacagtaag aaagcactga tgcgctacga 1260

agacgtttac atgcctgagg tgtacaaagc gattaacatt gcgcaaaaca ccgcatggaa 1320

aatcaacaag aaagtcctag cggtcgccaa cgtaatcacc aagtggaagc attgtccggt 1380

cgaggacatc cctgcgattg agcgtgaaga actcccgatg aaaccggaag acatcgacat 1440

gaatcctgag gctctcaccg cgtggaaacg tgctgccgct gctgtgtacc gcaaggacaa 1500

ggctcgcaag tctcgccgta tcagccttga gttcatgctt gagcaagcca ataagtttgc 1560

taaccataag gccatctggt tcccttacaa catggactgg cgcggtcgtg tttacgctgt 1620

gtcaatgttc aacccgcaag gtaacgatat gaccaaagga ctgcttacgc tggcgaaagg 1680

taaaccaatc ggtaaggaag gttactactg gctgaaaatc cacggtgcaa actgtgcggg 1740

tgtcgacaag gttccgttcc ctgagcgcat caagttcatt gaggaaaacc acgagaacat 1800

catggcttgc gctaagtctc cactggagaa cacttggtgg gctgagcaag attctccgtt 1860

ctgcttcctt gcgttctgct ttgagtacgc tggggtacag caccacggcc tgagctataa 1920

ctgctccctt ccgctggcgt ttgacgggtc ttgctctggc atccagcact tctccgcgat 1980

gctccgagat gaggtaggtg gtcgcgcggt taacttgctt cctagtgaaa ccgttcagga 2040

catctacggg attgttgcta agaaagtcaa cgagattcta caagcagacg caatcaatgg 2100

gaccgataac gaagtagtta ccgtgaccga tgagaacact ggtgaaatct ctgagaaagt 2160

caagctgggc actaaggcac tggctggtca atggctggct tacggtgtta ctcgcagtgt 2220

gactaagcgt tcagtcatga cgctggctta cgggtccaaa gagttcggct tccgtcaaca 2280

agtgctggaa gataccattc agccagctat tgattccggc aagggtctga tgttcactca 2340

gccgaatcag gctgctggat acatggctaa gctgatttgg gaatctgtga gcgtgacggt 2400

ggtagctgcg gttgaagcaa tgaactggct taagtctgct gctaagctgc tggctgctga 2460

ggtcaaagat aagaagactg gagagattct tcgcaagcgt tgcgctgtgc attgggtaac 2520

tcctgatggt ttccctgtgt ggcaggaata caagaagcct attcagacgc gcttgaacct 2580

gatgttcctc ggtcagttcc gcttacagcc taccattaac accaacaaag atagcgagat 2640

tgatgcacac aaacaggagt ctggtatcgc tcctaacttt gtacacagcc aagacggtag 2700

ccaccttcgt aagactgtag tgtgggcaca cgagaagtac ggaatcgaat cttttgcact 2760

gattcacgac tccttcggta cgattccggc tgacgctgcg aacctgttca aagcagtgcg 2820

cgaaactatg gttgacacat atgagtcttg tgatgtactg gctgatttct acgaccagtt 2880

cgctgaccag ttgcacgagt ctcaattgga caaaatgcca gcacttccgg ctaaaggtaa 2940

cttgaacctc cgtgacatct tagagtcgga cttcgcgttc gcgtaaggat ccggcaagac 3000

tggccccgct tggcaacgca acagtgagcc cctccctagt gtgtttgggg atgtgactat 3060

gtattcgtgt gttggccaac gggtcaaccc gaacagattg atacccgcct tggcatttcc 3120

tgtcagaatg taacgtcagt tgatggtact 3150

<210> 277

<211> 125

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (23)..(42)

<223> a, c, t, g, unknown or other

<400> 277

gaaattaata cgactcacta tannnnnnnn nnnnnnnnnn nngttttaga gctagaaata 60

gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 120

ttttt 125

<210> 278

<211> 8452

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 278

tgcggtattt cacaccgcat caggtggcac ttttcgggga aatgtgcgcg gaacccctat 60

ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagattat caaaaaggat 120

cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 180

gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 240

tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 300

gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 360

agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 420

tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 480

agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 540

gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 600

catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 660

ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 720

atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 780

tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 840

cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 900

cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 960

atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 1020

aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 1080

ttgaagcatt tatcagggtt attgtctcat gaccaaaatc ccttaacgtg agttttcgtt 1140

ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct 1200

gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 1260

ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 1320

aaatactgtt cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 1380

gcctacatac ctcgctctgc taatcctgtt accagtggct gttgccagtg gcgataagtc 1440

gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 1500

aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 1560

cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 1620

tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 1680

ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 1740

atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 1800

cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt 1860

ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga 1920

gcgcagcgag tcagtgagcg aggaagcggt cgctgaggct tgacatgatt ggtgcgtatg 1980

tttgtatgaa gctacaggac tgatttggcg ggctatgagg gcgggggaag ctctggaagg 2040

gccgcgatgg ggcgcgcggc gtccagaagg cgccatacgg cccgctggcg gcacccatcc 2100

ggtataaaag cccgcgaccc cgaacggtga cctccacttt cagcgacaaa cgagcactta 2160

tacatacgcg actattctgc cgctatacat aaccactcag ctagcttaag atcccatcaa 2220

gcttgcatgc cgggcgcgcc agaaggagcg cagccaaacc aggatgatgt ttgatggggt 2280

atttgagcac ttgcaaccct tatccggaag ccccctggcc cacaaaggct aggcgccaat 2340

gcaagcagtt cgcatgcagc ccctggagcg gtgccctcct gataaaccgg ccagggggcc 2400

tatgttcttt acttttttac aagagaagtc actcaacatc ttaaaatggc caggtgagtc 2460

gacgagcaag cccggcggat caggcagcgt gcttgcagat ttgacttgca acgcccgcat 2520

tgtgtcgacg aaggcttttg gctcctctgt cgctgtctca agcagcatct aaccctgcgt 2580

cgccgtttcc atttgcagga gattcgaggt accatgtacc catacgatgt tccagattac 2640

gcttcgccga agaaaaagcg caaggtcgaa gcgtccgaca agaagtacag catcggcctg 2700

gacatcggca ccaactctgt gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc 2760

aagaaattca aggtgctggg caacaccgac cggcacagca tcaagaagaa cctgatcgga 2820

gccctgctgt tcgacagcgg cgaaacagcc gaggccaccc ggctgaagag aaccgccaga 2880

agaagataca ccagacggaa gaaccggatc tgctatctgc aagagatctt cagcaacgag 2940

atggccaagg tggacgacag cttcttccac agactggaag agtccttcct ggtggaagag 3000

gataagaagc acgagcggca ccccatcttc ggcaacatcg tggacgaggt ggcctaccac 3060

gagaagtacc ccaccatcta ccacctgaga aagaaactgg tggacagcac cgacaaggcc 3120

gacctgcggc tgatctatct ggccctggcc cacatgatca agttccgggg ccacttcctg 3180

atcgagggcg acctgaaccc cgacaacagc gacgtggaca agctgttcat ccagctggtg 3240

cagacctaca accagctgtt cgaggaaaac cccatcaacg ccagcggcgt ggacgccaag 3300

gccatcctgt ctgccagact gagcaagagc agacggctgg aaaatctgat cgcccagctg 3360

cccggcgaga agaagaatgg cctgttcggc aacctgattg ccctgagcct gggcctgacc 3420

cccaacttca agagcaactt cgacctggcc gaggatgcca aactgcagct gagcaaggac 3480

acctacgacg acgacctgga caacctgctg gcccagatcg gcgaccagta cgccgacctg 3540

tttctggccg ccaagaacct gtccgacgcc atcctgctga gcgacatcct gagagtgaac 3600

accgagatca ccaaggcccc cctgagcgcc tctatgatca agagatacga cgagcaccac 3660

caggacctga ccctgctgaa agctctcgtg cggcagcagc tgcctgagaa gtacaaagag 3720

attttcttcg accagagcaa gaacggctac gccggctaca ttgacggcgg agccagccag 3780

gaagagttct acaagttcat caagcccatc ctggaaaaga tggacggcac cgaggaactg 3840

ctcgtgaagc tgaacagaga ggacctgctg cggaagcagc ggaccttcga caacggcagc 3900

atcccccacc agatccacct gggagagctg cacgccattc tgcggcggca ggaagatttt 3960

tacccattcc tgaaggacaa ccgggaaaag atcgagaaga tcctgacctt ccgcatcccc 4020

tactacgtgg gccctctggc caggggaaac agcagattcg cctggatgac cagaaagagc 4080

gaggaaacca tcaccccctg gaacttcgag gaagtggtgg acaagggcgc ttccgcccag 4140

agcttcatcg agcggatgac caacttcgat aagaacctgc ccaacgagaa ggtgctgccc 4200

aagcacagcc tgctgtacga gtacttcacc gtgtataacg agctgaccaa agtgaaatac 4260

gtgaccgagg gaatgagaaa gcccgccttc ctgagcggcg agcagaaaaa ggccatcgtg 4320

gacctgctgt tcaagaccaa ccggaaagtg accgtgaagc agctgaaaga ggactacttc 4380

aagaaaatcg agtgcttcga ctccgtggaa atctccggcg tggaagatcg gttcaacgcc 4440

tccctgggca cataccacga tctgctgaaa attatcaagg acaaggactt cctggacaat 4500

gaggaaaacg aggacattct ggaagatatc gtgctgaccc tgacactgtt tgaggacaga 4560

gagatgatcg aggaacggct gaaaacctat gcccacctgt tcgacgacaa agtgatgaag 4620

cagctgaagc ggcggagata caccggctgg ggcaggctga gccggaagct gatcaacggc 4680

atccgggaca agcagtccgg caagacaatc ctggatttcc tgaagtccga cggcttcgcc 4740

aacagaaact tcatgcagct gatccacgac gacagcctga cctttaaaga ggacatccag 4800

aaagcccagg tgtccggcca gggcgatagc ctgcacgagc acattgccaa tctggccggc 4860

agccccgcca ttaagaaggg catcctgcag acagtgaagg tggtggacga gctcgtgaaa 4920

gtgatgggcc ggcacaagcc cgagaacatc gtgatcgaaa tggccagaga gaaccagacc 4980

acccagaagg gacagaagaa cagccgcgag agaatgaagc ggatcgaaga gggcatcaaa 5040

gagctgggca gccagatcct gaaagaacac cccgtggaaa acacccagct gcagaacgag 5100

aagctgtacc tgtactacct gcagaatggg cgggatatgt acgtggacca ggaactggac 5160

atcaaccggc tgtccgacta cgatgtggac catatcgtgc ctcagagctt tctgaaggac 5220

gactccatcg acaacaaggt gctgaccaga agcgacaaga accggggcaa gagcgacaac 5280

gtgccctccg aagaggtcgt gaagaagatg aagaactact ggcggcagct gctgaacgcc 5340

aagctgatta cccagagaaa gttcgacaat ctgaccaagg ccgagagagg cggcctgagc 5400

gaactggata aggccggctt catcaagaga cagctggtgg aaacccggca gatcacaaag 5460

cacgtggcac agatcctgga ctcccggatg aacactaagt acgacgagaa tgacaagctg 5520

atccgggaag tgaaagtgat caccctgaag tccaagctgg tgtccgattt ccggaaggat 5580

ttccagtttt acaaagtgcg cgagatcaac aactaccacc acgcccacga cgcctacctg 5640

aacgccgtcg tgggaaccgc cctgatcaaa aagtacccta agctggaaag cgagttcgtg 5700

tacggcgact acaaggtgta cgacgtgcgg aagatgatcg ccaagagcga gcaggaaatc 5760

ggcaaggcta ccgccaagta cttcttctac agcaacatca tgaacttttt caagaccgag 5820

attaccctgg ccaacggcga gatccggaag cggcctctga tcgagacaaa cggcgaaacc 5880

ggggagatcg tgtgggataa gggccgggat tttgccaccg tgcggaaagt gctgagcatg 5940

ccccaagtga atatcgtgaa aaagaccgag gtgcagacag gcggcttcag caaagagtct 6000

atcctgccca agaggaacag cgataagctg atcgccagaa agaaggactg ggaccctaag 6060

aagtacggcg gcttcgacag ccccaccgtg gcctattctg tgctggtggt ggccaaagtg 6120

gaaaagggca agtccaagaa actgaagagt gtgaaagagc tgctggggat caccatcatg 6180

gaaagaagca gcttcgagaa gaatcccatc gactttctgg aagccaaggg ctacaaagaa 6240

gtgaaaaagg acctgatcat caagctgcct aagtactccc tgttcgagct ggaaaacggc 6300

cggaagagaa tgctggcctc tgccggcgaa ctgcagaagg gaaacgaact ggccctgccc 6360

tccaaatatg tgaacttcct gtacctggcc agccactatg agaagctgaa gggctccccc 6420

gaggataatg agcagaaaca gctgtttgtg gaacagcaca agcactacct ggacgagatc 6480

atcgagcaga tcagcgagtt ctccaagaga gtgatcctgg ccgacgctaa tctggacaaa 6540

gtgctgtccg cctacaacaa gcaccgggat aagcccatca gagagcaggc cgagaatatc 6600

atccacctgt ttaccctgac caatctggga gcccctgccg ccttcaagta ctttgacacc 6660

accatcgacc ggaagaggta caccagcacc aaagaggtgc tggacgccac cctgatccac 6720

cagagcatca ccggcctgta cgagacacgg atcgacctgt ctcagctggg aggcgacagc 6780

cccaagaaga agagaaaggt ggaggccagc taacatatga ttcgaatgtc tttcttgcgc 6840

tatgacactt ccagcaaaag gtagggcggg ctgcgagacg gcttcccggc gctgcatgca 6900

acaccgatga tgcttcgacc ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc 6960

gctccagggc gagcgctgtt taaatagcca ggcccccgat tgcaaagaca ttatagcgag 7020

ctaccaaagc catattcaaa cacctagatc actaccactt ctacacaggc cactcgagct 7080

tgtgatcgca ctccgctaag ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa 7140

catgacacaa gaatccctgt tacttctcga ccgtattgat tcggatgatt cctacgcgag 7200

cctgcggaac gaccaggaat tctgggaggt gagtcgacga gcaagcccgg cggatcaggc 7260

agcgtgcttg cagatttgac ttgcaacgcc cgcattgtgt cgacgaaggc ttttggctcc 7320

tctgtcgctg tctcaagcag catctaaccc tgcgtcgccg tttccatttg cagccgctgg 7380

cccgccgagc cctggaggag ctcgggctgc cggtgccgcc ggtgctgcgg gtgcccggcg 7440

agagcaccaa ccccgtactg gtcggcgagc ccggcccggt gatcaagctg ttcggcgagc 7500

actggtgcgg tccggagagc ctcgcgtcgg agtcggaggc gtacgcggtc ctggcggacg 7560

ccccggtgcc ggtgccccgc ctcctcggcc gcggcgagct gcggcccggc accggagcct 7620

ggccgtggcc ctacctggtg atgagccgga tgaccggcac cacctggcgg tccgcgatgg 7680

acggcacgac cgaccggaac gcgctgctcg ccctggcccg cgaactcggc cgggtgctcg 7740

gccggctgca cagggtgccg ctgaccggga acaccgtgct caccccccat tccgaggtct 7800

tcccggaact gctgcgggaa cgccgcgcgg cgaccgtcga ggaccaccgc gggtggggct 7860

acctctcgcc ccggctgctg gaccgcctgg aggactggct gccggacgtg gacacgctgc 7920

tggccggccg cgaaccccgg ttcgtccacg gcgacctgca cgggaccaac atcttcgtgg 7980

acctggccgc gaccgaggtc accgggatcg tcgacttcac cgacgtctat gcgggagact 8040

cccgctacag cctggtgcaa ctgcatctca acgccttccg gggcgaccgc gagatcctgg 8100

ccgcgctgct cgacggggcg cagtggaagc ggaccgagga cttcgcccgc gaactgctcg 8160

ccttcacctt cctgcacgac ttcgaggtgt tcgaggagac cccgctggat ctctccggct 8220

tcaccgatcc ggaggaactg gcgcagttcc tctgggggcc gccggacacc gcccccggcg 8280

cctgataagg atccggcaag actggccccg cttggcaacg caacagtgag cccctcccta 8340

gtgtgtttgg ggatgtgact atgtattcgt gtgttggcca acgggtcaac ccgaacagat 8400

tgatacccgc cttggcattt cctgtcagaa tgtaacgtca gttgatggta ct 8452

<210> 279

<211> 102

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 279

gttttagagc tatgctgttt tgaatggtcc caaaacggaa gggcctgagt ccgagcagaa 60

gaagaagttt tagagctatg ctgttttgaa tggtcccaaa ac 102

<210> 280

<211> 100

<212> DNA

<213> Homo sapiens

<400> 280

cggaggacaa agtacaaacg gcagaagctg gaggaggaag ggcctgagtc cgagcagaag 60

aagaagggct cccatcacat caaccggtgg cgcattgcca 100

<210> 281

<211> 50

<212> DNA

<213> Homo sapiens

<400> 281

agctggagga ggaagggcct gagtccgagc agaagaagaa gggctcccac 50

<210> 282

<211> 30

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 282

gaguccgagc agaagaagaa guuuuagagc 30

<210> 283

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 283

agctggagga ggaagggcct gagtccgagc agaagagaag ggctcccat 49

<210> 284

<211> 53

<212> DNA

<213> Homo sapiens

<400> 284

ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccatca cat 53

<210> 285

<211> 52

<212> DNA

<213> Homo sapiens

<400> 285

ctggaggagg aagggcctga gtccgagcag aagagaaggg ctcccatcac at 52

<210> 286

<211> 54

<212> DNA

<213> Homo sapiens

<400> 286

ctggaggagg aagggcctga gtccgagcag aagaaagaag ggctcccatc acat 54

<210> 287

<211> 50

<212> DNA

<213> Homo sapiens

<400> 287

ctggaggagg aagggcctga gtccgagcag aagaagggct cccatcacat 50

<210> 288

<211> 47

<212> DNA

<213> Homo sapiens

<400> 288

ctggaggagg aagggcctga gcccgagcag aagggctccc atcacat 47

<210> 289

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> source

<223> /note="Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 289

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggctagtc 60

cguuuu 66

<210> 290

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 290

gaguccgagc agaagaagaa 20

<210> 291

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 291

gacaucgaug uccuccccau 20

<210> 292

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 292

gucaccucca augacuaggg 20

<210> 293

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 293

auuggguguu cagggcagag 20

<210> 294

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 294

guggcgagag gggccgagau 20

<210> 295

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 295

ggggccgaga uuggguguuc 20

<210> 296

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 296

gugccauuag cuaaaugcau 20

<210> 297

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 297

guaccaccca caggugccag 20

<210> 298

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 298

gaaagccucu gggccaggaa 20

<210> 299

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 299

ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccat 48

<210> 300

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 300

gaguccgagc agaagaagau 20

<210> 301

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 301

gaguccgagc agaagaagua 20

<210> 302

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 302

gaguccgagc agaagaacaa 20

<210> 303

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 303

gaguccgagc agaagaugaa 20

<210> 304

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 304

gaguccgagc agaaguagaa 20

<210> 305

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 305

gaguccgagc agaugaagaa 20

<210> 306

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 306

gaguccgagc acaagaagaa 20

<210> 307

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 307

gaguccgagg agaagaagaa 20

<210> 308

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 308

gaguccgugc agaagaagaa 20

<210> 309

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 309

gagucggagc agaagaagaa 20

<210> 310

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 310

gagaccgagc agaagaagaa 20

<210> 311

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 311

aatgacaagc ttgctagcgg tggg 24

<210> 312

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 312

aaaacggaag ggcctgagtc cgagcagaag aagaagttt 39

<210> 313

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 313

aaacaggggc cgagattggg tgttcagggc agaggtttt 39

<210> 314

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 314

aaaacggaag ggcctgagtc cgagcagaag aagaagtt 38

<210> 315

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 315

aacggaggga ggggcacaga tgagaaactc agggttttag 40

<210> 316

<211> 38

<212> DNA

<213> Homo sapiens

<400> 316

agcccttctt cttctgctcg gactcaggcc cttcctcc 38

<210> 317

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 317

cagggaggga ggggcacaga tgagaaactc aggaggcccc 40

<210> 318

<211> 80

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 318

ggcaatgcgc caccggttga tgtgatggga gcccttctag gaggccccca gagcagccac 60

tggggcctca acactcaggc 80

<210> 319

<211> 23

<212> DNA

<213> Homo sapiens

<400> 319

gtcacctcca atgactaggg tgg 23

<210> 320

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (6)..(25)

<223> a, c, t, g, unknown or other

<400> 320

caccgnnnnn nnnnnnnnnn nnnnn 25

<210> 321

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (5)..(24)

<223> a, c, t, g, unknown or other

<400> 321

aaacnnnnnn nnnnnnnnnn nnnnc 25

<210> 322

<211> 33

<212> DNA

<213> Homo sapiens

<400> 322

catcgatgtc ctccccattg gcctgcttcg tgg 33

<210> 323

<211> 33

<212> DNA

<213> Homo sapiens

<400> 323

ttcgtggcaa tgcgccaccg gttgatgtga tgg 33

<210> 324

<211> 33

<212> DNA

<213> Homo sapiens

<400> 324

tcgtggcaat gcgccaccgg ttgatgtgat ggg 33

<210> 325

<211> 33

<212> DNA

<213> Homo sapiens

<400> 325

tccagcttct gccgtttgta ctttgtcctc cgg 33

<210> 326

<211> 33

<212> DNA

<213> Homo sapiens

<400> 326

ggagggaggg gcacagatga gaaactcagg agg 33

<210> 327

<211> 33

<212> DNA

<213> Homo sapiens

<400> 327

aggggccgag attgggtgtt cagggcagag agg 33

<210> 328

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 328

aacaccgggt cttcgagaag acctgtttta gagctagaaa tagcaagtta aaat 54

<210> 329

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 329

caaaacgggt cttcgagaag acgttttaga gctatgctgt tttgaatggt ccca 54

<210> 330

<211> 33

<212> DNA

<213> Mus musculus

<400> 330

caagcactga gtgccattag ctaaatgcat agg 33

<210> 331

<211> 33

<212> DNA

<213> Mus musculus

<400> 331

aatgcatagg gtaccaccca caggtgccag ggg 33

<210> 332

<211> 33

<212> DNA

<213> Mus musculus

<400> 332

acacacatgg gaaagcctct gggccaggaa agg 33

<210> 333

<211> 37

<212> DNA

<213> Homo sapiens

<400> 333

ggaggaggta gtatacagaa acacagagaa gtagaat 37

<210> 334

<211> 37

<212> DNA

<213> Homo sapiens

<400> 334

agaatgtaga ggagtcacag aaactcagca ctagaaa 37

<210> 335

<211> 98

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 335

ggacgaaaca ccggaaccat tcaaaacagc atagcaagtt aaaataaggc tagtccgtta 60

tcaacttgaa aaagtggcac cgagtcggtg cttttttt 98

<210> 336

<211> 186

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 336

ggacgaaaca ccggtagtat taagtattgt tttatggctg ataaatttct ttgaatttct 60

ccttgattat ttgttataaa agttataaaa taatcttgtt ggaaccattc aaaacagcat 120

agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 180

tttttt 186

<210> 337

<211> 95

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 337

gggttttaga gctatgctgt tttgaatggt cccaaaacgg gtcttcgaga agacgtttta 60

gagctatgct gttttgaatg gtcccaaaac ttttt 95

<210> 338

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (5)..(34)

<223> a, c, t, g, unknown or other

<400> 338

aaacnnnnnn nnnnnnnnnn nnnnnnnnnn nnnngt 36

<210> 339

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (7)..(36)

<223> a, c, t, g, unknown or other

<400> 339

taaaacnnnn nnnnnnnnnn nnnnnnnnnn nnnnnn 36

<210> 340

<211> 84

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 340

gtggaaagga cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag 60

ttaaaataag gctagtccgt tttt 84

<210> 341

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (6)..(24)

<223> a, c, t, g, unknown or other

<400> 341

caccgnnnnn nnnnnnnnnn nnnn 24

<210> 342

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (5)..(23)

<223> a, c, t, g, unknown or other

<400> 342

aaacnnnnnn nnnnnnnnnn nnnc 24

<210> 343

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 343

gttttagagc tatgctgttt tgaatggtcc caaaactgag accaaaggtc tcgttttaga 60

gctatgctgt tttgaatggt cccaaaac 88

<210> 344

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 344

aaacggaagg gcctgagtcc gagcagaaga agaag 35

<210> 345

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 345

aaaacttctt cttctgctcg gactcaggcc cttcc 35

<210> 346

<211> 46

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(19)

<223> a, c, u, g, unknown or other

<400> 346

nnnnnnnnnn nnnnnnnnng uuauuguacu cucaagauuu auuuuu 46

<210> 347

<211> 91

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 347

guuacuuaaa ucuugcagaa gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu 60

cauuuuaugg caggguguuu ucguuauuua a 91

<210> 348

<211> 70

<212> DNA

<213> Homo sapiens

<400> 348

ttttctagtg ctgagtttct gtgactcctc tacattctac ttctctgtgt ttctgtatac 60

tacctcctcc 70

<210> 349

<211> 122

<212> DNA

<213> Homo sapiens

<400> 349

ggaggaaggg cctgagtccg agcagaagaa gaagggctcc catcacatca accggtggcg 60

cattgccacg aagcaggcca atggggagga catcgatgtc acctccaatg actagggtgg 120

gc 122

<210> 350

<211> 48

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (3)..(32)

<223> a, c, u, g, unknown or other

<400> 350

acnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnguuuuaga gcuaugcu 48

<210> 351

<211> 67

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> source

<223> /note="Description of Combined DNA/RNA Molecule: Synthetic

oligonucleotide"

<400> 351

agcauagcaa guuaaaauaa ggctaguccg uuaucaacuu gaaaaagugg caccgagucg 60

gugcuuu 67

<210> 352

<211> 62

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, u, g, unknown or other

<400> 352

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cg 62

<210> 353

<211> 73

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 353

tgaatggtcc caaaacggaa gggcctgagt ccgagcagaa gaagaagttt tagagctatg 60

ctgttttgaa tgg 73

<210> 354

<211> 69

<212> DNA

<213> Homo sapiens

<400> 354

ctggtcttcc acctctctgc cctgaacacc caatctcggc ccctctcgcc accctcctgc 60

atttctgtt 69

<210> 355

<211> 138

<212> DNA

<213> Mus musculus

<400> 355

acccaagcac tgagtgccat tagctaaatg catagggtac cacccacagg tgccaggggc 60

ctttcccaaa gttcccagcc ccttctccaa cctttcctgg cccagaggct ttcccatgtg 120

tgtggctgga ccctttga 138

<210> 356

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 356

gtgctttgca gaggcctacc 20

<210> 357

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 357

cctggagcgc atgcagtagt 20

<210> 358

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 358

accttctgtg tttccaccat tc 22

<210> 359

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 359

ttggggagtg cacagacttc 20

<210> 360

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 360

ggctccctgg gttcaaagta 20

<210> 361

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 361

agaggggtct ggatgtcgta a 21

<210> 362

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

probe"

<400> 362

tagctctaaa acttcttctt ctgctcggac 30

<210> 363

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

probe"

<400> 363

ctagccttat tttaacttgc tatgctgttt 30

<210> 364

<211> 99

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, u, g, unknown or other

<400> 364

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99

<210> 365

<211> 12

<212> DNA

<213> Homo sapiens

<400> 365

tagcgggtaa gc 12

<210> 366

<211> 12

<212> DNA

<213> Homo sapiens

<400> 366

tcggtgacat gt 12

<210> 367

<211> 12

<212> DNA

<213> Homo sapiens

<400> 367

actccccgta gg 12

<210> 368

<211> 12

<212> DNA

<213> Homo sapiens

<400> 368

actgcgtgtt aa 12

<210> 369

<211> 12

<212> DNA

<213> Homo sapiens

<400> 369

acgtcgcctg at 12

<210> 370

<211> 12

<212> DNA

<213> Homo sapiens

<400> 370

taggtcgacc ag 12

<210> 371

<211> 12

<212> DNA

<213> Homo sapiens

<400> 371

ggcgttaatg at 12

<210> 372

<211> 12

<212> DNA

<213> Homo sapiens

<400> 372

tgtcgcatgt ta 12

<210> 373

<211> 12

<212> DNA

<213> Homo sapiens

<400> 373

atggaaacgc at 12

<210> 374

<211> 12

<212> DNA

<213> Homo sapiens

<400> 374

gccgaattcc tc 12

<210> 375

<211> 12

<212> DNA

<213> Homo sapiens

<400> 375

gcatggtacg ga 12

<210> 376

<211> 12

<212> DNA

<213> Homo sapiens

<400> 376

cggtactctt ac 12

<210> 377

<211> 12

<212> DNA

<213> Homo sapiens

<400> 377

gcctgtgccg ta 12

<210> 378

<211> 12

<212> DNA

<213> Homo sapiens

<400> 378

tacggtaagt cg 12

<210> 379

<211> 12

<212> DNA

<213> Homo sapiens

<400> 379

cacgaaatta cc 12

<210> 380

<211> 12

<212> DNA

<213> Homo sapiens

<400> 380

aaccaagata cg 12

<210> 381

<211> 12

<212> DNA

<213> Homo sapiens

<400> 381

gagtcgatac gc 12

<210> 382

<211> 12

<212> DNA

<213> Homo sapiens

<400> 382

gtctcacgat cg 12

<210> 383

<211> 12

<212> DNA

<213> Homo sapiens

<400> 383

tcgtcgggtg ca 12

<210> 384

<211> 12

<212> DNA

<213> Homo sapiens

<400> 384

actccgtagt ga 12

<210> 385

<211> 12

<212> DNA

<213> Homo sapiens

<400> 385

caggacgtcc gt 12

<210> 386

<211> 12

<212> DNA

<213> Homo sapiens

<400> 386

tcgtatccct ac 12

<210> 387

<211> 12

<212> DNA

<213> Homo sapiens

<400> 387

tttcaaggcc gg 12

<210> 388

<211> 12

<212> DNA

<213> Homo sapiens

<400> 388

cgccggtgga at 12

<210> 389

<211> 12

<212> DNA

<213> Homo sapiens

<400> 389

gaacccgtcc ta 12

<210> 390

<211> 12

<212> DNA

<213> Homo sapiens

<400> 390

gattcatcag cg 12

<210> 391

<211> 12

<212> DNA

<213> Homo sapiens

<400> 391

acaccggtct tc 12

<210> 392

<211> 12

<212> DNA

<213> Homo sapiens

<400> 392

atcgtgccct aa 12

<210> 393

<211> 12

<212> DNA

<213> Homo sapiens

<400> 393

gcgtcaatgt tc 12

<210> 394

<211> 12

<212> DNA

<213> Homo sapiens

<400> 394

ctccgtatct cg 12

<210> 395

<211> 12

<212> DNA

<213> Homo sapiens

<400> 395

ccgattcctt cg 12

<210> 396

<211> 12

<212> DNA

<213> Homo sapiens

<400> 396

tgcgcctcca gt 12

<210> 397

<211> 12

<212> DNA

<213> Homo sapiens

<400> 397

taacgtcgga gc 12

<210> 398

<211> 12

<212> DNA

<213> Homo sapiens

<400> 398

aaggtcgccc at 12

<210> 399

<211> 12

<212> DNA

<213> Homo sapiens

<400> 399

gtcggggact at 12

<210> 400

<211> 12

<212> DNA

<213> Homo sapiens

<400> 400

ttcgagcgat tt 12

<210> 401

<211> 12

<212> DNA

<213> Homo sapiens

<400> 401

tgagtcgtcg ag 12

<210> 402

<211> 12

<212> DNA

<213> Homo sapiens

<400> 402

tttacgcaga gg 12

<210> 403

<211> 12

<212> DNA

<213> Homo sapiens

<400> 403

aggaagtatc gc 12

<210> 404

<211> 12

<212> DNA

<213> Homo sapiens

<400> 404

actcgatacc at 12

<210> 405

<211> 12

<212> DNA

<213> Homo sapiens

<400> 405

cgctacatag ca 12

<210> 406

<211> 12

<212> DNA

<213> Homo sapiens

<400> 406

ttcataaccg gc 12

<210> 407

<211> 12

<212> DNA

<213> Homo sapiens

<400> 407

ccaaacggtt aa 12

<210> 408

<211> 12

<212> DNA

<213> Homo sapiens

<400> 408

cgattccttc gt 12

<210> 409

<211> 12

<212> DNA

<213> Homo sapiens

<400> 409

cgtcatgaat aa 12

<210> 410

<211> 12

<212> DNA

<213> Homo sapiens

<400> 410

agtggcgatg ac 12

<210> 411

<211> 12

<212> DNA

<213> Homo sapiens

<400> 411

cccctacggc ac 12

<210> 412

<211> 12

<212> DNA

<213> Homo sapiens

<400> 412

gccaacccgc ac 12

<210> 413

<211> 12

<212> DNA

<213> Homo sapiens

<400> 413

tgggacaccg gt 12

<210> 414

<211> 12

<212> DNA

<213> Homo sapiens

<400> 414

ttgactgcgg cg 12

<210> 415

<211> 12

<212> DNA

<213> Homo sapiens

<400> 415

actatgcgta gg 12

<210> 416

<211> 12

<212> DNA

<213> Homo sapiens

<400> 416

tcacccaaag cg 12

<210> 417

<211> 12

<212> DNA

<213> Homo sapiens

<400> 417

gcaggacgtc cg 12

<210> 418

<211> 12

<212> DNA

<213> Homo sapiens

<400> 418

acaccgaaaa cg 12

<210> 419

<211> 12

<212> DNA

<213> Homo sapiens

<400> 419

cggtgtattg ag 12

<210> 420

<211> 12

<212> DNA

<213> Homo sapiens

<400> 420

cacgaggtat gc 12

<210> 421

<211> 12

<212> DNA

<213> Homo sapiens

<400> 421

taaagcgacc cg 12

<210> 422

<211> 12

<212> DNA

<213> Homo sapiens

<400> 422

cttagtcggc ca 12

<210> 423

<211> 12

<212> DNA

<213> Homo sapiens

<400> 423

cgaaaacgtg gc 12

<210> 424

<211> 12

<212> DNA

<213> Homo sapiens

<400> 424

cgtgccctga ac 12

<210> 425

<211> 12

<212> DNA

<213> Homo sapiens

<400> 425

tttaccatcg aa 12

<210> 426

<211> 12

<212> DNA

<213> Homo sapiens

<400> 426

cgtagccatg tt 12

<210> 427

<211> 12

<212> DNA

<213> Homo sapiens

<400> 427

cccaaacggt ta 12

<210> 428

<211> 12

<212> DNA

<213> Homo sapiens

<400> 428

gcgttatcag aa 12

<210> 429

<211> 12

<212> DNA

<213> Homo sapiens

<400> 429

tcgatggtaa ac 12

<210> 430

<211> 12

<212> DNA

<213> Homo sapiens

<400> 430

cgactttttg ca 12

<210> 431

<211> 12

<212> DNA

<213> Homo sapiens

<400> 431

tcgacgactc ac 12

<210> 432

<211> 12

<212> DNA

<213> Homo sapiens

<400> 432

acgcgtcaga ta 12

<210> 433

<211> 12

<212> DNA

<213> Homo sapiens

<400> 433

cgtacggcac ag 12

<210> 434

<211> 12

<212> DNA

<213> Homo sapiens

<400> 434

ctatgccgtg ca 12

<210> 435

<211> 12

<212> DNA

<213> Homo sapiens

<400> 435

cgcgtcagat at 12

<210> 436

<211> 12

<212> DNA

<213> Homo sapiens

<400> 436

aagatcggta gc 12

<210> 437

<211> 12

<212> DNA

<213> Homo sapiens

<400> 437

cttcgcaagg ag 12

<210> 438

<211> 12

<212> DNA

<213> Homo sapiens

<400> 438

gtcgtggact ac 12

<210> 439

<211> 12

<212> DNA

<213> Homo sapiens

<400> 439

ggtcgtcatc aa 12

<210> 440

<211> 12

<212> DNA

<213> Homo sapiens

<400> 440

gttaacagcg tg 12

<210> 441

<211> 12

<212> DNA

<213> Homo sapiens

<400> 441

tagctaaccg tt 12

<210> 442

<211> 12

<212> DNA

<213> Homo sapiens

<400> 442

agtaaaggcg ct 12

<210> 443

<211> 12

<212> DNA

<213> Homo sapiens

<400> 443

ggtaatttcg tg 12

<210> 444

<211> 69

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 444

gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuuuuuu 69

<210> 445

<211> 69

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 445

gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuuuuuu 69

<210> 446

<211> 69

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 446

gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuuuuuu 69

<210> 447

<211> 69

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 447

ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuuuuuu 69

<210> 448

<211> 69

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 448

guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuuuuuu 69

<210> 449

<211> 76

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 449

gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucauu uuuuuu 76

<210> 450

<211> 76

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 450

gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucauu uuuuuu 76

<210> 451

<211> 76

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 451

gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucauu uuuuuu 76

<210> 452

<211> 76

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 452

ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucauu uuuuuu 76

<210> 453

<211> 76

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 453

guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucauu uuuuuu 76

<210> 454

<211> 88

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 454

gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu guuuuuuu 88

<210> 455

<211> 88

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 455

gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu guuuuuuu 88

<210> 456

<211> 88

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 456

gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu guuuuuuu 88

<210> 457

<211> 88

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 457

ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu guuuuuuu 88

<210> 458

<211> 88

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 458

guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu guuuuuuu 88

<210> 459

<211> 103

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 459

gucaccucca augacuaggg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 460

<211> 103

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 460

gacaucgaug uccuccccau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 461

<211> 103

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 461

gaguccgagc agaagaagaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 462

<211> 103

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 462

ggggccgaga uuggguguuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 463

<211> 103

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 463

guggcgagag gggccgagau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 464

<211> 120

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 464

gtggaaagga cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag 60

ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt 120

<210> 465

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 465

tcggtgcgct ggttgatttc ttcttgcgct tttttggctt 40

<210> 466

<211> 26

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 466

gauuucuucu ugcgcuuuuu guuuua 26

<210> 467

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (22)..(26)

<223> a, c, t, g, unknown or other

<400> 467

tgatttcttc ttgcgctttt tnnnnn 26

<210> 468

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 468

tgatttcttc ttgcgctttt ntggct 26

<210> 469

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (2)..(2)

<223> a, c, t, g, unknown or other

<400> 469

tnatttcttc ttgcgctttt ttggct 26

<210> 470

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 470

gatttcttct tgcgcttttt tgg 23

<210> 471

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> CDS

<222> (1)..(33)

<400> 471

tcc atc cgt aca acc cac aac cct gct agt gag c 34

Ser Ile Arg Thr Thr His Asn Pro Ala Ser Glu

1 5 10

<210> 472

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 472

Ser Ile Arg Thr Thr His Asn Pro Ala Ser Glu

1 5 10

<210> 473

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> CDS

<222> (1)..(33)

<400> 473

tcc atc gca aca acc cac aac cct gct agt gag c 34

Ser Ile Ala Thr Thr His Asn Pro Ala Ser Glu

1 5 10

<210> 474

<211> 11

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 474

Ser Ile Ala Thr Thr His Asn Pro Ala Ser Glu

1 5 10

<210> 475

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> CDS

<222> (1)..(33)

<400> 475

tca atc cgt aca acc cac aac cct gct agt gag c 34

Ser Ile Arg Thr Thr His Asn Pro Ala Ser Glu

1 5 10

<210> 476

<211> 42

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (1)..(36)

<400> 476

caa ttg aat tta aaa gaa acc gat acc gtt ttg gtt taagga 42

Gln Leu Asn Leu Lys Glu Thr Asp Thr Val Leu Val

1 5 10

<210> 477

<211> 12

<212> PRT

<213> Homo sapiens

<400> 477

Gln Leu Asn Leu Lys Glu Thr Asp Thr Val Leu Val

1 5 10

<210> 478

<211> 42

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (1)..(42)

<400> 478

caa ttg aat tta aaa gaa acc gat acc gtt tac gaa att gga 42

Gln Leu Asn Leu Lys Glu Thr Asp Thr Val Tyr Glu Ile Gly

1 5 10

<210> 479

<211> 14

<212> PRT

<213> Homo sapiens

<400> 479

Gln Leu Asn Leu Lys Glu Thr Asp Thr Val Tyr Glu Ile Gly

1 5 10

<210> 480

<211> 34

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (2)..(34)

<400> 480

t cct aaa aaa ccg aac tcc gcg ctg cgt aaa gta 34

Pro Lys Lys Pro Asn Ser Ala Leu Arg Lys Val

1 5 10

<210> 481

<211> 11

<212> PRT

<213> Homo sapiens

<400> 481

Pro Lys Lys Pro Asn Ser Ala Leu Arg Lys Val

1 5 10

<210> 482

<211> 34

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (2)..(34)

<400> 482

t cct aca aaa ccg aac tcc gcg ctg cgt aaa gta 34

Pro Thr Lys Pro Asn Ser Ala Leu Arg Lys Val

1 5 10

<210> 483

<211> 11

<212> PRT

<213> Homo sapiens

<400> 483

Pro Thr Lys Pro Asn Ser Ala Leu Arg Lys Val

1 5 10

<210> 484

<211> 33

<212> DNA

<213> Homo sapiens

<400> 484

tgcgctggtt gatttcttct tgcgcttttt tgg 33

<210> 485

<211> 33

<212> DNA

<213> Homo sapiens

<400> 485

tacgctggtt gatttcttct tgcgcttttt ttg 33

<210> 486

<211> 27

<212> DNA

<213> Homo sapiens

<400> 486

ggagggtttt atggggaaag gccattg 27

<210> 487

<211> 29

<212> DNA

<213> Homo sapiens

<400> 487

gtaaaaaaga agactagaaa ttttgatac 29

<210> 488

<211> 46

<212> DNA

<213> Homo sapiens

<400> 488

ggagggtttt atggggaaag gcaaagaaga ctagaaattt tgatac 46

<210> 489

<211> 27

<212> DNA

<213> Homo sapiens

<400> 489

aggtgaagca taatgtctca aaaaata 27

<210> 490

<211> 29

<212> DNA

<213> Homo sapiens

<400> 490

attttattaa tacaaatcag tgaaatcat 29

<210> 491

<211> 46

<212> DNA

<213> Homo sapiens

<400> 491

aggtgaagca taatgtctca aaattaatac aaatcagtga aatcat 46

<210> 492

<211> 36

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (1)..(36)

<400> 492

aat tta aaa gaa acc gat acc gtt tac gaa att gga 36

Asn Leu Lys Glu Thr Asp Thr Val Tyr Glu Ile Gly

1 5 10

<210> 493

<211> 12

<212> PRT

<213> Homo sapiens

<400> 493

Asn Leu Lys Glu Thr Asp Thr Val Tyr Glu Ile Gly

1 5 10

<210> 494

<211> 36

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (1)..(30)

<400> 494

aat tta aaa gaa acc gat acc gtt ttg gtt taagga 36

Asn Leu Lys Glu Thr Asp Thr Val Leu Val

1 5 10

<210> 495

<211> 10

<212> PRT

<213> Homo sapiens

<400> 495

Asn Leu Lys Glu Thr Asp Thr Val Leu Val

1 5 10

<210> 496

<211> 36

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (1)..(36)

<400> 496

tgg gat cca aaa aaa tat ggt ggt ttt gat agt cca 36

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro

1 5 10

<210> 497

<211> 12

<212> PRT

<213> Homo sapiens

<400> 497

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro

1 5 10

<210> 498

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> CDS

<222> (1)..(36)

<400> 498

tgg gat cca aaa aaa tat tgt ggt ttt gat agt cca 36

Trp Asp Pro Lys Lys Tyr Cys Gly Phe Asp Ser Pro

1 5 10

<210> 499

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 499

Trp Asp Pro Lys Lys Tyr Cys Gly Phe Asp Ser Pro

1 5 10

<210> 500

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 500

aaactacttt acgcagcgcg gagttcggtt ttttg 35

<210> 501

<211> 4104

<212> DNA

<213> Homo sapiens

<220>

<221> CDS

<222> (1)..(4104)

<400> 501

atg gac aag aag tac agc atc ggc ctg gac atc ggc acc aac tct gtg 48

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

ggc tgg gcc gtg atc acc gac gag tac aag gtg ccc agc aag aaa ttc 96

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

aag gtg ctg ggc aac acc gac cgg cac agc atc aag aag aac ctg atc 144

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

gga gcc ctg ctg ttc gac agc ggc gaa aca gcc gag gcc acc cgg ctg 192

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

aag aga acc gcc aga aga aga tac acc aga cgg aag aac cgg atc tgc 240

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

tat ctg caa gag atc ttc agc aac gag atg gcc aag gtg gac gac agc 288

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

ttc ttc cac aga ctg gaa gag tcc ttc ctg gtg gaa gag gat aag aag 336

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

cac gag cgg cac ccc atc ttc ggc aac atc gtg gac gag gtg gcc tac 384

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

cac gag aag tac ccc acc atc tac cac ctg aga aag aaa ctg gtg gac 432

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

agc acc gac aag gcc gac ctg cgg ctg atc tat ctg gcc ctg gcc cac 480

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

atg atc aag ttc cgg ggc cac ttc ctg atc gag ggc gac ctg aac ccc 528

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

gac aac agc gac gtg gac aag ctg ttc atc cag ctg gtg cag acc tac 576

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

aac cag ctg ttc gag gaa aac ccc atc aac gcc agc ggc gtg gac gcc 624

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

aag gcc atc ctg tct gcc aga ctg agc aag agc aga cgg ctg gaa aat 672

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

ctg atc gcc cag ctg ccc ggc gag aag aag aat ggc ctg ttc ggc aac 720

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

ctg att gcc ctg agc ctg ggc ctg acc ccc aac ttc aag agc aac ttc 768

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

gac ctg gcc gag gat gcc aaa ctg cag ctg agc aag gac acc tac gac 816

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

gac gac ctg gac aac ctg ctg gcc cag atc ggc gac cag tac gcc gac 864

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

ctg ttt ctg gcc gcc aag aac ctg tcc gac gcc atc ctg ctg agc gac 912

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

atc ctg aga gtg aac acc gag atc acc aag gcc ccc ctg agc gcc tct 960

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

atg atc aag aga tac gac gag cac cac cag gac ctg acc ctg ctg aaa 1008

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

gct ctc gtg cgg cag cag ctg cct gag aag tac aaa gag att ttc ttc 1056

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

gac cag agc aag aac ggc tac gcc ggc tac att gac ggc gga gcc agc 1104

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

cag gaa gag ttc tac aag ttc atc aag ccc atc ctg gaa aag atg gac 1152

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

ggc acc gag gaa ctg ctc gtg aag ctg aac aga gag gac ctg ctg cgg 1200

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

aag cag cgg acc ttc gac aac ggc agc atc ccc cac cag atc cac ctg 1248

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

gga gag ctg cac gcc att ctg cgg cgg cag gaa gat ttt tac cca ttc 1296

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

ctg aag gac aac cgg gaa aag atc gag aag atc ctg acc ttc cgc atc 1344

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

ccc tac tac gtg ggc cct ctg gcc agg gga aac agc aga ttc gcc tgg 1392

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

atg acc aga aag agc gag gaa acc atc acc ccc tgg aac ttc gag gaa 1440

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

gtg gtg gac aag ggc gct tcc gcc cag agc ttc atc gag cgg atg acc 1488

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

aac ttc gat aag aac ctg ccc aac gag aag gtg ctg ccc aag cac agc 1536

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

ctg ctg tac gag tac ttc acc gtg tat aac gag ctg acc aaa gtg aaa 1584

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

tac gtg acc gag gga atg aga aag ccc gcc ttc ctg agc ggc gag cag 1632

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

aaa aag gcc atc gtg gac ctg ctg ttc aag acc aac cgg aaa gtg acc 1680

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

gtg aag cag ctg aaa gag gac tac ttc aag aaa atc gag tgc ttc gac 1728

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

tcc gtg gaa atc tcc ggc gtg gaa gat cgg ttc aac gcc tcc ctg ggc 1776

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

aca tac cac gat ctg ctg aaa att atc aag gac aag gac ttc ctg gac 1824

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

aat gag gaa aac gag gac att ctg gaa gat atc gtg ctg acc ctg aca 1872

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

ctg ttt gag gac aga gag atg atc gag gaa cgg ctg aaa acc tat gcc 1920

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

cac ctg ttc gac gac aaa gtg atg aag cag ctg aag cgg cgg aga tac 1968

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

acc ggc tgg ggc agg ctg agc cgg aag ctg atc aac ggc atc cgg gac 2016

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

aag cag tcc ggc aag aca atc ctg gat ttc ctg aag tcc gac ggc ttc 2064

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

gcc aac aga aac ttc atg cag ctg atc cac gac gac agc ctg acc ttt 2112

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

aaa gag gac atc cag aaa gcc cag gtg tcc ggc cag ggc gat agc ctg 2160

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

cac gag cac att gcc aat ctg gcc ggc agc ccc gcc att aag aag ggc 2208

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

atc ctg cag aca gtg aag gtg gtg gac gag ctc gtg aaa gtg atg ggc 2256

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

cgg cac aag ccc gag aac atc gtg atc gcc atg gcc aga gag aac cag 2304

Arg His Lys Pro Glu Asn Ile Val Ile Ala Met Ala Arg Glu Asn Gln

755 760 765

acc acc cag aag gga cag aag aac agc cgc gag aga atg aag cgg atc 2352

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

gaa gag ggc atc aaa gag ctg ggc agc cag atc ctg aaa gaa cac ccc 2400

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

gtg gaa aac acc cag ctg cag aac gag aag ctg tac ctg tac tac ctg 2448

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

cag aat ggg cgg gat atg tac gtg gac cag gaa ctg gac atc aac cgg 2496

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

ctg tcc gac tac gat gtg gac gcc atc gtg cct cag agc ttt ctg aag 2544

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

gac gac tcc atc gac gcc aag gtg ctg acc aga agc gac aag gcc cgg 2592

Asp Asp Ser Ile Asp Ala Lys Val Leu Thr Arg Ser Asp Lys Ala Arg

850 855 860

ggc aag agc gac aac gtg ccc tcc gaa gag gtc gtg aag aag atg aag 2640

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

aac tac tgg cgg cag ctg ctg aac gcc aag ctg att acc cag aga aag 2688

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

ttc gac aat ctg acc aag gcc gag aga ggc ggc ctg agc gaa ctg gat 2736

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

aag gcc ggc ttc atc aag aga cag ctg gtg gaa acc cgg cag atc aca 2784

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

aag cac gtg gca cag atc ctg gac tcc cgg atg aac act aag tac gac 2832

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

gag aat gac aag ctg atc cgg gaa gtg aaa gtg atc acc ctg aag tcc 2880

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

aag ctg gtg tcc gat ttc cgg aag gat ttc cag ttt tac aaa gtg cgc 2928

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

gag atc aac aac tac cac cac gcc cac gcc gcc tac ctg aac gcc gtc 2976

Glu Ile Asn Asn Tyr His His Ala His Ala Ala Tyr Leu Asn Ala Val

980 985 990

gtg gga acc gcc ctg atc aaa aag tac cct aag ctg gaa agc gag ttc 3024

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

gtg tac ggc gac tac aag gtg tac gac gtg cgg aag atg atc gcc 3069

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

aag agc gag cag gaa atc ggc aag gct acc gcc aag tac ttc ttc 3114

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

tac agc aac atc atg aac ttt ttc aag acc gag att acc ctg gcc 3159

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

aac ggc gag atc cgg aag cgg cct ctg atc gag aca aac ggc gaa 3204

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

acc ggg gag atc gtg tgg gat aag ggc cgg gat ttt gcc acc gtg 3249

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

cgg aaa gtg ctg agc atg ccc caa gtg aat atc gtg aaa aag acc 3294

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

gag gtg cag aca ggc ggc ttc agc aaa gag tct atc ctg ccc aag 3339

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

agg aac agc gat aag ctg atc gcc aga aag aag gac tgg gac cct 3384

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

aag aag tac ggc ggc ttc gac agc ccc acc gtg gcc tat tct gtg 3429

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

ctg gtg gtg gcc aaa gtg gaa aag ggc aag tcc aag aaa ctg aag 3474

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

agt gtg aaa gag ctg ctg ggg atc acc atc atg gaa aga agc agc 3519

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

ttc gag aag aat ccc atc gac ttt ctg gaa gcc aag ggc tac aaa 3564

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

gaa gtg aaa aag gac ctg atc atc aag ctg cct aag tac tcc ctg 3609

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

ttc gag ctg gaa aac ggc cgg aag aga atg ctg gcc tct gcc ggc 3654

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

gaa ctg cag aag gga aac gaa ctg gcc ctg ccc tcc aaa tat gtg 3699

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

aac ttc ctg tac ctg gcc agc cac tat gag aag ctg aag ggc tcc 3744

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

ccc gag gat aat gag cag aaa cag ctg ttt gtg gaa cag cac aag 3789

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

cac tac ctg gac gag atc atc gag cag atc agc gag ttc tcc aag 3834

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

aga gtg atc ctg gcc gac gct aat ctg gac aaa gtg ctg tcc gcc 3879

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

tac aac aag cac cgg gat aag ccc atc aga gag cag gcc gag aat 3924

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

atc atc cac ctg ttt acc ctg acc aat ctg gga gcc cct gcc gcc 3969

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

ttc aag tac ttt gac acc acc atc gac cgg aag agg tac acc agc 4014

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

acc aaa gag gtg ctg gac gcc acc ctg atc cac cag agc atc acc 4059

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

ggc ctg tac gag aca cgg atc gac ctg tct cag ctg gga ggc gac 4104

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 502

<211> 1368

<212> PRT

<213> Homo sapiens

<400> 502

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Ala Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Ala Lys Val Leu Thr Arg Ser Asp Lys Ala Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Ala Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 503

<211> 15

<212> DNA

<213> Homo sapiens

<400> 503

cagaagaaga agggc 15

<210> 504

<211> 51

<212> DNA

<213> Homo sapiens

<400> 504

ccaatgggga ggacatcgat gtcacctcca atgactaggg tggtgggcaa c 51

<210> 505

<211> 15

<212> DNA

<213> Homo sapiens

<400> 505

ctctggccac tccct 15

<210> 506

<211> 52

<212> DNA

<213> Homo sapiens

<400> 506

acatcgatgt cacctccaat gacaagcttg ctagcggtgg gcaaccacaa ac 52

<210> 507

<211> 1733

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 507

ccgtttaaac aattctgcag gaatctagtt attaatagta atcaattacg gggtcattag 60

ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 120

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 180

caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 240

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 300

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 360

tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 420

tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 480

gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 540

aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 600

gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 660

ggcgggcgga agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 720

gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 780

cttctcctcc gggctgtaat tagcgcttgg tttaatgacg gcttgtttct tttctgtggc 840

tgcgtgaaag ccttgagggg ctccgggagg gccctttgtg cggggggagc ggctcggggg 900

gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg ctccgcgctg cccggcggct 960

gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg cagtgtgcgc gaggggagcg 1020

cggccggggg cggtgccccg cggtgcgggg ggggctgcga ggggaacaaa ggctgcgtgc 1080

ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc gtcggtcggg ctgcaacccc 1140

ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg gggctccgta 1200

cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg 1260

gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc ggcccccgga 1320

gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg taatcgtgcg 1380

agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc 1440

gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg 1500

gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc cagcctcggg 1560

gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg ttcggcttct 1620

ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tcatgccttc ttctttttcc 1680

tacagctcct gggcaacgtg ctggttattg tgctgtctca tcattttggc aaa 1733

<210> 508

<211> 4269

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 508

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaag 4269

<210> 509

<211> 780

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 509

ggaagcggag ccactaactt ctccctgttg aaacaagcag gggatgtcga agagaatccc 60

gggccagtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 120

gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 180

tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 240

accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 300

aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 360

ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 420

ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 480

cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 540

aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 600

gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac 660

cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 720

gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 780

<210> 510

<211> 597

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 510

cgataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 60

tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 120

ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 180

gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 240

cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 300

ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 360

gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 420

gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 480

cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 540

tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcg 597

<210> 511

<211> 210

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 511

cgacctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 60

ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 120

cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 180

gggaggattg ggaagacaat ggcaggcatg 210

<210> 512

<211> 906

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (109)..(109)

<223> a, c, t, g, unknown or other

<220>

<221> modified_base

<222> (135)..(135)

<223> a, c, t, g, unknown or other

<400> 512

ataacttcgt ataatgtatg ctatacgaag ttattcgcga tgaataaatg aaagcttgca 60

gatctgcgac tctagaggat ctgcgactct agaggatcat aatcagccnt accacatttt 120

gtagaggttt tactngcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 180

atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 240

aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 300

tccaaactca tcaatgtatc ttatcatgtc tggatctgcg actctagagg atcataatca 360

gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga 420

acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg 480

gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 540

ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tgcgactcta 600

gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc 660

acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat 720

tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 780

tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 840

gatccccatc aagctgatcc ggaaccctta atataacttc gtataatgta tgctatacga 900

agttat 906

<210> 513

<211> 1079

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 513

caggccctcc gagcgtggtg gagccgttct gtgagacagc cgggtacgag tcgtgacgct 60

ggaaggggca agcgggtggt gggcaggaat gcggtccgcc ctgcagcaac cggaggggga 120

gggagaaggg agcggaaaag tctccaccgg acgcggccat ggctcggggg ggggggggca 180

gcggaggagc gcttccggcc gacgtctcgt cgctgattgg cttcttttcc tcccgccgtg 240

tgtgaaaaca caaatggcgt gttttggttg gcgtaaggcg cctgtcagtt aacggcagcc 300

ggagtgcgca gccgccggca gcctcgctct gcccactggg tggggcggga ggtaggtggg 360

gtgaggcgag ctggacgtgc gggcgcggtc ggcctctggc ggggcggggg aggggaggga 420

gggtcagcga aagtagctcg cgcgcgagcg gccgcccacc ctccccttcc tctgggggag 480

tcgttttacc cgccgccggc cgggcctcgt cgtctgattg gctctcgggg cccagaaaac 540

tggcccttgc cattggctcg tgttcgtgca agttgagtcc atccgccggc cagcgggggc 600

ggcgaggagg cgctcccagg ttccggccct cccctcggcc ccgcgccgca gagtctggcc 660

gcgcgcccct gcgcaacgtg gcaggaagcg cgcgctgggg gcggggacgg gcagtagggc 720

tgagcggctg cggggcgggt gcaagcacgt ttccgacttg agttgcctca agaggggcgt 780

gctgagccag acctccatcg cgcactccgg ggagtggagg gaaggagcga gggctcagtt 840

gggctgtttt ggaggcagga agcacttgct ctcccaaagt cgctctgagt tgttatcagt 900

aagggagctg cagtggagta ggcggggaga aggccgcacc cttctccgga ggggggaggg 960

gagtgttgca atacctttct gggagttctc tgctgcctcc tggcttctga ggaccgccct 1020

gggcctggga gaatcccttc cccctcttcc ctcgtgatct gcaactccag tctttctag 1079

<210> 514

<211> 4336

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 514

agatgggcgg gagtcttctg ggcaggctta aaggctaacc tggtgtgtgg gcgttgtcct 60

gcaggggaat tgaacaggtg taaaattgga gggacaagac ttcccacaga ttttcggttt 120

tgtcgggaag ttttttaata ggggcaaata aggaaaatgg gaggataggt agtcatctgg 180

ggttttatgc agcaaaacta caggttatta ttgcttgtga tccgcctcgg agtattttcc 240

atcgaggtag attaaagaca tgctcacccg agttttatac tctcctgctt gagatcctta 300

ctacagtatg aaattacagt gtcgcgagtt agactatgta agcagaattt taatcatttt 360

taaagagccc agtacttcat atccatttct cccgctcctt ctgcagcctt atcaaaaggt 420

attttagaac actcatttta gccccatttt catttattat actggcttat ccaaccccta 480

gacagagcat tggcattttc cctttcctga tcttagaagt ctgatgactc atgaaaccag 540

acagattagt tacatacacc acaaatcgag gctgtagctg gggcctcaac actgcagttc 600

ttttataact ccttagtaca ctttttgttg atcctttgcc ttgatcctta attttcagtg 660

tctatcacct ctcccgtcag gtggtgttcc acatttgggc ctattctcag tccagggagt 720

tttacaacaa tagatgtatt gagaatccaa cctaaagctt aactttccac tcccatgaat 780

gcctctctcc tttttctcca tttataaact gagctattaa ccattaatgg tttccaggtg 840

gatgtctcct cccccaatat tacctgatgt atcttacata ttgccaggct gatattttaa 900

gacattaaaa ggtatatttc attattgagc cacatggtat tgattactgc ttactaaaat 960

tttgtcattg tacacatctg taaaaggtgg ttccttttgg aatgcaaagt tcaggtgttt 1020

gttgtctttc ctgacctaag gtcttgtgag cttgtatttt ttctatttaa gcagtgcttt 1080

ctcttggact ggcttgactc atggcattct acacgttatt gctggtctaa atgtgatttt 1140

gccaagcttc ttcaggacct ataattttgc ttgacttgta gccaaacaca agtaaaatga 1200

ttaagcaaca aatgtatttg tgaagcttgg tttttaggtt gttgtgttgt gtgtgcttgt 1260

gctctataat aatactatcc aggggctgga gaggtggctc ggagttcaag agcacagact 1320

gctcttccag aagtcctgag ttcaattccc agcaaccaca tggtggctca caaccatctg 1380

taatgggatc tgatgccctc ttctggtgtg tctgaagacc acaagtgtat tcacattaaa 1440

taaataaatc ctccttcttc ttcttttttt tttttttaaa gagaatactg tctccagtag 1500

aatttactga agtaatgaaa tactttgtgt ttgttccaat atggtagcca ataatcaaat 1560

tactctttaa gcactggaaa tgttaccaag gaactaattt ttatttgaag tgtaactgtg 1620

gacagaggag ccataactgc agacttgtgg gatacagaag accaatgcag actttaatgt 1680

cttttctctt acactaagca ataaagaaat aaaaattgaa cttctagtat cctatttgtt 1740

taaactgcta gctttactta acttttgtgc ttcatctata caaagctgaa agctaagtct 1800

gcagccatta ctaaacatga aagcaagtaa tgataatttt ggatttcaaa aatgtagggc 1860

cagagtttag ccagccagtg gtggtgcttg cctttatgcc tttaatccca gcactctgga 1920

ggcagagaca ggcagatctc tgagtttgag cccagcctgg tctacacatc aagttctatc 1980

taggatagcc aggaatacac acagaaaccc tgttggggag gggggctctg agatttcata 2040

aaattataat tgaagcattc cctaatgagc cactatggat gtggctaaat ccgtctacct 2100

ttctgatgag atttgggtat tattttttct gtctctgctg ttggttgggt cttttgacac 2160

tgtgggcttt ctttaaagcc tccttcctgc catgtggtct cttgtttgct actaacttcc 2220

catggcttaa atggcatggc tttttgcctt ctaagggcag ctgctgagat ttgcagcctg 2280

atttccaggg tggggttggg aaatctttca aacactaaaa ttgtccttta attttttttt 2340

taaaaaatgg gttatataat aaacctcata aaatagttat gaggagtgag gtggactaat 2400

attaaatgag tccctcccct ataaaagagc tattaaggct ttttgtctta tacttaactt 2460

tttttttaaa tgtggtatct ttagaaccaa gggtcttaga gttttagtat acagaaactg 2520

ttgcatcgct taatcagatt ttctagtttc aaatccagag aatccaaatt cttcacagcc 2580

aaagtcaaat taagaatttc tgacttttaa tgttaatttg cttactgtga atataaaaat 2640

gatagctttt cctgaggcag ggtctcacta tgtatctctg cctgatctgc aacaagatat 2700

gtagactaaa gttctgcctg cttttgtctc ctgaatacta aggttaaaat gtagtaatac 2760

ttttggaact tgcaggtcag attcttttat aggggacaca ctaagggagc ttgggtgata 2820

gttggtaaat gtgtttaagt gatgaaaact tgaattatta tcaccgcaac ctacttttta 2880

aaaaaaaaag ccaggcctgt tagagcatgc ttaagggatc cctaggactt gctgagcaca 2940

caagagtagt tacttggcag gctcctggtg agagcatatt tcaaaaaaca aggcagacaa 3000

ccaagaaact acagttaagg ttacctgtct ttaaaccatc tgcatataca cagggatatt 3060

aaaatattcc aaataatatt tcattcaagt tttcccccat caaattggga catggatttc 3120

tccggtgaat aggcagagtt ggaaactaaa caaatgttgg ttttgtgatt tgtgaaattg 3180

ttttcaagtg atagttaaag cccatgagat acagaacaaa gctgctattt cgaggtctct 3240

tggtttatac tcagaagcac ttctttgggt ttccctgcac tatcctgatc atgtgctagg 3300

cctaccttag gctgattgtt gttcaaataa acttaagttt cctgtcaggt gatgtcatat 3360

gatttcatat atcaaggcaa aacatgttat atatgttaaa catttgtact taatgtgaaa 3420

gttaggtctt tgtgggtttg atttttaatt ttcaaaacct gagctaaata agtcattttt 3480

acatgtctta catttggtgg aattgtataa ttgtggtttg caggcaagac tctctgacct 3540

agtaacccta cctatagagc actttgctgg gtcacaagtc taggagtcaa gcatttcacc 3600

ttgaagttga gacgttttgt tagtgtatac tagtttatat gttggaggac atgtttatcc 3660

agaagatatt caggactatt tttgactggg ctaaggaatt gattctgatt agcactgtta 3720

gtgagcattg agtggccttt aggcttgaat tggagtcact tgtatatctc aaataatgct 3780

ggcctttttt aaaagccctt gttctttatc accctgtttt ctacataatt tttgttcaaa 3840

gaaatacttg tttggatctc cttttgacaa caatagcatg ttttcaagcc atattttttt 3900

tccttttttt tttttttttt ggtttttcga gacagggttt ctctgtatag ccctggctgt 3960

cctggaactc actttgtaga ccaggctggc ctcgaactca gaaatccgcc tgcctctgcc 4020

tcctgagtgc cgggattaaa ggcgtgcacc accacgcctg gctaagttgg atattttgtt 4080

atataactat aaccaatact aactccactg ggtggatttt taattcagtc agtagtctta 4140

agtggtcttt attggccctt cattaaaatc tactgttcac tctaacagag gctgttggta 4200

ctagtggcac ttaagcaact tcctacggat atactagcag attaagggtc agggatagaa 4260

actagtctag cgttttgtat acctaccagc tttatactac cttgttctga tagaaatatt 4320

tcaggacatc tagctt 4336

<210> 515

<211> 1846

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 515

aattctaccg ggtaggggag gcgcttttcc caaggcagtc tggagcatgc gctttagcag 60

ccccgctggg cacttggcgc tacacaagtg gcctctggcc tcgcacacat tccacatcca 120

ccggtaggcg ccaaccggct ccgttctttg gtggcccctt cgcgccacct tctactcctc 180

ccctagtcag gaagttcccc cccgccccgc agctcgcgtc gtgcaggacg tgacaaatgg 240

aagtagcacg tctcactagt ctcgtgcaga tggacagcac cgctgagcaa tggaagcggg 300

taggcctttg gggcagcggc caatagcagc tttgctcctt cgctttctgg gctcagaggc 360

tgggaagggg tgggtccggg ggcgggctca ggggcgggct caggggcggg gcgggcgccc 420

gaaggtcctc cggaggcccg gcattctgca cgcttcaaaa gcgcacgtct gccgcgctgt 480

tctcctcttc ctcatctccg ggcctttcga cctgcaatcg ccgctagcga agttcctatt 540

ctctagaaag tataggaact tcgccaccat gggatcggcc attgaacaag atggattgca 600

cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 660

aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 720

tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 780

gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 840

aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 900

tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 960

ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 1020

ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 1080

cgaactgttc gccaggctca aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca 1140

tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 1200

ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 1260

tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 1320

tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaggggatcc 1380

gctgtaagtc tgcagaaatt gatgatctat taaacaataa agatgtccac taaaatggaa 1440

gtttttcctg tcatactttg ttaagaaggg tgagaacaga gtacctacat tttgaatgga 1500

aggattggag ctacgggggt gggggtgggg tgggattaga taaatgcctg ctctttactg 1560

aaggctcttt actattgctt tatgataatg tttcatagtt ggatatcata atttaaacaa 1620

gcaaaaccaa attaagggcc agctcattcc tcccactcat gatctataga tctatagatc 1680

tctcgtggga tcattgtttt tctcttgatt cccactttgt ggttctaagt actgtggttt 1740

ccaaatgtgt cagtttcata gcctgaagaa cgagatcagc agcctctgtt ccacatacac 1800

ttcattctca gtattgtttt gccaagttct aattccatca gaaagc 1846

<210> 516

<211> 1519

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 516

taccgggtag gggaggcgct tttcccaagg cagtctggag catgcgcttt agcagccccg 60

ctgggcactt ggcgctacac aagtggcctc tggcctcgca cacattccac atccaccggt 120

aggcgccaac cggctccgtt ctttggtggc cccttcgcgc caccttctac tcctccccta 180

gtcaggaagt tcccccccgc cccgcagctc gcgtcgtgca ggacgtgaca aatggaagta 240

gcacgtctca ctagtctcgt gcagatggac agcaccgctg agcaatggaa gcgggtaggc 300

ctttggggca gcggccaata gcagctttgc tccttcgctt tctgggctca gaggctggga 360

aggggtgggt ccgggggcgg gctcaggggc gggctcaggg gcggggcggg cgcccgaagg 420

tcctccggag gcccggcatt ctgcacgctt caaaagcgca cgtctgccgc gctgttctcc 480

tcttcctcat ctccgggcct ttcgacctgc aggtcctcgc catggatcct gatgatgttg 540

ttgattcttc taaatctttt gtgatggaaa acttttcttc gtaccacggg actaaacctg 600

gttatgtaga ttccattcaa aaaggtatac aaaagccaaa atctggtaca caaggaaatt 660

atgacgatga ttggaaaggg ttttatagta ccgacaataa atacgacgct gcgggatact 720

ctgtagataa tgaaaacccg ctctctggaa aagctggagg cgtggtcaaa gtgacgtatc 780

caggactgac gaaggttctc gcactaaaag tggataatgc cgaaactatt aagaaagagt 840

taggtttaag tctcactgaa ccgttgatgg agcaagtcgg aacggaagag tttatcaaaa 900

ggttcggtga tggtgcttcg cgtgtagtgc tcagccttcc cttcgctgag gggagttcta 960

gcgttgaata tattaataac tgggaacagg cgaaagcgtt aagcgtagaa cttgagatta 1020

attttgaaac ccgtggaaaa cgtggccaag atgcgatgta tgagtatatg gctcaagcct 1080

gtgcaggaaa tcgtgtcagg cgatctcttt gtgaaggaac cttacttctg tggtgtgaca 1140

taattggaca aactacctac agagatttaa agctctaagg taaatataaa atttttaagt 1200

gtataatgtg ttaaactact gattctaatt gtttgtgtat tttagattcc aacctatgga 1260

actgatgaat gggagcagtg gtggaatgca gatcctagag ctcgctgatc agcctcgact 1320

gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 1380

gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 1440

agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 1500

gaagacaata gcaggcatg 1519

<210> 517

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 517

gagggcctat ttcccatgat tcc 23

<210> 518

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 518

cttgtggaaa ggacgaaaca cc 22

<210> 519

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (4)..(23)

<223> a, c, t, g, unknown or other

<400> 519

aacnnnnnnn nnnnnnnnnn nnnggtgttt cgtcctttcc acaag 45

<210> 520

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 520

cctgagtgtt gaggccccag tggctgct 28

<210> 521

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 521

acgagggcag agtgctgctt gctgctggcc aggcccc 37

<210> 522

<211> 68

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 522

catcaggctc tcagctcagc ctgagtgttg aggccctgct ggccaggccc ctgcgtgggc 60

ccaagctg 68

<210> 523

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 523

gagggcctat ttcccatgat tccttca 27

<210> 524

<211> 125

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (84)..(103)

<223> a, c, t, g, unknown or other

<400> 524

aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60

cttgctattt ctagctctaa aacnnnnnnn nnnnnnnnnn nnnggtgttt cgtcctttcc 120

acaag 125

<210> 525

<211> 111

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (9)..(28)

<223> a, c, t, g, unknown or other

<400> 525

gaaacaccnn nnnnnnnnnn nnnnnnnngt tttagagcta gaaatagcaa gttaaaataa 60

ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt t 111

<210> 526

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 526

agctgtttta ctggtcggct 20

<210> 527

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 527

aatggataca cctggtcgaa 20

<210> 528

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 528

caatggatac acctggtcga 20

<210> 529

<211> 68

<212> DNA

<213> Homo sapiens

<400> 529

accatgtata ccacttgggc tttggcagta gctaactgca ctaaatataa tataaggagg 60

gttttatg 68

<---

Изобретение относится к области биотехнологии, в частности к вариантам сконструированной системы CRISPR-Cas, содержащей слитый белок, содержащий белок Cas9, слитый с по меньшей мере одним сигналом ядерной локализации (NLS), или одну или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и РНК системы CRISPR-Cas или одну или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas. Изобретение эффективно для модификации эукариотической клетки. 2 н. и 42 з.п. ф-лы, 74 ил., 15 табл., 16 пр.

1. Сконструированная система CRISPR-Cas для модификации эукариотической клетки, содержащая:

(a) слитый белок, содержащий белок Cas9, слитый с по меньшей мере одним сигналом ядерной локализации (NLS), или одну или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и

(b) РНК системы CRISPR-Cas или одну или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas, где РНК системы CRISPR-Cas содержит направляющую последовательность, способную гибридизоваться с целевой последовательностью, примыкающей к мотиву, смежному с протоспейсером, (PAM) в эукариотической клетке, парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и tracr-последовательность,

при этом Cas9 содержит по меньшей мере одну мутацию в каталитическом домене и представляет собой никазу, не обладающую способностью расщеплять одну цепь ДНК,

где РНК системы CRISPR-Cas способна формировать комплекс CRISPR с белком Cas9 и направлять белок Cas9 к целевой последовательности в эукариотической клетке.

2. Система по п.1, отличающаяся тем, что фермент Cas9 слит с по меньшей мере двумя NLS.

3. Система по п.2, в которой белок Cas9 слит с первым NLS на С-конце Cas9 или рядом с ним и со вторым NLS на N-конце Cas9 или рядом с ним.

4. Система по любому из пп.1-3, в которой NLS независимо выбирают из группы, состоящей из PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, POPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK и RKCLQAGMNLEARKTKK.

5. Система по любому из пп.1-4, в которой Cas9 представляет собой Cas9 S. pyogenes, а PAM включает NGG; или где Cas9 представляет собой S. thermophilus Cas9, а PAM включает NNAGAAW.

6. Система по любому из пп.1-5, отличающаяся тем, что Cas9 содержит по меньшей мере одну мутацию, соответствующую D10A, H840A, N854A или N863A Cas9 S. pyogenes.

7. Система по любому из пп.1-6, в которой Cas9 слит по меньшей мере с одним доменом гетерологичного белка.

8. Система по п. 7, отличающаяся тем, что домен гетерологичного белка содержит эпитопную метку, репортерный домен или домен белка, обладающий одной или несколькими из следующих активностей: метилазная активность, деметилазная активность, активность активации транскрипции, активность подавления транскрипции, активность фактора освобождения при транскрипции, активность для модификации гистонов, активность для расщепления РНК и активность для связывания нуклеиновой кислоты.

9. Система по любому из пп.1-8, отличающаяся тем, что РНК системы CRISPR-Cas содержит: crRNA, содержащую направляющую последовательность и парную tracr-последовательность, и tracrRNA, содержащую tracr-последовательность.

10. Система по любому из пп.1-8, отличающаяся тем, что РНК системы CRISPR-Cas представляет собой химерную РНК, содержащую в направлении от 5' к 3' направляющую последовательность, парную tracr-последовательность и tracr-последовательность.

11. Система по п.10, отличающаяся тем, что tracr-последовательность составляет по меньшей мере 30 нуклеотидов в длину.

12. Система по п.10, в которой tracr-последовательность содержит по меньшей мере 40 нуклеотидов в длину.

13. Система по п.10, в которой tracr-последовательность содержит по меньшей мере 50 нуклеотидов в длину.

14. Система по любому из пп.1-13, где РНК системы CRISPR-Cas содержит один или несколько модифицированных нуклеотидов.

15. Система по любому из пп.1-14, где система содержит РНК системы CRISPR-Cas и слитый белок.

16. Система по любому из пп. 1-14, отличающаяся тем, что система содержит РНК системы CRISPR-Cas и мРНК, кодирующую слитый белок, которая является кодон-оптимизированной для экспрессии в эукариотической клетке.

17. Система по любому из пп.1-14, где указанные одна или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и указанные одна или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas, содержатся в одном или нескольких векторах.

18. Система по п.17, отличающаяся тем, что указанные одна или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и указанные одна или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas, содержатся в одном и том же векторе.

19. Система по п.17 или 18, в которой векторы представляют собой вирусные векторы.

20. Система по п.19, в которой вирусные векторы представляют собой ретровирусные, лентивирусные, аденовирусные, аденоассоциированные или векторы вируса простого герпеса.

21. Система по любому из пп.1-20, в которой эукариотическая клетка представляет собой клетку млекопитающего или клетку человека.

22. Сконструированная система CRISPR-Cas для модификации эукариотической клетки, содержащая:

(a) слитый белок, содержащий белок Cas9, слитый с по меньшей мере одним сигналом ядерной локализации (NLS) и с по меньшей мере одним доменом гетерологичного белка, или одну или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и

(b) РНК системы CRISPR-Cas или одну или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas, где РНК системы CRISPR-Cas содержит направляющую последовательность, способную гибридизоваться с целевой последовательностью, примыкающей к мотиву, смежному с протоспейсером (PAM) в эукариотической клетке, парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и tracr-последовательность,

при этом РНК способна образовывать комплекс CRISPR с белком Cas9 и направлять белок Cas9 к целевой последовательности в эукариотической клетке.

23. Система по п.22, отличающаяся тем, что Cas9 слит с по меньшей мере двумя NLS.

24. Система по п.23, в которой белок Cas9 слит с первым NLS на С-конце Cas9 или рядом с ним и со вторым NLS на N-конце Cas9 или рядом с ним.

25. Система по любому из пп.22-24, в которой NLS независимо выбирают из группы, состоящей из PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, POPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK и RKCLQAGMNLEARKTKK.

26. Система по любому из пп.22-25, в которой Cas9 представляет собой Cas9 S. pyogenes, а PAM включает NGG; или где Cas9 представляет собой S. thermophilus Cas9, а PAM включает NNAGAAW.

27. Система по любому из пп.22-26, отличающаяся тем, что Cas9 содержит по меньшей мере одну мутацию в каталитическом домене и представляет собой никазу, не способную расщеплять одну цепь ДНК.

28. Система по п.27, отличающаяся тем, что Cas9 содержит по меньшей мере одну мутацию, соответствующую D10A, H840A, N854A или N863A Cas9 S. pyogenes.

29. Система по любому из пп.22-26, отличающаяся тем, что Cas9 содержит по меньшей мере одну мутацию в двух или более каталитических доменах и, по существу, лишен всей активности расщепления ДНК.

30. Система по п.29, отличающаяся тем, что Cas9 содержит мутацию, соответствующую D10A Cas9 S. pyogenes, и дополнительно содержит по меньшей мере одну мутацию, соответствующую H840A, N854A или N863A Cas9 S. pyogenes.

31. Система по любому из пп. 22-30, отличающаяся тем, что гетерологичный белковый домен содержит эпитопную метку, репортерный домен или белковый домен, обладающий одной или несколькими из следующих активностей: метилазная активность, деметилазная активность, активность активации транскрипции, активность подавления транскрипции, активность фактора высвобождения при транскрипции, активность модификации гистонов, активность расщепления РНК и активность связывания нуклеиновой кислоты.

32. Система по любому из пп.22-31, отличающаяся тем, что РНК системы CRISPR-Cas содержит: crRNA, содержащую направляющую последовательность и парную tracr-последовательность, и tracrRNA, содержащую tracr-последовательность.

33. Система по любому из пп.22-31, где РНК системы CRISPR-Cas представляет собой химерную РНК, содержащую в направлении от 5' к 3' направляющую последовательность, парную tracr-последовательность и tracr-последовательность.

34. Система по п.33, в которой tracr-последовательность содержит по меньшей мере 30 нуклеотидов в длину.

35. Система по п.33, в которой tracr-последовательность содержит по меньшей мере 40 нуклеотидов в длину.

36. Система по п.33, в которой tracr-последовательность содержит по меньшей мере 50 нуклеотидов в длину.

37. Система по любому из пп.22-36, где РНК системы CRISPR-Cas содержит один или несколько модифицированных нуклеотидов.

38. Система по любому из пп.22-37, где система содержит РНК системы CRISPR-Cas и слитый белок.

39. Система по любому из пп.22-37, где система содержит РНК системы CRISPR-Cas и мРНК, кодирующую слитый белок, которая кодон-оптимизирована для экспрессии в эукариотической клетке.

40. Система по любому из пп.22-37, где указанные одна или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и указанные одна или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas,содержатся в одном или нескольких векторах.

41. Система по п.40, отличающаяся тем, что указанные одна или более молекул нуклеиновой кислоты, кодирующих этот слитый белок, и указанные одна или более молекул нуклеиновой кислоты, кодирующих РНК системы CRISPR-Cas, содержатся в одном и том же векторе.

42. Система по п.40 или 41, где векторы представляют собой вирусные векторы.

43. Система по п.42, в которой вирусные векторы представляют собой ретровирусные, лентивирусные, аденовирусные, аденоассоциированные или векторы вируса простого герпеса.

44. Система по любому из пп.22-43, где эукариотическая клетка представляет собой клетку млекопитающего или клетку человека.

название	год	авторы	номер документа
КОНСТРУИРОВАНИЕ СИСТЕМ, СПОСОБЫ И ОПТИМИЗИРОВАННЫЕ НАПРАВЛЯЮЩИЕ КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ	2013	Чжан, Фэн Цун, Лэ Хсю, Патрик Ран, Фэй	RU2796017C2
НОВЫЕ ФЕРМЕНТЫ И СИСТЕМЫ CRISPR	2016	Кунин Юджин Чжан Фэн Вольф Юрий И. Шмаков Сергей Северинов Константин Семенова Екатерина Минахин Леонид Макарова Кира С. Конерманн Сильвана Джунг Джулия Гутенберг Джонатан С. Абудайех Омар О.	RU2777988C2
НОВЫЕ ФЕРМЕНТЫ CRISPR И СИСТЕМЫ	2016	Северинов Константин Чжан Фэн Вольф Юрий И. Шмаков Сергей Семенова Екатерина Минахин Леонид Макарова Кира С. Кунин Юджин Конерманн Сильвана Джунг Джулия Гутенберг Джонатан С. Абудайех Омар О. Ландер Эрик С.	RU2771826C2
ДОСТАВКА, КОНСТРУИРОВАНИЕ И ОПТИМИЗАЦИЯ СИСТЕМ, СПОСОБОВ И КОМПОЗИЦИЙ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ И ПРИМЕНЕНИЯ В ТЕРАПИИ	2013	Чжан Фэн Хайденрайх Маттиас Жань Фэй Суич Лукаш	RU2721275C2
ГИБРИДНЫЕ БЕЛКИ ВАРИАНТА sPD-1—FC	2019	Джачча, Амато Дж. Агилера, Тодд А. Кариолис, Михалис С. Мяо, Юй Тхаккар, Каушик Чжан, Синь Эрик	RU2785993C2
Антитела против CXCR2 и их применение	2019	Чэнь, Дорис, Шим, Сью Пултон, Линн, Дороти Кларк, Адам Лэйн, Дэвид, Жозе Саймон Поллард, Мэттью Кукси, Бриджит, Энн Дойл, Энтони Гилл, Джейсон, Уильям	RU2807067C2
НОВЫЕ ФЕРМЕНТЫ И СИСТЕМЫ CRISPR	2023	Чжан, Фэн Цече, Бернд Гутенберг, Йонатан, С. Абудайе, Омар, О. Слеймейкер, Йан	RU2832308C2
КОМПОЗИЦИИ Т-КЛЕТОК С НЕДОСТАТОЧНОСТЬЮ РЕЦЕПТОРОВ Т-КЛЕТОК	2013	Зентман Чарльз Л.	RU2781979C2
НАПРАВЛЯЕМАЯ РНК РЕГУЛЯЦИЯ ТРАНСКРИПЦИИ	2014	Чёрч, Джордж М. Мали, Прашант Г. Эсвельт, Кевин М.	RU2756865C2
СИСТЕМА РЕДАКТИРОВАНИЯ ГЕНОМА CRISPR/CAS9 II ТИПА И ЕЕ ПРИМЕНЕНИЕ	2022	Тянь Жуй Хуан Лун Се Хунсянь	RU2794774C1

JINEK M
et al., A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity, Science, AUGUST 2012, 337(6096): 816-821
GASIUNAS G
et al., Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria, Proceedings of the National Academy of Scieces, 2012 (published online September 4,

КОМПОНЕНТЫ СИСТЕМЫ CRISPR-CAS, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ Российский патент 2023 года по МПК C12N15/113 C12N15/79 C12N15/90 C12N9/22

Описание патента на изобретение RU2796549C2

Похожие патенты RU2796549C2

Иллюстрации к изобретению RU 2 796 549 C2

Реферат патента 2023 года КОМПОНЕНТЫ СИСТЕМЫ CRISPR-CAS, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ

Формула изобретения RU 2 796 549 C2

Документы, цитированные в отчете о поиске Патент 2023 года RU2796549C2

RU 2 796 549 C2