ОЛИГОНУКЛЕОТИД ДЛЯ ЛЕЧЕНИЯ ПАЦИЕНТОВ С МЫШЕЧНОЙ ДИСТРОФИЕЙ Российский патент 2018 года по МПК C12N15/113 A61K31/7088 A61K48/00 A61P21/00 

Описание патента на изобретение RU2674600C2

Область изобретения

Изобретение относится к области генетики человека, более конкретно, к способу конструирования единичного олигонуклеотида, который предпочтительно способен индуцировать пропускание двух или более экзонов пре-мРНК. Кроме того, изобретение относится к указанному олигонуклеотиду, к фармацевтической композиции, содержащей указанный олигонуклеотид, и к применению указанного олигонуклеотида, как указано в настоящем описании.

Уровень техники, к которому относится изобретение

Олигонуклеотиды являются перспективными в медицине для лечения генетических нарушений, таких как мышечная дистрофия. Мышечная дистрофия (MD) относится к генетическим заболеваниям, которые характеризуются прогрессирующей слабостью и дегенерацией скелетных мышц. Мышечная дистрофия Дюшенна (DMD) и мышечная дистрофия Беккера (BMD) являются наиболее распространенными детскими формами мышечной дистрофии, и они используются в настоящем описании для иллюстрации изобретения. DMD представляет собой тяжелое летальное нервно-мышечное нарушение, приводящее к потребности в инвалидной коляске в возрасте до 12 лет и пациенты DMD часто погибают в возрасте до тридцати лет вследствие дыхательной или сердечной недостаточности.

DMD вызывается мутациями в гене DMD; в основном делециями или дупликациями со сдвигом рамки считывания одного или нескольких экзонов, небольшими нуклеотидными вставками или делециями, или точечными нонсенс-мутациями, которые, как правило, приводят к отсутствию функционального дистрофина. В ходе последнего десятилетия появилась специально индуцируемая модификация сплайсинга для восстановления нарушенной рамки считывания транскрипта DMD в качестве перспективной терапии мышечной дистрофии Дюшенна (DMD) (van Ommen G.J. et al., Yokota T., et al., van Deutekom et al., Goemans N.M., et al.). С использованием специфичных к последовательности антисмысловых олигонуклеотидов (AON), которые нацелены на конкретный экзон, фланкирующий или содержащий мутацию, и препятствуют его сигналам сплайсинга, может быть индуцировано пропускание этого экзона во время процессинга пре-мРНК DMD. Несмотря на получаемый в результате укороченный транскрипт, открытая рамка считывания восстанавливается, и образуется белок, который сходен с белками, встречающимися у пациентов с обычно более мягкой мышечной дистрофией Беккера. Индуцируемое AON пропускание экзонов обеспечивает специфический для мутации и, таким образом, потенциально персонализированный терапевтический подход для пациентов с DMD и определенных пациентов с тяжелой BMD. Поскольку большинство мутаций кластеризуются в области экзонов 45-55 в гене DMD, пропускание одного конкретного экзона в этой области может быть терапевтическим для субпопуляции пациентов с различными мутациями. Пропускание экзона 51 имеют наибольшие субпопуляции пациентов (приблизительно 13%), включая пациентов с делециями экзонов 45-50, 48-50, 50 или 52. В случае некоторых мутаций для восстановления открытой рамки считывания требуется пропускание более одного экзона. Например, для пациентов DMD с делецией с экзона 46 по экзон 50 в гене DMD, только пропускание обоих из экзонов 45 и 51 является корректирующим. Для лечения этих пациентов требуется введение двух олигонуклеотидов, один из которых нацелен на экзон 45, а другой из которых нацелен на экзон 51. Осуществимость пропускания двух или более последовательных экзонов с использованием комбинации AON, либо в коктейле, либо в доставляемых с помощью вирусов генных конструкциях, широко исследована (Aartsma-Rus A. et al., 2004; Béroud C., et al.; Van Vliet L., et al.; Yokota T., et al.; Goyenvalle A., et al.). Пропускание множества экзонов было бы применимым для совокупных субпопуляций пациентов, позволило бы имитировать делеции, о которых известно, что они ассоциированы с относительно мягкими фенотипами, и обеспечило бы инструмент для нацеливания на редкие мутации вне области горячей точки делеций в гене DMD. Однако недостатком разработки лекарственных средств, содержащих множество олигонуклеотидов, является то, что учреждение по контролю за оборотом лекарственных средств может рассматривать олигонуклеотиды с различными последовательностями как различные лекарственные средства, для каждого из которых требуются доказательства стабильной продукции, испытания токсичности и клинические испытания. Таким образом, существует потребность в одном молекулярном соединении, способном индуцировать пропускание по меньшей мере двух экзонов, чтобы упростить лечение совокупных подгрупп пациентов с DMD.

Описание изобретения

Изобретение относится к способу конструирования олигонуклеотида, где указанный олигонуклеотид способен связываться с областью первого экзона и с областью второго экзона в одной и той же пре-мРНК, где указанная область указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона. Олигонуклеотиды, получаемые указанным способом, предпочтительно способны индуцировать пропускание указанного первого экзона и указанного второго экзона в указанной пре-мРНК. Предпочтительно, также индуцируется пропускание дополнительного экзона(ов), где указанный дополнительный экзон(ы) предпочтительно расположен между указанным первым и указанным вторым экзонами. Полученный транскрипт указанной пре-мРНК, где пропускаются указанные экзоны, находится в рамке считывания.

Олигонуклеотид

В первом аспекте изобретение относится к олигонуклеотиду, который способен связываться с областью первого экзона и с областью второго экзона в одной и той же пре-мРНК, где указанная область второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона.

Олигонуклеотид предпочтительно способен индуцировать пропускание первого и второго экзонов указанной пре-мРНК; более предпочтительно, индуцируется пропускание дополнительного экзона(ов), где указанный дополнительный экзон(ы) предпочтительно расположен между указанным первым и указанным вторым экзонами, и где полученный транскрипт находится в рамке считывания.

Пропускание экзона препятствует природным процессам сплайсинга, происходящим в эукариотической клетке. У высших эукариот генетическая информация для белков в ДНК клетки кодируется в экзонах, которые отделены друг от друга последовательностями интронов. Эти интроны в некоторых случаях являются очень длинными. Аппарат транскрипции эукариот образует пре-мРНК, которая содержит как экзоны, так и интроны, в то время как аппарат сплайсинга, часто уже во время происходящей продукции пре-мРНК, образует истинную кодирующую мРНК для белка путем удаления интронов и связывания экзонов, присутствующих в пре-мРНК, в ходе процесса, называемого сплайсингом.

Олигонуклеотид по изобретению, который способен связываться с областью первого экзона в пре-мРНК и с областью второго экзона в той же пре-мРНК, следует рассматривать как олигонуклеотид, пригодный для связывания с областью первого экзона в пре-мРНК и пригодный для связывания с областью второго экзона в той же пре-мРНК. Такой олигонуклеотид по изобретению характеризуется его признаком связывания (т.е. способен связываться), когда его используют с или в комбинации с пре-мРНК, предпочтительно в клетке. В этом контексте выражение "способен к" может быть заменено на "может". Таким образом, специалисту в данной области будет понятно, что олигонуклеотид, способный связываться с областью первого экзона и способный связываться с областью второго экзона в одной и той же пре-мРНК, определяемый нуклеотидной последовательностью, определяет указанный олигонуклеотид структурно, т.е. указанный олигонуклеотид обладает такой последовательностью, которая обратно комплементарна последовательности указанной области указанного первого экзона и также обратно комплементарна последовательности указанной области указанного второго экзона в одной и той же пре-мРНК. Степень обратной комплементарности с указанными областями указанного первого и/или указанного второго экзона, которая необходима для олигонуклеотида по изобретению, может составлять менее 100%. Может быть допустимым определенное количество несоответствий нуклеотидов или один или два пропуска, как дополнительно описано в настоящем описании. Нуклеотидную последовательность области первого экзона, которая обладает по меньшей мере 50% идентичностью с указанной областью указанного второго экзона (или нуклеотидная последовательность области второго экзона, которая обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона), с которой способен связываться олигонуклеотид по изобретению, можно конструировать с использованием способа по изобретению, как пояснено ниже в настоящем описании. Предпочтительная пре-мРНК представляет собой пре-мРНК дистрофина. Предпочтительные комбинации первого и второго экзонов пре-мРНК дистрофина и предпочтительные области указанных первого и второго экзонов дистрофина определены в таблице 2. Олигонуклеотид по изобретению предпочтительно способен индуцировать пропускание указанных первого и второго экзонов в указанной пре-мРНК дистрофина; более предпочтительно, индуцируется пропускание дополнительного экзона(ов), где указанный дополнительный экзон(ы) предпочтительно расположен между указанным первым и указанным вторым экзонами, и где полученный транскрипт дистрофина находится в рамке считывания, предпочтительно, как указано в таблице 1.

Транскрипт находится в рамке считывания, когда он имеет открытую рамку считывания, которая обеспечивает продукцию белка. Состояние нахождения мРНК в рамке считывания можно оценивать с помощью анализа последовательности и/или анализа ОТ-ПЦР, как известно специалисту в данной области. Полученный белок, который образуется в результате трансляции транскрипта в рамке считывания, можно анализировать с помощью иммунофлуоресценции и/или анализа с использованием вестерн-блоттинга с использованием антител, которые перекрестно реагируют с указанным белком, как известно специалисту в данной области. В рамках настоящего изобретения олигонуклеотид, описанный в настоящем описании, может быть назван функциональным, если полученный транскрипт в рамке считывания идентифицируется с помощью ОТ-ПЦР и/или анализа последовательности, или если белок, образовавшийся с указанного транскрипта, идентифицируется с помощью иммунофлуоресценции и/или анализа с использованием вестерн-блоттинга, в соответствующей системе in vitro или in vivo в зависимости от типа транскрипта. Если транскрипт представляет собой транскрипт дистрофина, соответствующая система может представлять собой мышечную клетку или мышечную трубочку здорового донора или пациента с DMD, как пояснено в настоящем описании ниже.

В одном варианте осуществления область второго экзона (присутствующая в той же пре-мРНК в качестве области первого экзона) обладает по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100% идентичностью с областью первого экзона, как определено выше (предпочтительные области первого и второго экзонов дистрофина указаны в таблице 2). Процент идентичности можно оценивать по всей длине указанных первого и/или второго экзонов или на протяжении области из 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов, как проиллюстрировано в настоящем описании для экзонов дистрофина. Для квалифицированного специалиста очевидно, что первый и второй экзоны, как описано в настоящем описании, представляют собой два различных экзона одной единственной мРНК или два различных экзона одной и той же пре-мРНК. Первый экзон, как указано в настоящем описании, может быть расположен выше (т.е. с 5'-стороны) второго экзона в одной и той же пре-мРНК, как указано в настоящем описании, или второй экзон может быть расположен выше указанного первого экзона. Предпочтительно, указанный первый экзон расположен выше указанного второго экзона. Специалисту в данной области очевидно, что олигонуклеотид по изобретению может быть исходно сконструирован так, чтобы он был способен связываться с областью первого экзона; ввиду идентичности области указанного первого и указанного второй экзонов, указанный олигонуклеотид также вторично может быть способен связываться с указанной областью указанного второго экзона. Возможно обратное конструирование: олигонуклеотид по изобретению может быть первично сконструирован так, чтобы он был способен связываться с областью второго экзона; ввиду идентичности области указанного первого и указанного второго экзонов, указанный олигонуклеотид также может быть вторично способен связываться с указанной областью указанного первого экзона.

Процент идентичности между областью первого и областью второго экзонов можно оценивать по всей области указанного первого экзона, где область может быть более короткой, более длинной или в равной степени длинной относительно части этой области, с которой олигонуклеотид по изобретению способен связываться. Область первого экзона и область второго экзона, как используют в рамках изобретения, также могут быть идентифицированы как область(и) идентичности. Предпочтительно область первого экзона, которая определяет идентичность с областью второго экзона, является в равной степени длинной или более длинной, чем часть этой области, с которой способен связываться олигонуклеотид по изобретению. Должно быть понятно, что олигонуклеотид по изобретению может быть способен связываться с меньшей частью или частично перекрывающейся частью указанных областей, использованных для оценки идентичности последовательностей указанных первого и/или второго экзонов. Таким образом, должно быть понятно, что олигонуклеотид, который способен связываться с областью первого и второго экзонов, может связываться с частью указанной области указанного первого экзона и указанного второго экзона. Указанная часть может иметь такую же длину, как и указанная область указанного первого и/или указанного второго экзонов. Указанная часть может быть более короткой или более длинной относительно указанной области указанного первого и/или указанного второго экзонов. Указанная часть может находиться в указанной области указанного первого и/или указанного второго экзонов. Указанная часть может перекрываться с указанной областью указанного первого и/или указанного второго экзонов. Это перекрывание может составлять 1, 2, 3, 4, 5 или более нуклеотидов на 5'- и/или на 3'-стороне области указанного первого и/или второго экзона. Олигонуклеотид может быть по меньшей мере на 1, 2, 3, 4, 5 или более нуклеотидов длиннее или короче области указанного первого и/или указанного второго экзона и может находиться на 5'- или 3'-стороне указанной области первой и/или второй области.

Область, составляющая 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 или вплоть до 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов, используемая для вычисления процента идентичности между первым экзоном и вторым экзоном, может представлять собой непрерывный участок, или она может прерываться одним, двумя, тремя, четырьмя или более пропусками при условии, что процент идентичности на протяжении всей области составляет по меньшей мере 50%.

Процент идентичности между областью первого экзона и областью второго экзона можно оценивать с использованием любой программы, известной специалисту в данной области. Предпочтительно, указанную идентичность оценивают следующим образом: наилучшее попарное выравнивание между первым и вторым экзонами с использованием сетевого инструмента EMBOSS Matcher с использованием параметров по умолчанию (матрица: EDNAFULL, штраф за внесение пропуска: 16, штраф за продолжение пропуска: 4).

Олигонуклеотид, как используют в рамках изобретения, предпочтительно относится к олигомеру, который способен связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарным области или части области первого и второго экзонов в одной и той же пре-мРНК.

Олигонуклеотид, как определено в настоящем описании (т.е. который способен связываться с областью первого экзона и с областью другого экзона (т.е. второго экзона) в одной и той же пре-мРНК, где указанная область указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона), также предпочтительно по меньшей мере на 80% обратно комплементарен указанной области указанного первого экзона и по меньшей мере на 45% обратно комплементарен указанной области указанного второго экзона. Более предпочтительно, указанный олигонуклеотид по меньшей мере на 85%, 90%, 95% или 100% обратно комплементарен указанной области указанного первого экзона и по меньшей мере на 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100% обратно комплементарен указанной области указанного второго экзона. Обратную комплементарность предпочтительно, но не обязательно, оценивают на протяжении всей длины олигонуклеотида.

Олигонуклеотид, охватываемый изобретением, может содержать по меньшей мере 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40 нуклеотидов. Олигонуклеотид, охватываемый изобретением, может содержать не более 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 нуклеотидов. Длина олигонуклеотида по изобретению определяется общим количеством нуклеотидов, охватываемых указанным олигонуклеотидом, независимо от модификаций, присутствующих в указанном олигонуклеотиде. Как дополнительно рассмотрено ниже, нуклеотиды могут содержать определенные химические модификации, однако такие модифицированные нуклеотиды, тем не менее, считаются нуклеотидами в контексте настоящего изобретения. В зависимости от химии олигонуклеотида, оптимальная длина олигонуклеотида может отличаться. Например, длина 2'-O-метилфосфоротиоатного олигонуклеотида может составлять от 15 до 30. Если этот олигонуклеотид далее модифицировать, как проиллюстрировано в настоящем описании, оптимальная длина может быть укорочена до 14, 13 или даже менее.

В предпочтительном варианте осуществления олигонуклеотид по изобретению имеет не более 30 нуклеотидов для ограничения вероятности снижения эффективности синтеза, выхода, частоты или масштабируемости, снижения биодоступности и/или клеточного захвата и транспорта, снижения безопасности и для ограничения расходов. В более предпочтительном варианте осуществления олигонуклеотид состоит из 15-25 нуклеотидов. Наиболее предпочтительно, олигонуклеотид, охватываемый изобретением, состоит из 20, 21, 22, 23, 24 или 25 нуклеотидов. Длина олигонуклеотида по изобретению предпочтительно является такой, что функциональность или активность олигонуклеотида определяется индукцией по меньшей мере 5% пропускания первого и второго экзонов (и любого экзона(ов) между ними), или способствованием тому, что образуется по меньшей мере 5% транскрипта в рамке считывания, когда по меньшей мере 100 нМ указанного олигонуклеотида используют для трансфицирования соответствующей клеточной культуры in vitro. Оценка присутствия указанного транскрипта уже описана в настоящем описании. Соответствующая клеточная культура представляет собой клеточную культуру, где пре-мРНК, содержащая указанный первый и указанный второй экзоны, транскрибируется и сплайсируется в мРНК-транскрипт. Если пре-мРНК представляет собой пре-мРНК дистрофина, соответствующая клеточная культура содержит (дифференцированные) мышечные клетки. В этом случае образуется по меньшей мере 20% транскрипта в рамке считывания, когда используют по меньшей мере 250 нМ указанного олигонуклеотида.

Область первого экзона может иметь длину по меньшей мере 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 или вплоть до 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов. Область первого экзона также может быть определена как составляющая по меньшей мере 1%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или 100% длины указанного экзона. Область первого экзона может быть названа областью идентичности.

Область второго экзона может составлять по меньшей мере 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 или вплоть до 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов. Область второго экзона может быть определена как составляющая по меньшей мере 1%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или 100% от длины указанного экзона. Область второго экзона может быть названа областью идентичности.

В одном варианте осуществления олигонуклеотид по изобретению способен связываться с областью экзона U+1 (первый экзон) из пре-мРНК, где область другого экзона D-1 (второй экзон) в той же пре-мРНК обладает по меньшей мере 50% идентичностью с указанной областью указанного (U+1) экзона, где указанный олигонуклеотид предназначен для пропускания указанного U+1 и указанного D-1 экзонов (и дополнительного экзона(ов), предпочтительно расположенного между указанным первым и указанным вторым экзонами) указанной пре-мРНК, с образованием транскрипта в рамке считывания, в котором экзоны U и D сплайсированы вместе (например, для DMD, предпочтительно, как в таблице 1). Олигонуклеотид по изобретению также обозначается в настоящем описании как соединение. Олигонуклеотид по изобретению предпочтительно представляет собой антисмысловой олигонуклеотид (т.е. AON). Олигонуклеотид предпочтительно предназначен для пропускания указанных двух экзонов (т.е. указанного первого (U+1) и указанного второго (D-1) экзонов) указанной пре-мРНК, и где образовавшийся транскрипт (в котором U прямо сплайсирован с D) находится в рамке считывания (например, для DMD, предпочтительно, как в таблице 1). Можно сказать, что указанный олигонуклеотид индуцирует пропускание указанных двух экзонов в одной единственной пре-мРНК. Необязательно, индуцируется пропускание дополнительного экзона(ов), где указанный дополнительный экзон(ы) предпочтительно расположен между указанным первым и указанным вторым экзонами, и образующийся транскрипт находится в рамке считывания.

Более предпочтительно, олигонуклеотид предназначен для пропускания указанных двух экзонов (т.е. указанного первого и указанного второго экзонов), и полного участка экзонов между указанным первым и указанным вторым экзонами в указанной пре-мРНК для удаления какой-либо мутации в указанном участке и для получения транскрипта, который является более коротким, но который обладает восстановленной открытой рамкой считывания, что обеспечивает продуцирование белка.

Без связи с какой-либо теорией, полагают, что вследствие по меньшей мере 50% идентичности или сходства последовательностей между указанными двумя экзонами, единственный олигонуклеотид по изобретению способен связываться и индуцировать пропускание обоих экзонов и предпочтительно всего участка экзонов между ними, чтобы получить более короткий транскрипт, который находится в рамке считывания. Таким образом, указанные два экзона могут быть соседними в пре-мРНК, или они могут быть разделены по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50 экзонами. Область, охватывающая один или несколько экзонов, присутствующих между указанным первым и указанным вторым экзонами, также может быть названа участком (множества) экзонов или мультиэкзонным участком. Предпочтительно, первый экзон этого мультиэкзонного участка представляет собой первый экзон, определенный в настоящем описании выше, а последний экзон этого мультиэкзонного участка представляет собой второй экзон, определенный в настоящем описании ранее. Олигонуклеотид по изобретению также может быть определен как олигонуклеотид, который способен индуцировать пропускание указанных двух экзонов, или пропускание участка (множества) экзонов или пропускание указанного мультиэкзонного участка. В предпочтительном варианте осуществления пропускание как первого экзона, так и второго экзона индуцируют с использованием одного единственного олигонуклеотида по изобретению. В предпочтительном варианте осуществления осуществляют пропускание более одного, более 2, более 3, более 4, более 5, более 6, более 7, более 8, более 9, более 10, более 11, более 12, более 13, более 14, более 15, более 16, более 17 экзонов, более 18, более 19, более 20, более 21, более 22, более 23, более 24, более 25, более 26, более 27, более 28, более 29, более 30, более 31, более 32, более 33, более 34, более 35, более 36, более 37, более 38, более 39, более 40, более 41, более 42, более 43, более 44, более 45, более 46, более 47, более 48, более 49, более 50 экзонов с использованием одного единственного олигонуклеотида, и, таким образом, это пропускание более 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50 экзонов проводят, не используя смесь или коктейль двух или более различных олигонуклеотидов, или не используя два или более различных олигонуклеотидов, которые могут быть связаны с помощью одного или нескольких линкера(ов), или не используя генную конструкцию, транскрибирующую два или более различных олигонуклеотидов. В одном варианте осуществления, таким образом, предусматривается, что изобретение охватывает один единственный олигонуклеотид и не содержит двух или более различных олигонуклеотидов, причем указанный единственный олигонуклеотид способен связываться с указанным первым и указанным вторым экзонами и способен индуцировать пропускание по меньшей мере указанного первого и указанного второго экзонов в одной пре-мРНК, как проиллюстрировано в настоящем описании. В этом контексте квалифицированному специалисту будет понятно, что слово "единственный" не относится к количеству молекул, требуемому для индукции пропускания экзонов. "Единственный" относится к последовательности олигонуклеотида: изобретение охватывает одну единственную олигонуклеотидную последовательность и ее применение, и не включает две или более различных олигонуклеотидных последовательностей, причем указанная единственная олигонуклеотидная последовательность способна связываться с указанным первым и указанным вторым экзонами и способна индуцировать пропускание по меньшей мере указанного первого и указанного второго экзонов в одной пре-мРНК, как объяснено в настоящем описании. Это изобретение представляет собой первое изобретение, позволяющее пропускание более чем одного экзона с помощью только одного единственного олигонуклеотида для лечения заболевания, вызываемого (редкой) мутацией в гене, при условии, что различные экзоны в указанном гене включают области, которые обладают по меньшей мере 50% идентичностью последовательностей.

Олигонуклеотид по изобретению предпочтительно используют в качестве части терапии на основе активности модулирования РНК, как определено в настоящем описании ниже. В зависимости от типа транскрипта, где присутствуют первый и второй экзоны, можно сконструировать олигонуклеотид для предупреждения, лечения или замедления данного заболевания.

Было показано, что нацеливание на два экзона в одной пре-мРНК с помощью одного олигонуклеотида, способного связываться с обоими экзонами, приводит к мРНК, лишенной экзонов-мишеней, и, кроме того, всего участка экзонов между ними. Преимуществом такого единственного олигонуклеотида, как определено в настоящем описании, является то, что можно лечить дефекты, вызванные различными мутациями в этом мультиэкзонном участке. Если выбрать два или более различных олигонуклеотидов для индукции пропускания двух или более экзонов, следует, например, учитывать, что каждый олигонуклеотид может обладать его собственным профилем PK, и что, таким образом, необходимо будет найти условия, где каждый из них будет сходным образом присутствовать в одной и той же клетке. Таким образом, другим преимуществом использования только одного единственного олигонуклеотида, способного связываться с двумя различными экзонами, как определено выше, является то, что значительно упрощается изготовление, исследование токсичности, поиск дозы и клиническое испытание, поскольку это может быть сведено к простому изготовлению и исследованию одного единственного соединения.

Ниже определены дополнительные признаки олигонуклеотида по изобретению.

В контексте изобретения, в предпочтительном варианте осуществления олигонуклеотид способен связываться с, нацеливаться на, гибридизоваться с, является обратно комплементарным и/или способен ингибировать функцию по меньшей мере одной регулирующей сплайсинг последовательности в по меньшей мере указанном первом экзоне и/или указанном втором экзоне и/или влияет на структуру по меньшей мере указанного первого экзона и/или указанного второго экзона:

где указанный олигонуклеотид содержит последовательность, которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной участку связывания серин-аргининового (SR) белка в указанном первом и/или втором экзоне,

и/или

где указанный олигонуклеотид способен связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарным энхансеру сплайсинга экзонов (ESE), последовательности распознавания экзонов (ERS) и/или сайленсеру сплайсинга экзонов (ESS) в указанном первом и/или втором экзоне.

Более предпочтительно, указанный олигонуклеотид, который способен связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарным области первого экзона пре-мРНК и/или области второго экзона пре-мРНК, способен специфически ингибировать по меньшей мере одну регулирующую сплайсинг последовательность и/или влиять на структуру по меньшей мере указанного первого и/или второго экзона в указанной пре-мРНК. Препятствование регулирующим сплайсинг последовательностям и/или структурам имеет преимущество, состоящее в том, что такие элементы располагаются в экзоне. Путем предоставления такого олигонуклеотида, как определено в настоящем описании, можно эффективно замаскировать по меньшей мере указанный первый и второй экзоны, и предпочтительно полный участок экзонов между ними, от аппарата сплайсинга. Отсутствие распознавания аппаратом сплайсинга этих экзонов, таким образом, приводит к пропусканию или исключению этих экзонов из конечной мРНК. Этот вариант осуществления сфокусирован только на кодирующих последовательностях. Полагают, что это позволяет способу быть более специфическим и, таким образом, надежным. Обратная комплементарность указанного олигонуклеотида с указанной областью указанного первого и/или второго экзона в пре-мРНК предпочтительно составляет по меньшей мере 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100%.

Таким образом, настоящее изобретение относится к антисмысловому олигонуклеотиду для применения в качестве лекарственного средства для предупреждения, замедления, смягчения и/или лечения заболевания у индивидуума,

где указанный олигонуклеотид способен связываться с областью первого экзона и областью второго экзона, где указанная область указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона,

где указанный первый и указанный второй экзоны находятся в одной и той же пре-мРНК у указанного индивидуума,

где указанное связывание приводит к пропусканию указанного первого экзона и указанного второго экзона и предпочтительно к пропусканию мультиэкзонного участка, начинающегося с указанного первого экзона и охватывающего один или несколько экзонов, находящихся между указанным первым и указанным вторым экзонами, и в лучшем случае к пропусканию всего участка экзонов между указанным первым и указанным вторым экзонами, и

где получают транскрипт в рамке считывания, позволяющий продуцирование функционального или полуфункционального белка.

Предпочтительно, как проиллюстрировано в настоящем описании, указанный олигонуклеотид способен индуцировать пропускание всего участка экзонов между указанным первым экзоном и указанным вторым экзоном.

Более предпочтительно, как объяснено в настоящем описании, указанное связывание указанного олигонуклеотида способно препятствовать по меньшей мере одной регулирующей сплайсинг последовательности в указанных областях указанных первого и второго экзонов, и/или вторичной структуре указанного первого и/или указанного второго экзонов, и/или вторичной структуре, охватывающей по меньшей мере указанный первый и/или указанный второй экзоны в указанной пре-мРНК. Предпочтительные регулирующие сплайсинг последовательности представлены в настоящем описании ниже.

Таким образом, один предпочтительный вариант осуществления относится к олигонуклеотиду по изобретению, который способен связываться с областью первого экзона в пре-мРНК и/или с областью второго экзона в той же пре-мРНК, где указанная область указанного второго экзона в той же пре-мРНК обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона (например, для DMD, предпочтительно, как в таблице 2), где указанный олигонуклеотид способен индуцировать пропускание указанного первого и указанного второго экзонов в указанной пре-мРНК; что приводит к транскрипту, который находится в рамке считывания (например, для DMD, предпочтительно, как в таблице в таблице 1 или 6). Указанный олигонуклеотид обеспечивает у указанного индивидуума функциональный или полуфункциональный белок, и указанный олигонуклеотид дополнительно содержит:

- последовательность, которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной области первого и/или второго экзона пре-мРНК, которая гибридизуется с другой частью первого и/или второго экзона пре-мРНК (закрытая структура), и/или

- последовательность, которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной области указанного первого и/или второго экзона пре-мРНК, которая не гибридизуется с указанной пре-мРНК (открытая структура).

Для этого варианта осуществления приводится ссылка на патентную заявку WO 2004/083446. Молекулы РНК обладают прочными вторичными структурами, по большей части вследствие спаривания оснований обратно комплементарных или частично обратно комплементарных участков в одной и той же РНК. Уже давно полагают, что структуры в РНК играют роль в функции РНК. Без связи с теорией, полагают, что вторичная структура РНК экзона играет роль в структурировании процесса сплайсинга. В ее структуре экзон распознается в качестве части, которая должна быть включена в мРНК. В одном варианте осуществления олигонуклеотид способен препятствовать структуре по меньшей мере указанного первого экзона и, возможно, также указанного второго экзона и, возможно, также участка экзонов между ними, и, таким образом, способен препятствовать сплайсингу указанного первого, и, возможно, также указанного второго экзона, и, возможно, также участка экзонов между ними, путем маскирования указанных экзонов от аппарата сплайсинга и тем самым обеспечения пропускания указанных экзонов. Без связи с теорией, полагают, что перекрывание с открытой структурой повышает эффективность инвазии олигонуклеотида (т.е. повышает эффективность, с которой олигонуклеотид может проникать в структуру), в то время как перекрывание с закрытой структурой повышает эффективность препятствования вторичной структуре РНК экзона. Было обнаружено, что длина частичной обратной комплементарности как с закрытой, так и с открытой структурой в значительной степени не ограничена. Авторы настоящего изобретения наблюдали высокую эффективность в случае олигонуклеотида с различной длиной обратной комплементарности в любой структуре. Термин "обратная комплементарность" используют в настоящем описании для обозначения участка нуклеиновых кислот, которые могут гибридизоваться с другим участком нуклеиновых кислот в физиологических условиях. Условия гибридизации определены в настоящем описании ниже. Таким образом, не является абсолютным требованием, чтобы все основания в области обратной комплементарности были способны спариваться с основаниями на противоположной цепи. Например, при конструировании олигонуклеотида может быть желательным включение, например, одного или нескольких остатков, которые не образуют пары оснований с основаниями на обратной комплементарной цепи. Несоответствия оснований могут быть до некоторой степени допустимыми, если в условиях в клетке участок нуклеотидов все еще способен гибридизоваться с обратно комплементарной частью. В контексте настоящего изобретения присутствие несоответствия в олигонуклеотиде по изобретению является предпочтительным, поскольку в одном варианте осуществления указанный олигонуклеотид является по меньшей мере на 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% обратно комплементарным области первого экзона и/или области второго экзона. Присутствие несоответствия в указанном олигонуклеотиде является предпочтительной характеристикой изобретения, поскольку указанный олигонуклеотид способен связываться с областью указанного первого и с областью указанного второго экзона, как определено в настоящем описании выше.

Другие преимущества обеспечения присутствия несоответствия оснований в антисмысловом олигонуклеотиде по изобретению определены в настоящем описании, и они сходны с преимуществами, обеспечиваемыми присутствием инозина (гипоксантина), и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований: избегание присутствия CpG, избегание или снижение потенциальной мультимеризации или агрегации, избегание квадруплексных структур, возможность конструирования олигонуклеотида с улучшенной кинетикой связывания РНК и/или термодинамическими свойствами.

Предпочтительно, обратная комплементарность олигонуклеотида области идентичности между указанными первым и/или вторым экзонами составляет от 45% до 65%, от 50% до 75%, но более предпочтительно от 65% до 100% или от 70% до 90%, или от 75% до 85%, или от 80% до 95%. Как правило, это обеспечивает 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или 11 несоответствий в олигонуклеотиде из 20 нуклеотидов. Таким образом, в олигонуклеотиде из 40 нуклеотидов может быть 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21 или 22 несоответствия оснований. Предпочтительно, в олигонуклеотиде из 40 нуклеотидов присутствует менее 14 несоответствий оснований. Количество несоответствий оснований является таким, что олигонуклеотид по изобретению все еще способен связываться с, гибридизоваться с, нацеливаться на область указанного первого экзона и на область указанного второго экзона, тем самым индуцируя пропускание по меньшей мере указанного первого и указанного второго экзонов и индуцируя продукцию транскрипта в рамке считывания, как объяснено в настоящем описании. Предпочтительно, продукции транскрипта в рамке считывания достигают по меньшей мере с 5% эффективностью при использовании по меньшей мере 100 нМ указанного олигонуклеотида для трансфекции соответствующей клеточной культуры in vitro, как объяснено в настоящем описании выше.

Следует отметить, что изобретение охватывает олигонуклеотид, который не обладает никаким несоответствием оснований с областью первого экзона и который может иметь 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21 или 22 несоответствия оснований с соответствующей областью второго экзона, как определено в настоящем описании. Однако изобретение также охватывает олигонуклеотид, который не имеет никакого несоответствия оснований с областью второго экзона и который может иметь 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21 или 22 несоответствия оснований с соответствующей областью первого экзона, как определено в настоящем описании. Наконец, изобретение охватывает олигонуклеотид, который может иметь 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21 или 22 несоответствия оснований с областью первого экзона и который может иметь 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 несоответствие оснований с соответствующей областью второго экзона, как определено в настоящем описании. Вновь, в рамках настоящего изобретения следует понимать, что количество несоответствий оснований в олигонуклеотиде по изобретению является таким, чтобы этот указанный олигонуклеотид все еще был способен связываться с, гибридизоваться с, нацеливаться на область указанного первого экзона и область указанного второго экзона, как пояснено в настоящем описании.

Олигонуклеотид по изобретению предпочтительно не пересекает пропуск в выравнивании области первого экзона и области второго экзона, как определено в настоящем описании. Выравнивание предпочтительно проводят с использованием сетевого инструмента EMBOSS Matcher, как пояснено в настоящем описании выше. Однако в конкретных случаях возможно, что олигонуклеотид по изобретению должен пересекать пропуск, как упомянуто в настоящем описании выше. Предпочтительно, указанный пропуск представляет собой только один пропуск. Указанный пропуск предпочтительно охватывает менее 3 нуклеотидов, наиболее предпочтительно только один нуклеотид. Количество и длина пропусков являются такими, что олигонуклеотид по изобретению все еще способен связываться с, гибридизоваться с, нацеливаться на область указанного первого экзона и область указанного второго экзона, тем самым индуцируя пропускание по меньшей мере указанного первого и указанного второго экзонов и индуцируя продукцию транскрипта в рамке считывания, как пояснено в настоящем описании.

Структуру (т.е. открытые и закрытые структуры) наилучшим образом анализируют в контексте пре-мРНК, где находится экзон. Такую структуру можно анализировать в истинной РНК. Однако в настоящее время возможно спрогнозировать вторичную структуру молекулы РНК (с наибольшими затратами энергии) достаточно тщательно с использованием моделирующих структуру программ. Неограничивающим примером подходящей программы является интернет-сервер Mfold (Zuker, M.).

Специалист в данной области способен спрогнозировать с приемлемой воспроизводимостью вероятную структуру экзона, учитывая нуклеотидную последовательность. Наилучшее прогнозирование осуществляют, когда программе предоставляют как последовательность указанного экзона, так и последовательности фланкирующих интронов. Как правило, не является необходимым моделирование структуры всей пре-мРНК.

Отжиг олигонуклеотида по изобретению может влиять на локальное сворачивание или 3D-структуру или конформацию РНК-мишени (т.е. область, охватывающую по меньшей мере первый и/или второй экзоны). Отличающаяся конформация может приводить к нарушению структуры, распознаваемой аппаратом сплайсинга. Однако, когда в первом и/или втором экзоне-мишени присутствуют потенциальные (скрытые) акцепторные и/или донорные последовательности сплайсинга, иногда образуется новая структура, определяющая отличающийся (нео-) экзон, т.е. с отличающимся 5'-концом, отличающимся 3'-концом или обоими из них. Этот тип активности находится в объеме настоящего изобретения, поскольку экзон-мишень исключается из мРНК. Присутствие нового экзона, содержащего часть указанного первого и/или второго экзона-мишени в мРНК, не изменяет тот факт, что экзон-мишень, как таковой, исключается. Включение нового экзона можно наблюдать в качестве побочного эффекта, который происходит только изредка. Существует две возможности, когда пропускание экзона используется для восстановления (части) открытой рамки считывания транскрипта, которая разрушается в результате мутации. Одной из них является то, что новый экзон является функциональным в отношении восстановления рамки считывания, в то время как в другом случае рамка считывания не восстанавливается. При выборе олигонуклеотида для восстановления открытой рамки считывания с помощью пропускания множества экзонов, безусловно, очевидно, что в этих условиях выбирают только те олигонуклеотиды, которые действительно приводят к пропусканию экзона, которое восстанавливает открытую рамку считывания данного транскрипта, с новым экзоном или без него.

Кроме того, в другом предпочтительном варианте осуществления предусматривается олигонуклеотид по изобретению, который способен связываться с областью первого экзона в пре-мРНК и с областью второго экзона в той же пре-мРНК, где указанная область указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона (предпочтительные области для экзонов дистрофина указаны в таблице 2 или таблице 6), где указанный олигонуклеотид способен индуцировать пропускание указанных первого и второго экзонов указанной пре-мРНК; что приводит к транскрипту, который находится в рамке считывания (для DMD, предпочтительно, как в таблице 1 или таблице 6). Указанный олигонуклеотид обеспечивает у указанного индивидуума функциональный или полуфункциональный белок, и указанный олигонуклеотид дополнительно содержит: последовательность, которая способна связываться с, нацеливаться на, гибридизоваться с, является обратно комплементарной для и/или способна ингибировать функцию одного или нескольких участков связывания серин-аргининового (SR) белка в РНК экзона из пре-мРНК.

В патентной заявке WO 2006/112705 авторы настоящего изобретения описали наличие корреляции между эффективностью внутреннего антисмыслового олигонуклеотида (AON) экзона в отношении индукции пропускания экзонов и присутствием предполагаемого участка связывания SR в заданном участке пре-мРНК указанного AON. Таким образом, в одном варианте осуществления получают указанный олигонуклеотид, как определено в настоящем описании, включая определение одного или нескольких (предполагаемых) участков связывания для белка SR в РНК указанного первого и/или указанного второго экзона и получение соответствующего олигонуклеотида, который способен связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарным указанной РНК и который по меньшей мере частично перекрывает указанный (предполагаемый) участок связывания. Термин "по меньшей мере частично перекрывает" определяют в настоящем описании как включающий перекрывание только одного нуклеотида участка связывания SR, а также множества нуклеотидов одного или нескольких указанных участков связывания, а также полное перекрывание одного или нескольких указанных участков связывания. Этот вариант осуществления, предпочтительно, дополнительно включает определение во вторичной структуре первого и/или второго экзона области, которая гибридизуется с другой частью указанного первого и/или второго экзона (закрытая структура), и области, которая не гибридизуется в указанной структуре (открытая структура), а затем получение олигонуклеотида, который по меньшей мере частично перекрывает один или несколько указанных (предполагаемых) участков связывания, и который перекрывает по меньшей мере часть указанной закрытой структуры и перекрывает по меньшей мере часть указанной открытой структуры, и который связывается с, нацеливается на, гибридизуется с и/или является обратно комплементарным первому и второму экзонам. Таким образом, авторы настоящего изобретения увеличивают вероятность получения олигонуклеотида, который способен препятствовать включению указанного первого и второго экзонов, и, если это применимо, полного участка экзонов между ними, из пре-мРНК в мРНК. Без связи с какой-либо теорией, в настоящее время полагают, что применение олигонуклеотида, направленного на участок связывания белка SR, приводит (по меньшей мере частично) к нарушению связывания белка SR с указанным участком связывания, что приводит к нарушенному или ухудшенному сплайсингу.

Предпочтительно, область первого экзона и/или область второго экзона в одной и той же пре-мРНК, с которой способен связываться олигонуклеотид по изобретению, содержит открытую/закрытую структуру и/или участок связывания белка SR, более предпочтительно указанная открытая/закрытая структура и указанный участок связывания белка SR частично перекрываются, и еще более предпочтительно указанная открытая/закрытая структура полностью перекрывает участок связывания белка SR, или участок связывания белка SR полностью перекрывает открытую/закрытую структуру. Это обеспечивает дальнейшее нарушение включения экзона.

Помимо консенсусных последовательностей участков связывания, множество (или даже все) экзонов содержат регулирующие сплайсинг последовательности, такие как последовательности энхансера сплайсинга экзонов (ESE), чтобы облегчить распознавание истинных участков сплайсинга сплайсингосомой (Cartegni L, et al. 2002; и Cartegni L, et al., 2003). Подгруппа факторов связывания, называемых белками SR, может связываться с этими ESE и привлекать другие факторы сплайсинга, такие как U1 и U2AF, в (слабо определенные) участки сплайсинга. Участки сплайсинга четырех из наиболее распространенных белков SR (SF2/ASF, SC35, SRp40 и SRp55) проанализированы детально (Cartegni L, et al. 2002 и Cartegni L, et al., 2003). Существует корреляция между эффективностью олигонуклеотида и наличием/отсутствием участка связывания SF2/ASF, SC35, SRp40 и SRp55 в части первого экзона, с которой связывается, гибридизуется и/или на которую нацеливается указанный олигонуклеотид. В предпочтительном варианте осуществления изобретение, таким образом, относится к олигонуклеотиду, который связывается с, гибридизуется с, нацеливается на и/или обратно комплементарен участку связывания для белка SR. Предпочтительно, указанный SR белок представляет собой SF2/ASF или SC35, SRp40 или SRp55. В одном варианте осуществления олигонуклеотид связывается с, гибридизуется с, нацеливается на и/или является обратно комплементарным участку связывания белка SF2/ASF, SC35, SRp40 или SRp55 в первом экзоне и участку связывания другого белка SF2/ASF, SC35, SRp40 или SRp55 во втором экзоне. В более предпочтительном варианте осуществления олигонуклеотид связывается с, гибридизуется с, нацеливается на и/или является обратно комплементарным участку связывания белка SF2/ASF, SC35, SRp40 или SRp55 в первом экзоне и участку связывания сходного белка SF2/ASF, SC35, SRp40 или SRp55 во втором экзоне.

В одном варианте осуществления у пациента обеспечивают функциональный или полуфункциональный белок с использованием олигонуклеотида, который способен связываться с, нацеливаться на регуляторную последовательность РНК, присутствующую в первом и/или втором экзоне, которая требуется для правильного сплайсинга указанного экзона(ов) в транскрипте. Для правильного сплайсинга экзонов в транскрипте требуется несколько цис-действующих последовательностей РНК. В частности, идентифицированы дополнительные элементы, такие как энхансеры сплайсинга экзонов (ESE), для регуляции специфического и эффективного сплайсинга конститутивных и альтернативных экзонов. С использованием соединения, содержащего олигонуклеотид, который связывается или способен связываться с одним из дополнительных элементов в указанном первом и/или втором экзоне(ах), их регуляторная функция нарушается так, что экзоны пропускаются. Таким образом, в одном предпочтительном варианте осуществления олигонуклеотид по изобретению способен связываться с областью первого экзона в пре-мРНК и областью второго экзона в той же пре-мРНК, где указанная область указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона, где указанный олигонуклеотид способен индуцировать пропускание указанных первого и второго экзона в указанной пре-мРНК; где указанная область указанного первого экзона и/или указанная область указанного второго экзона содержит энхансер сплайсинга экзонов (ESE), последовательность распознавания экзонов (ERS) и/или последовательность энхансера сплайсинга (SES), и/или где указанный олигонуклеотид способен связываться с, нацеливаться на, способен ингибировать и/или является обратно комплементарным указанному энхансеру сплайсинга экзонов (ESE), последовательности распознавания экзонов (ERS) и/или последовательности энхансера сплайсинга (SES).

Ниже описаны предпочтительные химические структуры олигонуклеотида по изобретению.

Олигонуклеотид широко известен как олигомер, который имеет базовые характеристики гибридизации, сходные с природными нуклеиновыми кислотами. Гибридизация определена в разделе, посвященном определениям, в конце описания изобретения. В настоящей заявке термины "олигонуклеотид" и "олигомер" используют взаимозаменяемо. Для получения указанного олигонуклеотида по изобретению можно использовать различные типы нуклеозидов. Олигонуклеотид может содержать по меньшей мере одну модифицированную межнуклеозидную связь и/или по меньшей мере одну модификацию сахара и/или по меньшей мере одну модификацию основания по сравнению с встречающимся в природе олигонуклеотидом на основе рибонуклеотида или дезоксирибонуклеотида.

"Модифицированная межнуклеозидная связь" указывает на присутствие модифицированной версии фосфодиэфира относительно встречающейся в природе РНК и ДНК. Примерами модификаций межнуклеозидной связи, которые совместимы с настоящим изобретением, являются фосфоротиоат (PS), хирально чистый фосфоротиоат, фосфородитиоат (PS2), фосфоноацетат (PACE), фосфоноацетамид (PACA), тиофосфоноацетат, тиофосфоноацетамид, фосфоротиоатное пролекарство, H-фосфонат, метилфосфонат, метилфосфонотиоат, метилфосфат, метилфосфоротиоат, этилфосфат, этилфосфоротиоат, боранофосфат, боранофосфоротиоат, метилборанофосфат, метилборанофосфоротиоат, метилборанофосфонат, метилборанофосфонотиоат и их производные. Другая модификация включает фосфорамидит, фосфорамидат, N3'→P5' фосфорамидат, фосфородиамидат, фосфортиоамидат, фосфоротиодиамидат, сульфамат, диметиленсульфоксид, сульфонат, метиленимино (MMI), оксалил- и тиоацетамидонуклеиновую кислоту (TANA); и их производные. В зависимости от длины, олигонуклеотид по изобретению может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38 или 39 модификаций основной цепи. Также изобретение охватывает внесение в указанный олигонуклеотид более одной отличающейся модификации основной цепи.

Также изобретение охватывает олигонуклеотид, который содержит межнуклеозидную связь, которая может отличаться с точки зрения атомов нуклеозидов, которые связаны друг с другом, по сравнению со встречающейся в природе межнуклеозидной связью. В этом отношении, олигонуклеотид по изобретению может содержать по меньшей мере одну межнуклеозидную связь, сконструированную как мономеры, связанные 3'-3', 5'-5', 2'-3', 2'-5', 2'-2'. Нумерация положений может отличаться для других химических структур, однако идея сохраняется в объеме изобретения.

В одном варианте осуществления олигонуклеотид по изобретению содержит по меньшей мере одну фосфоротиоатную модификацию. В более предпочтительном варианте осуществления олигонуклеотид по изобретению является полностью модифицированным посредством фосфоротиоата.

"Модификация сахара" указывает на присутствие модифицированной версии рибозильной части относительно рибозильной части во встречающихся в природе РНК и ДНК (т.е. фуранозильная часть), такой как бициклические сахара, тетрагидропираны, структуры морфолино, 2'-модифицированные сахара, 3'-модифицированные сахара, 4'-модифицированные сахара, 5'-модифицированные сахара и 4'-замещенные сахара. Примеры подходящих модификаций сахаров включают, но не ограничиваются ими, 2'-O-модифицированные нуклеотидные остатки РНК, такие как 2'-O-алкил или 2'-O-(замещенный)алкил, например 2'-O-метил, 2'-O-(2-цианоэтил), 2'-O-(2-метокси)этил (2'-MOE), 2'-O-(2-тиометил)этил, 2'-O-бутирил, 2'-O-пропаргил, 2'-O-аллил, 2'-O-(2-амино)пропил, 2'-O-(2-(диметиламино)пропил), 2'-O-(3-амино)пропил, 2'-O-(3-(диметиламино)пропил), 2'-O-(2-амино)этил, 2'-O-(3-гуанидино)пропил (как описано в патентной заявке WO 2013/061295, University of the Witwatersrand, включенной в настоящее описание в качестве ссылки), 2'-O-(2-(диметиламино)этил); 2'-O-(галогеналкокси)метил (Arai K. et al.), например, 2'-O-(2-хлорэтокси)метил (MCEM), 2'-O-(2,2-дихлорэтокси)метил (DCEM); 2'-O-алкоксикарбонил, например, 2'-O-[2-(метоксикарбонил)этил] (MOCE), 2'-O-[2-(N-метилкарбамоил)этил] (MCE), 2'-O-[2-(N,N-диметилкарбамоил)этил] (DMCE); 2'-O-[метиламинокарбонил]метил; 2'-азидо; 2'-амино и 2'-замещенный амино; 2'-галоген, например, 2'-F, FANA (2'-F арабинозилнуклеиновая кислота); карбо- и аза- модификации сахаров; 3'-O-алкил, например, 3'-O-метил, 3'-O-бутирил, 3'-O-пропаргил; 2',3'-дидезокси; и их производные.

Другая модификация сахара включает "мостиковые" или "бициклические" (BNA) модифицированные части сахаров нуклеиновой кислоты, такие, как встречаются, например, в закрытой нуклеиновой кислоте (LNA), ксило-LNA, α-L-LNA, β-D-LNA, cEt (2'-O,4'-C связанный этил) LNA, cMOEt (2'-O,4'-C связанный метоксиэтил) LNA, связанной этиленовым мостиком нуклеиновой кислоте (ENA), BNANC[N-Me] (как описано в Chem. Commun. 2007, 3765-3767 Kazuyuki Miyashita et al., которая включена в настоящее описание в качестве ссылки в полном объеме), CRN, как описано в патентной заявке WO 2013/036868 (Marina Biotech, включенной в настоящее описание в качестве ссылки в полном объеме); разомкнутой нуклеиновой кислоте (UNA) или других ациклических нуклеозидах, таких как описаны в патентной заявке США US 2013/0130378 (Alnylam Pharmaceuticals), включенной в настоящее описание в качестве ссылки в полном объеме; 5'-метил-замещенных BNA (как описано в патентной заявке США 13/530218, которая включена в качестве ссылки в полном объеме); циклогексенилнуклеиновой кислоте (CeNA), алтриолнуклеиновой кислоте (ANA), гекситолнуклеиновой кислоте (HNA), фторированной HNA (F-HNA), пиранозил-РНК (p-РНК), 3'-дезоксипиранозил-ДНК (p-ДНК); или других модифицированных частях сахаров, таких как морфолино (PMO), катионный морфолино (PMOPlus), PMO-X; трициклоДНК; трицикло-PS-ДНК; и их производные. Производные BNA описаны, например, в WO 2011/097641, которая включена в настоящее описание в качестве ссылки в полном объеме. Примеры PMO-X описаны в WO 2011150408, которая включена в настоящее описание в качестве ссылки в полном объеме. В зависимости от длины, олигонуклеотид по изобретению может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40 модификаций сахаров. Также изобретение охватывает внесение более одной отличающейся модификации сахаров в указанный олигонуклеотид.

В одном варианте осуществления олигонуклеотид по изобретению содержит по меньшей мере одну модификацию сахара, выбранную из 2'-O-метила, 2'-O-(2-метокси)этила, 2'-F, морфолино, мостикового нуклеотида или BNA, или олигонуклеотид содержит как мостиковые нуклеотиды, так и 2'-дезоксинуклеотиды (смешанные BNA/ДНК-меры). Было показано, что олигонуклеотиды, содержащие 2'-фтор (2-'F) нуклеотид, способны привлекать связывающий энхансер интерлейкина фактор 2 и 3 (ILF2/3) и тем самым способны индуцировать пропускание экзонов в пре-мРНК-мишени (Rigo F, et al., WO 2011/097614).

В другом варианте осуществления олигонуклеотид, как определено в настоящем описании, содержит или состоит из LNA или ее производного. Более предпочтительно, олигонуклеотид по изобретению модифицирован по его всей длине модификацией сахара, выбранной из 2'-O-метила, 2'-O-(2-метокси)этила, морфолино, мостиковой нуклеиновой кислоты (BNA) или смешанного BNA/ДНК-мера. В более предпочтительном варианте осуществления олигонуклеотид по изобретению является полностью 2'-O-метил-модифицированным.

В предпочтительном варианте осуществления олигонуклеотид по изобретению содержит по меньшей мере одну модификацию сахара и по меньшей мере одну модифицированную межнуклеозидную связь. Такие модификации включают пептидно-нуклеиновую кислоту (PNA), модифицированную борным кластером PNA, окси-пептидно-нуклеиновую кислоту на основе пирролидина (POPNA), нуклеиновую кислоту на основе гликоля или глицерина (GNA), нуклеиновую кислоту на основе треозы (TNA), ациклическую нуклеиновую кислоту на основе треонинола (aTNA), олигонуклеотиды на основе морфолино (PMO, PPMO, PMO-X), катионные олигомеры на основе морфолино (PMOPlus, PMO-X), олигонуклеотиды с объединенными основаниями и остовами (ONIB), пирролидин-амидные олигонуклеотиды (POM); и их производные. В предпочтительном варианте осуществления олигонуклеотид по изобретению содержит остов пептидно-нуклеиновой кислоты и/или остов морфолинофосфородиамидата или их производное. В более предпочтительном варианте осуществления олигонуклеотид по изобретению является 2'-O-метилфосфоротиоат-модифицированным, т.е. содержит по меньшей мере одну 2'-O-метилфосфоротиоатную модификацию, предпочтительно олигонуклеотид по изобретению является полностью 2'-O-метилфосфоротиоат-модифицированным. Предпочтительно, 2'-O-метилфосфоротиоат-модифицированный олигонуклеотид или полностью 2'-O-метилфосфоротиоат-модифицированный олигонуклеотид представляет собой РНК-олигонуклеотид.

Термин "модификация основания" или "модифицированное основание", как определено в настоящем описании, относится к модификации встречающегося в природе основания в РНК и/или ДНК (т.е. пиримидинового или пуринового основания) или к синтезированным de novo основаниям. Такое синтезированное de novo основание может рассматриваться как "модифицированное" по сравнению с существующим основанием.

В дополнение к модификациям, описанным выше, олигонуклеотид по изобретению может содержать дополнительные модификации, такие как различные типы нуклеотидных остатков нуклеиновой кислоты или нуклеотидов, как описано ниже. Для получения олигонуклеотида по изобретению можно использовать различные типы нуклеотидных остатков нуклеиновой кислоты. Указанный олигонуклеотид может иметь по меньшей мере одну модификацию основной цепи и/или сахара и/или по меньшей мере одну модификацию основания по сравнению с олигонуклеотидом на основе РНК или ДНК.

Олигонуклеотид может содержать природные основания пурины (аденин, гуанин) или пиримидины (цитозин, тимин, урацил) и/или модифицированные основания, как определено ниже. В контексте изобретения урацил может быть заменен тимином.

Модификация оснований включает модифицированную версию природных пуриновых и пиримидиновых оснований (например, аденин, урацил, гуанин, цитозин и тимин), таких как гипоксантин, оротовая кислота, агматидин, лизидин, псевдоурацил, псевдотимин, N1-метилпсевдоурацил, 2-тиопиримидин (например, 2-тиоурацил, 2-тиотимин), 2,6-диаминопурин, G-зажим и его производные, 5-замещенный пиримидин (например, 5-галогенурацил, 5-метилурацил, 5-метилцитозин, 5-пропинилурацил, 5-пропинилцитозин, 5-аминометилурацил, 5-гидроксиметилурацил, 5-аминометилцитозин, 5-гидроксиметилцитозин, Super T), 5-октилпиримидин, 5-тиофенпиримидин, 5-октин-1-илпиримидин, 5-этинилпиримидин, 5-(пиридиламид), 5-изобутил, 5-фенил, как описано в патентной заявке US 2013/0131141 (RXi), включенной в настоящее описание в качестве ссылки в полном объеме; 7-деазагуанин, 7-деазааденин, 7-аза-2,6-диаминопурин, 8-аза-7-деазагуанин, 8-аза-7-деазааденин, 8-аза-7-деаза-2,6-диаминопурин, Super G, Super A и N4-этилцитозин, или их производные; N2-циклопентилгуанин (cPent-G), N2-циклопентил-2-аминопурин (cPent-AP) и N2-пропил-2-аминопурин (Pr-AP), или их производные; и вырожденные или универсальные основания, такие как 2,6-дифтортолуол, или отсутствующие основания, такие как абазические участки (например, 1-дезоксирибоза, 1,2-дидезоксирибоза, 1-дезокси-2-O-метилрибоза; или производные пирролидина, в которых кислород кольца заменен азотом (азарибоза)). Примеры производных Super A, Super G и Super T могут быть найдены в патенте США 6683173 (Epoch Biosciences), который включен в настоящее описание в качестве ссылки. Было показано, что cPent-G, cPent-AP и Pr-AP снижает иммуностимулирующие эффекты при включении в миРНК (siRNA) (Peacock H. et al.), и сходные признаки были показаны для псевдоурацила и N1-метилпсевдоурацила (патентная заявка США 2013/0123481, modeRNA Therapeutics, включенная в настоящее описание качестве ссылки в полном объеме).

"Тимин" и "5-метилурацил" могут использоваться в настоящем документе взаимозаменяемо. Аналогично, "2,6-диаминопурин" идентичен "2-аминоаденину", и эти термины могут использоваться в настоящем документе взаимозаменяемо.

В предпочтительном варианте осуществления олигонуклеотид по изобретению содержит по меньшей мере один 5-метилцитозин и/или по меньшей мере один 5-метилурацил и/или по меньшей мере одно 2,6-диаминопуриновое основание, что следует понимать как то, что по меньшей мере одно из цитозиновых нуклеиновых оснований указанного олигонуклеотида модифицировано путем замены протона в положении 5 кольца пиримидина метильной группой (т.е. 5-метилцитозином), и/или что по меньшей мере одно из урацильных нуклеиновых оснований указанного олигонуклеотида модифицировано путем замены протона в положении 5 кольца пиримидина метильной группой (т.е. 5-метилурацил), и/или что по меньшей мере одно из адениновых нуклеиновых оснований указанного олигонуклеотида модифицировано путем замены протона в положении 2 аминогруппой (т.е. 2,6-диаминопурин), соответственно. В контексте изобретения выражение "замена протона метильной группой в положении 5 кольца пиримидина" может быть заменено выражением "замена пиримидина 5-метилпиримидином", причем пиримидин обозначает только урацил, только цитозин или оба из них. Аналогично, в контексте изобретения выражение "замена протона аминогруппой в положении 2 аденина" может быть заменено выражением "замена аденина 2,6-диаминопурином". Если указанный олигонуклеотид содержит 1, 2, 3, 4, 5, 6, 7, 8, 9 или более остатков цитозина, урацила и/или аденина, по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или более остатков цитозина, урацила и/или аденина, соответственно, могут быть модифицированы таким путем. В предпочтительном варианте осуществления все остатки цитозина, все остатки урацила и/или все остатки аденина модифицированы таким путем или заменены 5-метилцитозином, 5-метилурацилом и/или 2,6-диаминопурином, соответственно.

Было обнаружено, что присутствие 5-метилцитозина, 5-метилурацила и/или 2,6-диаминопурина в олигонуклеотиде по изобретению имеет положительный эффект по меньшей мере на один из параметров или улучшение по меньшей мере одного из параметров указанного олигонуклеотида. В этом контексте параметры могут включать: аффинность и/или кинетику связывания, активность сайленсинга, биостабильность, (внутритканевое) распределение, клеточный захват и/или транспорт, и/или иммуногенность указанного олигонуклеотида, как объяснено ниже.

Поскольку известно, что несколько модификаций, упомянутых выше, увеличивает величину Tm и, таким образом, усиливает связывание определенного нуклеотида с его аналогом на его мРНК-мишени, эти модификации могут быть исследованы в отношении усиления связывания олигонуклеотида по изобретению как с областью первого экзона, так и с областью второго экзона, в контексте изобретения. Поскольку последовательности олигонуклеотида по изобретению могут не быть на 100% обратно комплементарными данной области первого экзона и/или второго экзона, увеличивающие Tm модификации, такие как мостиковый нуклеотид или BNA (такой как LNA) или модификация основания, выбранная из 5-метилпиримидинов и/или 2,6-диаминопурина, предпочтительно могут быть осуществлены в нуклеотидном положении, которое обратно комплементарно указанной первой и/или указанной второй области указанных экзонов.

Аффинность связывания и/или кинетика связывания или гибридизации зависят от термодинамических свойств AON. Они по меньшей мере частично определяются температурой плавления указанного олигонуклеотида (Tm; вычисляемая, например, с помощью калькулятора свойств олигонуклеотидов (http://www.unc.edu/~cail/biotool/oligo/index.html или http://eu.idtdna.com/analyzer/Applications/OligoAnalyzer/) для одноцепочечной РНК с использованием базовой Tm и модели ближайшего соседа) и/или свободной энергией комплекса олигонуклеотида и экзона-мишени (с использованием RNA structure версии 4.5 или РНК mfold версии 3.5). Если Tm увеличивается, активность пропускания экзона, как правило, возрастает, однако ожидается, что, когда Tm является слишком высокой, AON станет менее специфичным к последовательности. Приемлемая Tm и свободная энергия зависят от последовательности олигонуклеотида. Таким образом, трудно привести предпочтительные диапазоны для каждого из этих параметров.

Активность олигонуклеотида по изобретению предпочтительно определяют следующим образом:

- смягчение одного или нескольких симптома(ов) заболевания, ассоциированного с мутацией, присутствующей в первом и/или во втором экзоне, и/или с мутацией, присутствующей в участке, начинающемся в указанном первом экзоне и оканчивающемся в указанном втором экзоне, предпочтительно смягчение одного или нескольких симптома(ов) DMD или BMD; и/или

- смягчение одной или нескольких характеристик клетки от пациента, предпочтительно мышечной клетки от пациента; и/или

- обеспечение у указанного индивидуума функционального или полуфункционального белка, предпочтительно функционального или полуфункционального белка дистрофина; и/или

- по меньшей мере частичное снижение продукции аберрантного белка у указанного индивидуума, предпочтительно по меньшей мере частичное снижение продукции аберрантного белка дистрофина у указанного индивидуума. Каждый из этих признаков и анализов для их оценки определен в настоящем описании ниже.

Ожидается, что предпочтительный олигонуклеотид по изобретению, содержащий 5-метилцитозин и/или 5-метилурацил и/или 2,6-диаминопуриновое основание, будет проявлять увеличенную активность по сравнению с соответствующей активностью олигонуклеотида без какого-либо 5-метилцитозина, без какого-либо 5-метилурацила и без какого-либо 2,6-диаминопуринового основания. Это различие в активности может составлять по меньшей мере 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100%. Биораспределение и биостабильность предпочтительно по меньшей мере частично определяются валидированным анализом лигирования при гибридизации, взятого из Yu et al., 2002. В одном варианте осуществления образцы плазмы или образцы гомогенизированной ткани инкубируют с конкретным улавливающим олигонуклеотидным зондом. После разделения, DIG-меченный олигонуклеотид лигируют с комплексом и проводят детекцию с использованием связанной с антителом против DIG пероксидазой. Некомпартментный анализ фармакокинетики проводят с использованием пакета программ WINNONLIN (модель 200, версия 5.2, Pharsight, Mountainview, CA). Проводят мониторинг уровней AON (мкг) на мл плазмы или мг ткани с течением времени для оценки площади под кривой (AUC), максимальной концентрации (Cmax), времени до достижения максимальной концентрации (Tmax), терминального времени полужизни и латентного периода всасывания (tlag). Такой предпочтительный анализ описан в экспериментальной части.

Олигонуклеотид может стимулировать врожденный иммунный ответ путем активации Toll-подобных рецепторов (TLR), включая TLR9 и TLR7 (Krieg A.M., et al., 1995). Активация TLR9, как правило, происходит вследствие присутствия неметилированных последовательностей CG, присутствующих в олигодезоксинуклеотидах (ODN), посредством имитации бактериальной ДНК, которая активирует врожденную иммунную систему посредством опосредуемого TLR9 высвобождения цитокинов. Однако 2'-O-метил-модификация может значительно снижать такой возможный эффект. Описано, что TLR7 распознает урациловые повторы в РНК (Diebold S.S., et al., 2006).

Активация TLR9 и TLR7 приводит к набору скоординированных иммунных ответов, которые включают врожденный иммунитет (макрофаги, дендритные клетки (DC) и NK-клетки) (Krieg A.M., et al., 1995; Krieg A.M., et al. 2000). В этот процесс вовлечено несколько хемокинов и цитокинов, таких как IP-10, TNFα, IL-6, MCP-1 и IFNα (Wagner H., et al., 1999; Popovic P.J., et al., 2006). Воспалительные цитокины привлекают дополнительные защитные клетки из крови, такие как T- и B-клетки. Уровни этих цитокинов можно исследовать с помощью исследования in vitro. В кратком изложении, цельную кровь человека инкубируют с возрастающими концентрациями олигонуклеотидов, после чего уровни цитокинов определяют с помощью стандартных коммерчески доступных наборов для ELISA. Снижение иммуногенности предпочтительно соответствует поддающемуся обнаружению снижению концентрации по меньшей мере одного из цитокинов, упомянутых выше, при сравнении с концентрацией соответствующего цитокина в анализе в клетке, обработанной олигонуклеотидом, содержащим по меньшей мере один 5-метилцитозин и/или 5-метилурацил и/или 2,6-диаминопурин, по сравнению с клеткой, обработанной соответствующим олигонуклеотидом, не имеющим 5-метилцитозинов, 5-метилурацилов или 2,6-диаминопуринов.

Таким образом, предпочтительный олигонуклеотид по изобретению имеет улучшенный параметр, такой как приемлемая или сниженная иммуногенность и/или лучшее биораспределение и/или приемлемая или улучшенная кинетика связывания РНК и/или термодинамические свойства по сравнению с соответствующим олигонуклеотидом без 5-метилцитозина, без 5-метилурацила и без 2,6-диаминопурина. Каждый из этих параметров можно оценивать с использованием анализов, известных специалисту в данной области.

Предпочтительный олигонуклеотид по изобретению содержит или состоит из молекулы РНК или модифицированной молекулы РНК. В предпочтительном варианте осуществления олигонуклеотид является одноцепочечным. Однако квалифицированному специалисту будет понятно, что одноцепочечный олигонуклеотид может образовывать внутреннюю двухцепочечную структуру. Однако этот олигонуклеотид, тем не менее, называют одноцепочечным олигонуклеотидом в контексте настоящего изобретения. Одноцепочечный олигонуклеотид имеет несколько преимуществ по сравнению с двухцепочечным олигонуклеотидом миРНК: (i) ожидается, что его синтез будет более простым, чем синтез двух комплементарных цепей миРНК; (ii) существует более широкий диапазон химических модификаций, возможных для повышения захвата в клетки, более высокой (физиологической) стабильности и снижения потенциальных общих неблагоприятных эффектов; (iii) миРНК имеют более высокий потенциал для неспецифических эффектов (включая гены вне мишени) и улучшенную фармакологию (например, возможен меньший контроль эффективности и селективности схемы лечения или дозы); и (iv) миРНК с меньшей вероятностью будут действовать в ядре и не могут быть направлены против интронов.

В другом варианте осуществления олигонуклеотид по изобретению содержит абазический участок или абазический мономер. В контексте изобретения такой мономер может называться абазическим участком или абазическим мономером. Абазический мономер представляет собой нуклеотидный остаток или структурный элемент, который лишен нуклеинового основания, по сравнению с соответствующим нуклеотидным остатком, содержащим нуклеиновое основание. В рамках изобретения абазический мономер, таким образом, представляет собой часть структурного элемента олигонуклеотида, но лишенную нуклеинового основания. Такой абазический мономер может присутствовать, или может быть связан, или может быть присоединен, или может быть конъюгирован со свободным концом олигонуклеотида.

В более предпочтительном варианте осуществления олигонуклеотид по изобретению содержит 1-10 или более абазических мономеров. Таким образом, в олигонуклеотиде по изобретению может находиться 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более абазических мономеров.

Абазический мономер может представлять собой любой тип, известный и понятный квалифицированному специалисту, неограничивающие примеры которых представлены ниже:

В рамках настоящего изобретения, R1 и R2 независимо представляют собой H, олигонуклеотид или другой абазический участок(ки) при условии, что не оба из R1 и R2 представляют собой H и R1 и R2 не оба являются олигонуклеотидами. Абазический мономер(ы) может быть связан с любым или с обоими концами олигонуклеотида, как указано выше. Следует отметить, что олигонуклеотид, связанный с одним или двумя абазическим участком(ами) или абазическим мономером(ами), может содержать менее 10 нуклеотидов. В этом отношении олигонуклеотид по изобретению может содержать по меньшей мере 10 нуклеотидов, необязательно включающих один или несколько абазических участков или абазических мономеров на одном или обоих концах. Другие примеры абазических участков, которые охватываются изобретением, описаны в патентной заявке США 2013/013378 (Alnylam Pharmaceuticals), включенной в настоящее описание в качестве ссылки в полном объеме.

В зависимости от длины олигонуклеотид по изобретению может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40 модификаций оснований. Также изобретение охватывает внесение более одной определенной модификации оснований в указанный олигонуклеотид.

Таким образом, в одном варианте осуществления олигонуклеотид по изобретению содержит:

(a) по меньшей мере одну модификацию основания, выбранную из 2-тиоурацила, 2-тиотимина, 5-метилцитозина, 5-метилурацила, тимина, 2,6-диаминопурина; и/или

(b) по меньшей мере одну модификацию сахара, выбранную из 2'-O-метила, 2'-O-(2-метокси)этила, 2'-O-дезокси (ДНК), 2'-F, морфолино, мостикового нуклеотида или BNA, или олигонуклеотид содержит как мостиковые нуклеотиды, так и 2'-дезокси-модифицированные нуклеотиды (смешанные BNA/ДНК-меры); и/или

(c) по меньшей мере одну модификацию основной цепи, выбранную из фосфоротиоата или фосфородиамидата.

В другом варианте осуществления олигонуклеотид по изобретению содержит:

(a) по меньшей мере одну модификацию оснований, выбранную из 5-метилпиримидина и 2,6-диаминопурина; и/или

(b) по меньшей мере одну модификацию сахара, которая представляет собой 2'-O-метил; и/или

(c) по меньшей мере одну модификацию основной цепи, которая представляет собой фосфоротиоат.

В одном варианте осуществления олигонуклеотид по изобретению содержит по меньшей мере одну модификацию по сравнению со встречающимся в природе олигонуклеотидом на основе рибонуклеотида или дезоксирибонуклеотида, более предпочтительно

(a) по меньшей мере одну модификацию основания, предпочтительно выбранную из 2-тиоурацила, 2-тиотимина, 5-метилцитозина, 5-метилурацила, тимина, 2,6-диаминопурина, более предпочтительно, выбранную из 5-метилпиримидина и 2,6-диаминопурина; и/или

(b) по меньшей мере одну модификацию сахара, предпочтительно выбранную из 2'-O-метила, 2'-O-(2-метокси)этила, 2'-O-дезокси (ДНК), 2'-F, морфолино, мостикового нуклеотида или BNA, или олигонуклеотид содержит как мостиковые нуклеотиды, так и 2'-дезокси-модифицированные нуклеотиды (смешанные BNA/ДНК-меры), более предпочтительно модификация сахара представляет собой 2'-O-метил; и/или

(c) по меньшей мере одну модификацию основной цепи, предпочтительно выбранную из фосфоротиоата или фосфородиамидата, более предпочтительно модификация основной цепи представляет собой фосфоротиоат.

Таким образом, олигонуклеотид согласно этому варианту осуществления изобретения содержит модификацию основания (a) и отсутствие модификации сахара (b) и отсутствие модификации основной цепи (c). Другой предпочтительный олигонуклеотид согласно этому аспекту изобретения включает модификацию сахара (b) и отсутствие модификации основания (a) и отсутствие модификации основной цепи (c). Другой предпочтительный олигонуклеотид согласно этому аспекту изобретения содержит модификацию основной цепи (c) и отсутствие модификации основания (a) и отсутствие модификации сахара (b). Также предполагается, что настоящее изобретение охватывает олигонуклеотиды, не имеющие ни одной из упомянутых выше модификаций, а также олигонуклеотиды, содержащие две, т.е. (a) и (b), (a) и (c) и/или (b) и (c), или все три из модификаций (a), (b) и (c), как определено выше.

В предпочтительном варианте осуществления олигонуклеотид по изобретению модифицирован по всей его длине одной или несколькими одинаковыми модификациями, выбранными из (a) одной из модификаций оснований; и/или (b) одной из модификаций сахара; и/или (c) одной из модификаций основной цепи.

С появлением технологии имитации нуклеиновых кислот стало возможным получать молекулы, которые обладают сходными, предпочтительно одинаковыми по типу характеристиками гибридизации, но не обязательно сходными количественными характеристиками, с самой нуклеиновой кислотой. Такие функциональные эквиваленты, безусловно, также являются пригодными для применения в рамках изобретения.

В другом предпочтительном варианте осуществления олигонуклеотид содержит инозин, гипоксантин, универсальное основание, вырожденное основание и/или нуклеозид или нуклеотид, содержащие основание, способное образовывать качающуюся пару оснований или ее функциональный эквивалент. Применение инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, является высоко перспективным, как пояснено ниже. Инозин, например, является известным модифицированным основанием, которое может образовывать пару с тремя основаниями: урацил, аденин и цитозин. Инозин представляет собой нуклеозид, который образуется, когда гипоксантин связан с кольцом рибозы (также известным как рибофураноза) через β [бета]-N9-гликозидную связь. Инозин (I) обычно встречается в тРНК, и он необходим для надлежащей трансляции генетического кода в качающихся парах оснований. Качающаяся пара оснований может существовать между G и U, или между I с одной стороны и U, A или C с другой стороны. Это является фундаментальным при образовании вторичной структуры РНК. Ее термодинамическая стабильность сравнима с термодинамической стабильностью пары оснований Уотсона-Крика. Генетический код исправляет несоответствия в количестве аминокислот (20) для триплетных кодонов (64), с использованием модифицированных пар оснований в первом основании антикодона.

Первое преимущество использования инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, позволяет конструировать олигонуклеотид, который способен связываться с областью первого экзона из пре-мРНК и способен связываться с областью второго экзона в той же пре-мРНК, где указанная область из указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона. Иными словами, присутствие инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, позволяет связывание указанного олигонуклеотида с областью первого экзона и с областью второго экзона указанной пре-мРНК.

Второе преимущество использования инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, позволяет конструировать олигонуклеотид, который охватывает однонуклеотидный полиморфизм (SNP), без опасения, что полиморфизм нарушит эффективность отжига олигонуклеотида. Таким образом, в рамках изобретения использование такого основания позволяет конструирование олигонуклеотида, который можно использовать для индивидуума, имеющего SNP в участке пре-мРНК, на который нацелен олигонуклеотид по изобретению.

Третье преимущество использования инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, представляет собой случай, когда указанный олигонуклеотид в норме содержит CpG, если он сконструирован как являющийся комплементарным части первого экзона пре-мРНК, как определено в настоящем описании. Присутствие CpG в олигонуклеотиде обычно ассоциировано с увеличенной иммуногенностью указанного олигонуклеотида (Dorn A. and Kippenberger S.). Эта увеличенная иммуногенность является нежелательной, поскольку она может индуцировать разрушение мышечных волокон. Ожидается, что замена гуанина инозином в одном, двух или более CpG в указанном олигонуклеотиде обеспечит олигонуклеотид со сниженным и/или приемлемым уровнем иммуногенности. Иммуногенность можно оценивать в модели на животных путем оценки присутствия клеток CD4+ и/или CD8+ и/или инфильтрации воспалительных мононуклеоцитов в биоптате мышц указанного животного. Иммуногенность также можно оценивать в крови животного или человека, подвергаемого лечению олигонуклеотидом по изобретению, путем обнаружения присутствия нейтрализующего антитела и/или антитела, распознающего указанный олигонуклеотид, с использованием стандартного иммуноанализа, известного квалифицированному специалисту. Увеличение иммуногенности предпочтительно соответствует поддающемуся обнаружению увеличению по меньшей мере одного из этих типов клеток по сравнению с количеством каждого типа клеток в соответствующем биоптате мышц животного до обработки или лечения соответствующим олигонуклеотидом, имеющим по меньшей мере один инозин (гипоксантин) и/или универсальное основание и/или вырожденное основание и/или нуклеотид, содержащий основание, способное образовывать качающуюся пару оснований. Альтернативно, увеличение иммуногенности можно оценивать путем обнаружения присутствия или увеличения количества нейтрализующего антитела или антитела, распознающего указанный олигонуклеотид, с использованием стандартного иммуноанализа. Снижение иммуногенности предпочтительно соответствует поддающемуся обнаружению снижению по меньшей мере одного из этих типов клеток по сравнению с количеством соответствующего типа клеток в соответствующем биоптате мышц животного до лечения или после лечения соответствующим олигонуклеотидом, не имеющим инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований. Альтернативно, снижение иммуногенности можно оценивать по отсутствию или снижению количества указанного соединения и/или нейтрализующих антител с использованием стандартного иммуноанализа.

Четвертым преимуществом использования инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, является избегание или снижение потенциальной мультимеризации или агрегации олигонуклеотидов. Например, известно, что олигонуклеотид, содержащий мотив G-квартет, имеет тенденцию к образованию квадруплекса, мультимера или агрегата, образованного хугстиновским спариванием оснований четырех одноцепочечных олигонуклеотидов (Cheng A.J. и Van Dyke M.W.), что, безусловно, нежелательно: ожидается, что в результате этого эффективность олигонуклеотида снизится. Мультимеризацию или агрегацию предпочтительно оценивают стандартными способами полиакриламидного неденатурирующего гель-электрофореза, известными квалифицированному специалисту. В предпочтительном варианте осуществления менее 20% или 15%, 10%, 7%, 5% или менее от общего количества олигонуклеотида по изобретению обладает способностью к мультимеризации или агрегации, оцениваемой с использованием анализа, упомянутого выше.

Пятым преимуществом использования инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, таким образом, также является избегание квадруплексных структур, которая ассоциирована с антитромботической активностью (Macaya R.F., et al.), а также со связыванием с и ингибированием фагоцитарного рецептора макрофагов (Suzuki K., et al.).

Шестым преимуществом использования инозина (гипоксантина) и/или универсального основания и/или вырожденного основания и/или нуклеотида, содержащего основание, способное образовывать качающуюся пару оснований, в олигонуклеотиде по изобретению, является возможность конструирования олигонуклеотида с улучшенной кинетикой связывания РНК и/или термодинамическими свойствами. Кинетика связывания РНК и/или термодинамические свойства по меньшей мере частично определяются температурой плавления олигонуклеотида (Tm; вычисляемая с помощью калькулятора свойств олигонуклеотидов (http://www.unc.edu/~cail/biotool/oligo/index.html) для одноцепочечной РНК с использованием базовой Tm и модели ближайшего соседа) и/или свободной энергией комплекса AON и экзона-мишени (с использованием RNA structure версии 4.5). Если Tm является чрезмерно высокой, ожидается, что олигонуклеотид будет менее специфичным. Приемлемая Tm и свободная энергия зависят от последовательности олигонуклеотида. Таким образом, трудно привести предпочтительные диапазоны для каждого из этих параметров. Приемлемая Tm может находиться в диапазоне от 35 до 85°C, и приемлемая свободная энергия может находиться в диапазоне от 15 до 45 ккал/моль.

В зависимости от длины, олигонуклеотид по настоящему изобретению может содержать по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 остатков инозина (гипоксантина) и/или универсальных оснований и/или вырожденных оснований и/или нуклеотидов, содержащих основание, способное образовывать качающуюся пару оснований, или их функциональные эквиваленты.

Предпочтительно, указанный олигонуклеотид по изобретению содержит РНК, поскольку дуплексы РНК/РНК являются высокостабильными. Является предпочтительным, чтобы РНК-олигонуклеотид содержал модификацию, обеспечивающую РНК с дополнительным свойством, например, устойчивостью к эндонуклеазам, экзонуклеазам и РНК-азе H, дополнительной прочностью гибридизации, увеличенной стабильностью (например, в жидкостях организма), увеличенной или сниженной пластичностью, сниженной токсичностью, увеличенным внутриклеточным транспортом, тканевой специфичностью и т.д. Предпочтительные модификации описаны выше.

Таким образом, один вариант осуществления относится к олигонуклеотиду, который содержит по меньшей мере одну модификацию. Предпочтительный модифицированный олигонуклеотид является полностью 2'-O-метил-модифицированным. В одном варианте осуществления изобретения олигонуклеотид содержит или состоит из гибридного олигонуклеотида, содержащего модификацию 2'-O-метил-фосфоротиоатным олигорибонуклеотидом и модификацию мостиковой нуклеиновой кислотой (BNA, как проиллюстрировано выше). В другом варианте осуществления изобретения олигонуклеотид содержит или состоит из гибридного олигонуклеотида, содержащего модификацию 2'-O-метоксиэтилфосфоротиоатом и мостиковую нуклеиновую кислоту (BNA, как проиллюстрировано выше). В другом варианте осуществления изобретения олигонуклеотид содержит или состоит из гибридного олигонуклеотида, содержащего модификацию мостиковой нуклеиновой кислотой (BNA, как проиллюстрировано выше) и модификацию олигодезоксирибонуклеотидом. Эта конкретная комбинация обладает лучшей специфичностью последовательности по сравнению с эквивалентом, состоящим только из мостиковой нуклеиновой кислоты, и обладает увеличенной эффективностью по сравнению с олигонуклеотидом, состоящим из модификации 2'-O-метилфосфоротиоатным олиго(дезокси)рибонуклеотидом.

Соединение, как описано в рамках изобретения, предпочтительно может обладать ионогенными группами. Ионогенные группы могут представлять собой основания или кислоты, и они могут быть заряженными или нейтральными. Ионогенные группы могут присутствовать в качестве пары ионов с соответствующим противоионом, который имеет противоположный заряд(ы). Примерами катионных противоионов являются натрий, калий, цезий, Tris, литий, кальций, магний, триалкиламмоний, триэтиламмоний и тетраалкиламмоний. Примерами анионных противоионов являются хлорид, бромид, йодид, лактат, мезилат, ацетат, трифторацетат, дихлорацетат и цитрат. Примеры противоионов описаны [например, Kumar L, которая включена в настоящее описание в качестве ссылки в полном объеме]. Примеры применения двух- или трехвалентных противоионов, особенно Ca2+, описаны в качестве дополнительных положительных характеристик к определенным олигонуклеотидам в патентной заявке США 2012046348 (Replicor), которая включена в качестве ссылки в полном объеме. Предпочтительные двухвалентные или трехвалентные противоионы выбирают из следующего перечня или группы: кальций, магний, кобальт, железо, марганец, барий, никель, медь и цинк. Предпочтительным двухвалентным противоионом является кальций. Таким образом, настоящее изобретение охватывает приготовление, получение и применение композиции, содержащей олигонуклеотид по изобретению и любой другой противоион, определенный выше, предпочтительно кальций.

Такой способ получения указанной композиции, содержащей указанный олигонуклеотид и указанный противоион, предпочтительно кальций, может быть следующим: олигонуклеотид по изобретению можно растворять в фармацевтически приемлемом водном эксципиенте, и постепенно к растворенному олигонуклеотиду можно добавлять раствор, содержащий указанный противоион, чтобы хелатный комплекс олигонуклеотида оставался растворимым.

Таким образом, в предпочтительном варианте осуществления олигонуклеотид по изобретению приводят в контакт с композицией, содержащей такой противоион, предпочтительно Ca2+, для формирования хелатного комплекса олигонуклеотида, содержащего два или более идентичных олигонуклеотидов, связанных таким противоионом, как определено в настоящем описании. Композиция, содержащая хелатный комплекс олигонуклеотида, содержащий два или более идентичных олигонуклеотида, связанных противоионом, предпочтительно кальцием, таким образом, охватывается настоящим изобретением.

Способ конструирования олигонуклеотида

Таким образом, в следующем аспекте изобретения предусматривается способ конструирования олигонуклеотида, где указанный способ приводит к олигонуклеотиду, как определено выше.

Этот способ включает следующие стадии:

(a) идентификация комбинации в рамке считывания первого и второго экзона в одной и той же пре-мРНК, где область указанного второго экзона обладает по меньшей мере 50% идентичностью с областью указанного первого экзона;

(b) конструирование олигонуклеотида, который способен связываться с указанной областью указанного первого экзона и указанной областью указанного второго экзона; и

(c) где указанное связывание приводит к пропусканию указанного первого экзона и указанного второго экзона, предпочтительно к пропусканию мультиэкзонного участка, начинающегося указанным первым экзоном и охватывающего один или несколько экзонов, присутствующих между указанным первым и указанным вторым экзонами, и, в лучшем случае, к пропусканию всего участка экзонов между указанным первым и указанным вторым экзонами.

На стадии b) такого способа указанный олигонуклеотид предпочтительно конструируют так, чтобы его связывание препятствовало по меньшей мере одной регулирующей сплайсинг последовательности в указанных областях указанного первого и/или второго экзонов в указанной пре-мРНК.

Альтернативно или в комбинации с препятствованием регулирующей сплайсинг последовательности, связывание указанного олигонуклеотида предпочтительно препятствует вторичной структуре, охватывающей по меньшей мере указанный первый и/или указанный второй экзоны в указанной пре-мРНК.

Олигонуклеотид, получаемый этим способом, способен индуцировать пропускание указанных первого и второго экзонов в указанной пре-мРНК. Предпочтительно индуцируется пропускание дополнительного экзона(ов), где указанный дополнительный экзон(ы) предпочтительно располагается между указанным первым и указанным вторым экзонами, и где полученный мРНК-транскрипт находится в рамке считывания. Олигонуклеотид предпочтительно способен индуцировать пропускание всего участка экзонов между указанным первым экзоном и указанным вторым экзоном. В одном варианте осуществления указанные области указанного первого экзона и указанного второго экзона содержат регулирующий сплайсинг элемент, так что связывание указанного олигонуклеотида способно препятствовать по меньшей мере одной регулирующей сплайсинг последовательности в указанных областях указанных первого и второго экзонов. Также предусматривается, что связывание указанного олигонуклеотида препятствует вторичной структуре, охватывающей по меньшей мере указанный первый и/или указанный второй экзоны в указанной пре-мРНК. Предпочтительная регулирующая сплайсинг последовательность содержит участок связывания серин-аргининового (SR) белка, энхансер сплайсинга экзонов (ESE), последовательность распознавания экзонов (ERS) и/или сайленсер сплайсинга экзонов (ESS).

Каждый признак этого способа уже определен в настоящем описании или известен квалифицированному специалисту.

Предпочтительные олигонуклеотиды

Предпочтительно, олигонуклеотид по изобретению предназначен для применения в качестве лекарственного средства, более предпочтительно, указанное соединение предназначено для применения в модулирующих РНК терапевтических средствах. Более предпочтительно, указанное модулирование РНК приводит к коррекции нарушенной транскрипционной рамки считывания и/или к восстановлению экспрессии желаемого или ожидаемого белка. Таким образом, способ по изобретению и олигонуклеотид по изобретению можно в принципе применять к любому заболеванию, связанному с присутствием нарушающей рамку считывания мутации, что приводит к аберрантному транскрипту и/или к отсутствию кодируемого белка и/или к присутствию аберрантного белка. В предпочтительном варианте осуществления способ по изобретению и олигонуклеотид по изобретению применяют к ассоциированным с заболеванием генам, содержащим повторяющиеся последовательности и, таким образом, области с относительно высокой идентичностью последовательности (т.е. по меньшей мере 50%, 60%, 70%, 80% идентичностью последовательности между областью второго экзона и областью первого экзона, как определено в настоящем описании). Неограничивающими примерами являются гены со спектрин-подобными повторами (поскольку ген DMD вовлечен в мышечную дистрофию Дюшенна, как описано в настоящем описании), Kelch-подобными повторами (как например, ген KLHL3, вовлеченный в семейную гиперкалиемическую гипертензию (Louis-Dit-Picard H et al.), ген KLHL6, вовлеченный в хронический лимфоцитарный лейкоз (Puente XS et al.), ген KLHL7, вовлеченный в пигментный ретинит (Friedman JS et al.), гены KLHL7/12, вовлеченные в синдром Шегрена (Uchida K et al.), ген KLHL9, вовлеченный в дистальную миопатию (Cirak S et al.), ген KLHL16 или GAN, вовлеченный в гигантскую аксональную невропатию (Bomont P et al.) , гены KLHL19 или KEAP1, вовлеченные в несколько злокачественных опухолей (Dhanoa BS et al.), ген KLHL20, вовлеченный в промиелоцитарный лейкоз (Dhanoa BS et al.) , или гены KLHL37 или ENC1, вовлеченные в опухоли головного мозга (Dhanoa BS et al.), FGF-подобными повторами, EGF-подобными повторами (как, например, ген NOTCH3, вовлеченный в CADASIL (Chabriat H et al.), гены SCUBE, вовлеченные в злокачественную опухоль или метаболическое заболевание костей, ген нейрексина-1 (NRXN1), вовлеченный в нейропсихиатрические нарушения и идиопатическую генерализованную эпилепсию (Moller RS et al.), ген Del-1, ген тенасцин-C (TNC), вовлеченный в атеросклероз и болезнь коронарных артерий (Mollie A et al.), ген THBS3 или ген фибриллина (FBN1), вовлеченный в синдром Марфана (Rantamaki T et al.), анкирин-подобными повторами (как, например, ген ANKRD1, вовлеченный в кардиомиопатию с дилятацией (Dubosq-Bidot L et al.), ген ANKRD2, ген ANKRD11, вовлеченные в синдром KBG (Sirmaci A et al.), ген ANKRD26, вовлеченный в тромбоцитопению (Noris P et al.) или диабет (Raciti GA et al.), ген ANKRD55, вовлеченный в рассеянный склероз (Alloza I et al.), или ген TRPV4, вовлеченный в дистальную спинальную мышечную атрофию (Fiorillo C et al.), HEAT-подобными повторами (как, например, ген, вовлеченный в болезнь Хантингтона), аннексин-подобными повторами, лейцин-богатыми повторами (как, например, гены NLRP2 и NLRP7, вовлеченные в идиопатическое привычное невынашивание беременности (Huang JY et al.)), ген LRRK2, вовлеченный в болезнь Паркинсона (Abeliovich A et al.), ген NLRP3, вовлеченный в болезнь Альцгеймера или менингит (Heneka MT et al.), ген NALP3, вовлеченный в почечную недостаточность (Knauf F et al.), или ген LRIG2, вовлеченный в урофациальный синдром (Stuart HM et al.), или доменами ингибитора сериновой протеазы (как, например, ген SPINK5, вовлеченный в синдром Незертона (Hovnanian A et al.), как описано в Andrade M.A. et al.

В контексте изобретения предпочтительной пре-мРНК или транскриптом является пре-мРНК или транскрипт дистрофина. Эта предпочтительная пре-мРНК или транскрипт предпочтительно являются человеческими. Заболевание, связанное с присутствием мутации, присутствующей в пре-мРНК дистрофина, представляет собой DMD или BMD, в зависимости от мутации. Предпочтительные комбинации и области первого и второго экзонов из пре-мРНК дистрофина, подлежащие применению в контексте изобретения, представлены в таблице 2.

В предпочтительном варианте осуществления соединение по изобретению используют для индукции пропускания экзона в клетке, в органе, в ткани и/или у пациента, предпочтительно у пациента с BMD или DMD или в клетке, органе, ткани, происходящих из указанного пациента. Пропускание экзона приводит к зрелой мРНК, которая не содержит пропущенного экзона, и, таким образом, когда указанный экзон кодирует аминокислоты, оно может приводить к экспрессии измененного, внутренне укороченного, но от частично до в большой степени функционального продукта дистрофина. Технология пропускания экзонов в настоящее время направлена на применение AON или транскрибирующих AON генных конструкций. Способы пропускания экзонов в настоящее время используют для борьбы с генетическими мышечными дистрофиями. Недавно авторами настоящего изобретения и другими исследователями были сообщены перспективные результаты в отношении терапии на основе индуцируемого AON пропускания экзонов, нацеленной на восстановление рамки считывания пре-мРНК дистрофина из мыши mdx и от пациентов с DMD (Heemskerk H., et al., Cirak S., et al., Goemans et al.). Путем направленного пропускания конкретного экзона тяжелый фенотип DMD (отсутствие функционального дистрофина) преобразуется в более мягкий фенотип BMD (экспрессия функционального или полуфункционального дистрофина). Пропускание экзона предпочтительно индуцируется связыванием AON, нацеленных на внутреннюю последовательность экзона.

Ниже изобретение иллюстрируется при помощи мутантной пре-мРНК дистрофина, где присутствуют первый и второй экзоны. Как определено в настоящем описании, пре-мРНК дистрофина предпочтительно означает пре-мРНК гена DMD, кодирующего белок дистрофина. Мутантная пре-мРНК дистрофина соответствует пре-мРНК пациента с BMD или DMD с мутацией по сравнению с пре-мРНК DMD дикого типа у здорового индивидуума, что приводит к (сниженным уровням) аберрантному белку (BMD), или к отсутствию функционального дистрофина (DMD). Пре-мРНК дистрофина также называют пре-мРНК DMD. Ген дистрофина также может быть называться геном DMD. Дистрофин и DMD могут использоваться в настоящем описании взаимозаменяемо.

Пациент предпочтительно означает пациента, имеющего DMD или BMD, как определено в настоящем описании ниже, или пациента, предрасположенного к развитию DMD или BMD вследствие его (или ее) генетического фона. В случае пациента с DMD, используемое соединение предпочтительно корректирует мутацию, присутствующую в гене DMD указанного пациента и, таким образом, предпочтительно образует белок дистрофина, сходный с белком дистрофина пациента с BMD: указанный белок предпочтительно представляет собой функциональный или полуфункциональный дистрофин, как определено в настоящем описании ниже. В случае пациента с BMD, антисмысловой олигонуклеотид по изобретению предпочтительно модифицирует мутацию, присутствующую в гене BMD указанного пациента и предпочтительно образует дистрофин, который является более функциональным, чем дистрофин, который исходно присутствует у указанного пациента с BMD.

Как определено в настоящем описании, функциональный дистрофин предпочтительно представляет собой дистрофин дикого типа, соответствующий белку, имеющему аминокислотную последовательность, как указано в SEQ ID NO: 1. Функциональный дистрофин предпочтительно представляет собой дистрофин, который имеет действующий связывающий домен в его N-концевой части (первые 240 аминокислот на N-конце), цистеин-богатый домен (аминокислоты с 3361 по 3685) и C-концевой домен (последние 325 аминокислот на C-конца), причем каждый из этих доменов присутствует в дистрофине дикого типа, как известно квалифицированному специалисту. Аминокислоты, указанные в настоящем описании, соответствуют аминокислотам дистрофина дикого типа, указанным в SEQ ID NO: 1. Иными словами, функциональный или полуфункциональный дистрофин представляет собой дистрофин, который проявляет по меньшей мере в некоторой степени активность дистрофина дикого типа. "По меньшей мере в некоторой степени" предпочтительно означает по меньшей мере 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% или 100% соответствующей активности функционального дистрофина дикого типа. В этом контексте активность функционального дистрофина предпочтительно представляет собой связывание с актином и взаимодействие с ассоциированным с дистрофином гликопротеиновым комплексом (DGC) или (DAGC) (Ehmsen J et al.). Связывание дистрофина с актином и с комплексом DGC можно визуализировать либо посредством ко-иммунопреципитации с использованием экстрактов тотального белка, либо посредством иммунофлуоресцентного анализа поперечных срезов из биоптата мышцы, предположительно являющейся дистрофичной, как известно квалифицированному специалисту.

Индивидуумы, страдающие DMD, как правило, имеют мутацию в гене, кодирующем дистрофин, которая препятствует синтезу полного белка, например, преждевременный стоп-кодон препятствует синтезу C-конца. При BMD ген дистрофина также содержит мутацию, однако эта мутация не нарушает открытую рамку считывания и синтезируется C-конец. В результате образуется (полу)функциональный или функциональный белок дистрофин, который обладает сходным типом активности с белком дикого типа, хотя и не обязательно сходным уровнем активности. Геном индивидуума с BMD, как правило, кодирует белок дистрофин, содержащий N-концевую часть (первые 240 аминокислот на N-конце), цистеин-богатый домен (аминокислоты с 3361 по 3685) и C-концевой домен (последние 325 аминокислот на C-конце), однако в большинстве случаев его центральный домен в форме стержня может быть короче, чем у дистрофина дикого типа (Monaco A.P., et al.).

Пропускание экзонов для лечения DMD, как правило, относится к обходу преждевременного стоп-кодона в пре-мРНК путем пропускания экзона, фланкирующего или содержащего мутацию. Это позволяет коррекцию открытой рамки считывания и синтез внутренне укороченного белка дистрофина, но включающего C-конец. В предпочтительном варианте осуществления у индивидуума, имеющего DMD и подвергаемого лечению олигонуклеотидом по изобретению, синтезируется дистрофин, который проявляет, по меньшей мере в некоторой степени, сходную активность с дистрофином дикого типа. Более предпочтительно, если указанный индивидуум является пациентом с DMD или предположительно является пациентом с DMD, (полу)функциональный дистрофин представляет собой дистрофин индивидуума, имеющего BMD: как правило, указанный дистрофин способен взаимодействовать как с актином, так и с DGC или DAGC (Ehmsen J., et al., Monaco A.P., et al.).

Центральный стержневой домен дистрофина дикого типа содержит 24 спектрин-подобных повтора (Ehmsen J., et al.). Во многих случаях центральный стержневой домен в BMD-подобных белках является более коротким, чем в дистрофине дикого типа (Monaco A.P., et al.). Например, центральный стержневой домен дистрофина, как предусматривается в настоящем описании, может содержать от 5 до 23, от 10 до 22 или от 12 до 18 спектрин-подобных повторов при условии, что он может связываться с актином и с DGC.

Смягчение одного или нескольких симптомов DMD или BMD у индивидуума с использованием соединения по изобретению можно оценивать с помощью любого из следующих анализов: продление времени до прекращения хождения, увеличение мышечной силы, повышение способности поднимать тяжести, улучшение времени вставания с пола, улучшение времени ходьбы на девять метров, улучшение времени подъема на четыре ступеньки, улучшение степени функции ног, улучшение легочной функции, улучшение сердечной функции, улучшение качества жизни. Каждый из этих анализов известен квалифицированному специалисту. В качестве примера, в публикации Manzur et al. (Manzur A.Y. et al.) приводится обширное пояснение каждого из этих анализов. Для каждого из этих анализов, когда выявляют поддающееся обнаружению улучшение или продление параметра, измеряемого в анализе, это предпочтительно означает, что один или несколько симптомов DMD или BMD смягчились у индивидуума с использованием соединения по изобретению. Поддающееся обнаружению улучшение или продление предпочтительно представляет собой статистически значимое улучшение или продление, как описано в Hodgetts et al. (Hodgetts S., et al.). Альтернативно, смягчение одного или нескольких симптомов DMD или BMD можно оценивать посредством измерения улучшения функции, целостности и/или выживаемости мышечных волокон. В предпочтительном способе один или несколько симптомов пациента с DMD или BMD смягчается и/или одна или несколько характеристик одной или нескольких мышечных клеток от пациента с DMD или BMD улучшается. Такие симптомы или характеристики можно оценивать на клеточном, тканевом уровне или у самого пациента.

Смягчение одной или нескольких характеристик мышечной клетки от пациента с DMD или BMD можно оценивать с помощью любого из следующих анализов на миогенной клетке или мышечной клетке от этого пациента: сниженный захват кальция мышечными клетками, сниженный синтез коллагена, измененная морфология, измененный биосинтез липидов, сниженный окислительный стресс и/или улучшенная функция, целостность и/или выживаемость мышечных волокон. Эти параметры обычно оценивают с использованием иммунофлуоресцентных и/или гистохимических анализов поперечных срезов биоптатов мышц.

Улучшение функции, целостности и/или выживаемости мышечных волокон можно оценивать с использованием по меньшей мере одного из следующих анализов: поддающееся обнаружению снижение уровня креатинкиназы в крови, поддающееся обнаружению снижение некроза мышечных волокон в поперечном срезе биоптата мышцы, предположительно являющейся дистрофической, и/или поддающееся обнаружению повышение гомогенности диаметра мышечных волокон в поперечном срезе биоптата мышцы, предположительно являющейся дистрофической. Каждый из этих анализов известен квалифицированному специалисту.

Креатинкиназу можно выявлять в крови, как описано в Hodgetts et al. (Hodgetts S., et al.). Поддающееся обнаружению снижение креатинкиназы может означать снижение на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или более по сравнению с концентрацией креатинкиназы у того же пациента с DMD или BMD до лечения.

Поддающееся обнаружению снижение некроза мышечных волокон предпочтительно оценивают в биоптате мышц, более предпочтительно, как описано в Hodgetts et al. (Hodgetts S., et al.), с использованием поперечных срезов биоптатов. Поддающееся обнаружению снижение некроза может представлять собой снижение, составляющее 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или более от площади, где идентифицирован некроз с использованием поперечных срезов биоптатов. Снижение измеряют путем сравнения с некрозом, как оценивают у того же пациента с DMD или BMD до лечения.

Поддающееся обнаружению повышение гомогенности диаметра мышечных волокон предпочтительно оценивают в поперечном срезе биоптата, более предпочтительно, как описано в Hodgetts et al. (Hodgetts S., et al.). Увеличение измеряют путем сравнения с гомогенностью диаметра мышечного волокна у того же пациента с DMD или BMD до лечения.

Предпочтительно, олигонуклеотид по изобретению обеспечивает у указанного индивидуума (более высокие уровни) функциональный и/или (полу)функциональный белок дистрофин (как для DMD, так и для BMD) и/или способен, по меньшей мере частично, снижать продукцию аберрантного белка дистрофина у указанного индивидуума. В этом контексте, функциональный и/или полуфункциональный дистрофин может означать, что может образовываться несколько форм функционального и/или полуфункционального дистрофина. Этого можно ожидать, когда область с по меньшей мере 50% идентичностью между первым и вторым экзонами перекрывается с одной или несколькими другими областями с по меньшей мере 50% идентичностью между другими первым и вторым экзонами, и где указанный олигонуклеотид способен связываться с указанной перекрывающейся частью, так что несколько различных участков экзонов пропускается и продуцируется несколько различных транскриптов в рамке считывания. Эта ситуация иллюстрируется в примере 4, где один единственный олигонуклеотид по изобретению (PS816; SEQ ID NO: 1679) способен индуцировать продукцию нескольких транскриптов в рамке считывания, все из которых имеют общий экзон 10 в качестве первого экзона, и где второй экзон может представлять собой экзон 13, 14, 15, 18, 20, 27, 30, 31, 32, 35, 42, 44, 47, 48 или 55.

Более высокие уровни относятся к увеличению уровня функционального и/или (полу)функционального белка дистрофина по сравнению с соответствующим уровнем функционального и/или (полу)функционального белка дистрофина у пациента до начала лечения олигонуклеотидом по изобретению. Уровень указанного функционального и/или (полу)функционального белка дистрофина предпочтительно оценивают с использованием иммунофлуоресцентного анализа или анализа с использованием вестерн-блоттинга (белок).

Снижение продукции аберрантной мРНК дистрофина или аберрантного белка дистрофина предпочтительно означает, что 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% или менее от первоначального количества аберрантной мРНК дистрофина или аберрантного белка дистрофина все еще поддается обнаружению с помощью ОТ-ПЦР (мРНК) или иммунофлуоресцентного анализа или анализа с использованием вестерн-блоттинга (белок). Аберрантную мРНК или белок дистрофина также обозначают в настоящем описании как менее функциональную (по сравнению с функциональным белком дистрофина дикого типа, как определено в настоящем описании ранее) или нефункциональную мРНК или белок дистрофина. Нефункциональный белок дистрофина предпочтительно представляет собой белок дистрофина, который не способен связывать актин и/или представителей белкового комплекса DGC. Нефункциональный белок дистрофина или мРНК дистрофина, как правило, не обладает или не кодирует белок дистрофина с интактным C-концом белка. В предпочтительном варианте осуществления используют способ пропускания экзонов (также называемый модулированием РНК или переключением сплайсинга).

Увеличение продукции функциональной и/или полуфункциональной мРНК и/или белка дистрофина предпочтительно означает, что такая функциональная и/или полуфункциональная мРНК и/или белок дистрофина поддаются обнаружению или увеличены по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или более по сравнению с выявляемым количеством указанной мРНК и/или белка в начале лечения. Указанное выявление можно осуществлять с использованием ОТ-ПЦР (мРНК) или иммунофлуоресцентного анализа или анализа с использованием вестерн-блоттинга (белок).

В другом варианте осуществления соединение по изобретению обеспечивает у указанного индивидуума функциональный или полуфункциональный белок дистрофина. Этот функциональный или полуфункциональный белок или мРНК дистрофина можно выявлять в качестве аберрантного белка или мРНК дистрофина, как пояснено в настоящем описании выше.

Посредством направленного совместного пропускания указанных двух экзонов (указанный первый и указанный второй экзоны) можно индуцировать пропускание дополнительного экзона(ов), где указанный дополнительный экзон(ы) предпочтительно расположен между указанным первым и указанным вторым экзонами, и где полученный транскрипт дистрофина находится в рамке считывания (предпочтительно, как в таблице 1 или 6), фенотип DMD или тяжелой BMD преобразуется в более мягкий фенотип BMD или даже бессимптомный фенотип. Совместное пропускание указанных двух экзонов предпочтительно индуцируется связыванием олигонуклеотида с областью первого экзона в пре-мРНК дистрофина и связыванием олигонуклеотида с областью второго экзона в пре-мРНК дистрофина, где указанная область указанного второго экзона обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона. Предпочтительно, указанный первый и указанный второй экзоны дистрофина и области идентичности в них представлены в таблице 2 или 6. Указанный олигонуклеотид предпочтительно не обладает перекрыванием с последовательностями не экзонов. Указанный олигонуклеотид предпочтительно не перекрывается с участками сплайсинга, по меньшей мере не в той степени, в какой они присутствуют в интроне. Указанный олигонуклеотид, направленный на внутреннюю последовательность экзона, предпочтительно не содержит последовательность, обратно комплементарную соседнему интрону. Способ пропускания экзонов предпочтительно используют так, что отсутствие указанных двух экзонов, предпочтительно дополнительного экзона(ов), более предпочтительно расположенного между указанным первым и указанным вторым экзонами, из мРНК, продуцированной с пре-мРНК DMD, образует кодирующую область для (более высокой) экспрессии более (полу)функционального - хотя и более короткого - белка дистрофина. В этом контексте (как правило, у пациента с BMD), ингибирование включения указанных двух экзонов, предпочтительно дополнительного экзона(ов), расположенных между указанным первым и указанным вторым экзонами, предпочтительно означает, что:

- уровень исходной аберрантной (менее функциональной) мРНК дистрофина снижен по меньшей мере на 5% при оценке способом ОТ-ПЦР, или уровень соответствующего аберрантного белка дистрофина снижается по меньшей мере на 2% при оценке с помощью иммунофлуоресцентного анализа или анализа с использованием вестерн-блоттинга с использованием антител против дистрофина; и/или

- транскрипт в рамке считывания, кодирующий полуфункциональный или функциональный белок дистрофин, поддается обнаружению или его уровень возрастает по меньшей мере на 5% при оценке способом ОТ-ПЦР (уровень мРНК) или по меньшей мере на 2% при оценке с помощью иммунофлуоресцентного анализа или вестерн-блоттинга с использованием антител против дистрофина (белковый уровень).

Снижение аберрантного менее функционального или нефункционального белка дистрофина предпочтительно составляет по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или 100%, и предпочтительно оно происходит одновременно или параллельно выявлению или увеличенной продукции более функционального или полуфункционального транскрипта или белка дистрофина. В этом контексте (как правило, у пациента с DMD), ингибирование включения указанных двух экзонов, предпочтительно дополнительного экзона(ов), расположенного между указанным первым и указанным вторым экзонами, предпочтительно означает, что у указанного индивидуума обеспечивается (более высокий уровень) более функциональный или (полу)функциональный белок или мРНК дистрофина.

После того, как у пациента с DMD обеспечивают (более высокие уровни) (более) функциональный или полуфункциональный белок дистрофина, причина DMD, по меньшей мере частично, смягчается. Таким образом, можно ожидать, что симптомы DMD в достаточной степени снижаются. Кроме того, настоящее изобретение относится к пониманию того, что пропускание всего участка из по меньшей мере двух экзонов дистрофина в пре-мРНК, содержащей указанные экзоны, индуцируется или усиливается при использовании единственного олигонуклеотида, направленного на (или способного связываться с, или гибридизоваться с, или являющегося обратно комплементарным или способного нацеливаться на) оба из внешних экзона указанного участка. В настоящей заявке, в предпочтительном варианте осуществления олигонуклеотид по изобретению, таким образом, по меньшей мере на 80% обратно комплементарен указанной области указанного первого экзона и по меньшей мере на 45% обратно комплементарен указанной области указанного второго экзона, как определено в настоящем описании, где указанные первый и второй экзоны соответствуют наружным экзонам участка экзонов, подлежащего пропусканию. Более предпочтительно, указанный олигонуклеотид по меньшей мере на 85%, 90% 95% или 100% обратно комплементарен указанной области указанного первого экзона и по меньшей мере на 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100% обратно комплементарен указанной области указанного второго экзона. Увеличенная частота пропускания также увеличивает уровень более (полу)функционального белка дистрофина, продуцированного в мышечной клетки индивидуума с DMD или BMD.

Олигонуклеотид в соответствии с настоящим изобретением, который предпочтительно используют, предпочтительно является обратно комплементарным или способен связываться, или гибридизоваться, или нацеливаться на область первого экзона дистрофина, причем указанная область имеет по меньшей мере 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов, предпочтительно является обратно комплементарной или способна связываться, или гибридизоваться, или нацеливаться на область второго экзона дистрофина, причем указанная область имеет по меньшей мере 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов, где указанная область указанного второго экзона в той же пре-мРНК обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона.

В контексте изобретения олигонуклеотид может содержать или состоять из функционального эквивалента олигонуклеотида. Функциональный эквивалент олигонуклеотида предпочтительно означает олигонуклеотид, как определено в настоящем описании, где один или несколько нуклеотидов заменены, и где активность указанного функционального эквивалента сохраняется по меньшей мере в некоторой степени. Предпочтительно, активность указанного соединения, содержащего функциональный эквивалент олигонуклеотида, представляет собой обеспечение функционального или полуфункционального белка дистрофина. Указанную активность указанного соединения, содержащего функциональный эквивалент олигонуклеотида, таким образом, предпочтительно оценивают путем количественного определения функционального или полуфункционального белка дистрофина. Функциональный или полуфункциональный дистрофин предпочтительно определяют в рамках настоящего изобретения как представляющий собой дистрофин, способный связываться с актином и представителями комплекса белков DGC и поддерживать структуру и гибкость мембран мышечных волокон. Оценка указанной активности соединения, содержащего функциональный олигонуклеотид или эквивалент, предпочтительно включает ОТ-ПЦР (для обнаружения пропускания экзона на уровне РНК) и/или иммунофлуоресценцию или анализ с использованием вестерн-блоттинга (для обнаружения экспрессии и локализации белка). Указанная активность предпочтительно сохраняется, по меньшей мере в некоторой степени, когда она соответствует по меньшей мере 50%, или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или по меньшей мере 95% или более соответствующей активности указанного соединения, содержащего олигонуклеотид, из которого происходит функциональный эквивалент. На протяжении настоящей заявки, когда используют слово "олигонуклеотид", оно может быть заменено его функциональным эквивалентом, как определено в настоящем описании.

Таким образом, применение олигонуклеотида или его функционального эквивалента, содержащего или состоящего из последовательности:

которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной области первого экзона дистрофина,

которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной области второго экзона дистрофина,

и

где указанная область второго экзона в пре-мРНК дистрофина обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона, проявляет терапевтические результаты в отношении DMD посредством:

- смягчения одного или нескольких симптомов DMD или BMD; и/или

- смягчения одной или нескольких характеристик мышечной клетки от пациента; и/или

- обеспечения у указанного индивидуума функционального или полуфункционального белка дистрофина; и/или

- по меньшей мере частичного снижения продукции аберрантного белка дистрофина у указанного индивидуума.

Каждый из этих признаков уже определен в настоящем описании.

Предпочтительно, олигонуклеотид содержит или состоит из последовательности, которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной области первого экзона DMD или дистрофина, где область второго экзона DMD или дистрофина в той же пре-мРНК обладает по меньшей мере 50% идентичностью с указанной областью указанного первого экзона. Указанные первый и второй экзоны предпочтительно выбирают из группы экзонов, включающей экзоны с 8 по 60, где участок экзонов, начинающийся с первого экзона и содержащий второй экзон в качестве последнего экзона, участок экзонов, начинающийся первым экзоном и содержащий второй экзон в качестве последнего экзона, когда он пропускается, обеспечивает транскрипт в рамке считывания. Предпочтительные комбинации экзонов в рамке считывания в мРНК дистрофина приведены в таблице 1, 2 или 6.

Без связи с какой-либо теорией, идентичность первого и второго экзонов дистрофина можно определять с помощью одного или нескольких из следующих аспектов. В одном варианте осуществления один или несколько интронов, присутствующих между первым экзоном и вторым экзоном, не являются чрезмерно большими. В этом контексте, чрезмерно большой интрон в гене дистрофина может составлять 70, 80, 90, 100, 200 т.п.н. или более; например, интрон 1 (~83 т.п.н.), интрон 2 (~170 т.п.н.), интрон 7 (~110 т.п.н.), интрон 43 (~70 т.п.н.), интрон 44 (~248 т.п.н.), интрон 55 (~119 т.п.н.) или интрон 60 (~96 т.п.н.). Кроме того, в следующем варианте осуществления может предусматриваться пример уже пациента с BMD, у которого экспрессируется укороченный белок дистрофин, где этот первый, этот второй экзон и участок экзонов от указанного первого экзона до указанного второго экзона удалены. Другим критерием может быть относительно большая применимость пропущенных экзонов для объединенных субпопуляций пациентов с DMD (и/или BMD) с конкретными соответствующими мутациями.

В предпочтительном варианте осуществления пропускается участок экзонов DMD в рамке считывания (более предпочтительно, полностью пропускается в одном транскрипте), где наружные экзоны определяются первым и вторым экзонами следующим образом:

- первый экзон представляет собой экзон 8, и второй экзон представляет собой экзон 19 (применимо для ~7% пациентов с DMD),

- первый экзон представляет собой экзон 9, и второй экзон представляет собой экзон 22 (применимо для ~11% пациентов с DMD),

- первый экзон представляет собой экзон 9, и второй экзон представляет собой экзон 30 (применимо для ~14% пациентов с DMD),

- первый экзон представляет собой экзон 10, и второй экзон представляет собой экзон 18 (применимо для ~5% пациентов с DMD),

- первый экзон представляет собой экзон 10 и второй экзон представляет собой экзон 30 (применимо для ~13% пациентов с DMD),

- первый экзон представляет собой экзон 10, и второй экзон представляет собой экзон 42 (применимо для ~16% пациентов с DMD),

- первый экзон представляет собой экзон 10, и второй экзон представляет собой экзон 47 (применимо для ~29% пациентов с DMD),

- первый экзон представляет собой экзон 10, и второй экзон представляет собой экзон 57 (применимо для ~72% пациентов с DMD),

- первый экзон представляет собой экзон 10, и второй экзон представляет собой экзон 60 (применимо для ~72% пациентов с DMD),

- первый экзон представляет собой экзон 11, и второй экзон представляет собой экзон 23 (применимо для ~8% пациентов с DMD),

- первый экзон представляет собой экзон 13 и второй экзон представляет собой экзон 30 (применимо для ~10% пациентов с DMD),

- первый экзон представляет собой экзон 23, и второй экзон представляет собой экзон 42 (применимо для ~7% пациентов с DMD),

- первый экзон представляет собой экзон 34 и второй экзон представляет собой экзон 53 (применимо для ~42% пациентов с DMD),

- первый экзон представляет собой экзон 40, и второй экзон представляет собой экзон 53 (применимо для ~38% пациентов с DMD),

- первый экзон представляет собой экзон 44, и второй экзон представляет собой экзон 56 (применимо для ~40% пациентов с DMD),

- первый экзон представляет собой экзон 45, и второй экзон представляет собой экзон 51 (применимо для ~17% пациентов с DMD)

- первый экзон представляет собой экзон 45 и второй экзон представляет собой экзон 53 (применимо для ~28% пациентов с DMD),

- первый экзон представляет собой экзон 45, и второй экзон представляет собой экзон 55 (применимо для ~33% пациентов с DMD),

- первый экзон представляет собой экзон 45, и второй экзон представляет собой экзон 60 (применимо для ~37% пациентов с DMD), или

- первый экзон представляет собой экзон 56, и второй экзон представляет собой экзон 60 (применимо для ~2% пациентов с DMD).

Таким образом, в одном варианте осуществления олигонуклеотид по изобретению индуцирует пропускание следующих экзонов дистрофина: экзоны с 8 по 19, экзоны с 9 по 22, экзоны с 9 по 30, экзоны с 10 по 18, экзоны с 10 по 30, экзоны с 10 по 42, экзоны с 10 по 47, экзоны с 10 по 57, экзоны с 10 по 60, экзоны с 11 по 23, экзоны с 13 по 30, экзоны с 23 по 42, экзоны с 34 по 53, экзоны с 40 по 53, экзоны с 44 по 56, экзоны с 45 по 51, экзоны с 45 по 53, экзоны с 45 по 55, экзоны с 45 по 60 или экзоны с 56 по 60.

Предпочтительно, олигонуклеотид по изобретению содержит или состоит из последовательности, которая способна связываться с, нацеливаться на, гибридизоваться с и/или является обратно комплементарной области первого экзона пре-мРНК дистрофина, так что обратно комплементарная часть составляет по меньшей мере 30% длины указанного олигонуклеотида по изобретению, более предпочтительно по меньшей мере 40%, еще более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, еще более предпочтительно по меньшей мере 90% или еще более предпочтительно по меньшей мере 95%, или еще более предпочтительно 98% и наиболее предпочтительно вплоть до 100%. В этом контексте первый экзон предпочтительно представляет собой экзон 8, 9, 10, 11, 13, 23, 34, 40, 44, 45 или 56 пре-мРНК дистрофина, как определено в настоящем описании. Указанный олигонуклеотид может содержать дополнительные фланкирующие последовательности. В более предпочтительном варианте осуществления длина указанной обратно комплементарной части указанного олигонуклеотида составляет по меньшей мере 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40 нуклеотидов. Можно использовать несколько типов фланкирующих последовательностей. Предпочтительно, фланкирующие последовательности используют для модификации связывания белка с указанным олигонуклеотидом или для модификации термодинамического свойства указанного олигонуклеотида, более предпочтительно для модификации аффинности связывания РНК-мишени. В другом предпочтительном варианте осуществления дополнительные фланкирующие последовательности являются обратно комплементарными последовательностям пре-мРНК дистрофина, которые не присутствуют в указанном экзоне.

В предпочтительном варианте осуществления олигонуклеотид содержит или состоит из последовательности, которая способна связываться с, нацеливаться на, гибридизоваться с и является обратно комплементарной по меньшей мере области первого и области второго экзона дистрофина, присутствующей в пре-мРНК дистрофина, где указанные первый и второй экзоны выбраны из группы экзонов 8 (SEQ ID NO: 2), 9 (SEQ ID NO: 3), 10 (SEQ ID NO: 4), 11 (SEQ ID NO: 1761), 13 (SEQ ID NO: 1762),18 (SEQ ID NO: 5), 19 (SEQ ID NO: 6), 22 (SEQ ID NO: 7), 23 (SEQ ID NO: 8), 30 (SEQ ID NO: 9), 34 (SEQ ID NO: 1763), 40 (SEQ ID NO: 1764), 42 (SEQ ID NO: 11), 44 (SEQ ID NO: 1765), 45 (SEQ ID NO: 12), 47 (SEQ ID NO: 10), 51 (SEQ ID NO: 1760), 53 (SEQ ID NO: 13), 55 (SEQ ID NO: 14), 56 (SEQ ID NO: 15), 57 (SEQ ID NO: 1744) или 60 (SEQ ID NO: 16) и указанные области имеют по меньшей мере 10 нуклеотидов. Однако указанные области также могут иметь по меньшей мере 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 или более нуклеотидов. Для предпочтительных экзонов, указанных выше, квалифицированный специалист способен идентифицировать область первого экзона и область второго экзона с использованием способов, известных в данной области. Более предпочтительно используют сетевой инструмент EMBOSS Matcher, как пояснено выше. Еще более предпочтительно, предпочтительные области идентичности первого и второго экзонов дистрофина, с которыми олигонуклеотид по изобретению предпочтительно связывается и/или для которых он является, по меньшей мере частично, обратно комплементарным, представлены в таблице 2. Обратная комплементарность в этом контексте предпочтительно составляет по меньшей мере 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100%. Предпочтительная олигонуклеотидная последовательность, подлежащая применению в рамках изобретения, способна связываться с, гибридизоваться с, нацеливаться на и/или является обратно комплементарной области идентичности между указанными первым и вторым экзонами, предпочтительно из таблицы 2, и имеет длину по меньшей мере 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 или 40 нуклеотидов, более предпочтительно менее 40 нуклеотидов или более предпочтительно менее 30 нуклеотидов, еще более предпочтительно менее 25 нуклеотидов и наиболее предпочтительно от 20 до 25 нуклеотидов. Обратная комплементарность в этом контексте предпочтительно составляет по меньшей мере 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% или 100%.

В одном варианте осуществления предпочтительный олигонуклеотид является таким, что первый и второй экзоны дистрофина являются такими, как указано в таблице 1, 2 или 6, и указанный олигонуклеотид способен связываться с соответствующими областями первого и второго экзонов, как указано в таблице 2 или 6 и как определяется SEQ ID NO: 17-1670, 1742, 1743 или 1766-1777.

Предпочтительные олигонуклеотиды описаны в таблице 3 и содержат или состоят из SEQ ID NO: 1671-1741. Другие предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1778-1891, как описано в таблице 6. Предпочтительные олигонуклеотиды содержат SEQ ID NO: 1671-1741 или 1778-1891 и имеют на 1, 2, 3, 4 или 5 нуклеотидов больше или на 1, 2, 3, 4 или 5 нуклеотидов меньше, чем их точный SEQ ID NO, как указано в таблице 3 или 6. Эти дополнительные нуклеотиды могут присутствовать на 5'- или 3'-стороне данного SEQ ID NO. Эти отсутствующие нуклеотиды могут представлять собой нуклеотиды, присутствующие на 5'- или 3'-стороне данного SEQ ID NO. Каждый из этих олигонуклеотидов может иметь любую химическую структуру, как определено в настоящем описании ранее или их комбинации. В каждом из олигонуклеотидов, указанных в настоящем описании с помощью SEQ ID NO, U может быть заменен на T.

Более предпочтительные олигонуклеотиды приведены ниже.

Если первый экзон дистрофина представляет собой экзон 8 и второй экзон дистрофина представляет собой экзон 19, предпочтительная область экзона 8 содержит или состоит из SEQ ID NO: 17, и предпочтительная область экзона 19 содержит или состоит из SEQ ID NO: 18. Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1722 или 1723 или содержит SEQ ID NO: 1722 или 1723, и имеет длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 13, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 101, и предпочтительная область экзона 13 содержит или состоит из SEQ ID NO: 102.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 14, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 103, и предпочтительная область экзона 14 содержит или состоит из SEQ ID NO: 104.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 15, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 105, и предпочтительная область экзона 15 содержит или состоит из SEQ ID NO: 106.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 18, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 109, и предпочтительная область экзона 18 содержит или состоит из SEQ ID NO: 110. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1679-1681, 1778, 1812, 1813, 1884-1886, 1890 или 1891 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую SEQ ID NO: 1814 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1815-1819 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1820, 1824 и имеющую длину 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1826, 1782, 1832 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1821, 1825, 1780 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1822 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1823, 1781, 1829, 1830, 1831 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов,

- последовательность оснований, определяемую любой из SEQ ID NO: 1887 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1888 или 1889 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую SEQ ID NO: 1827 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую SEQ ID NO: 1828 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 18, другая предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 1766, и другая предпочтительная область экзона 18 содержит или состоит из SEQ ID NO: 1767. Предпочтительные олигонуклеотиды содержат последовательность оснований, определяемую любой из SEQ ID NO: 1783, 1833, 1834, 1835 и имеющую длину 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 18, другая предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 1768, и другая предпочтительная область экзона 18 содержит или состоит из SEQ ID NO: 1769. Предпочтительные олигонуклеотиды содержат последовательность оснований, определяемую любой из SEQ ID NO: 1673 или 1674 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 20, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 111, и предпочтительная область экзона 20 содержит или состоит из SEQ ID NO: 112.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 27, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 121, и предпочтительная область экзона 27 содержит или состоит из SEQ ID NO: 122.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 30, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 127, и предпочтительная область экзона 30 содержит или состоит из SEQ ID NO: 128. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1679-1681, 1812, 1813, 1884-1886, 1890 или 1891 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую SEQ ID NO: 1814 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую SEQ ID NO: 1675 или 1676 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую SEQ ID NO: 1677 или 1678 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1784, 1836 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1786, 1838 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1780 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1785, 1837 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 30, другая предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 1772, и другая предпочтительная область экзона 30 содержит или состоит из SEQ ID NO: 1773. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1688, 1689, 1839, 1840, 1841, 1842, 1843 или 1844 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1845, 1846, 1847, 1848 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1849, 1850 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1787, 1851 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 31, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 129, и предпочтительная область экзона 31 содержит или состоит из SEQ ID NO: 130.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 32, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 131, и предпочтительная область экзона 32 содержит или состоит из SEQ ID NO: 132.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 35, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 137, и предпочтительная область экзона 35 содержит или состоит из SEQ ID NO: 138.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 42, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 151, и предпочтительная область экзона 42 содержит или состоит из SEQ ID NO: 152.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 44, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 153, и предпочтительная область экзона 44 содержит или состоит из SEQ ID NO: 154.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 47, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 157, и предпочтительная область экзона 47 содержит или состоит из SEQ ID NO: 158.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 48, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 159, и предпочтительная область экзона 48 содержит или состоит из SEQ ID NO: 160.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 55, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 167, и предпочтительная область экзона 55 содержит или состоит из SEQ ID NO: 168.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 57, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 169, и предпочтительная область экзона 57 содержит или состоит из SEQ ID NO: 170.

Если первый экзон дистрофина представляет собой экзон 10 и второй экзон дистрофина представляет собой экзон 60, предпочтительная область экзона 10 содержит или состоит из SEQ ID NO: 173, и предпочтительная область экзона 60 содержит или состоит из SEQ ID NO: 174.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1673 или содержит SEQ ID NO: 1673 и имеет длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1675 или содержит SEQ ID NO: 1675 и имеет длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1677 или содержит SEQ ID NO: 1677 и имеет длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1679 или содержит SEQ ID NO: 1679 и имеет длину 25, 26, 27, 28, 29 или 30 нуклеотидов. Предпочтительный олигонуклеотид содержит последовательность оснований SEQ ID NO: 1679 и имеет длину 25, 26, 27, 28, 29 или 30 нуклеотидов. Необязательно, 1, 2, 3, 4, 5, 6, 7 из U в SEQ ID NO: 1679 заменены на T. В предпочтительном варианте осуществления все U в SEQ ID NO: 1679 заменен/заменены на T. Предпочтительный олигонуклеотид, содержащий SEQ ID NO: 1679, содержит любую из химических структур, определенных в настоящем описании выше: модификацию основания и/или модификацию сахара и/или модификацию основной цепи.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1681 или содержит SEQ ID NO: 1681 и имеет длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1684 или содержит SEQ ID NO: 1684 и имеет длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1685 или содержит SEQ ID NO: 1685 и имеет длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1686 или содержит SEQ ID NO: 1686 и имеет длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1688 или содержит SEQ ID NO: 1688 и имеет длину 26, 27, 28, 29 или 30 нуклеотидов. Предпочтительный олигонуклеотид содержит последовательность оснований SEQ ID NO: 1688 и имеет длину 26, 27, 28, 29 или 30 нуклеотидов. Необязательно, 1, 2, 3, 4, 5, 6 из U в SEQ ID NO: 1688 заменен/заменены на T. В предпочтительном варианте осуществления все U в SEQ ID NO: 1688 заменены на T. Предпочтительный олигонуклеотид, содержащий SEQ ID NO: 1688, содержит любую из химических структур, определенных в настоящем описании выше: модификацию основания и/или модификацию сахара и/или модификацию основной цепи.

Для каждого из олигонуклеотидов, соответствующих SEQ ID NO: 1673, 1675, 1677, 1679, 1681, 1684, 1685, 1686 и 1688, первый экзон дистрофина представляет собой экзон 10. Однако второй экзон дистрофина представляет собой экзон 13, 14, 15, 18, 20, 27, 30, 31, 32, 35, 42, 44, 47, 48, 55, 57 или 60. Это означает, что при использовании любого из этих олигонуклеотидов может произойти образование нескольких транскриптов в рамке считывания, каждый из которых приводит к продукции укороченного, но (полу)функционального белка дистрофина.

Если первый экзон дистрофина представляет собой экзон 11 и второй экзон дистрофина представляет собой экзон 23, предпочтительная область экзона 23 содержит или состоит из SEQ ID NO: 191, и предпочтительная область экзона 23 содержит или состоит из SEQ ID NO: 192. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1794, 1861, 1795, 1862 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1796, 1863, 1797, 1864 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1798, 1865, 1799, 1866 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 13 и второй экзон дистрофина представляет собой экзон 30, предпочтительная область экзона 13 содержит или состоит из SEQ ID NO: 285, и предпочтительная область экзона 30 содержит или состоит из SEQ ID NO: 286. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1808, 1867, 1809, 1868, 1810, 1869, 1858, 1873 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов,

- последовательность оснований, определяемую любой из SEQ ID NO: 1811, 1870, 1859, 1874 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1856, 1871, 1860, 1875 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1857, 1872 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 23 и второй экзон дистрофина представляет собой экзон 42, предпочтительная область экзона 23 содержит или состоит из SEQ ID NO: 776, и предпочтительная область экзона 42 содержит или состоит из SEQ ID NO: 777. Предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1698-1703.

Если первый экзон дистрофина представляет собой экзон 34 и второй экзон дистрофина представляет собой экзон 53, предпочтительная область экзона 34 содержит или состоит из SEQ ID NO: 1294, и предпочтительная область экзона 53 содержит или состоит из SEQ ID NO: 1295. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1800, 1876, 1801, 1877 и имеющую длину 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1802, 1878, 1803, 1879 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 40 и второй экзон дистрофина представляет собой экзон 53, предпочтительная область экзона 40 содержит или состоит из SEQ ID NO: 1477, и предпочтительная область экзона 53 содержит или состоит из SEQ ID NO: 1478. Предпочтительные олигонуклеотиды содержат:

- последовательность оснований, определяемую любой из SEQ ID NO: 1804, 1880 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

- последовательность оснований, определяемую любой из SEQ ID NO: 1805, 1881 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 44 и второй экзон дистрофина представляет собой экзон 56, предпочтительная область экзона 44 содержит или состоит из SEQ ID NO: 1577, и предпочтительная область экзона 56 содержит или состоит из SEQ ID NO: 1558. Предпочтительные олигонуклеотиды содержат последовательность оснований, определяемую любой из SEQ ID NO: 1806, 1882, 1807, 1883 и имеющую длину 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 45 и второй экзон дистрофина представляет собой экзон 51, предпочтительная область экзона 45 содержит или состоит из SEQ ID NO: 1567, и предпочтительная область экзона 51 содержит или состоит из SEQ ID NO: 1568. Предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1730-1731.

Если первый экзон дистрофина представляет собой экзон 45 и второй экзон дистрофина представляет собой экзон 53, предпочтительная область экзона 45 содержит или состоит из SEQ ID NO: 1569, и предпочтительная область экзона 53 содержит или состоит из SEQ ID NO: 1570. Предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1732-1737.

Если первый экзон дистрофина представляет собой экзон 45 и второй экзон дистрофина представляет собой экзон 55, предпочтительная область экзона 45 содержит или состоит из SEQ ID NO: 1571, и предпочтительная область экзона 55 содержит или состоит из SEQ ID NO: 1572. Предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1704-1719, 1788, 1852, 1789, 1853.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1706 или содержит SEQ ID NO: 1706 и имеет длину 25, 26, 27, 28, 29 или 30 нуклеотидов. Предпочтительный олигонуклеотид, содержащий SEQ ID NO: 1706 и имеющий длину 25 нуклеотидов, состоит из SEQ ID NO: 1706.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1707 или содержит SEQ ID NO: 1707 и имеет длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов. Предпочтительный олигонуклеотид, содержащий SEQ ID NO: 1707 и имеющий длину 25 нуклеотидов, состоит из SEQ ID NO: 1706.

Предпочтительный олигонуклеотид состоит из SEQ ID NO: 1713 или содержит SEQ ID NO: 1713 и имеет длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов. Предпочтительный олигонуклеотид, содержащий SEQ ID NO: 1713 и имеющий длину 25 нуклеотидов, состоит из SEQ ID NO: 1710.

Предпочтительные олигонуклеотиды содержат последовательность оснований, определяемую любой из SEQ ID NO: 1788, 1852, 1789, 1853 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 45 и второй экзон дистрофина представляет собой экзон 55, другая предпочтительная область экзона 45 содержит или состоит из SEQ ID NO: 1774, и другая предпочтительная область экзона 55 содержит или состоит из SEQ ID NO: 1775. Предпочтительные олигонуклеотиды содержат последовательность оснований, определяемую любой из SEQ ID NO: 1790, 1854, 1792, 1855 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов.

Если первый экзон дистрофина представляет собой экзон 45 и второй экзон дистрофина представляет собой экзон 60, предпочтительная область экзона 45 содержит или состоит из SEQ ID NO: 1577, и предпочтительная область экзона 60 содержит или состоит из SEQ ID NO: 1578. Предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1738-1741.

Если первый экзон дистрофина представляет собой экзон 56 и второй экзон дистрофина представляет собой экзон 60, предпочтительная область экзона 56 содержит или состоит из SEQ ID NO: 1742, и предпочтительная область экзона 60 содержит или состоит из SEQ ID NO: 1743. Предпочтительные олигонуклеотиды содержат или состоят из SEQ ID NO: 1720-1721.

Более предпочтительный олигонуклеотид содержит:

(a) последовательность оснований, определяемую SEQ ID NO: 1673 или 1674 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов; или

(b) последовательность оснований, определяемую SEQ ID NO: 1675 или 1676 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов; или

(c) последовательность оснований, определяемую SEQ ID NO: 1677 или 1678 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов; или

(d) последовательность оснований, определяемую любой из SEQ ID NO: 1679-1681 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов; или

(e) последовательность оснований, определяемую любой из SEQ ID NO: 1684-1686 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов; или

(f) последовательность оснований, определяемую SEQ ID NO: 1688 или 1689 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов; или

(g) последовательность оснований, определяемую любой из SEQ ID NO: 1704-1706 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов,

(h) последовательность оснований, определяемую любой из SEQ ID NO: 1707-1709 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов; или

(i) последовательность оснований, определяемую любой из SEQ ID NO: 1710, 1713-1717 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Еще более предпочтительные олигонуклеотиды содержат:

(a) последовательность оснований, определяемую любой из SEQ ID NO: 1679-1681, 1778, 1812, 1813, 1884-1886, 1890 или 1891 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или SEQ ID NO: 1814 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

(b) последовательность оснований, определяемую SEQ ID NO: 1688, 1689 или 1839-1844 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

(c) последовательность оснований, определяемую SEQ ID NO: 1673 или 1674 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(d) последовательность оснований, определяемую SEQ ID NO: 1675 или 1676 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(e) последовательность оснований, определяемую SEQ ID NO: 1677 или 1678 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(f) последовательность оснований, определяемую любой из SEQ ID NO: 1684-1686 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(g) последовательность оснований, определяемую любой из SEQ ID NO: 1704-1706 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(h) последовательность оснований, определяемую любой из SEQ ID NO: 1707-1709 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(i) последовательность оснований, определяемую любой из SEQ ID NO: 1710, 1713-1717 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(j) последовательность оснований, определяемую любой из SEQ ID NO: 1815-1819 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(k) последовательность оснований, определяемую любой из SEQ ID NO: 1820, 1824, и имеющую длину 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(l) последовательность оснований, определяемую любой из SEQ ID NO: 1826, 1782, 1832 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(m) последовательность оснований, определяемую любой из SEQ ID NO: 1821, 1825, 1780 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(n) последовательность оснований, определяемую любой из SEQ ID NO: 1822 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(o) последовательность оснований, определяемую любой из SEQ ID NO: 1823, 1781, 1829, 1830, 1831 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(p) последовательность оснований, определяемую любой из SEQ ID NO: 1783, 1833, 1834, 1835 и имеющую длину 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(q) последовательность оснований, определяемую любой из SEQ ID NO: 1887 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(r) последовательность оснований, определяемую любой из SEQ ID NO: 1888 или 1889 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

(s) последовательность оснований, определяемую SEQ ID NO: 1827 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(t) последовательность оснований, определяемую SEQ ID NO: 1828 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(u) последовательность оснований, определяемую любой из SEQ ID NO: 1784, 1836 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(v) или последовательность оснований, определяемую любой из SEQ ID NO: 1786, 1838 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(w) последовательность оснований, определяемую любой из SEQ ID NO: 1780 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(x) последовательность оснований, определяемую любой из SEQ ID NO: 1785, 1837 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(y) последовательность оснований, определяемую любой из SEQ ID NO: 1845, 1846, 1847, 1848 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(z) последовательность оснований, определяемую любой из SEQ ID NO: 1849, 1850 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(a1) последовательность оснований, определяемую любой из SEQ ID NO: 1787, 1851 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

(b1) последовательность оснований, определяемую любой из SEQ ID NO: 1788, 1852, 1789, 1853 и имеющую длину 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(c1) последовательность оснований, определяемую любой из SEQ ID NO: 1790, 1854, 1792, 1855 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(d1) последовательность оснований, определяемую любой из SEQ ID NO: 1794, 1861, 1795, 1862 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(e1) последовательность оснований, определяемую любой из SEQ ID NO: 1796, 1863, 1797, 1864 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(f1) последовательность оснований, определяемую любой из SEQ ID NO: 1798, 1865, 1799, 1866 и имеющую длину 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(g1) последовательность оснований, определяемую любой из SEQ ID NO: 1808, 1867, 1809, 1868, 1810, 1869, 1858, 1873 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(h1) последовательность оснований, определяемую любой из SEQ ID NO: 1811, 1870, 1859, 1874 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(i1) последовательность оснований, определяемую любой из SEQ ID NO: 1856, 1871, 1860, 1875 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(j1) последовательность оснований, определяемую любой из SEQ ID NO: 1857, 1872 и имеющую длину 26, 27, 28, 29 или 30 нуклеотидов, или

(k1) последовательность оснований, определяемую любой из SEQ ID NO: 1800, 1876, 1801, 1877 и имеющую длину 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(l1) последовательность оснований, определяемую любой из SEQ ID NO: 1802, 1878, 1803, 1879 и имеющую длину 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(m1) последовательность оснований, определяемую любой из SEQ ID NO: 1804, 1880 и имеющую длину 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(n1) последовательность оснований, определяемую любой из SEQ ID NO: 1805, 1881 и имеющую длину 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, или

(o1) последовательность оснований, определяемую любой из SEQ ID NO: 1806, 1882, 1807, 1883 и имеющую длину 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов.

Олигонуклеотид по изобретению, который содержит или состоит из последовательности, определяемой номером SEQ ID, также охватывает олигонуклеотид, содержащий последовательность оснований, определяемую этим SEQ ID. Олигонуклеотиды, имеющие модифицированную основную цепь (т.е. модифицированные части сахаров и/или модифицированные межнуклеозидные связи), относительно олигонуклеотидов, определяемых SEQ ID, также охватываются изобретением. Каждое основание U в SEQ ID NO олигонуклеотида, как определено в настоящем описании, может быть модифицировано или заменено на T.

Композиция

В следующем аспекте предусматривается композиция, содержащая олигонуклеотид, как описано в предыдущем разделе под названием "Олигонуклеотид". Эта композиция предпочтительно содержит или состоит из олигонуклеотида, как описано выше. Предпочтительная композиция содержит один единственный олигонуклеотид, как определено выше. Таким образом, понятно, что пропускания по меньшей мере указанного первого и указанного второго экзона достигают с использованием одного единственного олигонуклеотида, а не с использованием коктейля различных олигонуклеотидов.

В предпочтительном варианте осуществления указанная композиция предназначена для применения в качестве лекарственного средства. Таким образом, указанная композиция представляет собой фармацевтическую композицию. Фармацевтическая композиция обычно содержит фармацевтически приемлемый носитель, разбавитель и/или эксципиент. В предпочтительном варианте осуществления композиция по настоящему изобретению содержит соединение, как определено в настоящем описании, и необязательно дополнительно содержит фармацевтически приемлемый состав, наполнитель, консервант, солюбилизатор, носитель, разбавитель, эксципиент, соль, адъювант и/или растворитель. Такой фармацевтически приемлемый носитель, наполнитель, консервант, солюбилизатор, разбавитель, соль, адъювант, растворитель и/или эксципиент может быть найден, например, в Remington. Соединение, как описано в рамках изобретения, обладает по меньшей мере одной ионогенной группой. Ионогенная группа может представлять собой основание или кислоту, и она может быть заряженной или нейтральной. Ионогенная группа может присутствовать в качестве пары ионов с соответствующим противоионом, который имеет противоположный заряд(ы). Примерами катионных противоионов являются натрий, калий, цезий, Tris, литий, кальций, магний, триалкиламмоний, триэтиламмоний и тетраалкиламмоний. Примерами анионных противоионов являются хлорид, бромид, йодид, лактат, мезилат, ацетат, трифторацетат, дихлорацетат и цитрат. Примеры противоионов описаны (Kumar L., которая включена в настоящее описание в качестве ссылки в полном объеме). Таким образом, в предпочтительном варианте осуществления олигонуклеотид по изобретению приводят в контакт с композицией, содержащей такие ионогенные группы, предпочтительно Ca2+, с получением хелатного комплекса олигонуклеотида, содержащего два или более идентичных олигонуклеотидов, связанных таким мультивалентным катионом, как уже определено в настоящем описании.

Фармацевтическую композицию, кроме того, можно составлять, чтобы дополнительно способствовать повышению стабильности, растворимости, всасывания, биодоступности, фармакокинетики и клеточного захвата указанного соединения, в частности, составов, содержащих эксципиенты или конъюгаты, способные образовывать комплексы, наночастицы, микрочастицы, нанотрубки, наногели, гидрогели, полоксамеры или плюроники, полимерсомы, коллоиды, микропузырьки, везикулы, мицеллы, липоплексы и/или липосомы. Примеры наночастиц включают полимерные наночастицы, золотые наночастицы, магнитные наночастицы, частицы на основе диоксида кремния, липидные наночастицы, наночастицы на основе сахаров, белковые наночастицы и пептидные наночастицы.

Предпочтительная композиция содержит по меньшей мере один эксципиент, который может далее способствовать усилению нацеливания и/или доставки указанной композиции и/или указанного олигонуклеотида к и/или в мышцу и/или клетку. Клетка может представлять собой мышечную клетку.

Другая предпочтительная композиция может содержать по меньшей мере один эксципиент, классифицируемый как второй тип эксципиента. Второй тип эксципиента может включать или содержать конъюгатную группу, как описано в настоящем описании, для усиления нацеливания и/или доставки композиции и/или олигонуклеотида по изобретению к ткани и/или клетке и/или в ткань и/или клетку, например, такую как мышечная ткань или клетка. Оба типа эксципиентов можно комбинировать в одну единственную композицию, как определено в настоящем описании. Предпочтительные конъюгатные группы описаны в части, посвященной определениям.

Квалифицированный специалист может выбирать, комбинировать и/или адаптировать один или несколько из описанных выше или других альтернативных эксципиентов и систем для доставки для составления и доставки соединения для применения в рамках настоящего изобретения.

Такую фармацевтическую композицию по изобретению можно вводить в эффективной концентрации в установленные моменты времени животному, предпочтительно млекопитающему. Более предпочтительным млекопитающим является человек. Соединение или композиция, как определено в настоящем описании, могут быть пригодны для прямого введения в клетку, ткань и/или орган in vivo у индивидуумов, предпочтительно указанные индивидуумы страдают или имеют риск развития BMD или DMD, и их можно вводить прямо in vivo, ex vivo или in vitro. Введение можно осуществлять системным и/или парентеральным путями, например, внутривенным, подкожным, внутрижелудочковым, интратекальным, внутримышечным, интраназальным, энтеральным, интравитреальным, внутрицеребральным, эпидуральным или пероральным путем.

Предпочтительно, такая фармацевтическая композиция по изобретению может быть инкапсулирована в форме эмульсии, суспензии, пилюли, таблетки, капсулы или мягкой желатиновой капсулы для пероральной доставки, или она может быть в форме аэрозоля или сухого порошка для доставки в дыхательные пути и легкие.

В одном варианте осуществления соединение по изобретению можно использовать вместе с другим соединением, уже известным тем, что его используют для лечения указанного заболевания. Такие другие соединения можно использовать для замедления прогрессирования заболевания, для снижения аномального поведения или движений, для снижения воспаления мышечной ткани, для улучшения функции, целостности и/или выживаемости мышечных волокон и/или для улучшения, увеличения или восстановления сердечной функции. Примерами являются, но не ограничиваясь ими, стероид, предпочтительно (глюко)кортикостероид, ингибитор ACE (предпочтительно периндоприл), блокатор рецептора ангиотензина II типа 1 (предпочтительно лозартан), ингибитор фактора некроза опухоли-альфа (TNFα), ингибитор TGFβ (предпочтительно декорин), рекомбинантный бигликан человека, источник mIGF-1, ингибитор миостатина, манноза-6-фосфат, антиоксидант, ингибитор ионных каналов, ингибитор протеаз, ингибитор фосфодиэстеразы (предпочтительно ингибитор PDE5, такой как силденафил или тадалафил), L-аргинин, блокаторы дофамина, амантадин, тетрабеназин и/или кофермент Q10. Это комбинированное применение может представлять собой последовательное применение: каждый компонент вводят в отдельной композиции. Альтернативно, каждое соединение можно использовать вместе в одной композиции.

Применение

В следующем аспекте предусматривается применение композиции или соединения, как описано в настоящем описании, в качестве лекарственного средства или части терапии, или применения, в которых соединение проявляет его активность внутриклеточно.

В предпочтительном варианте осуществления соединение или композиция по изобретению предназначены для применения в качестве лекарственного средства, где лекарственное средство предназначено для профилактики, замедления, смягчения и/или лечения заболевания, как определено в настоящем описании, предпочтительно DMD или BMD.

Способ профилактики, замедления, смягчения и/или лечения заболевания

В следующем аспекте предусматривается способ профилактики, замедления, смягчения и/или лечения заболевания, как определено в настоящем описании, предпочтительно DMD или BMD. Указанное заболевание можно предупреждать, лечить, замедлять или смягчать у индивидуума, в клетке, ткани или органе указанного индивидуума. Способ включает введение олигонуклеотида или композиции по изобретению указанному индивидууму или субъекту, нуждающемуся в этом.

Способ по изобретению, где олигонуклеотид или композиция, как определено в настоящем описании, могут быть пригодными для введения в клетку, ткань и/или орган in vivo индивидуумам, предпочтительно индивидуумам, страдающим BMD или DMD или имеющим риск развития такого заболевания, можно проводить in vivo, ex vivo или in vitro. Индивидуум или субъект, нуждающиеся в этом, предпочтительно представляют собой млекопитающее, более предпочтительно человека.

В одном варианте осуществления в способе по изобретению концентрация олигонуклеотида или композиции находится в диапазоне от 0,01 нМ до 1 мкМ. Более предпочтительно, используемая концентрация составляет от 0,02 до 400 нМ, или от 0,05 до 400 нМ, или от 0,1 до 400 нМ, еще более предпочтительно от 0,1 до 200 нМ.

Диапазоны доз олигонуклеотида или композиции по изобретению предпочтительно выбирают, исходя из исследований с возрастающей дозой в клинических испытаниях (применение in vivo), для которых существуют строгие требования протокола. Олигонуклеотид, как определено в настоящем описании, можно использовать в дозе, которая находится в диапазоне от 0,01 до 200 мг/кг, или от 0,05 до 100 мг/кг, или от 0,1 до 50 мг/кг, или от 0,1 до 20 мг/кг, предпочтительно от 0,5 до 10 мг/кг.

Диапазоны концентрации или дозы олигонуклеотида или композиции, приведенные выше, являются предпочтительными концентрациями или дозами для применений in vitro или ex vivo. Квалифицированному специалисту будет понятно, что в зависимости от типа используемого олигонуклеотида, клетки-мишени, подлежащей лечению, гена-мишени и его уровней экспрессии, используемой среды и условий трансфекции и инкубации, концентрация или доза указанного используемого олигонуклеотида может далее варьировать и может требовать дальнейшей оптимизации.

Определения

"Идентичность последовательностей", как известно в данной области, представляет собой взаимосвязь между двумя или более последовательностями нуклеиновой кислоты (полинуклеотид или нуклеотид), как определяют путем сравнения последовательностей. В данной области процент "идентичности" или "сходства" указывает на степень родственности последовательностей нуклеиновой кислоты при определении по соответствию цепей таких последовательностей. "Идентичность" может быть заменена в настоящем описании "сходством". Предпочтительно, процент идентичности определяют путем сравнения всей SEQ ID NO, как определено в настоящем описании. Однако также можно использовать часть последовательности. Часть последовательности в этом контексте может означать по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или 100% данной последовательности или SEQ ID NO.

"Идентичность" и "сходство" можно без труда вычислить известными способами, включая, но не ограничиваясь ими, способы, описанные в Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heine, G., Academic Press, 1987; и Sequence Analysis Primer Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991; и Carillo, H., and Lipman, D., SIAM J. Applied Math., 48: 1073 (1988).

Предпочтительные способы определения идентичности разработаны так, чтобы обеспечить наибольшее соответствие между исследуемыми последовательностями. Способы определения идентичности и сходства закодированы в общедоступных компьютерных программах. Предпочтительные компьютерные программы для определения идентичности и сходства между двумя последовательностями включают, например, пакет программ GCG (Devereux, J., et al., Nucleic Acids Research 12 (1):387 (1984)), BestFit и FASTA (Altschul, S.F. et al., J. Mol. Biol. 215: 403-410 (1990)). Семейство программ BLAST 2.0, которое можно использовать для поиска сходства в базах данных, включает, например, BLASTN для нуклеотидных последовательностей запроса против нуклеотидных последовательностей из баз данных. Семейство программ BLAST 2.0 является общедоступным от NCBI и других источников (BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al., J. Mol. Biol. 215: 403-410 (1990)). Также для определения идентичности можно использовать хорошо известный алгоритм Смита-Ватермана.

Предпочтительные параметры для сравнения нуклеиновых кислот включают следующие параметры: алгоритм: Needleman and Wunsch, J. Mol. Biol. 48: 443-453 (1970); матрица сравнений: совпадение = +10, несовпадение = 0; штраф за пропуск: 50; штраф за продолжение пропуска: 3. Доступен в качестве программы Gap от Genetics Computer Group, расположенной в Madison, Wis. Выше приведены параметры по умолчанию для сравнений нуклеиновых кислот.

Другим предпочтительным способом определения сходства и идентичности последовательностей является способ с использованием алгоритма Needleman-Wunsch (Needleman, S.B. and Wunsch, C.D. (1970) J. Mol. Biol. 48, 443-453, Kruskal, J.B. (1983), обзор сравнения последовательностей: D. Sankoff and J.B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley).

Другим предпочтительным способом определения сходства и идентичности последовательностей является способ с использованием EMBOSS Matcher и алгоритма Waterman-Eggert (локальное выравнивание двух последовательностей; [Schoniger и Waterman, Bulletin of Mathematical Biology 1992, Vol. 54 (4), pp. 521-536; Vingron and Waterman, J. Mol. Biol. 1994; 235(1), p1-12]). Можно использовать следующие web-сайты: http://www.ebi.ac.uk/Tools/emboss/align/index.html или http://emboss.bioinformatics.nl/cgi-bin/emboss/matcher. Определения параметров, используемых в этом алгоритме, находится на следующем web-сайте: http://emboss.sourceforge.net/docs/themes/AlignFormats.html#id. Предпочтительно используют параметры по умолчанию (матрица: EDNAFULL, штраф за пропуск: 16, штраф за продолжение пропуска: 4). Emboss Matcher обеспечивает наилучшее локальное выравнивание между двумя последовательностями, однако также предоставляются альтернативные выравнивания. В таблице 2 представлено наилучшее локальное выравнивание между двумя различными экзонами, предпочтительно экзонами дистрофина, которые предпочтительно используют для конструирования олигонуклеотидов. Однако также можно идентифицировать альтернативные выравнивания и, таким образом, альтернативные области идентичности между двумя экзонами, и их можно использовать для конструирования олигонуклеотидов, что также является частью настоящего изобретения.

На протяжении заявки слова "связывается", "нацеливается", "гибридизуется" могут использоваться взаимозаменяемо, когда их используют в контексте олигонуклеотида, который обратно комплементарен области пре-мРНК, как определено в настоящем описании. Аналогично, выражения "способен связываться", "способен нацеливаться" и "способен гибридизоваться" могут использоваться взаимозаменяемо для указания на то, что олигонуклеотид имеет определенную последовательность, которая позволяет связывание, нацеливание или гибридизацию с последовательностью-мишенью. Когда последовательность-мишень определена в настоящем описании или известна в данной области, квалифицированный специалист способен сконструировать все возможные структуры указанного олигонуклеотида с использованием принципа обратной комплементарности. В этом отношении будет понятно, что допустимо ограниченное количество несоответствий или пропусков в последовательности между олигонуклеотидом по изобретению и последовательностями-мишенями в первом и/или втором экзонах при условии, что связывание не изменяется, как рассмотрено выше. Таким образом, олигонуклеотид, который способен связываться с определенной последовательностью-мишенью, может считаться олигонуклеотидом, который обратно комплементарен последовательности-мишени. В контексте изобретения "гибридизуется" или "способен гибридизоваться" используют для физиологических условий в клетке, предпочтительно в клетке человека, если нет иных указаний.

Как используют в рамках изобретения, "гибридизация" относится к спариванию комплементарных олигомерных соединений (например, антисмысловое соединение и его нуклеиновая кислота-мишень). Не ограничиваясь конкретным механизмом, наиболее распространенный механизм образования пар вовлекает образование водородных связей, которое может представлять собой образование водородных связей по типу Уотсона-Крика, Хугстина или обратному хугстиновскому типу между комплементарными нуклеозидными или нуклеотидными основаниями (нуклеиновые основания). Например, природное основание аденин представляет собой нуклеиновое основание, комплементарное природному нуклеиновому основанию тимину, 5-метилурацилу и урацилу, которые образуют пару путем образования водородных связей. Природное основание гуанин представляет собой нуклеиновое основание, комплементарное природным основаниям цитозину и 5-метилцитозину. Гибридизация может происходить в различных условиях.

Аналогично, "обратную комплементарность" используют для указания на две нуклеотидных последовательности, которые способны гибридизоваться друг с другом, в то время как одна из последовательностей ориентирована от 3' к 5', а другая ориентирована в обратном направлении, т.е. от 5' к 3'. Таким образом, нуклеозид A на первой нуклеотидной последовательности способен образовывать пару с нуклеозидом A* на второй нуклеотидной последовательности через их соответствующие нуклеиновые основания, и нуклеозид B, расположенный в 5'-положении от упомянутого выше нуклеозида A в первой нуклеотидной последовательности, способен образовывать пару с нуклеозидом B*, который расположен в 3'-положении от упомянутого выше нуклеозида A* во второй нуклеотидной последовательности. В контексте настоящего изобретения первая нуклеотидная последовательность, как правило, представляет собой олигонуклеотид по изобретению, и вторая нуклеотидная последовательность представляет собой часть экзона из пре-мРНК, предпочтительно пре-мРНК дистрофина. Олигонуклеотид предпочтительно называют обратно комплементарным области экзона (первого и/или второго экзона), когда указанный олигонуклеотид по меньшей мере на 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100% обратно комплементарен указанной области указанного первого и/или второго экзона. Предпочтительно, обратная комплементарность составляет по меньшей мере 80%, 85%, 90%, 95% или 100%.

В контексте изобретения эксципиенты включают полимеры (например, полиэтиленимин (PEI), полипропиленимин (PPI), производные декстрана, бутилцианоакрилат (PBCA), гексилцианоакрилат (PHCA), сополимер молочной и гликолевой кислоты (PLGA), полиамины (например, спермин, спермидин, путресцин, кадаверин), хитозан, поли(амидоамины) (PAMAM), поли(сложный эфир-амин), поливиниловый эфир, поливинилпирролидон (PVP), полиэтиленгликоль (PEG) циклодекстрины, гиалуроновую кислоту, коломиновую кислоту и их производные), дендримеры (например, поли(амидоамин)), липиды {например, 1,2-диолеоил-3-диметиламмоний пропан (DODAP), диолеоилдиметиламмоний хлорид (DODAC), производные фосфатидилхолина [например, 1,2- дистеароил-sn-глицеро-3-фосфохолин (DSPC)], производные лизо-фосфатидилхолина [например, 1-стеароил-2-лизо-sn-глицеро-3-фосфохолин (S-LysoPC)], сфингомиелин, 2-{3-[бис-(3-аминопропил)амино]пропиламино}-N-дитетрацедилкарбамоилметилацетамид (RPR209120), производные фосфоглицерина [например, 1,2-дипальмитоил-sn-глицеро-3-фосфоглицерин, натриевая соль (DPPG-Na), производные фосфатицидной кислоты [1,2-дистеароил-sn-глицеро-3-фосфатицидная кислота, натриевая соль (DSPA), производные фосфатидилэтаноламина [например, диолеоил-фосфатидилэтаноламин (DOPE), 1,2-дистеароил-sn-глицеро-3-фосфоэтаноламин (DSPE), 2-дифитаноил-sn-глицеро-3-фосфоэтаноламин (DPhyPE)], N-[1-(2,3-диолеоилокси)пропил]-N,N,N-триметиламмоний (DOTAP), N-[1-(2,3-диолеоилокси)пропил]-N,N,N-триметиламмоний (DOTMA), 1,3-диолеоилокси-2-(6-карбоксиспермил)пропиламид (DOSPER), (1,2-димиристоилоксипропил-3-диметилгидроксиэтиламмоний (DMRIE), (N1-холестерилоксикарбонил-3,7-диазанонан-1,9-диамин (CDAN), диметилдиоктадециламмоний бромид (DDAB), 1-пальмитоил-2-олеоил-sn-глицерол-3-фосфохолин (POPC), (b-L-аргинил-2,3-L-диаминопропионовая кислота-N-пальмитил-N-олеиламид тригидрохлорид (AtuFECT01), производные N,N-диметил-3-аминопропана [например, 1,2-дистеароилокси-N,N-диметил-3-аминопропан (DSDMA), 1,2-диолеилокси-N,N-диметил-3-аминопропан (DoDMA), 1,2-дилинолеилокси-N,N-3-диметиламинопропан (DLinDMA), 2,2-дилинолеил-4-диметиламинометил-[1,3]-диоксолан (DLin-K-DMA), производные фосфатидилсерина [1,2-диолеил-sn-глицеро-3-фосфо-L-серин, натриевая соль (DOPS)], холестерин}, белки (например, альбумин, желатины, ателлоколлаген) и пептиды (например, протамин, PepFects, NickFects, полиаргинин, полилизин, CADY, MPG).

В контексте изобретения конъюгатные группы выбирают из группы, состоящей из нацеливающих частей, повышающих стабильность частей, усиливающих захват частей, усиливающих растворимость частей, улучшающих фармакокинетику частей, улучшающих фармакодинамику частей, повышающих активность частей, репортерных молекул и лекарственных средств, где эти части могут представлять собой пептиды, белки, углеводы, полимеры, производные этиленгликоля, витамины, липиды, полифторалкильные части, стероиды, холестерин, флуоресцентные части и радиоактивно меченые части. Конъюгатные группы необязательно могут быть защищенными и они могут быть связаны с олигонуклеотидом по изобретению прямо или через двухвалентный или поливалентных линкер.

Конъюгатные группы включают части, которые усиливают нацеливание, захват, растворимость, активность, фармакодинамику, фармакокинетику или которые снижают токсичность. Примеры таких групп включают пептиды (например, глутатион, полиаргинин, пептиды RXR (см., например, Antimicrob. Agents Chemother. 2009, 53, 525), полиорнитин, TAT, TP10, pAntp, полилизин, NLS, пенетратин, MSP, ASSLNIA, MPG, CADY, Pep-1, Pip, SAP, SAP(E), транспортан, буфорин II, полимиксин B, гистатин, CPP5, NickFects, PepFects), vivo-porter, белки (например, антитела, авидин, Ig, трансферрин, альбумин), углеводы (например, глюкоза, галактоза, манноза, мальтоза, мальтотриоза, рибоза, трегалоза, глюкозамин, N-ацетилглюкозамин, лактоза, сахароза, фукоза, арабиноза, талоза, сиаловая кислота, гиалуроновая кислота, нейрамидиновая кислота, рамноза, квиновоза, галактозамин, N-ацетилгалактозамин, ксилоза, ликсоза, фруктоза, манноза-6-фосфат, 2-дезоксирибоза, глюкал, целлулобиоза, хитобиоза, хитотриоза), полимеры (например, полиэтиленгликоль, полиэтиленимин, полимолочная кислота, поли(амидоамин)), производные этиленгликоля (например, триэтиленгликоль, тетраэтиленгликоль), водорастворимые витамины (например, витамин B, B1, B2, B3, B5, B6, B7, B9, B12, C), жирорастворимые витамины (например, витамин A, D, D2, D3, E, K1, K2, K3), липиды (например, пальмитил, миристил, олеил, стеарил, батил, глицерофосфолипид, глицеролипид, сфинголипид, церамид, цереброзид, сфингозин, стерин, пренол, эруцил, арахидонил, линолеил, линоленил, арахидил, бутирил, сапеинил, элаидил, лаурил, бегенил, нонил, децил, ундецил, октил, гептил, гексил, пентил, DOPE, DOTAP, терпенил, дитерпеноид, тритерпеноид), полифторалкильные части (например, перфтор[1H,1H,2H,2H]-алкил), одобренные лекарственные средства с ММ<1500 Да, которые обладают аффинностью к конкретным белкам (например, NSAID, такие как ибупрофен (больше описано в патенте США 6656730, включенном в настоящее описание в качестве ссылки), антидепрессанты, противовирусные средства, антибиотики, алкилирующие средства, амебицидные средства, аналгетики, андрогены, ингибиторы ACE, снижающие аппатит средства, антациды, противогельминтные средства, антиангиогенные средства, антиадренергетики, антиангинальные средства, антихолинергетики, антикоагулянты, противосудорожные препараты, противодиабетические средства, противодиарейные средства, антидиуретики, антидоты, противогрибковые средства, противорвотные средства, средства против головокружения, противоподагрические средства, антигонадотропные средства, антигистамины, антигиперлипидемические средства, антигипертензивные средства, противомалярийные средства, средства против мигрени, средства против злокачественной опухоли, антипсихотические средства, противоревматические средства, антитиреоидные средства, антитоксины, противокашлевые средства, анксиолитические средства, контрацептивы, стимуляторы ЦНС, хелаторы, сердечно-сосудистые средства, противозастойные средства, дерматологические средства, диуретики, отхаркивающие средства, диагностические средства, желудочно-кишечные средства, анестетики, глюкокортикоиды, антиаритмические средства, иммуностимулирующие средства, иммунодепрессивные средства, слабительные средства, лепростатические средства, метаболические средства, средства, действующие на органы дыхательной системы, муколитики, мышечные релаксанты, нутрицевтические средства, сосудорасширяющие средства, тромболитические средства, утеротонические средства, сосудосуживающие средства), природные соединения с ММ<2000 Да (например, антибиотики, эйкозаноиды, алкалоиды, флавоноиды, терпеноиды, кофакторы ферментов, поликетиды), стероиды (например, преднизон, преднизолон, дексаметазон, ланостерин, холевая кислота, эстран, андростан, прегнан, холан, холестан, эргостерин, холестерин, кортизол, кортизон, дефлазакорт), пентациклические тритерпеноиды (например, 18β-глицирретиновая кислота, урсоловая кислота, амирин, карбеноксолон, эноксолон, ацетоксолон, бетулиновая кислота, азиатиковая кислота, эритродиол, олеанолевая кислота), полиамины (например, спермин, спермидин, путресцин, кадаверин), флуоресцентные части (например, FAM, карбоксифлуоресцеин, FITC, TAMRA, JOE, HEX, TET, родамин, Cy3, Cy3,5, Cy5, Cy5,5, CW800, BODIPY, AlexaFluors, Dabcyl, DNP), репортерные молекулы (например, акридины, биотины, дигоксигенин, (радио)изотопно меченые части (например, с 2H, 13C, 14C, 15N, 18O, 18F, 32P, 35S, 57Co, 99mTc, 123I, 125I, 131I, 153Gd)) и их комбинации. Такие конъюгатные группы могут быть присоединены прямо к соединениям по изобретению или через линкер. Этот линкер может быть двухвалентным (обеспечивающим конъюгат 1:1) или поливалентным, обеспечивающим олигомер с более чем одной конъюгатной группой. Методики связывания такой конъюгатной группы, либо прямо, либо через линкер, с олигомером по изобретению известны в данной области. Также в контексте изобретения находится применение наночастиц, с которыми ковалентно связаны олигонуклеотиды по изобретению, таким образом, такие конструкции называют сферическими нуклеиновыми кислотами (SNA), например, как описано в J. Am. Chem. Soc. 2008, 130, 12192 (Hurst et al., включенная в настоящее описание в качестве ссылки).

В настоящем документе и в его формуле изобретения глагол "содержать" и его спряжения используют в неограничивающем значении для обозначения того, что объекты после этого слова включены, однако объекты, конкретно не упомянутые, не исключены. Кроме того, глагол "состоять из" может быть заменен на "по существу состоять из", что означает, что олигонуклеотид или композиция, как определено в настоящем описании, могут содержать дополнительный компонент(ы) помимо компонентов, конкретно указанных, причем указанный дополнительный компонент(ы) не изменяет уникальной характеристики изобретения. Кроме того, указание на элемент в единственном числе не исключает возможности того, что присутствует более одного элемента, если контекст явно не требует, чтобы существовал один и только один из элементов. Таким образом, форма единственного числа обычно означает "по меньшей мере один".

Слова "приблизительно" или "примерно", когда их используют применительно к числовой величине (приблизительно 10), предпочтительно означают, что величина может представлять собой данную величину, равную 10, или отличается менее чем на 1% от этой величины.

Каждый вариант осуществления, как указано в настоящем описании, может быть комбинирован с другим, если нет иных указаний. Все патентные и литературные ссылки в настоящем описании включены в настоящее описание в качестве ссылки в полном объеме.

Следующие примеры представлены только для иллюстративных целей, и они не предназначены для ограничения объема настоящего изобретения никоим образом.

Примеры

Таблицы 1-3

Таблица 1
Перечень возможных комбинаций экзонов в транскрипте гена DMD, для которых экзон U (вышележащий) имеет непрерывную открытую рамку считывания с экзоном D (нижележащий), если экзоны с U+1 (первый экзон) по D-1 (второй экзон), и любые экзоны между ними, удалены из транскрипта.
Первый экзон ("U") Второй экзон ("D") 1 8,20,22,51,53,59,62,64,65,67,76,79 2 5,6,9,10,11,13,14,15,16,17,19,21,23,24,25,26,27,28,
29,30,31,32,33,34,35,36,37,38,39,40,41,
42,43,45,47,49,50,52,54,56,58,60,61,68,70
3 6,9,10,11,13,14,15,16,17,19,21,23,24,25,26,27,28,29,
30,31,32,33,34,35,36,37,38,39,40,41,42,43,45,47,49,
50,52,54,56,58,60,61,68,70

4 9,10,11,13,14,15,16,17,19,21,23,24,25,26,27,28,29,
30,31,32,33,34,35,36,37,38,39,40,41,42,
43,45,47,49,50,52,54,56,58,60,61,68,70
5 9,10,11,13,14,15,16,17,19,21,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,
43,45,47,49,50,52,54,56,58,60,61,68,70
6 12,18,44,46,55,57,63,66,69,71,72,73,74,75,77,78 7 20,22,51,53,59,62,64,65,67,76,79 8 11,13,14,15,16,17,19,21,23,24,25,26,27,28,29,30,31,
32,33,34,35,36,37,38,39,40,41,42,43,45,
47,49,50,52,54,56,58,60,61,68,70
9 13,14,15,16,17,19,21,23,24,25,26,27,28,29,30,31,32,
33,34,35,36,37,38,39,40,41,42,43,45,47,
49,50,52,54,56,58,60,61,68,70
10 13,14,15,16,17,19,21,23,24,25,26,27,28,29,30,31,32,
33,34,35,36,37,38,39,40,41,42,43,45,47,
49,50,52,54,56,58,60,61,68,70
11 18,44,46,55,57,63,66,69,71,72,73,74,75,77,78 12 15,16,17,19,21,23,24,25,26,27,28,29,30,31,32,33,34,
35,36,37,38,39,40,41,42,43,45,47,49,50,
52,54,56,58,60,61,68,70
13 16,17,19,21,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,45,47,49,50,52,
54,56,58,60,61,68,70
14 17,19,21,23,24,25,26,27,28,29,30,31,32,33,34,35,36,
37,38,39,40,41,42,43,45,47,49,50,52,54,
56,58,60,61,68,70
15 19,21,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,
38,39,40,41,42,43,45,47,49,50,52,54,56,
58,60,61,68,70
16 19,21,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,
38,39,40,41,42,43,45,47,49,50,52,54,56,
58,60,61,68,70
17 44,46,55,57,63,66,69,71,72,73,74,75,77,78

18 21,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,
39,40,41,42,43,45,47,49,50,52,54,56,58,
60,61,68,70
19 22,51,53,59,62,64,65,67,76,79 20 23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,
40,41,42,43,45,47,49,50,52,54,56,58,60,
61,68,70
21 51,53,59,62,64,65,67,76,79 22 25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,
42,43,45,47,49,50,52,54,56,58,60,61,68,
70
23 26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,
43,45,47,49,50,52,54,56,58,60,61,68,70
24 27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,
45,47,49,50,52,54,56,58,60,61,68,70
25 28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,45,
47,49,50,52,54,56,58,60,61,68,70
26 29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,45,47,
49,50,52,54,56,58,60,61,68,70
27 30,31,32,33,34,35,36,37,38,39,40,41,42,43,45,47,49,
50,52,54,56,58,60,61,68,70
28 31,32,33,34,35,36,37,38,39,40,41,42,43,45,47,49,50,
52,54,56,58,60,61,68,70
29 32,33,34,35,36,37,38,39,40,41,42,43,45,47,49,50,52,
54,56,58,60,61,68,70
30 33,34,35,36,37,38,39,40,41,42,43,45,47,49,50,52,54,
56,58,60,61,68,70
31 34,35,36,37,38,39,40,41,42,43,45,47,49,50,52,54,56,
58,60,61,68,70
32 35,36,37,38,39,40,41,42,43,45,47,49,50,52,54,56,58,
60,61,68,70
33 36,37,38,39,40,41,42,43,45,47,49,50,52,54,56,58,60,
61,68,70
34 37,38,39,40,41,42,43,45,47,49,50,52,54,56,58,60,61,
68,70

35 38,39,40,41,42,43,45,47,49,50,52,54,56,58,60,61,68,70 36 39,40,41,42,43,45,47,49,50,52,54,56,58,60,61,68,70 37 40,41,42,43,45,47,49,50,52,54,56,58,60,61,68,70 38 41,42,43,45,47,49,50,52,54,56,58,60,61,68,70 39 42,43,45,47,49,50,52,54,56,58,60,61,68,70 40 43,45,47,49,50,52,54,56,58,60,61,68,70 41 45,47,49,50,52,54,56,58,60,61,68,70 42 45,47,49,50,52,54,56,58,60,61,68,70 43 46,55,57,63,66,69,71,72,73,74,75,77,78 44 47,49,50,52,54,56,58,60,61,68,70 45 55,57,63,66,69,71,72,73,74,75,77,78 46 49,50,52,54,56,58,60,61,68,70 47 50,52,54,56,58,60,61,68,70 48 52,54,56,58,60,61,68,70 49 52,54,56,58,60,61,68,70 50 53,59,62,64,65,67,76 51 54,56,58,60,61,68,70 52 59,62,64,65,67,76 53 56,58,60,61,68,70 54 57,63,66,69,71,72,73,74,75,77,78 55 58,60,61,68,70 56 63,66,69,71,72,73,74,75,77,78 57 60,61,68,70 58 62,64,65,67,76,79 59 68,70 60 68,70 61 64,65,67,76,79 62 66,69,71,72,73,74,75,77,78 63 67,76,79 64 67,76,79 65 69,71,72,73,74,75,77,78 66 76,79 67 70 68 71,72,73,74,75,77,78

70 73,74,75,77,78 71 74,75,77,78 72 75,77,78 73 77,78 74 77,78

Таблица 2
Перечень областей экзонов: участки последовательности с (частично) высокой идентичностью или сходством последовательности (по меньшей мере 50%) между двумя различными экзонами дистрофина, идентифицированные в качестве наилучшего попарного выравнивания с помощью EMBOSS Matcher с использованием параметров по умолчанию (матрица: EDNAFULL, штраф за пропуск: 16, штраф за продолжение пропуска: 4) (http://www.ebi.ac.uk/tools/psa/emboss_matcher/nucleotide.html). Пропускание этих экзонов, и предпочтительно любых экзонов между ними, может привести к транскрипту DMD в рамке считывания (как в таблице 1)
Экзоны-мишени Выравнивание EMBOSS SEQ ID NO 8
19
AGAUAAGAAGUCCA
||.|.||||||.||
AGCUGAGAAGUUCA
17
18
8
21
ACCUAUCCAGAUAAG-AAGUCCAUCUUAAUGUACA
||..|||....|||| |||||..|..|.||||.||
ACAAAUCAUUUUAAGCAAGUCUUUUCUGAUGUGCA
19
20
8
50
UUUGCCUCAACAAGUGAG--CAUUGAAGCC
|||.|.||||.|..|||| ||..|.||||
UUUACUUCAAGAGCUGAGGGCAAAGCAGCC
21
22
8
52
GAAGCCAUCCAGGAAGUGGAA
|.|.|.||.|||||..|||||
GCAACAAUGCAGGAUUUGGAA
23
24

8
58
CAAGUGAGCAUUGAA
||||.|.|.||||||
CAAGAGGGAAUUGAA
25
26
9
10
CUAGCACAGGGAUA
|.||||||.|||.|
CAAGCACAAGGAGA
27
28
9
12
GUCAGUCUAGCACAGGGAUAUGAGAGAAC
|.|.|.|||.||.|...|.|.||.|||||
GACUGGCUAACAAAAACAGAAGAAAGAAC
29
30
9
13
UCUAGCACAGGGAUAUGAGAG
|||||.|||.|.|.|.|..||
UCUAGAACAAGAACAAGUCAG
31
32
9
14
ACACAGGCUGCUUAUGUCACCACCUCUGAC
|.|||..||.||.|..|..|.||.|||.||
AGACAUCCUUCUCAAAUGGCAACGUCUUAC
33
34
9
15
UCUAGCACAGGGAUAUGAGAGAA
|.|||..||.||.|.|.|||.||
UUUAGUGCAUGGCUUUCAGAAAA
35
36
9
16
UAUGCCUACACACAGGCUGCUUAUGUCACCAC
|||.|...||.|||.|.| |||.|.|||.|||
UAUUCACUCAAACAAGAU-CUUCUUUCAACAC
37
38

9
18
GAUAUGAGAGAACUUC
|||||.|..|||||||
GAUAUAACUGAACUUC
39
40
9
20
CACCACCUCUGACCCUACA
||||.|.||.||.||.|||
CACCCCAUCAGAGCCAACA
41
42
9
22
CUUA-UGUCACCACCUCUGA
|||| |||||||..||.|||
CUUAGUGUCACCGACUAUGA
43
44
9
23
UAUGUCACCACCUCUG
|||.|||.||||.|||
UAUCUCAGCACCACUG
45
46
9
25
CAGGGAUAUG-AGAGAACUUCUUCCC
|||.|||||. |||.|| |||..|||
CAGUGAUAUUCAGACAA-UUCAGCCC
47
48
9
26
UAAGCCUCGAUUCAAGAGCUAU
||||||||.|.. ||||.||||
UAAGCCUCCAGA-AAGAUCUAU
49
50
9
27
ACCACCUCUGACCCUACAC
||.|||..||.|.||.|||
ACUACCAGUGGCUCUGCAC
51
52

9
28
GGAUAUGAGAGAACUUCU
|||..||||..||..|||
GGAGCUGAGGAAAUCUCU
53
54
9
29
AGGGAUAUGAGAGAACUUCUUCCCCU
|||.|..|||||.|..|..|||.|.|
AGGAACUUGAGACAUUUAAUUCUCGU
55
56
9
30
CAGUCUAGCACAGGGAUAUGAGAGAACUUCUUCCCCUAAGCCUCGAUUC
|||||| ||.||||....|||.|.|.|.| |.|.|.|||.||..||.||
CAGUCU-GCCCAGGAGACUGAAAAAUCCU-UACACUUAAUCCAGGAGUC
57
58
9
31
GGUCAGUCUAGCACAGGGAUAUGAGAGAACUUCUUC
|.|||||.|||.| ||.||||...|||.|..||
GAUCAGUUUAGAA----GAAAUGAAGAAACAUAAUC
59
60
9
32
UUCUUCCCCUAAGCCUCGAUUCAAGAGCUAUGCCUACA
||.||||...||.|..|.|.|...||||...|.|||||
UUAUUCCAGAAACCAGCCAAUUUUGAGCAGCGUCUACA
61
62
9
33
CCCUAAGC-CUCGAUUCAAGAG
|||.|||. ||.|||..|||||
CCCAAAGAACUUGAUGAAAGAG
63
64
9
34
GGGAUAUGAGAGAACUUCUUCCCCUAAGCCUCGAUUCAAGAGCUAUGCCUACACACA--GGCUG
|.||.|||...|||.||.| |||.||||...|||....|.|...|||.||..|||.| |||||
GAGAAAUGCUUGAAAUUGU-CCCGUAAGAUGCGAAAGGAAAUGAAUGUCUUGACAGAAUGGCUG
65
66

9
35
AGUCUAGCACAGGGAUAUGAGAGAACUU
||..||.|||||.|.||.|||||..|||
AGAGUAUCACAGAGGUAGGAGAGGCCUU
67
68
9
36
UCAGUCUAGCACAG----GGAU--AUGAGAGAA
||||.||..||||. |||| ||.||||||
UCAGGCUGACACACUUUUGGAUGAAUCAGAGAA
69
70
9
38
CAGUCUAGCACAGGGAUAUGAGAGAACUUCUU
||||.||.|.|| |||||...|.||.|.|||
CAGUUUAACUCA--GAUAUACAAAAAUUGCUU
71
72
9
40
CAGGCUGCUUAUGUC
|||||||.|.||.||
CAGGCUGAUGAUCUC
73
74
9
41
CCACCUCUGACCC
|||.|||.||.||
CCAACUCAGAUCC
75
76
9
42
GAUAUGAGAGAACUUCU
||..||..|.|||||||
GAAGUGGAACAACUUCU
77
78
9
44
GGGAUAUGAGAGAACU
|.|||.|||.|||.||
GCGAUUUGACAGAUCU
79
80

9
46
GUCAGUCUAGCACAGGGAUAUGAGAGAACUUCUU
|||||..|..||.||.|||.|.|..|||.||.||
GUCAGAAUUUCAAAGAGAUUUAAAUGAAUUUGUU
81
82
9
47
UCCCCUAAGCCUCGA
||||.||||||..||
UCCCAUAAGCCCAGA
83
84
9
48
GAUUCAAGAGCUAUGCCU-ACACACAGG
|.|||.||||||.|.||| |.|.|||.|
GUUUCCAGAGCUUUACCUGAGAAACAAG
85
86
9
49
GGUCAGUCUAG-CACAGGGAUAUGAGAGAACUUCU
|.|||..|||. ||...||||.||..|||..||.|
GUUCAAGCUAAACAACCGGAUGUGGAAGAGAUUUU
87
88
9
51
CACGGUCAGUCUAGCACAGGGAUAUGAGAGAACUU
|.|.|.|||..|...||.|||.|..||.|||||||
CUCUGGCAGAUUUCAACCGGGCUUGGACAGAACUU
89
90
9
53
CUACACACAGGCUG
|.|||||..|||||
CAACACAAUGGCUG
91
92
9
57
GUCUAGCACAGGGAUAUGAGAGAACUUCU
|||| ||||.....|.||...||||||||
GUCU-GCACCUUUCUCUGCAGGAACUUCU
93
94

9
59
CAGGCUGCUUAUGUCACCAC
|||||||...|.||||..||
CAGGCUGAGGAGGUCAAUAC
95
96
9
60
CACCUCUGACCCUACA
||.||||.|||.||.|
CAGCUCUCACCGUAUA
97
98
10
12
UGAUGUGGAAGUGGUGAAAGACCAGUUUCAUACUCAUGAG
||||.|.||||...|.|||..|||..|.||....|||.||
UGAUCUUGAAGACCUAAAACGCCAAGUACAACAACAUAAG
99
100
10
13
UCAAACAGCUUUAGAAGAAGUA
||||..||.|.|||||.|||.|
UCAAGAAGAUCUAGAACAAGAA
101
102
10
14
CAAACAGCUUUAGAAGAAGU-AUUAUCG-UGGCUUCUUU
||||||.||.||||.|.|.. |..|.|| |||.||||||
CAAACAUCUGUAGAUGGACAGAAGACCGCUGGGUUCUUU
103
104
10
15
ACAGCUUUAGAAGAAGUAUUAUCGUGGCUUC
|.||.|..|.|.|||.|.|||||..|.||||
AAAGAUCAAAAUGAAAUGUUAUCAAGUCUUC
105
106
10
16
AGUAAACCUGGACCGUUAUCAAACAGCUUUAGAAGAAGU
|.|.||.|..||.|.|..|..|||| ||..||||.||||
ACUCAAACAAGAUCUUCUUUCAACA-CUGAAGAAUAAGU
107
108

10
18
AUUUGGAAGCUC-CUGAAGACAAGUCAUUUGGCAG
|||||.||.||. |.||||..|.|..|.||..|||
AUUUGCAAUCUUUCGGAAGGAAGGCAACUUCUCAG
109
110
10
20
AUCAAACA-GCUUUAGAAGAAGU
|||||||| ||.|.||||.||.|
AUCAAACAAGCCUCAGAACAACU
111
112
10
22
GACACAUUGCAAGCA
|||||.||||.|.||
GACACUUUGCCACCA
113
114
10
23
UGAAGUAAACCUGGACCGUUAUCAAACAGCUUUAGAAGAAGU
||||.|.|.||.|.| .||||||.|||..||.||||||.|
UGAAAUUAGCCGGAA---AUAUCAAUCAGAAUUUGAAGAAAU
115
116
10
25
AAACCUG-GACCGUUAUCAAACAGCUUUAGAAGAAGUAUUAUC
|.||.|| |||.|...|||||.|.|||.|.|...|||...|||
AGACUUGAGACAGAACUCAAAGAACUUAACACUCAGUGGGAUC
117
118
10
26
CUGCUGAGGACACAUUGCAAGCACAAGGAGAGAU
||.|.||.||...|..|.|||||...|.||||||
CUCCAGAUGAAUUACAGAAAGCAGUUGAAGAGAU
119
120
10
27
ACAGCUUUAGAAGAAG
|.||||..||||||.|
AGAGCUAAAGAAGAGG
121
122

10
28
AAACCUGGACCGUUAUCAAACAGCUU--UAGAAGAAGUAUUAUCGUGGCUUCUUUCUGCUGAGGACACAUUGCAAGC
|.||.|||| |..|.||||||..|. ||.|.||||||..||.....|||....|..|||| |.|||||.|..||
AUACUUGGA--GAAAGCAAACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGA--AAACAUUCCUGGC
123
124
10
29
CUAAUGA-UGUGGAAGUGGUGAAA
|||||.| ||.||||.|.|.||.|
CUAAUCAAUGAGGAACUUGAGACA
125
126
10
30
GACAAGUCAUUUGGCAGUUCAUUGAUGGAGAGUGAAGUAAACCUGGACCGUUAUCAAACAGCUUUAGAAG
|||||| ||.|||||||.|.|| |.||.||..||..|||||.....|||||...||...||||
GACAAG-CAGUUGGCAGCUUAU--------AUUGCAGACAAGGUGGACGCAGCUCAAAUGCCUCAGGAAG
127
128
10
31
GACAAGUCAUUUGGCAGUUCAUUGAUGGAGAG-UGAAGUAA
||||||||||. ||.|||.|...|.|||. |||||.||
GACAAGUCAUG----AGAUCAGUUUAGAAGAAAUGAAGAAA
129
130
10
32
ACAAGUCAUUUGGCAGUUCAUUGAUGGAGAGU-GAAGUAAA--CCUGGACCGUUAUCAAACAGCUUUAGAA---GAAGUAUUAUCGU
|||||..|.|..|..|.|..|.||||.||.|. ||.|.|.. ||||.|..|..|.||||.|| |.|.||| ||||||.||..||
ACAAGAAAGUAAGAUGAUUUUAGAUGAAGUGAAGAUGCACUUGCCUGCAUUGGAAACAAAGAG-UGUGGAACAGGAAGUAGUACAGU
131
132
10
33
UGAUGUGGAAGUGGUGA--AAGAC
|||.||||||.|||||| |||||
UGAAGUGGAAAUGGUGAUAAAGAC
133
134

10
34
CUAAUGAUGUGGAAGUGGUGAA-AGACCAG
|||..|||.|||||.||...|| |||.|||
CUACAGAUAUGGAAUUGACAAAGAGAUCAG
135
136
10
35
AAACAGCUUUAG--AAGAAGUA
||||||.|||.| ||||||.|
AAACAGUUUUGGGCAAGAAGGA
137
138
10
36
AAGCACAAGGAGAGAUUUCUAAUGA-UGUGGA
||.||||.|||.|..|||.....|| ||||||
AAACACAUGGAAACUUUUGACCAGAAUGUGGA
139
140
10
37
GAAGUAAACCUGGA
|||.|||..|||||
GAAUUAAGACUGGA
141
142
10
38
UGAAGUAAACCUGGACCGUUAUCAAACAGCUUUAGAAGAAGU
|||||.|| .||||.|..|.|.|..|||.|.||.||.||.|
UGAAGGAA--UUGGAGCAGUUUAACUCAGAUAUACAAAAAUU
143
144
10
39
AUUGAUGGAGAGUGAAGUAAACCU
||||.||.|.||.|.||..|||.|
AUUGUUGCAAAGAGGAGACAACUU
145
146
10
40
UGAGGACACAUUGCAAGCACAAGG----AGAGAUUUCUAAUGAUGUGGAAGUGGUGAAAGA
|||||.|.||..|.|...|.|||| |||.||||||.||.| ||||.|...||..||||
UGAGGUCUCAAAGAAGAAAAAAGGCUCUAGAAAUUUCUCAUCA-GUGGUAUCAGUACAAGA
147
148

10
41
GCUGAGGACACAUUGCAAGCACAAGGAGAGAUU-UCUAAUGAUGUGG
|||||...||....|.|.|||....|||.|.|| |||.|.||||.||
GCUGAAUGCAGUGCGUAGGCAAGCUGAGGGCUUGUCUGAGGAUGGGG
149
150
10
42
CUGAAGACAAGUCAUUUGGCAGUUCAUUGAUGGAGAGUGAAGUAAACCUGGACCGUUAUCAAACAGCUUU-AGAAGAAGUAUUAUC-GUGG-----CUUCUUUCUGCUGAGGACACAU-UGC-//
|||||||||.| |.|||||.|.||..|| |||.....|..|.|.| .|.|||.|..||||..||..|.| |.|||...|||||.| |||| |||||...||||...|||...| |||
CUGAAGACAUG-CCUUUGGAAAUUUCUU-AUGUGCCUUCUACUUA--UUUGACUGAAAUCACUCAUGUCUCACAAGCCCUAUUAGAAGUGGAACAACUUCUCAAUGCUCCUGACCUCUGUGCU//
//AAGCACAAGGAGAGAUUUCU
|||..|...|| ||||.|||
//AAGGACUUUGA-AGAUCUCU
151
152
10
44
CGUUAUCAAACAGCUUUAGAAGAAGUAUUAUC-GUGGCUUCUUUCUGCUGAGGACACAUUGCAAGCACAAGGAGAGAUUUCUAAUGAUGUGGAAGUGGUGAAAGACCAGU
||||.|||....|.|.|| ||||..|.|.||| ||||||.......||||| |||..||...|| |.|...|.|.|||.||.|..||..||||...|..|||.||.|..
CGUUUUCAUUAUGAUAUA-AAGAUAUUUAAUCAGUGGCUAACAGAAGCUGA--ACAGUUUCUCAG-AAAGACACAAAUUCCUGAGAAUUGGGAACAUGCUAAAUACAAAU
153
154
10
46
AAGUAAACCUGGACCGU-UAUCAAACAGCUUUAGAAGAA---GUAUUAUCGUGG
|||.|.|.||.|.|.|. |.|||||.||.||||.|.||| ||.||||.||.|
AAGAAUAUCUUGUCAGAAUUUCAAAGAGAUUUAAAUGAAUUUGUUUUAUGGUUG
155
156

10
47
AAGCUCCUGAAGACAAGUC
||||||..|.||||||.||
AAGCUCAAGCAGACAAAUC
157
158
10
48
UGGAAGCUCCUGAAGACAAGUCAUUUGGCAGUU
|.|||||||. ||.|.|||.|.||.|||||.|
UUGAAGCUCA--AAUAAAAGACCUUGGGCAGCU
159
160
10
49
GAGAGUGAAGUAAACCUGGACCGUUAUCAAACAGCUUUAGAAGAAGUAUUAUC
||.|.||||.||....|..|...|.|.|||.|.|.|.|.|||||..|.||.||
GAAACUGAAAUAGCAGUUCAAGCUAAACAACCGGAUGUGGAAGAGAUUUUGUC
161
162
10
51
UUCAUUGAUGGAGAGUGAAGUAAACCUGGACCGUUAUCAAACAGCUUUAGA-AGAAGUAUUAUCG--UGGCUUCUUUCUGCU-GAGGACACAUUGCAAGCACAAGGAGAGAU
|||.||||||..|.|.|.|......|||| |.|.|.||||.|.|..||.|| ||||.| ||.|| |||||| |.|||||| ||..|.....|..||.||||..|.|.|||
UUCCUUGAUGUUGGAGGUACCUGCUCUGG-CAGAUUUCAACCGGGCUUGGACAGAACU--UACCGACUGGCUU-UCUCUGCUUGAUCAAGUUAUAAAAUCACAGAGGGUGAU
163
164
10
53
GAGAGAUUUCU-AAUGAUGUGGAAGUGGUGAAAGACCAGUUUCAUA
||.|||.|||. |||.|...|||.|..||..||||.||..||||.|
GAAAGAAUUCAGAAUCAGUGGGAUGAAGUACAAGAACACCUUCAGA
165
166
10
55
CAGCUUUAGAAGAA
|.|||||.||||||
CUGCUUUGGAAGAA
167
168

10
57
CAUUUGGAAGCUCCUGAAGACAAGU
|||||||||||...|...|||.|||
CAUUUGGAAGCCAGUUCUGACCAGU
169
170
10
59
CUUUCUGCUGAGGACACA
||..||.|||||||.|.|
CUGCCUCCUGAGGAGAGA
171
172
10
60
CAUUUGGAAGCUCCUGAAG
||..||||||||.|||.||
CAGAUGGAAGCUUCUGCAG
173
174
11
12
AUCAGAAGAUGAA------GAA--ACUGAAGUACAAGAGCAGAUGAAUCUCCUAAAUUCAAGAUGGGAAUGCCUCAGGGUAGCUAGCAUGGAAAAACAAA
|||||||..|||| ||| ||||....||||.|.||||.|||....|.|.....|.|..||.|..|||||..|| |.||....|.|||.|.|.||
AUCAGAAACUGAAAGAGUUGAAUGACUGGCUAACAAAAACAGAAGAAAGAACAAGGAAAAUGGAGGAAGAGCCUCUUGG-ACCUGAUCUUGAAGACCUAA
175
176
11
13
AGAAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAAUCUCCUAAAUU-CAAGAUGG
|||||||..|||| .|||.|||||....|.|.|||...||.|.|. ||.|.|||
AGAAGAUCUAGAA---CAAGAACAAGUCAGGGUCAAUUCUCUCACUCACAUGGUGG
177
178
11
14
GAUGAAGAAACUGAAGUACAAGAGCAGAUGA
||||...||||....|||.|.|..||||.||
GAUGGGCAAACAUCUGUAGAUGGACAGAAGA
179
180

11
15
UAUCAGAAGAUGAAGAAACUGAAGUACAAGAG-CAGAUGAAUCUCCUAAAUUCAAGAUGGGAAUGCCUCAGGGUAGCUAGCAUGGAAAAAC
|.||||||.|.|||||..|.|. |.||||||. ||.|..|.|..|.| |.|||||...||||. .|...||.|.||.|.|.||||||
UUUCAGAAAAAGAAGAUGCAGU-GAACAAGAUUCACACAACUGGCUU----UAAAGAUCAAAAUGA--AAUGUUAUCAAGUCUUCAAAAAC
181
182
11
16
AAGAAACUGAAGUACAAGAGCAGA-UGAAUCUCCUAAAUUCAAGAU
||||||..|.|.|.||.|.|||.| ||.||...||.||. ||||||
AAGAAAAAGCAAUCCAUGGGCAAACUGUAUUCACUCAAA-CAAGAU
183
184
11
18
AGGAAAAUUAUCAGAAGAUGAAGAAA
|||.||.||.|||||.....||||||
AGGCAACUUCUCAGACUUAAAAGAAA
185
186
11
20
CGGGUUGGUAAUAUUCUACAA-UUGGGAAGUAAGCUGAUUGGAACAGGAAA-AUUAUCAGAAGA
|.|||.|.|...|||||.|.| |||..||||.||....|| |||.||... |.||||||||.|
CCGGUGGAUCGAAUUCUGCCAGUUGCUAAGUGAGAGACUU--AACUGGCUGGAGUAUCAGAACA
187
188
11
22
CCAUCAGGGCCGGGUU
||||||||.|..||.|
CCAUCAGGACAUGGGU
189
190
11
23
CUGAUUGGAACAGGAAAAUU--AUCAGAAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAAUCUCCU
||||....|.|.|||||..| |||||||..||||||||.|||.|.||....|.|||.|. ||||||
CUGAAAUUAGCCGGAAAUAUCAAUCAGAAUUUGAAGAAAUUGAGGGACGCUGGAAGAAGC-UCUCCU
191
192

11
24
GAUGAAGAAACUGAAGUACAAGAGCAGAUGAAUC
|||..|||||.|. ||.||.|||||.||||.|
GAUUCAGAAAUUC---UAAAAAAGCAGCUGAAAC
193
194
11
25
GUUGGUAAUAUUCU-ACAAUUGGGA--AGUAAGCUGAUUGGAACAGGAAAAUUAUCAGAAGAUGAAGAAACUGAAGUACA
||..||.||||||. ||||||..|. |||......|.||..| |.|||..|...||||||||.||||| |||||.|.|
GUCAGUGAUAUUCAGACAAUUCAGCCCAGUCUAAACAGUGUCA-AUGAAGGUGGGCAGAAGAUAAAGAA--UGAAGCAGA
195
196
11
26
CAGGAAAAU-UAUCAGAAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAA
|||.||.|| ||||||| ||||.|..|| ||.|..|||..|||.||.|||
CAGAAAGAUCUAUCAGA-GAUGCACGAA-UGGAUGACACAAGCUGAAGAA
197
198
11
27
AAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAAUCUCCUAAAU
||||.||.|......||..|.|||.|.|..||||.|||||.|.|
AAGAAGAGGCCCAACAAAAAGAAGCGAAAGUGAAACUCCUUACU
199
200
11
28
GAAGAUGAAGAAA---CUGAAGUACAAGA
|.||.|||.|||| ||||.||.|.|||
GGAGCUGAGGAAAUCUCUGAGGUGCUAGA
201
202
11
29
GCUGAUUGGAACAGGAAAAUUAUCAGAAGAUGAAGAAACUGAAGUACAAGAGCA--GAUGAAUCUCCUAAAUUCAA
||..|||||.|||| |...||.||||.|..|.||..|..||.|..|.| |.|| ||.|||..|...|.|||.||
GCAUAUUGGCACAG--ACCCUAACAGAUGGCGGAGUCAUGGAUGAGCUA-AUCAAUGAGGAACUUGAGACAUUUAA
203
204
11
31
AAGCUGAUUGGAACAGGAAAAUUAUCAGAAGAUGAAGAAACUGAAGUA-CAAGAGCAGAUGAA
||.||||||.||..||..|....|||||...| ||||||| |||||.| ||..|.|||..|||
AAUCUGAUUUGACAAGUCAUGAGAUCAGUUUA-GAAGAAA-UGAAGAAACAUAAUCAGGGGAA
205
206

11
32
AUUGGGAAGUAAGCUGAUUGGAACAGGAA
|||||.||..|||. |..|||||||||||
AUUGGAAACAAAGA-GUGUGGAACAGGAA
207
208
11
33
AAAAUUAUCAG--AAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAA
||||.|.|.|| ||| ||||| .|||||||..||..|..|||.||
AAAAGUCUGAGUGAAG-UGAAG--UCUGAAGUGGAAAUGGUGAUAAA
209
210
11
34
UGGAACAGGAAAAUU-AUCAGAAGAUGAAGAAA
|||||..|..|||.. |||||.||.|||||.||
UGGAAUUGACAAAGAGAUCAGCAGUUGAAGGAA
211
212
11
35
AGAUGAAGAAACUGAAG
||||..||||||.||||
AGAUUGAGAAACAGAAG
213
214
11
36
AUCAGAAGAUGAAGAAACUGAAGUACAAGAGCAGAUG
|||||| ||..|||||||...||.| ||.||.|||.|
AUCAGA-GAAAAAGAAACCCCAGCA-AAAAGAAGACG
215
216
11
37
AUGGAUUUGACAGCC
||.|||||| |||||
AUCGAUUUG-CAGCC
217
218
11
38
AAAAUUAUCAGAAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAAUCU
||||||....|||......||..|||||.|.||..||..|.|||||||
AAAAUUGCUUGAACCACUGGAGGCUGAAAUUCAGCAGGGGGUGAAUCU
219
220

11
39
AGAAGAUGA-AGAAACUGAAG-UACAAGAGCAGAUG
||||...|| ||.||.|.||| ||.||.|||||.||
AGAAAGCGAGAGGAAAUAAAGAUAAAACAGCAGCUG
221
222
11
40
AGUACAAGAG-CAGA-UGA--AUCUCCUAAAUU
|||||||||| |||. ||| |||||||.||.|
AGUACAAGAGGCAGGCUGAUGAUCUCCUGAAAU
223
224
11
41
GAAAAUUAUCAGAAGAUGAAGAAACUGAAGUACAAGAGCAGAUGAAU
||||.|.|||.|.|..||.|||| ||||.| ||||.||.|||||
GAAAUUGAUCGGGAAUUGCAGAA---GAAGAA--AGAGGAGCUGAAU
225
226
11
42
UAUCAGAAGAUGAAGAA
|||.|||||..|||.||
UAUUAGAAGUGGAACAA
227
228
11
44
ACAAGAGCAGAUGAAUCUCCUAAAUUCAAGAUGGGAAUGCCUCAGGGUAGCUAGCAUGGAAAA-ACAAA
|||..|||.||..|.|.||..|.| ||||....|||.|||.||..|.|..|.||||..||| |||||
ACAGAAGCUGAACAGUUUCUCAGA---AAGACACAAAUUCCUGAGAAUUGGGAACAUGCUAAAUACAAA
229
230
11
46
GAAGUACAAGAGCAGAUGAAUCUCCUAAAUUCAA
||||.||||.||.|.||.. |.||..||.|||||
GAAGAACAAAAGAAUAUCU-UGUCAGAAUUUCAA
231
232
11
47
CAGAAGAUGAAGA--AACUGAAGUACAAG----AGCAGAUGAAUCUCC
|||||||..|||| ||||..|..|.||| ||||||..|||||||
CAGAAGAGCAAGAUAAACUUGAAAAUAAGCUCAAGCAGACAAAUCUCC
233
234

11
48
AACUGAAGUACAAG-AGCAGAUGAAUCUCCUAAAUUCAAGA
|.||||...||||| ||.|..||||.||| ||||..||||
ACCUGAGAAACAAGGAGAAAUUGAAGCUC--AAAUAAAAGA
235
236
11
49
GGAACAGGAAAAUUAUCAGAAGAUGAAGAAACUGAAGUACAAGAG
|.|||.|.||.|..|....|||.|.||.||.|.||.||..|||||
GAAACUGAAAUAGCAGUUCAAGCUAAACAACCGGAUGUGGAAGAG
237
238
11
51
AUGAAUCUCCUAAAUUCAAGAUGGGAAUGCC
|.|||.||.|.|..|.|||..|.|.||||||
AGGAAACUGCCAUCUCCAAACUAGAAAUGCC
239
240
11
53
GAAAAUUAUCAGAAGAUGAAGAAACUGAAGUACAAGAGCA
||||....||||||...|..|.| ||||||||||||.||
GAAAGAAUUCAGAAUCAGUGGGA--UGAAGUACAAGAACA
241
242
11
55
AGAUGAAGAAACUGAAGUACAAGAGCAGAUGAAUC
|||.||....|..|.||||.||||||.||||||.|
AGAAGACUCCAAGGGAGUAAAAGAGCUGAUGAAAC
243
244
11
57
GGAAGUAAGCUGAUUGGAACAGGAAAAUUAUCAGAAGAU--GAAGAA-ACUGAAGUACA
||.||..|.|| |||||| ||..|.||..|||.||.| ||||.| |..||.|||||
GGCAGGCACCU-AUUGGA---GGCGACUUUCCAGCAGUUCAGAAGCAGAACGAUGUACA
245
246

11
59
UCAGGGCCGGGUUGGUAAUAUUCUACAAUUGGGAAGUAAGCUGAUUGGAACAGGAAAAUU- AUCAGAAGAUGAAGAAACU----GAAGUACAAGAGCAGAUGAAUCUCCUAAAU-//
|||...|.|.||.||.||.|||..||.. |.|.|..|||||.|||.|.||.|||||. ||.|||...|..|.|.||| |||.|.||||||...|.|.||...||..|.
UCAAUACUGAGUGGGAAAAAUUGAACCU----GCACUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACCCUUGAAAGACUCCAGGAACUUCAAGAGGCCACGGAUGAGCUGG ACC//
//UCAAGAUGGGAAUGCCUCAGGGUAGCUAG
|||||.||.|.....||.|||..|.|.||
//UCAAGCUGCGCCAAGCUGAGGUGAUCAAG
247
248
11
60
CCUAAAUUCAAGAUGGGA
|||.||..|.||||||.|
CCUGAACACCAGAUGGAA
249
250
12
17
ACAUAGAGUUUUAAUGGA
|||.|.|..|.|||||||
ACAGACAACUGUAAUGGA
251
252
12
43
GCUAACAAAAAC-AGAAGAAAGAACAAGG
|.||||||||.. |.|||.|...||||||
GUUAACAAAAUGUACAAGGACCGACAAGG
253
254
12
45
CAAAAACAGAAGAAAGAA-----CAAGGAAAAUGGAGGAAG
||||||||||.|..||.| ||.|.|||||.| |||||
CAAAAACAGAUGCCAGUAUUCUACAGGAAAAAUUG-GGAAG
255
256

12
54
UUACAUAGAGUUUUAAUGGAUCUCC-AGAAUCA
|.|||.|||.|.|.||||..|||.. ||||.||
UAACAGAGAAUAUCAAUGCCUCUUGGAGAAGCA
257
258
12
56
GAUCUCCA----GAAUCAGAAACUGAAAGAGUUGA--AUGACUGGCUA-ACAAAAACAGAAGAAAGAAC
||.||||| |||...|||.||.|.|.||.||. ||.||...||. |..|||||||...|||.|.|
GACCUCCAAGGUGAAAUUGAAGCUCACACAGAUGUUUAUCACAACCUGGAUGAAAACAGCCAAAAAAUC
259
260
13
15
UCACGCAACUGCUGCUUUGGAAGAACAA
||||.|||||| |||||. ||||.|||
UCACACAACUG--GCUUUA-AAGAUCAA
261
262
13
16
AAGAAGAUCUAGAACAAGAACAAG
|||..||||||||| |||||.|||
AAGCGGAUCUAGAA-AAGAAAAAG
263
264
13
18
AAUCUAGUGGAGAUCACGCAACUGCU--GCUUUGGAAGAACAACUUAA
|||||...|||....|.||||||.|| |..||..|||||.||.|.||
AAUCUUUCGGAAGGAAGGCAACUUCUCAGACUUAAAAGAAAAAGUCAA
265
266
13
20
AUCUAGUGGAGAUCACG-CAACUGCUGCU
|.|.|.|||||...|.| |||||.|||||
AACAAUUGGAGCAGAUGACAACUACUGCU
267
268
13
22
AGUCAGGGUCAAUUCUCUC
||||||...|.|..|||||
AGUCAGAAACCAAACUCUC
269
270

13
23
GCUUCAAGAAGAUCUAGAACAAGAACAAGUCAG-GGUCAAUUCUCUCAC
||||.|..|||.|||... |||||.|||...|| ||.|.||.||.||.|
GCUUUACAAAGUUCUCUG-CAAGAGCAACAAAGUGGCCUAUACUAUCUC
271
272
13
24
ACAUGG-UGGUGGUAGUUGAUG
|.|||| |||..|.||||||||
AAAUGGAUGGCUGAAGUUGAUG
273
274
13
25
AGAAGAUCUAGAACAAGAACAAGUCAGGGU
|||||||..||||..|.....||.|||.||
AGAAGAUAAAGAAUGAAGCAGAGCCAGAGU
275
276
13
26
CUUCAAGAAGAUCUA
||.||..||||||||
CUCCAGAAAGAUCUA
277
278
13
27
UCAAGAAGAUCUAGAACAAGAACAAGUCAGGGUCAAUUCUCUCACUCA
|.|||||||.....|||||.||.|||..|..||.||....||.|||.|
UAAAGAAGAGGCCCAACAAAAAGAAGCGAAAGUGAAACUCCUUACUGA
279
280
13
28
CAUGGUGGUGGUAGUUGAUG--AAUCUAGUGGAGAUCACGCAACUGCUGCUUUG-GAAGAACAACUUAA
||||.|||....||||..|| |..||.|..||.|.||..|||.|| |||... ||||.|.||.||||
CAUGUUGGCAUGAGUUAUUGUCAUACUUGGAGAAAGCAAACAAGUG--GCUAAAUGAAGUAGAAUUUAA
281
282
13
29
CAUGGUGGUGGUAGUUGAUGA
|||||..|.|.||.|..||||
CAUGGAUGAGCUAAUCAAUGA
283
284

13
30
UCACUCACAUGGUGGUGGUAGUUGAUGAAUCUAGUGGAGAUC-ACGCAACU
|||.|.|||.|..|.|||.||.|.|| |.|..||...||.|. |||||.||
UCAUUGACAAGCAGUUGGCAGCUUAU-AUUGCAGACAAGGUGGACGCAGCU
285
286
13
31
AGAAGAUCUAGAACAAGAACAAGUCAGGG
||||||..| |||.||..|.|| ||||||
AGAAGAAAU-GAAGAAACAUAA-UCAGGG
287
288
13
32
GAUGAAUCUAGUGGA---GAUCACGCAACUGC-UGCUUUGGAA
|||||.|.|||..|| ||..|.|||..||| |||.||||||
GAUGAUUUUAGAUGAAGUGAAGAUGCACUUGCCUGCAUUGGAA
289
290
13
34
GCAACUGCUGCUUUGGAA
|||.||.|.|.|.|||||
GCAGCUACAGAUAUGGAA
291
292
13
35
UCAAGAAGAUCUAGAACAAGAACAAGUCAGGGUCAAUUCUCUCACUCACAUGGUGGUGGUAGUUGAUGAAUCUAGUGGAGAUCACGCAACUGCUGCUUUGGAAGAACAACUUA
||||.||||..|.||..||.|..|.||.....|.||...|.||||..|..|.|..|.||.. ||||..|...|..|||..|..|.|.|...|.||. |||||||..||||.|
UCAAAAAGAGAUUGAGAAACAGAAGGUGCACCUGAAGAGUAUCACAGAGGUAGGAGAGGCC-UUGAAAACAGUUUUGGGCAAGAAGGAGACGUUGG--UGGAAGAUAAACUCA
293
294
13
36
UUGAUGAAUCUAGUGGAGAUCACGCAACUGCUGCUUUG-GAAGAACAACUUAAG
|.||||||||. ||||..|.|.|||..|.||.... |||||....||||||
UGGAUGAAUCA----GAGAAAAAGAAACCCCAGCAAAAAGAAGACGUGCUUAAG
295
296

13
37
GAAUCUAGUGGAGAUCACGCAAC
||.||||...|.||.||.|||.|
GACUCUACACGUGACCAAGCAGC
297
298
13
38
AUCUAGAACAAGAACAAGUCA
||||..||.|.|||.|..|||
AUCUGAAAGAGGAAGACUUCA
299
300
13
39
GAUGAAUCUAGUGGAGAUCACGC---AACUGCUGCUUUGGAAGA-ACAACUUAA
||..||.|.||.|||.||.|.|. |||.||.|||.|...||| |.|||.|||
GAGAAAGCGAGAGGAAAUAAAGAUAAAACAGCAGCUGUUACAGACAAAACAUAA
301
302
13
40
AGAUCUAGAACAAGAACAAGUCAGGGUC---AAUUCUCUCACUCACAUGGUGGUGGUAGUUGAUGAAUCUAGUGGA-GAUCACGC-AACUGCU
||.|||..||.|||||.|| |||.|| ||.|.||||| ||| |||||...|||..|.||..|..|..|| ||||.|.. ||.||||
AGGUCUCAAAGAAGAAAAA---AGGCUCUAGAAAUUUCUCA-UCA----GUGGUAUCAGUACAAGAGGCAGGCUGAUGAUCUCCUGAAAUGCU
303
304
13
41
AGUGGAGAUCACGCAACUGCUGCUUUGGAAG
|||||||...||.||..|.|.|||..|.|||
AGUGGAGCCAACUCAGAUCCAGCUCAGCAAG
305
306
13
42
UGAUGAAUCUAG--UGGAGAUCACGCAACUGCUGC-UUUGGAA
|||.|||.|.|. |||.|||.||..||....||| |||||||
UGAAGAAACGAUGAUGGUGAUGACUGAAGACAUGCCUUUGGAA
307
308

13
44
AGUUGAUGAAUCUAGUGGAGAUCA----CGCAACUGCUGCUUUGGAAGA-ACAACUU
||.|..|.|||| |||||..|.|| |..|||.|.|.||..|.|||| ||||.||
AGAUAUUUAAUC-AGUGGCUAACAGAAGCUGAACAGUUUCUCAGAAAGACACAAAUU
309
310
13
46
CUUCAAGAAGAUCUAGAACAAG
||..|||||.|.||.||.||||
CUAAAAGAAAAGCUUGAGCAAG
311
312
13
47
GUGCUUCAAGAAGAUCU--AGAACAAGAACAAGU
|||||.|.|.|||..|. |||.|||||..||.|
GUGCUCCCAUAAGCCCAGAAGAGCAAGAUAAACU
313
314
13
48
AGUGGAGAUCACGCAACUGCUGCUUUGG
||.|.||.|.|..||.||||||||.|||
AGAGCAGUUAAAUCAUCUGCUGCUGUGG
315
316
13
49
UAGAACAAGAACAAGUCAG
|.|.|||||.|.||..|||
UUGUACAAGGAAAAACCAG
317
318
13
51
GGUCAAUUCUCUCACUCACAUGGUGGUGGUAGUUGAUGAAUCUAGUGGAGAUCACGCAACUGCUGCUUUGGAAGAA
|.||||.|.....|.|||||..| ||||.|.||.|.|||. ||.|.|||.||||...|..||.|..|...|.||||
GAUCAAGUUAUAAAAUCACAGAG-GGUGAUGGUGGGUGAC-CUUGAGGAUAUCAACGAGAUGAUCAUCAAGCAGAA
319
320
13
53
GAUCUAGAACAAGAACA
|||..||.|||||||||
GAUGAAGUACAAGAACA
321
322

13
55
GCUGCUUUGGAAGAA
|||||||||||||||
GCUGCUUUGGAAGAA
323
323
13
57
UUCAAGAAGAUCUAGAACAAGAACAA
|||.||.||.|| ||||..|||||.|
UUCCAGCAGUUC-AGAAGCAGAACGA
324
325
13
59
GGAGAUCACGCAACUGCUGCUUUGGAAGAACAACUUAAG
||.||||.|...|.||...||.|..||||.||.||..||
GGCGAUCUCCUCAUUGACUCUCUCCAAGAUCACCUCGAG
326
327
13
60
GCAACUGCUGCUUUGGAAGAACAACUUAAG
|.||.|||..||.||.||||. |||.|.||
GAAAUUGCGCCUCUGAAAGAG-AACGUGAG
328
329
14
15
ACGUCUUACUGAAGAACA
|.|.|||.|.|||.||.|
AUGGCUUUCAGAAAAAGA
330
331
14
16
AUCGAUGGGCAAAC
|||.||||||||||
AUCCAUGGGCAAAC
332
333
14
18
UUCUCAAAUGGCAACGUCUUACUGAAGAA
|.||.||.|.|||| ||||.|.||||.|
UCCUGAAUUUGCAA--UCUUUCGGAAGGA
334
335

14
20
CAAAUGGCAACGUCUUACUGAAGA
||.|||.|||| |..|.|||||.|
CAGAUGACAAC-UACUGCUGAAAA
336
337
14
22
UAUUGGGAGAUCGAUGGGCAAACAUCUGUAGAUGG
|||..|||||.| |||.|... ||||.|.|.||||
UAUCAGGAGACC-AUGAGUGC-CAUCAGGACAUGG
338
339
14
23
UUUACAAGACAUCCUUCUCAAAUGGCAAC
||||||| |..|| |||..||..|||||
UUUACAA-AGUUC--UCUGCAAGAGCAAC
340
341
14
24
AAGACAUCCUUCUCAAAUGGCAACGUCUUACUGAAGAA
||||.||...|..|..|.|...|.||.||.||||||.|
AAGAAAUGGAUGGCUGAAGUUGAUGUUUUUCUGAAGGA
342
343
14
25
UGUAGAUGGACAGAAGA
||.||.|||.|||||||
UGAAGGUGGGCAGAAGA
344
345
14
27
AAAUGGCAACGUCUUACUGA
|||..|.|||..||||||||
AAAGUGAAACUCCUUACUGA
346
347
14
28
GCAAACAUCUG--UAGAUGGA
|||||||..|| ||.|||.|
GCAAACAAGUGGCUAAAUGAA
348
349

14
29
AUCGAUGGGCAAA
||.||||.||.||
AUGGAUGAGCUAA
350
351
14
30
CAGAAGACCGCUGGGUUCUUUUACAAG
|||.||.||......|||.||.|||||
CAGGAGUCCCUCACAUUCAUUGACAAG
352
353
14
31
UUUUACAAGACAU
|||.|||||.|||
UUUGACAAGUCAU
354
355
14
32
UGUAGAUGGACAGAAGA
|.||||||.|..|||||
UUUAGAUGAAGUGAAGA
356
357
14
33
AACGUCUUACUGAAG
||.||||.|.|||||
AAAGUCUGAGUGAAG
358
359
14
34
AAAUGGCAACGUCUU-ACUGAA
||||| ||.||||| ||.|||
AAAUG--AAUGUCUUGACAGAA
360
361
14
35
CAGAAGACCGCUGGGUUCUUUU
|||||||..|.|....||||||
CAGAAGAGUGGUUAAAUCUUUU
362
363

14
36
CAAAUGGCAACGUCUUAC
||.||||.|||.|.|.||
CACAUGGAAACUUUUGAC
364
365
14
37
AUCGAUGGGCAAACAUCUGUAGAUGGACAGAAGACCG
||||||..|||..|||.|. |.|..||...|||||.|
AUCGAUUUGCAGCCAUUUC-ACACAGAAUUAAGACUG
366
367
14
38
UCUCAAAUGGCAACGUCUUACUGAAGA
|||.|||..|.||....|.|.|.||||
UCUGAAAGAGGAAGACUUCAAUAAAGA
368
369
14
39
GAAGACCGCUGGGUUCUUUUACAAGACAUCCUUCUCAAAUGGCAACGUCUUAC
||||||.....||.|..|.||.|||| ||..||...||..||..||..|||||
GAAGACAAUGAGGGUACUGUAAAAGA-AUUGUUGCAAAGAGGAGACAACUUAC
370
371
14
40
ACGUCUUACUGAAGAACA
|.||||.|..||||||.|
AGGUCUCAAAGAAGAAAA
372
373
14
41
GGGAGAUCGAUGGGCAAA
||||.||.|| |.|||||
GGGAAAUUGA-GAGCAAA
374
375
14
42
AAGACAU-CCUUCUCAAAU
||||||| ||||...||||
AAGACAUGCCUUUGGAAAU
376
377

14
44
AAAUGGCAACGUCUUACUGAAGA
|||||||..|||.||..|.|.||
AAAUGGCGGCGUUUUCAUUAUGA
378
379
14
46
UAGAUGGACAGAAGA
||||.|.|||.||||
UAGAAGAACAAAAGA
380
381
14
47
UUCUCAAAUGGCAACGUCUUACUGAAGAAC
||||||||.....|..|...||||.||.||
UUCUCAAACAAUUAAAUGAAACUGGAGGAC
382
383
14
48
AUUGGGAGAUCGAUGGGCAAACAUCUGUAGAUGGAC
|.|.|||.||..||...|||.||.....|||.||||
AGUUGGAAAUUUAUAACCAACCAAACCAAGAAGGAC
384
385
14
49
AUGGGCAAACAUCUGUAGAUGGACAGA
|.|||||. |||.||||.|.|||.|.|
AAGGGCAG-CAUUUGUACAAGGAAAAA
386
387
14
51
UGGACAGAAG--ACCG-CUGGGUUCUUUUACAAGACAUCCUUCUCAAAUGGCA
|||||||||. |||| ||||.||..|.|.|..||.....||.|.||||..||
UGGACAGAACUUACCGACUGGCUUUCUCUGCUUGAUCAAGUUAUAAAAUCACA
388
389
14
53
UGGGUUCUUUUACAAGACAUCCUUCUCAAAUGG---CAACGUCUUACUGAA
||||.|....|||||||...|||||..||..|| ||||...|.|.||||
UGGGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAA
390
391

14
55
CAAAUGGCAACGUCUUACUGAA
|||.||.|||.|||.|||.|.|
CAACUGCCAAUGUCCUACAGGA
392
393
14
57
CUUUUACAAGACAUCCUUCUCAAAUGGCAACGUCU
|.|||..|||.||....|..|.|.|||.|.|||||
CAUUUGGAAGCCAGUUCUGACCAGUGGAAGCGUCU
394
395
14
59
GAUGGGCAAACAUCUGUAGAUG
||..||||.|.|....||||||
GACUGGCAGAGAAAAAUAGAUG
396
397
14
60
CUGUAGAUGGACAGAAGACC-GCUGGGUUCUUUUACA
||.|.||.|..|.|||.||| |.|||...|||.|.||
CUCUGGAAGACCUGAACACCAGAUGGAAGCUUCUGCA
398
399
15
16
AGAAAAAGAAGAUGCAGUG---AACAAGAUUCACACAA
||||||||.| ||.||..| |||...||||||.|||
AGAAAAAGCA-AUCCAUGGGCAAACUGUAUUCACUCAA
400
401
15
18
CACAACUGGCUUUAAAGAUCAAAAUGAAAUGUUAUCAAGUCUUCAA
||||.||||.||....|.|||.|| |...||||....||||.|.||
CACAGCUGGAUUACUCGCUCAGAA-GCUGUGUUGCAGAGUCCUGAA
402
403
15
20
AAAGAAGAU-GCAGUGAACAAGAUUCACA-CAACUG
||.|.|||| |||...||||||..|||.| ||||||
AAUGCAGAUAGCAUCAAACAAGCCUCAGAACAACUG
404
405

15
23
AACUGGCUUUAAAGAUCAAAAUGAAAU
||.|.||...|||.|||||...|||.|
AAUUAGCCGGAAAUAUCAAUCAGAAUU
406
407
15
24
UUCAGAAAAAGAAGAUG---CAGUGAACA
|||..||||||.||.|| |||||.|.|
UUCUAAAAAAGCAGCUGAAACAGUGCAGA
408
409
15
25
UUUUAGUGCAUGGCUUUCAGAAAAAGAAGAUGCAGUGAACA-AGAUUCACACAACUGGCUUUAAAGAUCAA-AAUGAA
|||||||...||...||||||.||...||.. ||||..|.| ||..|||...||...|.....|||||.|| ||||||
UUUUAGUCAGUGAUAUUCAGACAAUUCAGCC-CAGUCUAAACAGUGUCAAUGAAGGUGGGCAGAAGAUAAAGAAUGAA
410
411
15
26
AUGGCUUUCAGAAAAAGAAGAUGCAGUGAACAAG
|||..||.|||||| |.||.||.||.||..|||
AUGAAUUACAGAAA--GCAGUUGAAGAGAUGAAG
412
413
15
27
AGAAAAAGAAGAUGCAGUGAA
|.|||||||||....||||||
ACAAAAAGAAGCGAAAGUGAA
414
415
15
28
CACACAACUGGCUUUAAAGAUCAAAAUGAAAUGUUAUCAAGUCUUCAAAAACU
||.||||.|||||..|...|..|.|||..||..|||..|...||..|||.|.|
CAAACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGAAAACAUU
416
417
15
29
AGAAGAUGCAGUGAACAAGAUUCACACA
|||.|||......||..||||||.||.|
AGAGGAUAACCCAAAUCAGAUUCGCAUA
418
419

15
30
UUUCAGAAAAAGAAGAUGCAGUGAACAAGAUUCA
||.||||.||.|..||.||||...|.|.|..|||
UUGCAGACAAGGUGGACGCAGCUCAAAUGCCUCA
420
421
15
31
AAAAUGAAAUGUUAU----CAAGUCUUCAAA
|||||..|||.|.|| ||||||.|.|.|
AAAAUCCAAUCUGAUUUGACAAGUCAUGAGA
422
423
15
32
GCCUUUUUAGUGCAUGGCUUUCAGAAAAAGAAGAUG
|||..|||.|.|||..|..|.||..|||..||||||
GCCAAUUUUGAGCAGCGUCUACAAGAAAGUAAGAUG
424
425
15
33
UUCAGAAAAAGAAGAUGCA
|.|||||||||.|||.|.|
UACAGAAAAAGCAGACGGA
426
427
15
34
CAGAAAAAGAAGAUGCAGUGAACAAGAUUCACACAACUGGCUUUAAAGAU-CAAAAUGAAAUGUUAUCAAGUCUUCAAAAACUGGC
||||||.| |||...||||.....|.||.|....||.||.|....||||| |.|||.||||||. |.|||||.|.|.|.||||
CAGAAAGA-AAGCAACAGUUGGAGAAAUGCUUGAAAUUGUCCCGUAAGAUGCGAAAGGAAAUGA----AUGUCUUGACAGAAUGGC
428
429
15
35
UUCAGAAAAAGAAGAUGCAGUGAACAAGAUUCACACA
||.|||||.|||||.||||....|..||..|||||.|
UUGAGAAACAGAAGGUGCACCUGAAGAGUAUCACAGA
430
431

15
36
UGCAUGGCUUUCAGAAAAAGAAGAUGCAGUGAACAAGA
||.|||..|...||||||||||....|||..|| ||||
UGGAUGAAUCAGAGAAAAAGAAACCCCAGCAAA-AAGA
432
433
15
37
UUUAAAGAUCAAAAUGAA
|||||||....||.||||
UUUAAAGGCAGAACUGAA
434
435
15
38
UGCAUGGCUUUCAGAAAAAGAAGAUGCAGUG-AACA-AGAUUCACACAACUGGCUUUAA
|.|||..|||| |||..|...|..|||||. |||. ||||..|||.||.|.||||.||
UCCAUUCCUUU--GAAGGAAUUGGAGCAGUUUAACUCAGAUAUACAAAAAUUGCUUGAA
436
437
15
39
UCAGAAAAAGA-AGAUGCAGUGAACAAGAUUCACACAACUGGCUUUAAAGAUCAAAAUGAAAUGUUAUCAAG
|.|||.||||. |||.|.|.|.||.| |.|.|||.|.|...|||.||| |||||...||||.|.|||||
UGAGAGAAAGCGAGAGGAAAUAAAGA----UAAAACAGCAGCUGUUACAGA-CAAAACAUAAUGCUCUCAAG
438
439
15
40
AAAGAAGAUGCAGUGAACAAGA---UUCACACAACUGGCUUUAAAGAUCAAAAUGAAAUGUUAUCAAGUCUUCAAAAACUGG
||||||||...|..|..|.||| |||.||..|.|||..|. ||..|||.|.|.|...|.||.|..||.|.|||..||.|
AAAGAAGAAAAAAGGCUCUAGAAAUUUCUCAUCAGUGGUAUC--AGUACAAGAGGCAGGCUGAUGAUCUCCUGAAAUGCUUG
440
441
15
41
UUUCAGAAAAAGAAGAUGCAG-UGAA
||.|||||.|||||...|.|| ||||
UUGCAGAAGAAGAAAGAGGAGCUGAA
442
443

15
42
GGCUUUAAAGAUC
|.||||.||||||
GACUUUGAAGAUC
444
445
15
44
UUUUUAGUGCAUGGCUUUCAGAAAAAGAAGAUGCAGUGAACAAGAUUCACACAACUG-GCUUUA--AAGAU-CAAAAUG-AAAUGUUAUC
|.||||.|...|||||..|||||...|||.|.....|.|..||||..||.|...||| |..||. ||.|| |.||||. |||||.||||
UAUUUAAUCAGUGGCUAACAGAAGCUGAACAGUUUCUCAGAAAGACACAAAUUCCUGAGAAUUGGGAACAUGCUAAAUACAAAUGGUAUC
446
447
15
46
AAGAUCAAAAUGAAAUGUUAUCAAGUCUUCAAAAA
||||.|||||..|.||.||.|||....||||||.|
AAGAACAAAAGAAUAUCUUGUCAGAAUUUCAAAGA
448
449
15
47
AAGAUCAAAAUGAAA-UGUUAUCAAGUCUUCAAA
|||||.||..||||| |....|||||....||||
AAGAUAAACUUGAAAAUAAGCUCAAGCAGACAAA
450
451
15
48
GCUUUCAGAAAAAGAAGAUGCAGUGAA
||||..|||....||||| |||||.||
GCUUGAAGACCUUGAAGA-GCAGUUAA
452
453
15
49
GAAAAAGAAGAUGCAGUGAACAAGAUUCACACAACUGGCUUU
||||..|||...|||||. ||||.| |.|||||.||.|.|
GAAACUGAAAUAGCAGUU--CAAGCU--AAACAACCGGAUGU
454
455

15
51
UGGCUUUAAAGAUCAAAAUGAAAUGUU-AUCAAG
||.|.||.|.|||...||.||.|||.| ||||||
UGACCUUGAGGAUAUCAACGAGAUGAUCAUCAAG
456
457
15
53
UUCAGAAAAAGAAG-AUGCAGUG-AACAAGAUUCACACAACUGGCUUUAA-AGAUCAAAAUGAAAUGUUAUCAAGUCUUCAAAA-ACUGGC
|||||||..||..| |||.|||. ||.||.|....||.|||.||....|| ||.|.| ||||||||||| |||..|||||.| |.||||
UUCAGAAUCAGUGGGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGA--AUGAAAUGUUA--AAGGAUUCAACACAAUGGC
458
459
15
55
UUUAGUGCAUGGCUUUCAGAAAAAGAA
|||..|||.||||||.|||||...|||
UUUCUUGCCUGGCUUACAGAAGCUGAA
460
461
15
57
UUCAGAAAAAGAA-GAUGCA
|||||||..|||| ||||.|
UUCAGAAGCAGAACGAUGUA
462
463
15
59
UGGCUUUCAGAAAAAGA-AGAUG
||.||..||||.|||.| |||||
UGACUGGCAGAGAAAAAUAGAUG
464
465
15
60
UCAGAAAAAGAAGAUG
||.||||.||||..||
UCUGAAAGAGAACGUG
466
467

16
18
AAAAGAAAAAG-CAAU
||||||||||| ||||
AAAAGAAAAAGUCAAU
468
469
16
20
UAAGUCAGUGACCCAGAAGACGGAAGCAUGGCUGGAUAACUUUGCCCGGUGUUGGGAUAAUUUAGUCCAAAAACUUGAAAAGAGUACAGC
|||||.||.|||..|...|.|.|.||.|| |.|.|.|||.| |.....||...|||||....|.|||.||.|.||..|||..|||.|
UAAGUGAGAGACUUAACUGGCUGGAGUAU--CAGAACAACAU---CAUCGCUUUCUAUAAUCAGCUACAACAAUUGGAGCAGAUGACAAC
470
471
16
22
AAGUCAGUGACCCAGAAGACGGAAGCAUGG
||.|.||||.|.|.||..|.|.||.|||||
AACUUAGUGUCACCGACUAUGAAAUCAUGG
472
473
16
23
AAAAGCAAUCCAUGGGCAAACUGUAUUCACUCAAACAAGAUC
||||||.| .|.|.||||| ||.||..||||..|.||..||
AAAAGCUA--GAGGAGCAAA-UGAAUAAACUCCGAAAAAUUC
474
475
16
24
ACCCAGAAGACGGAAGCAUGGCUGGA
||||.|||||. |.|.|||||||.|
ACCCUGAAGAA--AUGGAUGGCUGAA
476
477
16
25
AAGACGGAAGCAUGGCUGGAUAACUUUGCCCGGUGUUGGGAUAAUUUAGUCCAAAAACUUGAAA
||||..||||||..||..||. |||||...|.|....||.|....|.||.||.|||||.|.|
AAGAAUGAAGCAGAGCCAGAG---UUUGCUUCGAGACUUGAGACAGAACUCAAAGAACUUAACA
478
479

16
26
GGGCAAACUGUAUUCACUCAAACAAGAUCU
|.|.||||||||..| |||.|..|||||||
GAGAAAACUGUAAGC-CUCCAGAAAGAUCU
480
481
16
27
UUAAAAGCGGAUCUAGAAA
||||||..|||.||.||||
UUAAAAAAGGAACUUGAAA
482
483
16
28
GAAAAAGCAAUCCAUGGGCAAACUGUAUU
||.|||||||.|.|..|||.||.||.|.|
GAGAAAGCAAACAAGUGGCUAAAUGAAGU
484
485
16
29
CAGAAGACGGAAGCAUGGCUG
||||.|.||||..|||||.||
CAGAUGGCGGAGUCAUGGAUG
486
487
16
30
CCCAGAAGACGGAAGCAU
|||||.||||.|||..||
CCCAGGAGACUGAAAAAU
488
489
16
31
AGAAAAGAAAAAGCA-AUCCAUGGGCA
|||||.|||.||.|| |..||.|||.|
AGAAAUGAAGAAACAUAAUCAGGGGAA
490
491
16
32
UUAGUCCAAAAAC
|||.||||.||||
UUAUUCCAGAAAC
492
493

16
33
CCAAA-AACUUGA--AAAGAGUA-CAGC
||||| ||||||| |||||||| ||||
CCAAAGAACUUGAUGAAAGAGUAACAGC
494
495
16
34
CGGAUCUAGAAAAGAAAAAGCAAUC
|.|||.|.|||..||.||||..|||
CAGAUAUGGAAUUGACAAAGAGAUC
496
497
16
36
GGAUCUAGAAAAGAAAAAGCAAUCC
||||..|..|.||||||||.||.||
GGAUGAAUCAGAGAAAAAGAAACCC
498
499
16
37
AAAAGCGGA-UCUAGAAAAGAAAAAGCA--AUCCAUG--GGCAAACUG
|||.|.||| ||||.|...||..||||| |..|.|| |||||||.|
AAAGGUGGACUCUACACGUGACCAAGCAGCAAACUUGAUGGCAAACCG
500
501
16
38
AUUCACUCAAACAAGAUCUUCUUUCAACACUGAAGAAU--AAGUCAG
|.|||...|.||||.|..|.|||..|.|||||.||..| ||.||||
ACUCAGAUAUACAAAAAUUGCUUGAACCACUGGAGGCUGAAAUUCAG
502
503
16
39
AACUGUAUUCACUCAAACAAGAU-CUUCUUUCAACACUGAAGAAUAAGUCAGUGA
||..|.|||....||||.|.||. |..|||.|||||..|||..|.|..|.||.||
AAAAGAAUUGUUGCAAAGAGGAGACAACUUACAACAAAGAAUCACAGAUGAGAGA
504
505
16
40
AAAAGCGGAUCUAGAAA
||||..||.||||||||
AAAAAAGGCUCUAGAAA
506
507

16
41
CAGAAGACGGAAGCAUGGCUGGAU
|||||||.|.|||....||||.||
CAGAAGAAGAAAGAGGAGCUGAAU
508
509
16
42
ACUGUAUUCACUCA
||||.|.|||||||
ACUGAAAUCACUCA
510
511
16
44
ACUGAAGAAUAAGUCAGUGACCCAGAA-GACGGAA
||.||||...|| ||||..|.||||| |||..||
ACAGAAGCUGAA--CAGUUUCUCAGAAAGACACAA
512
513
16
46
AAAAGCGGAUCUAGAAAAGAAAAAGC
|||||.|.|.|.|..|||..||||||
AAAAGAGCAGCAACUAAAAGAAAAGC
514
515
16
47
AAAAACUUGAAAAGA
|.|||||||||||.|
AUAAACUUGAAAAUA
516
517
16
48
AGCAAUCCAUGGGCAAACUGUAUUCACUCAAAC-AAGA
||.||||..|.||.||..|.||..||..||||| ||||
AGGAAUCAGUUGGAAAUUUAUAACCAACCAAACCAAGA
518
519
16
49
UUUCAACACUGAAGAAUAAGUCAGUGACCCAG
|||..|||..|||.||..||.||.|.|.||||
UUUGUACAAGGAAAAACCAGCCACUCAGCCAG
520
521

16
51
GCAAACUGUAUUCACUCAAACAAGAUCUUCUUUCAACACUGAAG
|.||||||...||.| |||||.|||..|.|..||..|..|||.|
GGAAACUGCCAUCUC-CAAACUAGAAAUGCCAUCUUCCUUGAUG
522
523
16
53
AAAGAAAAAGCAAUCCAUGGGCAAA
|.||.|.|.||||||||...|.|||
ACAGUAGAUGCAAUCCAAAAGAAAA
524
525
16
55
GAAGAAU--AAGUCAGUGACCCAGAAGACGGAAGCAUGGC
|||||.| |||..|||.|...||..||.|.||..|||||
GAAGACUCCAAGGGAGUAAAAGAGCUGAUGAAACAAUGGC
526
527
16
57
UUCACUCAAACAAGAUCUUCUUU--CAACA-CUGAAGAAUAAGUCAGUGACCCAGAAGAC
|||.||..|..||..|||..|.| |.||| |||||..||.|...|.|.|.||.|.||.|
UUCUCUGCAGGAACUUCUGGUGUGGCUACAGCUGAAAGAUGAUGAAUUAAGCCGGCAGGC
528
529
16
59
GCAAUCCAUGGGCAAACUGU--AUUCACUCAAAC-AAGAUCUUCUUUCAACACUGAAG
|||..||.|||||.|.||.. |||.||||...| ||||||..||....|.|.|.|||
GCAGCCCGUGGGCGAUCUCCUCAUUGACUCUCUCCAAGAUCACCUCGAGAAAGUCAAG
530
531
16
60
CAGAAGACGGAAGCAU
||..|||.||||||.|
CACCAGAUGGAAGCUU
532
533
17
18
AUCACUAACACAGACAACUGUAAUGGAAA
||.|||..|.|||| |.||||..||.|.|
AUUACUCGCUCAGA-AGCUGUGUUGCAGA
534
535

17
20
GAACUUCCACCACCACCUCCCCAAAAGA
|||..||||.| |||||.|||||..|||
GAAAAUCCAAC-CCACCACCCCAUCAGA
536
537
17
22
CCACCACUCAGCCAUCA
||||||.|..||.||||
CCACCAAUGCGCUAUCA
538
539
17
23
CACCACCUCCCCAAAAGAAGAGGCAGAUUACUGUGGAUUCUGAAAUUAG
||.||||.|....||||| ||.|..||..|..|.|...|||||||||||
CAGCACCACUGUGAAAGA-GAUGUCGAAGAAAGCGCCCUCUGAAAUUAG
540
541
17
24
UGUGGAUUCUGAAAUUAGGAAAA
||.||||||.||||||...||||
UGGGGAUUCAGAAAUUCUAAAAA
542
543
17
25
AAACAGU---AACUACGGUGACCACAAGGGAA
||||||| ||..|.||||..||.|||..||
AAACAGUGUCAAUGAAGGUGGGCAGAAGAUAA
544
545
17
27
AAGAGGAACUUCCACCACCACCUCCCCAAAAGAAGAGGC
||.||||||||..|.|.|.|.|..||.|..|..||.|||
AAAAGGAACUUGAAACUCUAACCACCAACUACCAGUGGC
546
547
17
28
AACACAGACAACUG--UAAUGGAAACAGUAACUACGGUGACCACAAGGGAACAGAU-CCUGGUAAAGC
||..||.||||.|| |||..|||..||.|..||...|.|..||.|..|||.|.|| |||||...|||
AAAGCAAACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGAAAACAUUCCUGGCGGAGC
548
549

17
29
UCCUGGUAAAGCAUGCUCAA-GAGGAACUU
||.|||...||| |..|||| |||||||||
UCAUGGAUGAGC-UAAUCAAUGAGGAACUU
550
551
17
30
AAAAGAAGAGGCAGAUUACUGUGGAUUCUGAAA
||.|||..|..|||..|.|...|||..||||||
AACAGAGCAUCCAGUCUGCCCAGGAGACUGAAA
552
553
17
31
AGGGAACAGAUCCUGGUAAAGCAUGCU
|.|.||||.|..|.||..|||.|.|||
AAGAAACAUAAUCAGGGGAAGGAGGCU
554
555
17
32
CUGUAAUGGAAACAGUAACUACGGUGACCACAAGG-GAACAGAUCCUGGUAAAGCAU
|||.|.||||||||...|.|..||. ||...|||. |.||||...|.|.||||.|||
CUGCAUUGGAAACAAAGAGUGUGGA-ACAGGAAGUAGUACAGUCACAGCUAAAUCAU
556
557
17
33
AGAAGAGGCAGAUUACUGUGGAUUCUGAAAUUAGGAAAAG
|.||.||.|.||.|...|||.|.||||||.| |||||.|
AUAAAAGUCUGAGUGAAGUGAAGUCUGAAGU--GGAAAUG
558
559
17
34
AGGCAGAUUACUGUGGAUUCUGAAAUU
|.||..|.||.|.|||||||||||.||
AUGCCUAGUAAUUUGGAUUCUGAAGUU
560
561
17
35
CACCUCCCCAAAAGAAGAG
||||||||.|..|||||||
CACCUCCCGAGCAGAAGAG
562
563

17
36
CCAAAAGAAGAGG
|.|||||||||.|
CAAAAAGAAGACG
564
565
17
37
CAGACAACUGUAAUGGAAACAGUAACUACGGUGACCAC
|||..|||| |.||||.|| ||..||||||||||
CAGCAAACU-UGAUGGCAA-----ACCGCGGUGACCAC
566
567
17
38
UGGAUUCUGAAAUU
||||..||||||||
UGGAGGCUGAAAUU
568
569
17
39
AAAGAAGAGGCAGAUUACUGUG--GAUUCUGAAAUUAGGAAAAG
|||||.|||.||..||||.... ||.||..|.||.||..||||
AAAGAGGAGACAACUUACAACAAAGAAUCACAGAUGAGAGAAAG
570
571
17
40
CAAAAGAAGAGGCAGAUUACUGUGGAUUCUGAAAU
||..|.|||||||||..|..||... |.|||||||
CAGUACAAGAGGCAGGCUGAUGAUC-UCCUGAAAU
572
573
17
41
CAGAUCCUGGUAAAGCAUGCUCAAGAGGAA
|||||||.|.|.| |||.||.|..|.||.|
CAGAUCCAGCUCA-GCAAGCGCUGGCGGGA
574
575
17
42
AAAAGAAGAGGCAGAUUACUGUGGA
|||.||.||.|..|||.||||..||
AAACGAUGAUGGUGAUGACUGAAGA
576
577

17
44
AAGAGGCAGAUUACUGUGGAUUCUGAA
||||..||.|||.|||.|.|||..|||
AAGACACAAAUUCCUGAGAAUUGGGAA
578
579
17
46
GAAGAGGCAGAUUACUGUG
||.||.||||||.||..||
GAGGAAGCAGAUAACAUUG
580
581
17
47
GACCACAAGGG-AACAGAUCCUGGUAAAGCAUGCUCAAGAGGA
|.|||.|||.| ||.|.|..||.| |||..|.|||||||..||
GCCCAGAAGAGCAAGAUAAACUUG-AAAAUAAGCUCAAGCAGA
582
583
17
48
UACUGUGGAU-UCUGAAAUUAGGAA
|.||||||.| |||...||||||||
UGCUGUGGUUAUCUCCUAUUAGGAA
584
585
17
49
ACCA-CCACUCAGCCA
|||| |||||||||||
ACCAGCCACUCAGCCA
586
587
17
51
AAACAGUAACUACGGUGACCACAA
|.||.||.|||..|||||| ||||
AGACUGUUACUCUGGUGAC-ACAA
588
589
17
53
CCAUCACUAACACAGACAACUGU--AAUGGAA
||.|||..|.|..||.||||.|| ||||.||
CCUUCAGAACCGGAGGCAACAGUUGAAUGAAA
590
591

17
55
CUCCCCAAAAGAAGAGGC
||.|||..|||.|.||||
CUACCCGUAAGGAAAGGC
592
593
17
57
AGCAUGCUCAAGAGGAACUUC
|.|.|.|||...|||||||||
ACCUUUCUCUGCAGGAACUUC
594
595
17
59
GUGACCACAAGGGAACA--GAUCCUGGUAAAGCAUGCUCAAGAGG
|.|.|||.||.|..||. |.|.||...||||||.|||.|.||||
GAGCCCAGAAUGUCACUCGGCUUCUACGAAAGCAGGCUGAGGAGG
596
597
17
60
UUUCACAGGCUGUCACCACCACUCAGCCAUCACU-AACAC
|.||||.|..|..|..||.|||||.|..|...|| |||||
UCUCACCGUAUAACCUCAGCACUCUGGAAGACCUGAACAC
598
599
18
43
GAAGCUGUGUUGCAGAGUCCUGAAUUUGCAAU
||||||.|.|..||| ||..||||.||||
GAAGCUCUCUCCCAG----CUUGAUUUCCAAU
600
601
18
45
GAGUCCUGAAUUUGCAAUCUUUCGGAAGGAAGGCAACU---UCUCAGACUUAAAAGAAA
||..|||||||.|||..|. .|.|.|||...||||.. |.||||||..||||.|.|
GAAGCCUGAAUCUGCGGUG--GCAGGAGGUCUGCAAACAGCUGUCAGACAGAAAAAAGA
602
603
18
54
UAAAAGAAAAAGUCAAU
|||.|||.||..|||||
UAACAGAGAAUAUCAAU
604
605

18
56
GAUGUUGAUAUAAC-UGAACUUCA
||.|||...||||| |||||||||
GACGUUUGGAUAACAUGAACUUCA
606
607
19
20
AGUUCAGAAAACUGCAAGAUGCCAGCAGAUCAGCUCAGGCCCUGGUGGAACAGAUGGUG
|.|.||||.|.|..|||.....|..||||.||.||.|....|.||||||.|..||..||
AAUGCAGAUAGCAUCAAACAAGCCUCAGAACAACUGAACAGCCGGUGGAUCGAAUUCUG
608
609
19
22
UCAGAAAACUGCAAGA-UGCCAGCAGAUCA
||||.|.|| ||.|| |||||.|||..||
UCAGGAGAC--CAUGAGUGCCAUCAGGACA
610
611
19
23
AGCGAGAAAAAGC--UGAGAAGUUCAGAAAACUGCAAGAUGCCAGCAGAUCAGCUCAGGCC--CUGGUGGAACA
|||..||||.|.| |.||||.||.|..|||.||...||.||..|.|||....|||...|| |||||.||.||
AGCCGGAAAUAUCAAUCAGAAUUUGAAGAAAUUGAGGGACGCUGGAAGAAGCUCUCCUCCCAGCUGGUUGAGCA
612
613
19
24
AUCAGCU-CAGGCCCUGGUGGAACAGAUGG-UGAA
||||..| ||..|||||..|.||..||||| ||||
AUCACAUACAAACCCUGAAGAAAUGGAUGGCUGAA
614
615
19
25
AGAGCGAGAAAAAGCUGAGA-AGUUCAGAAA--ACUGCAAGA
|||||.|||....|||..|| |.||.|||.| |||..||||
AGAGCCAGAGUUUGCUUCGAGACUUGAGACAGAACUCAAAGA
616
617

19
26
GCCAUAGAGCGAGAAAAAGCUGAGAAGUUC--AGAAAACUGCAAGAUGCCAGCA-GAUC-AGCUCAG-- GCCCUGGUGGA--ACAGAUGGUGAA
||||.|.|| |||.....|..|.||.|||. |||||||||.|||...||||.| |||| |.|..|| ||.|...|||| |||.|.|.||||
GCCAGAAAG- GAGGCCUUGAAGGGAGGUUUGGAGAAAACUGUAAGCCUCCAGAAAGAUCUAUCAGAGAUGCACGAAUGGAUGACACAAGCUGAA
618
619
19
28
AGCUGAGAAGUUCAGAAAACUGCAAGAU
|||||||.|..||....|..|||.||||
AGCUGAGGAAAUCUCUGAGGUGCUAGAU
620
621
19
29
AGAUGCCAGCAGAUCAGCUCAGGCCCUGGUGGAACAGAUGGUGAA
||||.| |||.||..||.|||.|||| |||||||||.|.|
AGAUUC--GCAUAUUGGCACAGACCCU-----AACAGAUGGCGGA
622
623
19
30
CAUAGAGCGAGAAAAAGCUGAGAAGUUCAGAAAACUG-CAAGAUGCCAGCAGAUCA
|||..|..||.||..||.|| |.||.|.|.|...|.| ||||.||...||||.|||
CAUUCAUUGACAAGCAGUUG-GCAGCUUAUAUUGCAGACAAGGUGGACGCAGCUCA
624
625
19
31
AGAUGCCAGCAGAUCAGCUCAG
|.|.|.||..|||||||.|.||
ACAAGUCAUGAGAUCAGUUUAG
626
627
19
32
AGAAAACUGCAAGAUGCCAGCA
|.||||.|.|||||||.|..||
AAAAAAUUACAAGAUGUCUCCA
628
629

19
33
AGAAAAAGCUGA-GAAGUUCAGAAAACUGCAAGAUGCCAGCAGAUCAGCU
|||||||||.|| |||..||..|||... |..||||..||...|.|||||
AGAAAAAGCAGACGGAAAAUCCCAAAGAA-CUUGAUGAAAGAGUAACAGCU
630
631
19
34
CAUAGAGCGAGAAAAAGCUG-AGAAGUUCAGAAAACUG
||.|.||..||.||.||.|| ||||.|.|...|||.||
CAGAAAGAAAGCAACAGUUGGAGAAAUGCUUGAAAUUG
632
633
19
35
AGCUGAGAAGU-UCAGAAAACUGCAAGAUGCCAGCAGAUCAGCUCAGGCCCUGGUGGAACAGAUGGUGAAUG
|.||||..||| |||.|.|..|...|||.|||...|.|.|||.|..||.|..|..|||...|.|||||.|.|
ACCUGAAGAGUAUCACAGAGGUAGGAGAGGCCUUGAAAACAGUUUUGGGCAAGAAGGAGACGUUGGUGGAAG
634
635
19
37
GCUGAGAAGUUCAGAAAACUGCAAGAUGCCAGCAGAUCAG
|.|||..|.|.|||.|||.|...|||..||...|..||||
GGUGACCACUGCAGGAAAUUAGUAGAGCCCCAAAUCUCAG
636
637
19
38
AGCAGAUCAGCUCAG
|||||.|.|.|||||
AGCAGUUUAACUCAG
638
639
19
39
CAUAGA-GCGAGAAAAAGCUGAGAAGUUCAGA--AAACUGCA
||.||| |.||||||..|....|||.|..||| ||||.|||
CACAGAUGAGAGAAAGCGAGAGGAAAUAAAGAUAAAACAGCA
640
641
19
40
CGAGAAAAAGCUGAGAAGUUCAGAAAACUGCAAGAUGCCAGCAGAUCAGCUCAGGCCCUGGU-GGAACAGAUGGUGAA
|.|||||...||.|..|||... |..|.|.|||||.||..||.|||.|.|||..|...||.| |||..|.||.|..||
CUAGAAAUUUCUCAUCAGUGGU-AUCAGUACAAGAGGCAGGCUGAUGAUCUCCUGAAAUGCUUGGAUGACAUUGAAAA
642
643

19
41
CAGAUC-AGCUCAG---GCCCUGGUGGAACA
|||||| ||||||| ||.||||.||.|.|
CAGAUCCAGCUCAGCAAGCGCUGGCGGGAAA
644
645
19
42
GUGGAACAGAUGGUGAAUG
||||||||..|..|.||||
GUGGAACAACUUCUCAAUG
646
647
19
44
CAUAGAGCGAGAAAAAGCUGAGAAGUUCAGAAAACUGCAAGAUGCCA
||.|.||..|.|||...||||||| ||..|||.| |||.|.||.|.|
CAGAAAGACACAAAUUCCUGAGAA-UUGGGAACA-UGCUAAAUACAA
648
649
19
46
AGAAAAAGCUGAGAAGUUCA
||||||...||||.|..|||
AGAAAAGCUUGAGCAAGUCA
650
651
19
47
AGAAGUUCAGAAAACUGCAAGAUG--CCAGCAGAUCAGCUCAGGC
|.|||..|||||.| |||||||. |..|.|.||.||||||.||
AUAAGCCCAGAAGA--GCAAGAUAAACUUGAAAAUAAGCUCAAGC
652
653
19
49
AGCAGAUCA-GCUCAGGCCCUGG---UGGAACAGAUGGUG
|||||.||| |||.|....|.|| |||||.||||..||
AGCAGUUCAAGCUAAACAACCGGAUGUGGAAGAGAUUUUG
654
655
19
53
GAAAAAGCUGAGAAGUUCAGAAAACUG-CAAGAUGCCAGC
|||.||||||||.||.||..|..||.| |.|||..|.|||
GAAGAAGCUGAGCAGGUCUUAGGACAGGCCAGAGCCAAGC
656
657

19
55
AGAAGUUCAGAAAACUGCAAGAUGCCAGCAG
|||||.|.|.|.||||||.|....||..|||
AGAAGCUGAAACAACUGCCAAUGUCCUACAG
658
659
19
57
GCAAGAUGCCAGCAGAUCAG
||.|..|.|||||||.||||
GCGACUUUCCAGCAGUUCAG
660
661
19
59
AACUGCAAGAUGCCAGCAGAUCAGCUCAGGCCCU
||||.|||||.|||| |.|||.|||| ||.|||
AACUUCAAGAGGCCA-CGGAUGAGCU--GGACCU
662
663
19
60
AGAAGUUCAGAAAACUGCAAGAUGCCAGCAGAUCAGCU
|.||..||||.|..|||.|||| ||.|.|.|.|||.|
AUAACCUCAGCACUCUGGAAGA--CCUGAACACCAGAU
664
665
20
21
AACCCACCACCCCAUCAGAGC-CAACAGCAAUUAAAAGUCAGUUAAAAAUU
||..||.|...|.|||||..| ||||..|||.|..|| |..|||||||||
AAGUCAACCGGCUAUCAGGUCUUCAACCUCAAAUUGAA-CGAUUAAAAAUU
666
667
20
50
ACAACAAUUGGAGC
||.||.||||||||
ACCACUAUUGGAGC
668
669
20
52
CAAUUGGAGCAGAUGACAACUACUGCUGAAAACUGGUUGAAAAUCCAACCCACCACCCCAUCA-GAGCCAACAGCAAUUA
||.|||||..|..|.|..||..||||..||||.| ||||||.|.|..|||.|| |||| |||.|.|.|.||||.|
CAGUUGGAAGAACUCAUUACCGCUGCCCAAAAUU---UGAAAAACAAGACCAGCA----AUCAAGAGGCUAGAACAAUCA
670
671

20
58
ACUGAACAGCCGGUGGAUCGAAU
||.||.|||||..||||..||.|
ACAGAGCAGCCUUUGGAAGGACU
672
673
21
22
CAACCGGCUAUCAGG
|||...|||||||||
CAAUGCGCUAUCAGG
674
675
21
23
UCAAAGCAUAGCCCUGAAAGAGA
||..||||...|..|||||||||
UCUCAGCACCACUGUGAAAGAGA
676
677
21
24
GAUUAA-AAAUUCAAAGCAUAGCCCUGAAAGAG
||||.| ||||||.||..|.....||||||.||
GAUUCAGAAAUUCUAAAAAAGCAGCUGAAACAG
678
679
21
25
CAUUUUAAGCAA-GUCUUUUCUGAUGUGCAGGCCAGAGAGAAAGAGCUACAGACA
||.|.|||.||. |||..|...|.||.||||...|.|.||||.||...|.||.||
CAGUCUAAACAGUGUCAAUGAAGGUGGGCAGAAGAUAAAGAAUGAAGCAGAGCCA
680
681
21
26
AGAAAGAGCUA-CAGACA
|||||||.||| ||||.|
AGAAAGAUCUAUCAGAGA
682
683
21
27
CUGAAAGAGAAAGGACAAG
|||||.|.||||.| ||||
CUGAAUGGGAAAUG-CAAG
684
685

21
28
AUUAAAAAUUCAAAGCA
|||.|||.||.|||.||
AUUUAAACUUAAAACCA
686
687
21
29
GAUUAAAAAUUCAAAGCAUAGCCC
|||...|.|||||.||.|||.|||
GAUGCGACAUUCAGAGGAUAACCC
688
689
21
30
CCUCAAAUUGAACGAUUAAAAAUUCAAAGCAUA
|||||.|||.|..||..|..|.||...|||.||
CCUCACAUUCAUUGACAAGCAGUUGGCAGCUUA
690
691
21
31
AAGUCUUUUCUGAUGUG-CAGGCCA-GAGA
||.||...||||||.|| ||.|.|| ||||
AAAUCCAAUCUGAUUUGACAAGUCAUGAGA
692
693
21
32
UGAAGUC-AACCGGCUAUCAGGUCUUCAACCUCAAAUUGAACGAUUAAAAAUUCAAAGCAUAGCCCUGAAAGA
||||||. ||..||..||.|.|.||..| |.|||.||||.|| |..||||....|..|.|.|.||| |||||
UGAAGUGGAAAUGGUGAUAAAGACUGGA-CGUCAGAUUGUAC-AGAAAAAGCAGACGGAAAAUCCC--AAAGA
694
695
21
33
AAAAAUUCAAAGCAUAGCCCUGAAAGA---
GAAAGGACAAGGACCCAUGUUCCUGGAUGCAGACUUUGUGGCCUUUACAAAU
|.||||.|...|.||.|.||.|.|||| ||||||| ||.|| |||| ||.|| ||||.|...||||...||||.||
AGAAAUGCUUGAAAUUGUCCCGUAAGAUGCGAAAGGA-AAUGA---AUGU--CUUGA--CAGAAUGGCUGGCAGCUACAGAU
696
697

21
34
GUGGCCUUUACAAAUCAUUUUAAGCAAG
|.||||||.| |||...||||..|||||
GAGGCCUUGA-AAACAGUUUUGGGCAAG
698
699
21
35
UUUGUGGCCUUUACAAAUCAUUUUAAG
||||..|||.||.||.|.....|||||
UUUGCAGCCAUUUCACACAGAAUUAAG
700
701
21
36
CUGAAAGAGAAAG
|||||||||.|||
CUGAAAGAGGAAG
702
703
21
39
AAAAAUUCAAAGCAUAGCCCUGAAAGAGAAAGGACA
|||.|.|||.||...||. |||||.||.||||.|
AAAGAAUCACAGAUGAGA---GAAAGCGAGAGGAAA
704
705
21
40
AGCCCUGAAAGAGAAAGGACAA
|||||.||.|. |||||||.||
AGCCCAGAGAU-GAAAGGAAAA
706
707
21
41
AAGCAUAGCCCUGAAAGAGAAAGGACAAGGACCCAUGUUCCUGGAUGCAGACUUUG
||||...|.|..||||..||.||.|.|....|.||..|||...||..|| ||||||
AAGCGCUGGCGGGAAAUUGAGAGCAAAUUUGCUCAGUUUCGAAGACUCA-ACUUUG
708
709
21
42
AGCCCUGAAAGAGAAAGGACAAGGACCCA-UGUUCCUGGAUGCAGACUUUGUGGCCUUUACAAAUCAUUUUAAGCAAG
||||||...|||....|.||||...|.|| ||.|||||....|.|...|.. ||.||||..|.|||..||||||||||
AGCCCUAUUAGAAGUGGAACAACUUCUCAAUGCUCCUGACCUCUGUGCUAA-GGACUUUGAAGAUCUCUUUAAGCAAG
710
711

21
44
ACAAGGACCCAUGUUCCUG
|.||.|||.||..||||||
AGAAAGACACAAAUUCCUG
712
713
21
46
UUACAAAUCAUUUUAA--GCAAGUCUUUUCUGAUGUGCAGGCCAGAGAGAA-AGAGCUA
||.||||....||||| |.|..|.||||.||.| ||.|||....|||.|| |..||||
UUUCAAAGAGAUUUAAAUGAAUUUGUUUUAUGGU-UGGAGGAAGCAGAUAACAUUGCUA
714
715
21
47
AGCCCUGAAAGAGAAAG
|||||.||| |||.|||
AGCCCAGAA-GAGCAAG
716
717
21
48
UUCAACCUCAAAUUGAA
||.||.|||||||..||
UUGAAGCUCAAAUAAAA
718
719
21
49
UGGAUGCAGACUUUGU
||||.| |||.|||||
UGGAAG-AGAUUUUGU
720
721
21
51
CCAUGUUCCUGGAUG
||||.|||||.||||
CCAUCUUCCUUGAUG
722
723
21
53
AAUUGAACGAUUAAAAAUUCAAAGCAUAGCCCUGAAAGAGAAAGGACAAG
|||..||.|.|.||..||||||..||..|.| ||.|||..||.|.|.|||
AAUGAAAUGUUAAAGGAUUCAACACAAUGGC-UGGAAGCUAAGGAAGAAG
724
725

21
55
CCCAUGUUCCUGGAUGCAGACUUUGUGGCCU---UUACAAA
|||.||..|||||| |.|.|||.|.|||| |||||.|
CCCCUGGACCUGGA---AAAGUUUCUUGCCUGGCUUACAGA
726
727
21
57
GAUGAAGUCAACCGGCUAUCAGGUCUU
||||||.|.|.|||||...||..|.||
GAUGAAUUAAGCCGGCAGGCACCUAUU
728
729
21
59
GGCCUUUAC-AAAUCAUUUUAAGCAAGUCUUUUCUGA
|||.|.||| |||.||...|.||.|.|||..|.||||
GGCUUCUACGAAAGCAGGCUGAGGAGGUCAAUACUGA
730
731
21
60
CCCUGAAAGAGAAAG
|.|||||||||||.|
CUCUGAAAGAGAACG
732
733
22
50
GGGUCCAGCAGUCAGAAACCAAACUC
|||...|||||.|.|| ||.|.|||
GGGCAAAGCAGCCUGA--CCUAGCUC
734
735
22
52
CACCAAUGCGCUAUCAGGAGACCAUGAGUGCC
||.||||||...||..|||....|.|.||.||
CAACAAUGCAGGAUUUGGAACAGAGGCGUCCC
736
737
22
58
CGCUAUCAGGAGACCA
|.|||.||||||.|||
CUCUACCAGGAGCCCA
738
739

23
24
AAUAUCAAUCAGAAUUUGAAGAAAUUGAGGG
|||..||..||.|...|||||||||.||.||
AAUCACAUACAAACCCUGAAGAAAUGGAUGG
740
741
23
25
GAAAUAUCAAUCAGAAUUUGAAGAAAUUGA
||.|..|.|..|||||.|..|||||.||.|
GAGACUUGAGACAGAACUCAAAGAACUUAA
742
743
23
26
CUGAAAUUAGCCGGAAAUAUCAAUCAGAAUUUGAAGAAAU--UGAGGGACGCUGGAAGAAG
|||.||....||.||||.|||.||||||..|..|.|||.. |||...|.|||| ||||||
CUGUAAGCCUCCAGAAAGAUCUAUCAGAGAUGCACGAAUGGAUGACACAAGCUG-AAGAAG
744
745
23
27
CUCAGCACCACUGUGAAAGAGAUGUCGAAGA
|||.||||.|...||||.|.||..|..||||
CUCUGCACUAGGCUGAAUGGGAAAUGCAAGA
746
747
23
28
AGAGCAACAAAGUGGC
|.|||||..|||||||
AAAGCAAACAAGUGGC
748
749
23
29
AUCAAUCAG-AAUUUGAAGAAAUUGAGGGACGCUGGAAGAAGCU
||||||.|| ||.||||...|.||.|....||.||||.|.|.||
AUCAAUGAGGAACUUGAGACAUUUAAUUCUCGUUGGAGGGAACU
750
751
23
30
AAAUUG-AGGGACGCUGGAAGAAGCUC
|.|||| ||..|.|.||||.|.|||||
AUAUUGCAGACAAGGUGGACGCAGCUC
752
753

23
31
AUCAGAAUUUGAAGAAAUUGAGGGAC
|||||. ||.||||||||..||..||
AUCAGU-UUAGAAGAAAUGAAGAAAC
754
755
23
32
AGUUCUCUGCAAGAGCAACAAAGUG
|.||..|||||...|.|||||||.|
ACUUGCCUGCAUUGGAAACAAAGAG
756
757
23
33
AAAUUAGCCGGAAAUAUCAAUCAGAAUUUGAAGAAA
|||..||.|||||| |||....||||.||||.||||
AAAGCAGACGGAAA-AUCCCAAAGAACUUGAUGAAA
758
759
23
34
AAGAAAGCGCCCUCUGAAAUUA-GCCGGAAAUAU--CAAUCAGAAUUUGAAGAAAUUGAGGGACGCUGGAAGAAGCUCUCCUCCCAGCUGGUUGAGCAUUGUCAAAAGCU//
||||||||..|...||.|...| ||..|||||.. |..|.|||.....|||.||.|||..|.|. ||..||||...||.....|..|.|.|...|.||||.||||.
AAGAAAGCAACAGUUGGAGAAAUGCUUGAAAUUGUCCCGUAAGAUGCGAAAGGAAAUGAAUGUCU-UGACAGAAUGGCUGGCAGCUACAGAUAUGGAAUUGACAAAG---//
//AGAGGAGCAAAUGAAUAAACUCCGAAAAAUU
|||..||||..||||..||..||.|..||||
//AGAUCAGCAGUUGAAGGAAUGCCUAGUAAUU
760
761
23
35
CCACUGUGAAAGAGAUGUCGAA---GAAAGCGCCCUCUGAA
|.|||...||||||||...||| |||.|.||.| |||||
CUACUCAAAAAGAGAUUGAGAAACAGAAGGUGCAC-CUGAA
762
763

23
36
ACAAAGUGGCCUAUACUAUCUCAG-CACCACUG--UGAAAGAGAUGUCGAAGAAAGCGCCCUCUGAAAUUAGCCG
|||||||||...||.|...||.|. |||...|| ||||..||| |...||||||.| ||..|..|||..||.||
ACAAAGUGGAUCAUUCAGGCUGACACACUUUUGGAUGAAUCAGA-GAAAAAGAAACC-CCAGCAAAAAGAAGACG
764
765
23
37
AUAUCAAUCAGAAUU
||.|||..|||||||
AUUUCACACAGAAUU
766
767
23
38
UUUGAAGAAAUUG
|||||||.|||||
UUUGAAGGAAUUG
768
769
23
39
AAAGCUAGAGGAGCAAAUGAAUAAAC
|||||.||||||...||.||..||||
AAAGCGAGAGGAAAUAAAGAUAAAAC
770
771
23
40
GAAAUAUCA-AUCAGAAUUUGAAGAAAUUGAGGGACGCUGGAAGAAGCUCUCCUCCCA-GCU-GGUUGAGCAUUGUCAAAA
|||||.||. |||||...|...||.|...||||.|.|||| |.|.||||||...| ||| ||.||| |||||..||||
GAAAUUUCUCAUCAGUGGUAUCAGUACAAGAGGCAGGCUG----AUGAUCUCCUGAAAUGCUUGGAUGA-CAUUGAAAAAA
772
773

23
41
AUAUCAAUCAGAAUUUGAAGAAAUUGAGGGACG--CUGGAAGAAGCUCUCCUCCCAGCUGGUUGAGCAUUGUCAAAAGCUAGAGGAGCAA
|.||..|||.|.|.|||.||||...||..||.| |||.|.|.||..|.....|.||||| .|.|| |||||..|.|.|.|.|..||||
AAAUUGAUCGGGAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAGUGCGUAGGCAAGCUG--AGGGC-UUGUCUGAGGAUGGGGCCGCAA
774
775
23
42
ACUGUGAAAGAGAUGUC-GAAGAAAGCGCCCUCUGAAAUU
||..|||..|.||||.| |||||.|. |||.|..||||||
ACGAUGAUGGUGAUGACUGAAGACAU-GCCUUUGGAAAUU
776
777
23
44
GAAAUUAGCCGGAAAUAUCAAUCAGAAUUUGAAGAAAUUGAGGGAC--GCUGGAAGAAGCU
||||| |.|||...|.||| |.|..||.|.||||.|||.|...|. |||...|||||||
GAAAU--GGCGGCGUUUUCA-UUAUGAUAUAAAGAUAUUUAAUCAGUGGCUAACAGAAGCU
778
779
23
46
GCUAGAGGAGCAAAUGAAUAAACUCCGAAAAAUUCA
||||||.||.||||.|||||...|...|.||.||||
GCUAGAAGAACAAAAGAAUAUCUUGUCAGAAUUUCA
780
781
23
47
GGAAAUAUCAAUCAGAAUUUGAAGAAAUUGAGGGACGC
||||.|.||||.|| |||..|.||||.||..||||.|
GGAAUUCUCAAACA--AUUAAAUGAAACUGGAGGACCC
782
783

23
48
GAAGAAAUUGAGGGACGCUGGAAGAAGCUCUCCUCCCAGCUGGUUGAGCAUUGUCAAAAGCUAGAGGAGCAAAUGAAUAAACUCC
|.|||||||||.| |.|....|.|||..||....| ||||.|...|..|...|.||.|.||.||.|||||..|.|||.|.||.|
GGAGAAAUUGAAG--CUCAAAUAAAAGACCUUGGGC-AGCUUGAAAAAAAGCUUGAAGACCUUGAAGAGCAGUUAAAUCAUCUGC
784
785
23
49
UGUGAAAGAGAUGUCGAAGAAAGCGC
||||.|||||||.|.|...||||.||
UGUGGAAGAGAUUUUGUCUAAAGGGC
786
787
23
51
UUCUCUGCAAGAGCAA
||||||||..||.|||
UUCUCUGCUUGAUCAA
788
789
23
53
GAAAUAUCAAUCAGAAUUUGAAGAAAUUGAGGGACGCU--GGAAGAAGCU
|||||.|.|| ||.|||..|...|||.|..|||.||| ||||||||||
GAAAUGUUAA--AGGAUUCAACACAAUGGCUGGAAGCUAAGGAAGAAGCU
790
791
23
55
UUUGAAGAAAUUGAGGGACGCUGGAAGAAGCUCUCCUCCCAGCUGGUUGAGCAUUGUCAAAAGCU-AGAGGAGCAAAUGAAUAAACUCCGAA
||.|||||||.|.|..||.....|.|..||.||.||....|.||||...||..|..|.....||| |.||.||| ||||..||||.|.||
UUGGAAGAAACUCAUAGAUUACUGCAACAGUUCCCCCUGGACCUGGAAAAGUUUCUUGCCUGGCUUACAGAAGC---UGAAACAACUGCCAA
792
793

23
57
UUCUCUGCAAGAGC
|||||||||.||.|
UUCUCUGCAGGAAC
794
795
23
59
CUCCUCCCAGCUGGUUGAGCAUUGUCAAAAGCUAGAGGAGCAAAUGAAUAAACUCCGAAAAAUUCA
||.|.|.|.||||..|| |||..| |||..||||.|||....|..|.|.|||||...||.||||
CUGCACUCCGCUGACUG-GCAGAG---AAAAAUAGAUGAGACCCUUGAAAGACUCCAGGAACUUCA
796
797
23
60
GAAGAAAGCGC-CCUCUGAAA
|.|||||..|| |||||||||
GGAGAAAUUGCGCCUCUGAAA
798
799
24
25
AUUCAGA-AAUUCUAAAAAAGCAGCUGAAACAGUG
||||||| ||||| |...|||...||||||||
AUUCAGACAAUUC----AGCCCAGUCUAAACAGUG
800
801
24
26
UGAAGAAAUGGAUGGCUGAAGUUGAUG
||.|..||||||||.|..|||.|||.|
UGCACGAAUGGAUGACACAAGCUGAAG
802
803
24
27
UAAAAAAGCAGCU-GAAAC
||||||||.|.|| |||||
UAAAAAAGGAACUUGAAAC
804
805
24
28
ACAUACAAACCCUGAAGAAAUGGAUGGCUGAAGUUGAUGUUUU-UCUGAAG
||.||.||.|.|||||.|.||...||||.|| |.|||.|...| |||||.|
ACUUAAAACCACUGAAAACAUUCCUGGCGGA-GCUGAGGAAAUCUCUGAGG
806
807

24
29
ACAAACCCUGAAGAAAUGGAUGGCUGAAGUUGAUGUUUUUCUGAAGGAGGAA
|||.||||| ||.|.||||..|..|.|.| ||||...|..|.||.||||||
ACAGACCCU-AACAGAUGGCGGAGUCAUG--GAUGAGCUAAUCAAUGAGGAA
808
809
24
30
AAAAGCAGCUGAAACAGUGCA
|||||..|||..|||||.|||
AAAAGUUGCUUGAACAGAGCA
810
811
24
31
UGGCUGAAGUUGAUGUU
||.||.|..||||||||
UGUCUCAGAUUGAUGUU
812
813
24
32
UGAAGGAGGAAUGGCCUGCCCUUGGGGAUUCAGAAAUUCUAAAAAAGCAGCUGAAACAGU
|||||..|.|.|.||||||..| |||..||.|.|.|.|..||.||.|..|...|||||
UGAAGAUGCACUUGCCUGCAUU---GGAAACAAAGAGUGUGGAACAGGAAGUAGUACAGU
814
815
24
33
ACCCUGAAGAAAUGGAUGGCUGAAGUUGAUGUUUUUCUGAAGGAGGAAUGG
|.|.||.|.|||.|..||..|||||| ||.|| ||||||..|.|||||
AACUUGUAUAAAAGUCUGAGUGAAGU-GAAGU----CUGAAGUGGAAAUGG
816
817
24
34
GAAUGGCCUGCCCUUGGGGAUUCAGAAAUUCUAAAAA----AGCAGCUGAAACAGUGC
|||||||..||...|...|||...|||.|...|||.| |||||.||||..|.|||
GAAUGGCUGGCAGCUACAGAUAUGGAAUUGACAAAGAGAUCAGCAGUUGAAGGAAUGC
818
819
24
35
AGAAAUGGAUGGCUGAAGUUGAUGUUUUUCU--GAAGGAGGAAUGGCCU
|||||..||.|| ||.|..|||.|..|.||. ||.|.||||..|||||
AGAAACAGAAGG-UGCACCUGAAGAGUAUCACAGAGGUAGGAGAGGCCU
820
821

24
36
AAUCACAUACAAAC
||.|||||..||||
AAACACAUGGAAAC
822
823
24
38
ACAUACAAACCCUGAAGAAAUGGAUGGCUGAAGUUGAU------GUUUUUCUGAAGGAGGAA
|||.|.|...|.||||..|.|||| |||||||.||.|. ||...||||||.||||||
ACAAAAAUUGCUUGAACCACUGGA-GGCUGAAAUUCAGCAGGGGGUGAAUCUGAAAGAGGAA
824
825
24
39
UAAAAAAGCAGCUGAAACAG
|||||.||||||||..||||
UAAAACAGCAGCUGUUACAG
826
827
24
40
GAAAUGGAUGGCUGAAGUUGA
||||||..|||.|||..||||
GAAAUGCUUGGAUGACAUUGA
828
829
24
41
AAAAAGCAGCUGAAA-CAGUGC
|||.||.|||||||. ||||||
AAAGAGGAGCUGAAUGCAGUGC
830
831
24
42
CAUACAAACCCUGAAGAAAUG--GAUGG
||.||...||.||||||||.| |||||
CACACUGUCCGUGAAGAAACGAUGAUGG
832
833
24
44
AUCACAUACAAACCCUGAAGAAAUGGAUGGCUGAAGUUGAU--GUUUUUCUGAAGGA
||.|.|||.|.|...|.||..|.|||.|..|.||||.|||. ||||.||.|||.||
AUGAUAUAAAGAUAUUUAAUCAGUGGCUAACAGAAGCUGAACAGUUUCUCAGAAAGA
834
835

24
46
AUGGAUGGCUGAAGUUGAU
||||.|||..||||..|||
AUGGUUGGAGGAAGCAGAU
836
837
24
47
UUUCUGAAGGAGGAAUGGCC--UGCCCUUGGGGAUUCAGAAAUUCUAAAA--AAGCAGCUGAAACAGUGC
||.|||..|||.||.|.||| |||.|..|||.||||..|||...|.||| ||.|.|..|.|.|.||||
UUACUGGUGGAAGAGUUGCCCCUGCGCCAGGGAAUUCUCAAACAAUUAAAUGAAACUGGAGGACCCGUGC
838
839
24
48
GAAAUUCUAAAAAAGCAGCUGAAACA
|||...||..||.|||||.|.||.||
GAAGACCUUGAAGAGCAGUUAAAUCA
840
841
24
49
CUGAAGAAAUGGAUGGCUGAAGUUGAUGUUUUUCUGAAGG
||.||.||..||||| ||.|...||| |||.|||.||||
CUAAACAACCGGAUG--UGGAAGAGAU-UUUGUCUAAAGG
842
843
24
51
UGCCCUUGGGGAU-UCA--GAAAUUCUAAAAAAGCAG
||.|||||.|||| ||| ||.||..|.|..||||||
UGACCUUGAGGAUAUCAACGAGAUGAUCAUCAAGCAG
844
845
24
53
AAUCACAUACAAACCCUGAAGAAAUGGAUGGCUGAAGUUGA-UGUUUUUCUGAAGGA
||..||| |.||..|||..||||..||| |||...|||||| ||...|..|.|||||
AAGUACA-AGAACACCUUCAGAACCGGA-GGCAACAGUUGAAUGAAAUGUUAAAGGA
846
847
24
55
AGGAAUGGCCUGCCCUUGGGGAUUCAGAAAUUCUAAAAAAGCAGCUGAAACAGUG
|||||.|||. |||.|..||.||..|.....|||||.|||.|.|||||||.||
AGGAAAGGCU---CCUAGAAGACUCCAAGGGAGUAAAAGAGCUGAUGAAACAAUG
848
849

24
57
UUCUGAAG-GAGGAAUGGCCUGCCCUUGGGGAUUCAGAAA-UUCUAAAAAAGC---AGCUGAAACA
||||||.. |.||||..|.||||.|.|.....|.|||.|| ||||......|| ||||||||.|
UUCUGACCAGUGGAAGCGUCUGCACCUUUCUCUGCAGGAACUUCUGGUGUGGCUACAGCUGAAAGA
850
851
24
59
UUCUAAAAAAGCAG-CUGA
|||||..||||||| ||||
UUCUACGAAAGCAGGCUGA
852
853
25
26
CUUGAGACAGAACUCAAAGAACUUAACACUC-AGUGGGAUCACA
|||||||.|||..|. |||..|||.|||| ||..|.||.|||
CUUGAGAGAGAUUUU---GAAUAUAAAACUCCAGAUGAAUUACA
854
855
25
27
AAAGAACUUAACACUC
||.||||||.|.||||
AAGGAACUUGAAACUC
856
857
25
29
AGAGUUUGCUUCGAGACUUGAGAC-AGAACUCAAA
|.|.||||.|.|||.| ||.|||. |.|||.||||
AAAAUUUGAUGCGACA-UUCAGAGGAUAACCCAAA
858
859
25
30
GCUUCGAGACUUGAGACAGAACUCAAAGAACUUAACACUCAGU
||.||.||.||....|....|||.|||.|.|.|.|||||.|.|
GCAUCCAGUCUGCCCAGGAGACUGAAAAAUCCUUACACUUAAU
860
861
25
31
ACUUGAGACAGAACUCAAAGAACUUAACACUCAGUGGGA
|.||.||| ||||.|.||..|||.||| ||||.||.|
AGUUUAGA-AGAAAUGAAGAAACAUAA---UCAGGGGAA
862
863

25
32
UAUUCAGACAAUUCAGCCCAGUCUAAACAGUGUCAAUGAAGGUGGGCAGAAGAUAAAGAAUGAAG
|||||. |.||..|||||.|.|.|.|.|||.|||.|. |||...|..|||.|||.....||||||
UAUUCC-AGAAACCAGCCAAUUUUGAGCAGCGUCUAC-AAGAAAGUAAGAUGAUUUUAGAUGAAG
864
865
25
33
UGAAGGUGGGCAGAAGAUAAAGAAUGAAGCAGAGCCAGAGUUUGCUUCGAGACUUGAGACAGAA---CUCAAAGAACUUAA
|||||..|....|..||||||||.||.|. |.|||| |||....||.|....||||.||| |.||||||||||.|
UGAAGUGGAAAUGGUGAUAAAGACUGGAC----GUCAGA--UUGUACAGAAAAAGCAGACGGAAAAUCCCAAAGAACUUGA
866
867
25
34
AAGAUAAAGAAUGAAGCAG
||.|.||||||.|.|.|||
AACAGAAAGAAAGCAACAG
868
869
25
35
AGGUGGGCAGAAGAUAAA
|.||.||..|||||||||
ACGUUGGUGGAAGAUAAA
870
871
25
36
GAAUGAAGCAGAGCCAGAG
|.|||||.|||||..|.||
GGAUGAAUCAGAGAAAAAG
872
873
25
37
CAGUGAUAUUCAGACAAUUCAGCCCAGUCUAAACAGUGUCAA
||..|||.|.|||.||.|||| |.|||..|.||.|.||..||
CAUCGAUUUGCAGCCAUUUCA-CACAGAAUUAAGACUGGAAA
874
875

25
38
CAGAGUUUGCUUCGAG-ACUUGAGACAGAACU
||.|..||||||..|. |||.|||.|.|||.|
CAAAAAUUGCUUGAACCACUGGAGGCUGAAAU
876
877
25
39
AUUCAGACAAUUCAGCCCAGUCUAAACAGUGUCAAUG-AAGGUGGGCAGAAGAUA-AAGAAUGAAGCAGAG
||..|||||||. ||...|.|.|||| ||..|...|| ||.|.||..|.||..|| ||.||.|||.||.||
AUGAAGACAAUG-AGGGUACUGUAAA-AGAAUUGUUGCAAAGAGGAGACAACUUACAACAAAGAAUCACAG
878
879
25
40
AGACAGAA--CUCAAAGAACUUAACACUCAGUGGGAUCA
|||.|.|| |||.|..||.||..|| |||||||.||||
AGAAAAAAGGCUCUAGAAAUUUCUCA-UCAGUGGUAUCA
880
881
25
41
GUGAUAUUCAGA-CAAUUCAGCCCAGUCUAAACAGUGUCAA
|.||.|||.||| |||.|..||.||||.|..| ||..||||
GGGAAAUUGAGAGCAAAUUUGCUCAGUUUCGA-AGACUCAA
882
883
25
42
ACAGUGUCAAUGAAGGUGGGCAGAAGAUAAAGAAUGAAG
|||.||||..|||||....|..||.|.|.|.||.|||||
ACACUGUCCGUGAAGAAACGAUGAUGGUGAUGACUGAAG
884
885
25
44
UCUAAACAGUGUCAAUGAA-GGUGGGCAGAAGAUAAAGAAUGAAGCAGA--GCCAGAGUUUGCUUCGAGACUUGAGA
|.||||.|...|.|||.|. ||....||||||.|.||.|.|....|||| |.||.|..||.|| ||||.|||.||
UAUAAAGAUAUUUAAUCAGUGGCUAACAGAAGCUGAACAGUUUCUCAGAAAGACACAAAUUCCU--GAGAAUUGGGA
886
887
25
46
GACAGAACU-CAAAGA-ACUUAA
|.|||||.| |||||| |.||||
GUCAGAAUUUCAAAGAGAUUUAA
888
889

25
47
CAGCCCAGUCU-AAACAGUGUCAAUGAAGGUGG
|||...|.||| |||||.| |.||||||..|||
CAGGGAAUUCUCAAACAAU-UAAAUGAAACUGG
890
891
25
48
CUUGAGACAGAACUCAAAGAACUUAACACUCAGUGGGAUCACAUG
|||||.|.|.|.||..||||.|||.|....||||...||||..||
CUUGAAAAAAAGCUUGAAGACCUUGAAGAGCAGUUAAAUCAUCUG
892
893
25
49
CAGCCCAGUCUAAACA
|||..||..|||||||
CAGUUCAAGCUAAACA
894
895
25
51
AGUUUGCUUCGAGACUUGAGACAGAACUCAAAGA
||.||.|..|..|.|||| |||||||||.|..||
AGAUUUCAACCGGGCUUG-GACAGAACUUACCGA
896
897
25
53
UCAAAGAACUUAACACUCAGUGGGAUCA
|.|||||| ||.|.|.||||||||||.|
UGAAAGAA-UUCAGAAUCAGUGGGAUGA
898
899
25
55
AGAGUUUGCUUCGAGACUUGAGACAGAA-CUCAAAGAACU
|.|||||..|.|..|.||| |||||| ||.|||.||||
AAAGUUUCUUGCCUGGCUU---ACAGAAGCUGAAACAACU
900
901
25
57
AAGAUAAAGAAUGAAGCAG
|||||.|.||||.||||.|
AAGAUGAUGAAUUAAGCCG
902
903

25
59
AGAGCC-AGAGUUUGCUUCGAGACUUGAGACAGAACUCAAAGAACUU-AACACUCAGUGGGAUCACAUGUGCCAACA
|||||| |||.|.|...|||.....|..||.||.|..|..||.|..| ||.|||.|||||||..|..||..||..||
AGAGCCCAGAAUGUCACUCGGCUUCUACGAAAGCAGGCUGAGGAGGUCAAUACUGAGUGGGAAAAAUUGAACCUGCA
904
905
26
27
AGCUGAAGAAGAGUAUCUUGAGAGAGAUUUUGAAUAUAAAACUCCAGA-UGAAUUACAGAAAGCAGUUGAAGAGAUGAAG
||||.||||||||...|...|.|.|||... |||..|.|||||||..| |||.| |.|.||..|||...|.||.|.|||
AGCUAAAGAAGAGGCCCAACAAAAAGAAGC-GAAAGUGAAACUCCUUACUGAGU--CUGUAAAUAGUGUCAUAGCUCAAG
906
907
26
28
UGAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAAUUACAGAAAGCAGUUGAAGAGAU
|||...|||.|||.||..||||||..|.||..|..|.|.....|.||.|||.||.||
UGAAGUAGAAUUUAAACUUAAAACCACUGAAAACAUUCCUGGCGGAGCUGAGGAAAU
908
909
26
29
CUAUCAGA-GAUGCACGAAUGGAUGACACAAGCUGAAGAA-GAGUAUCUUGAGAGA
|||.|||| |..|.|...|||||||| |||.|..|| |||.|.|||||||.|
CUAACAGAUGGCGGAGUCAUGGAUGA-----GCUAAUCAAUGAGGAACUUGAGACA
910
911
26
31
GAAAGCAGUU--GAAGAGAUGAAG
||.|.||||| |||||.||||||
GAGAUCAGUUUAGAAGAAAUGAAG
912
913
26
32
UAUGCCAGAAAGGAGGCCUUGAAGGGAGGUUUGGAGAAAACUGUAAGCCUCCAGAAAGAUCUAUCAGAGAUGCAC
|||.|||||||..||.|..|...|.|..|..|..|.||.|..|||||. |......||||..|....||||||||
UAUUCCAGAAACCAGCCAAUUUUGAGCAGCGUCUACAAGAAAGUAAGA-UGAUUUUAGAUGAAGUGAAGAUGCAC
914
915
26
33
UAUAAAACUCCAGAUGAAUUACAGAAAGCAGUUGAAGAGAUGA
|||||||.||....||||.|..||...|.|||.|||..|.|||
UAUAAAAGUCUGAGUGAAGUGAAGUCUGAAGUGGAAAUGGUGA
916
917

26
34
AGAGAUGCACGAAUGGAUGACACAAGCUG---AAGAA---GAGUAUCUUGAGAGAGAUUUUGAA---UAUAAAACUCCAGAUGAAUUACAGAA-AGCAGUUGAAGAGAUG
|||.||||..|||....|..|..|||.|| |||.| ||.|.||||||.|||.....||.. ||.|.|..|..|..|||...|.|||. |||||||||||..|||
AGAAAUGCUUGAAAUUGUCCCGUAAGAUGCGAAAGGAAAUGAAUGUCUUGACAGAAUGGCUGGCAGCUACAGAUAUGGAAUUGACAAAGAGAUCAGCAGUUGAAGGAAUG
918
919
26
35
GAGGCCUUGAAGGGAGGUUUGGAGAAAACUGUAAGCCUCCAGAAAGAUCUA-UCAG
|||||||||||...||.|||||..||.|..|..|...|...|.|||||..| ||||
GAGGCCUUGAAAACAGUUUUGGGCAAGAAGGAGACGUUGGUGGAAGAUAAACUCAG
920
921
26
36
AAGGGAGGUUUGGAGAAAACUGUAAGCCUC--CAGAAAG---AUCUAUCAGA--GAUGCACGAAUGGAUGACACA-AGCUGAAGAA
|.||.|..|||.||..|.|.|||...||.| ||.|||| |||..||||. ||..|||...|||||||..|| ||...|||||
AUGGAAACUUUUGACCAGAAUGUGGACCACAUCACAAAGUGGAUCAUUCAGGCUGACACACUUUUGGAUGAAUCAGAGAAAAAGAA
922
923
26
37
AGAUGCACGAAUGGAUGACACAAGCUGAA
|.|.|||..|.||.||||||.|.||..||
AAAGGCAGAACUGAAUGACAUACGCCCAA
924
925

26
38
UCAGAGAUGCACGAAUGGAUGACACAAGCUGAAGAAGAGUAUCUUGAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAAUUACAGAAAG
|||||..|.||..|||.|.|...||.|...||.|..||...||...||.|.| |||||.|.|||.. .||.||.||..|.||||
UCAGAUAUACAAAAAUUGCUUGAACCACUGGAGGCUGAAAUUCAGCAGGGGG----UGAAUCUGAAAGA--GGAAGACUUCAAUAAAG
926
927
26
39
GAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAAUUACAGAAA
|.|||||....|.||.|||||||..|||.|| |||||||.|
GCGAGAGGAAAUAAAGAUAAAACAGCAGCUG--UUACAGACA
928
929
26
40
GAGGUUUGGAGAAAACUGUAAGCCUCCAGAAAGAUCU-AUCAGAGAUGCACGAAUGGAUGACACAAGCUGAAGA
|||||.|..|..||.....|||.|||.|||||..||| |||||.|.| |..|.|..|.||..||.|||||.||
GAGGUCUCAAAGAAGAAAAAAGGCUCUAGAAAUUUCUCAUCAGUGGU--AUCAGUACAAGAGGCAGGCUGAUGA
930
931
26
41
GAAUUACAGAAAGCAGUUGAAGAGAUGAA
|||||.|||||.......||.|||.||||
GAAUUGCAGAAGAAGAAAGAGGAGCUGAA
932
933
26
42
UUUGGAGAAAACUGUAAGC
||||.|||...||.|||||
UUUGAAGAUCUCUUUAAGC
934
935

26
44
AGGUUUGGAGAAAACUGUAAGCCUC--CAGAAAGAUCUAUCAGAGAUGCACGAA-UGGAUGACACAAGCUGAAGAAGAGUAUCUUGAGAGAGA
||.|.||..||.||.||...||.|. ||..|.|||.||. |||.||..|...| |||.|.|||.||||||||.| ||.|||. |||.|||
AGAUCUGUUGAGAAAUGGCGGCGUUUUCAUUAUGAUAUAA-AGAUAUUUAAUCAGUGGCUAACAGAAGCUGAACA---GUUUCUC-AGAAAGA
936
937
26
46
AGAAGAGUAUCUUGAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAAUU
|.||||.|||||||..||| ||||..||.|.| |..|.|||||||
AAAAGAAUAUCUUGUCAGA-AUUUCAAAGAGA----UUUAAAUGAAUU
938
939
26
47
AUGACACAAGCUGAAGAAGAGUAUCUUGAGAG--AGAUUUUGAAUAUAAAACUCCAGAUGA
||.|..|.||..||..||||..|.|||||.|. ||.|...|.|.|.|||.||||||..||
AUAAGCCCAGAAGAGCAAGAUAAACUUGAAAAUAAGCUCAAGCAGACAAAUCUCCAGUGGA
940
941
26
48
UCCAGAAAGAUCUAUCAGAGAUGCACGAAUGGAUGACACAAGCUGAAGAAGAGUAUCUUGAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAAUUACAGAAAGCAGUUGAA
|||||| |.|.||.|.||||..||.|.|...|| ..|||||.||..|.|..|.||||.|. |..||||| ||||..|..||.||..|..| |.|||||||.||
UCCAGA--GCUUUACCUGAGAAACAAGGAGAAAU---UGAAGCUCAAAUAAAAGACCUUGGGC---AGCUUGAA---AAAAAGCUUGAAGACCUUGA-AGAGCAGUUAAA
942
943
26
49
CAAGCUGAAGAAGAGUAUCUUGAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAAUUAC-AGAAAGCAG
||||||.||.||..|.||.|.|| ||||||||||..||.|...|..||..||.|..|. |.|||.|||
CAAGCUAAACAACCGGAUGUGGA-AGAGAUUUUGUCUAAAGGGCAGCAUUUGUACAAGGAAAAACCAG
944
945

26
51
AUGACACAAGCUGAAGAAGAGU-AUCUUGAGAGAGAUUUUGAAUAUAAAACUCCAGAUGAA
||.|||.|.|.|||.|..|.|| |.|||||| ||.||.....|.||.|...||.||..|||
AUCACAGAGGGUGAUGGUGGGUGACCUUGAG-GAUAUCAACGAGAUGAUCAUCAAGCAGAA
946
947
26
53
UGAA-UAUAA-AACUCCAGAUGAAUUACAGAAAGCAGUUGAA-GAGAUG
|||| ||.|| |||.||....|||....||..|.|||||||| ||.|||
UGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUG
948
949
26
55
GAAAGGAGGCCUUGAAGGGAGGUUUGGAGAAAACUGUAAGCCU-CCAGAAAGAUCUAUCAGAGAUGCACGAAUGGAUGACACAAGCUGAA
||.|||..||.|||.|.|.|..|... |||..||||.||...| ||.....||.||...|.||.|.|..|..|||.|.|||.||||||||
GAGAGGCUGCUUUGGAAGAAACUCAU-AGAUUACUGCAACAGUUCCCCCUGGACCUGGAAAAGUUUCUUGCCUGGCUUACAGAAGCUGAA
950
951
26
57
GAUGAAUUACAGAAAGCAG
||||||||| ||...||||
GAUGAAUUA-AGCCGGCAG
952
953
26
59
CAAGCUGAAGAAGAGUAUCUUGAGAGAGAUU--UUGAAUAUAAAACUCCAGAUGAAUUACAGAAAGCAGUUGAAGAGA
||.|||||.||.|...||..||||.|.||.. |||||..|..| |||| |.|||.|..||||.|..|.|.||.||||
CAGGCUGAGGAGGUCAAUACUGAGUGGGAAAAAUUGAACCUGCA-CUCC-GCUGACUGGCAGAGAAAAAUAGAUGAGA
954
955
27
28
ACAAGAGGCCUUAAAAAAG--GAACUUGAAACUCUAACCAC
|||||.||| |.||..||| |||.||.||..|..||||||
ACAAGUGGC-UAAAUGAAGUAGAAUUUAAACUUAAAACCAC
956
957

27
29
UAAAAAAGGAACUUGAAAC
|.||..||||||||||.||
UCAAUGAGGAACUUGAGAC
958
959
27
30
AGCUCAAGCUCCACCUGUAGCACA
|||||||...||.|..|.|||.||
AGCUCAAAUGCCUCAGGAAGCCCA
960
961
27
31
AAAAGAAGCGAAAGUGAAACUCCUUACUGAGUCUGUAAAUAGUGUCAUAGCUCAAGCUCCACCUGUAGCACA
|||.||| ||||...||.|.....|..|||.|||...|.||.|||.|..|||| |.|..| |||.|||||
AAAUGAA--GAAACAUAAUCAGGGGAAGGAGGCUGCCCAAAGAGUCCUGUCUCA-GAUUGA--UGUUGCACA
962
963
27
32
AGUGGCUCUGCACUAGGCUGAAUGGGAAAUGCAAGACUUUGGAA
||||....||||||.|.|||.||.|||||.. ||||.|.|||||
AGUGAAGAUGCACUUGCCUGCAUUGGAAACA-AAGAGUGUGGAA
964
965
27
33
UGUAAAUAGUGUCAUAG-CUCAAGCUCCACCUGUA--GCACAAGAGGCCUUAAAA----AAGGAACUUGA
||.||||.|||..|.|| ||..|..||....|||| |.|.|||..|.|..|||| ||.||||||||
UGGAAAUGGUGAUAAAGACUGGACGUCAGAUUGUACAGAAAAAGCAGACGGAAAAUCCCAAAGAACUUGA
966
967
27
34
AAGAAGCGAAAG----UGAAACUCCUUACUGAGU
||||.||||||| ||||..||.|.||.||.|
AAGAUGCGAAAGGAAAUGAAUGUCUUGACAGAAU
968
969
27
35
ACUGAGUCUG-UAAAUAGUGUC---AUAGCUCAAGCUCCACCUGUAGCACAAGAGGCCUUAAA
|||.|||||. |.||||||..| ||||||.. |.||.||.| ||||.|||||...|||||
ACUCAGUCUUCUGAAUAGUAACUGGAUAGCUGU--CACCUCCCG-AGCAGAAGAGUGGUUAAA
970
971

27
36
AGAGCUAAAGAAGAGGCCCAACAAAAAGAAG
||||..||||||. .||||.||||||||||
AGAGAAAAAGAAA--CCCCAGCAAAAAGAAG
972
973
27
37
AGUGUCAUAGCUCAAGC-UCCACCUGUAGC
|.|.|||.|||||||.| ||.|..||.|||
AAUCUCAGAGCUCAACCAUCGAUUUGCAGC
974
975
27
38
GGCUGAAUGGGAAAU-GCAAGACUU
||.|||||..||||. |.|||||||
GGGUGAAUCUGAAAGAGGAAGACUU
976
977
27
39
AAAGAAGAGGC--CCAACAA-AAAGAAGCGAAAGUGAAA
|||||.|||.| |..|||| ||||||.|..|..|||.|
AAAGAGGAGACAACUUACAACAAAGAAUCACAGAUGAGA
978
979
27
40
AAAAAAGGAACUUGAAACU-CUAACCA
||||||||..||.||||.| ||.|.||
AAAAAAGGCUCUAGAAAUUUCUCAUCA
980
981
27
41
UGAAUGGGAAAUGCA
|||..|||||.||||
UGAUCGGGAAUUGCA
982
983
27
42
GAAACUCCUUACUGAGUCUGUAAAUAGUGUCAUAGCUCAAGCUCCACCUGUAGCACAAGAGGCCUUAAAAAAGGAAC
||||.|.|||| ||.|.||...|.|..|.|.| ||.||....|.|.|||..||||||.....|||.||..|||||
GAAAUUUCUUA-UGUGCCUUCUACUUAUUUGA---CUGAAAUCACUCAUGUCUCACAAGCCCUAUUAGAAGUGGAAC
984
985

27
44
UCUGUAAAUAGUGUCAUAGCUCAAGCUCCAC
|.|.|||..||||.| ||.|..|||||..||
UAUUUAAUCAGUGGC-UAACAGAAGCUGAAC
986
987
27
46
AGCUAAAGAAGAGGCCCAACAAAAAGAAGCGAAAGUGAAACUC
|.||..|.|||||...||||.|||||||..|...|.|.||.||
ACCUGGAAAAGAGCAGCAACUAAAAGAAAAGCUUGAGCAAGUC
988
989
27
47
AGAAGCGAAAGUGAAACU
|||||.|.|||..|||||
AGAAGAGCAAGAUAAACU
990
991
27
48
AGAGCUAAAGAAGAGGCCCAACAAAAA---GAAGCGAAAGUGAAACUCCUUACUGAGUCUGUAAAUA
||||||..|...|||...|||..|.|| |||||..||.|.|||..||||....||..||.|||.|
AGAGCUUUACCUGAGAAACAAGGAGAAAUUGAAGCUCAAAUAAAAGACCUUGGGCAGCUUGAAAAAA
992
993
27
49
AGCUAAAGAAGAGGCCCAACAAAAAGAAGCGAAAGUGAAA
|.||.||..||..|..|||...|||.||.||.|.|||.||
AACUGAAAUAGCAGUUCAAGCUAAACAACCGGAUGUGGAA
994
995
27
51
UUAAAAAAGGAACUUGAAACUCUAACCACCAACUACCA
|||..||.|.||||...|.|||.||.|...||.|.|||
UUACUAAGGAAACUGCCAUCUCCAAACUAGAAAUGCCA
996
997
27
53
AGCUAAAGAAGAGGCCCAACA
||||||.|||||.||..|.||
AGCUAAGGAAGAAGCUGAGCA
998
999

27
55
ACCAACUACCAGUGGCUCUGCACUAGGCUGAAUGGGAAAUGCAAGACU
|.|||||.|||.||.| ||.||..|.||| |...|.||.|.|||.||
AACAACUGCCAAUGUC-CUACAGGAUGCU--ACCCGUAAGGAAAGGCU
1000
1001
27
57
ACCAGUGGC----UCUGCAC
||||||||. |||||||
ACCAGUGGAAGCGUCUGCAC
1002
1003
27
59
CUGCACUAGGCUGAAUGGGAAA
|||||||..|||||.|||.|.|
CUGCACUCCGCUGACUGGCAGA
1004
1005
27
60
AAGCGAAAGUGAAACUCCUUACUGA
|||.|||.||||..|.|.|.|.|||
AAGAGAACGUGAGCCACGUCAAUGA
1006
1007
28
29
AUUGUCAUACUUGGAGAAAGCA-AACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGAAAACAUU
|||..||||.|.|.|.|.|.|. ||||..||||..|.|.|.|.|..|..|||.|....|...|||..|.|||||
AUUCGCAUAUUGGCACAGACCCUAACAGAUGGCGGAGUCAUGGAUGAGCUAAUCAAUGAGGAACUUGAGACAUU
1008
1009
28
30
GUUGGCAUGAGUUAUUGUCAUACUUGGAGAAAGCAAA-CAAGUGGCUAA
|||||||.....||||| ||.||..||.|.|.|||.. |||.||.||.|
GUUGGCAGCUUAUAUUG-CAGACAAGGUGGACGCAGCUCAAAUGCCUCA
1010
1011
28
31
AAAUGAAGUAGAAU
||||||||.|..||
AAAUGAAGAAACAU
1012
1013

28
32
AGAAAGCAAACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGAAAACA
||||||.||. |.|....||.||||||| |||..|..||||.....||.||.|||||
AGAAAGUAAG-AUGAUUUUAGAUGAAGU-GAAGAUGCACUUGCCUGCAUUGGAAACA
1014
1015
28
33
ACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAA
|.||..|.||.|.||||||..|.|.|.||.|..|||
AUAAAAGUCUGAGUGAAGUGAAGUCUGAAGUGGAAA
1016
1017
28
34
AGAAAGCAAACAAGUGGCUAAAUG
||||||||| ||..|||..|||||
AGAAAGCAA-CAGUUGGAGAAAUG
1018
1019
28
35
AGCAAACAAGUGGCUAAAU
||||.|..|||||.|||||
AGCAGAAGAGUGGUUAAAU
1020
1021
28
36
GAGAAAGCAAACAAGUGGCUAAAUGAAGUAGAAUUUAA
||||||...||......||.|||.||||..|...||||
GAGAAAAAGAAACCCCAGCAAAAAGAAGACGUGCUUAA
1022
1023
28
37
AGAAUUUAAACUUAAAA
||||||.|.|||..|||
AGAAUUAAGACUGGAAA
1024
1025
28
38
CUAAAUGAAGUAGAAUUUAA
||.||.||.|.|||.||.||
CUGAAAGAGGAAGACUUCAA
1026
1027

28
39
AAACAAGUG--GCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGA
|||.||.|| ||.||..|.||...|.||..|||..|.||.|||.||
AAAGAAUUGUUGCAAAGAGGAGACAACUUACAACAAAGAAUCACAGA
1028
1029
28
40
GGCUAAAUGAAGUAGAA------UUUAAACUUAAAACCACUGAAAACAUUCCUGGCGGA--GCUGAGGAAAUCUCUGAGGUGCUAG
|.||.||.||||.|.|| |..|||.||...|.||.||..|.||.|.|..|.||. |||||.||..|| ||||..||||.|
GUCUCAAAGAAGAAAAAAGGCUCUAGAAAUUUCUCAUCAGUGGUAUCAGUACAAGAGGCAGGCUGAUGAUCUC-CUGAAAUGCUUG
1030
1031
28
41
CUGAAAACAUUCC-UGGCGGAGCUGAGGAAAUCUCUGAGG
|||||..||.|.| |.|...||||||||...|.|||||||
CUGAAUGCAGUGCGUAGGCAAGCUGAGGGCUUGUCUGAGG
1032
1033
28
42
CUGAGGAAAUCUCUGAGGUGC
||..||||||.|||.|.||||
CUUUGGAAAUUUCUUAUGUGC
1034
1035
28
44
GUUUGGGCAUGUUGGCAUGAGUUAUUGUCAUACUUGGAGAAAGCAAACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAAAACCACUGAAAACAUUCCUG
|||..|..|||..|||.|.. |.|||.|.||| |..|||.|...||..|||||||||..||||..|||......||.|.||..||..|| |||||||
GUUGAGAAAUGGCGGCGUUU-UCAUUAUGAUA--UAAAGAUAUUUAAUCAGUGGCUAACAGAAGCUGAACAGUUUCUCAGAAAGACACAA---AUUCCUG
1036
1037

28
46
AUGAGUUAUUGUCAUACUUGGAGAAAGCAAACAAG-UGGCUA
||||.||..|.|.||..||||||.|||||.|.||. |.||||
AUGAAUUUGUUUUAUGGUUGGAGGAAGCAGAUAACAUUGCUA
1038
1039
28
47
AAGCAAACAAGUGGCUAAAUGAAGUAGAAUUUAAACUUAA
||||..|.|||.| |.|.||.||.|.|||..|||.||.||
AAGCCCAGAAGAG-CAAGAUAAACUUGAAAAUAAGCUCAA
1040
1041
28
48
AAUGAAGUAGAAUUUAAACUUAAAACCACUGAAAACAUUCCUGGCGGAGCU-GAGGAAAUCUCUGAGGUGCUAGA
||..|||.||||.||.||..|.|||. ||||.| |||.|.|.|||| ||..|||....|||.|..||.||
AAACAAGGAGAAAUUGAAGCUCAAAU-----AAAAGA--CCUUGGGCAGCUUGAAAAAAAGCUUGAAGACCUUGA
1042
1043
28
49
AAAUGAAGUAGAAUUUAAACUUAAA
||.||||.|||.|.||.||..||||
AACUGAAAUAGCAGUUCAAGCUAAA
1044
1045
28
51
CUUGGAGAAAGCAAACA-AGUGGCUAAAUGAAGUAGAAUUUAAACU-UAAAACCACUGAAAACAUUCCUGGCGGAGCU-GAGGAAAUCUCUGAGGUGCU
||||||.|.|.|..||. |.|||||...|....|.|| |.||..| |||||.|||.||......|..|||..||.|| |||||.|||...|||.||.|
CUUGGACAGAACUUACCGACUGGCUUUCUCUGCUUGA--UCAAGUUAUAAAAUCACAGAGGGUGAUGGUGGGUGACCUUGAGGAUAUCAACGAGAUGAU
1046
1047
28
53
AGUAGAAUUUAAACUUAAAACCACUGAAAACAUUC-CUGGCGGAGCUGAGGAAAUCUCUGAG
|||.||||. |||..|.|||..|.|.||.|||.|. |||| .||||.|||||....|||||
AGUUGAAUG-AAAUGUUAAAGGAUUCAACACAAUGGCUGG--AAGCUAAGGAAGAAGCUGAG
1048
1049

28
55
AAACUUAAA-ACCACUGAAAACAUUCCUGGCGGAGCUGAGGAAAUCUCU
|||||.|.| |..||||.||...||||....|||.|||...||.|.|||
AAACUCAUAGAUUACUGCAACAGUUCCCCCUGGACCUGGAAAAGUUUCU
1050
1051
28
57
GCUAAAUGAAGUAGAAUUUA
|||.||.||.|..|||||.|
GCUGAAAGAUGAUGAAUUAA
1052
1053
28
59
GUAGAAUUUAAACUUAAAACCACUGA
|.|.||||.||.||..|..||.||||
GAAAAAUUGAACCUGCACUCCGCUGA
1054
1055
29
30
CUUGAAAAUUUGAUGCGACAUUCAGAGGAUAACCCAAAUCAGAUUCGCAUAUUGGCACAGACCCUAACA
||||||.|....||.|....|.|..||||.|....|||.....|.|.|.||.|.....||.||||.|||
CUUGAACAGAGCAUCCAGUCUGCCCAGGAGACUGAAAAAUCCUUACACUUAAUCCAGGAGUCCCUCACA
1056
1057
29
31
AGUCAUG-GAUGAGCU---AAUCAAUGAGGAA
||||||| |||.||.| ||..|||||.|||
AGUCAUGAGAUCAGUUUAGAAGAAAUGAAGAA
1058
1059
29
32
ACAUUCAGAGGAUAACCCAAAUCAGAUUCGCAUAUUGGCACAGACC
|.|.|.|.|.|||..|.|.|...||.||||..||||. ||.|.|||
AAAAUUACAAGAUGUCUCCAUGAAGUUUCGAUUAUUC-CAGAAACC
1060
1061
29
33
AAAAUUUGAUGCGACAUUCAGAG
|.||.||||||..|.|.|.|.||
AGAACUUGAUGAAAGAGUAACAG
1062
1063

29
34
CAGAUUCGCAUAUUGGCACAGACCCUAACAGAUGGCGGAGU
|||||..|.| ||||.||.|||....|.|||.||..|||.|
CAGAUAUGGA-AUUGACAAAGAGAUCAGCAGUUGAAGGAAU
1064
1065
29
35
AACAGAUGGCGGAGUCAUGGAUGAGCUAAUCAAUGAGGAACUUGAGACAUUUAA
||||||.||.|.| |.|| |.||| .||||..||||.|...|||.|.||.||
AACAGAAGGUGCA--CCUG-AAGAG--UAUCACAGAGGUAGGAGAGGCCUUGAA
1066
1067
29
36
CACUUGAAAA--UUUGAUGCGACAUUCAGAGGAUAACCCAAAUCAGAUUCGCAUAUUGGCACAGACCCUAACAGAUG
|||.||.||| |||||...|| ||...||..|.|.|.||||...||| |||...|||..|.||.||....||||
CACAUGGAAACUUUUGACCAGA-AUGUGGACCACAUCACAAAGUGGAU---CAUUCAGGCUGACACACUUUUGGAUG
1068
1069
29
37
GCAUAUUGGCACAGACCCUAA-CAGAUGGCGGAGUCAUGGAUGAGC
|.|.|||.|.|.||.|||.|| |..|..||..|..|||.|||..||
GGAAAUUAGUAGAGCCCCAAAUCUCAGAGCUCAACCAUCGAUUUGC
1070
1071
29
38
AGGAACUUGAGACAUUUAAUUC
|||||.|.|||...|||||.||
AGGAAUUGGAGCAGUUUAACUC
1072
1073
29
39
GAGUCAUGGAUGAGCUAAUCAAUGAGGAACUUGAGACA
||.|||..||||||..||.....||||||.|..|||.|
GAAUCACAGAUGAGAGAAAGCGAGAGGAAAUAAAGAUA
1074
1075
29
40
UCACUUGAAAA--UUUGAUGCGACAUUCAGA
||.|.|||||. ||.||| ||||||.|.|
UCUCCUGAAAUGCUUGGAU--GACAUUGAAA
1076
1077

29
41
ACCCAAAUCAGAUUC
|.||||.||||||.|
AGCCAACUCAGAUCC
1078
1079
29
42
CACAGACCCUAACAGAUG
||||..|||||..|||.|
CACAAGCCCUAUUAGAAG
1080
1081
29
44
AUUCAGAGGAUAACCCAA----AUCAGAUUCGCAUAUUGGCACAGAC-CCUAACAGAUGG
|.||||.||.||||..|| |.|||.|||.||.|..|.||||.|. |||.|.|..|||
AAUCAGUGGCUAACAGAAGCUGAACAGUUUCUCAGAAAGACACAAAUUCCUGAGAAUUGG
1082
1083
29
46
GAUGAGCUAAUCAAUGAGGAACUUGAGACAUUUAA
||..|||.|.|.||.||..|.||||||..|.|.||
GAGCAGCAACUAAAAGAAAAGCUUGAGCAAGUCAA
1084
1085
29
47
ACUUGAAAAUUUGAU---GC-GACA----UUCAGAGGAUAA
||||||||||..|.| || |||| |.|||.||||||
ACUUGAAAAUAAGCUCAAGCAGACAAAUCUCCAGUGGAUAA
1086
1087
29
48
UCACUUGAAAAUUU
|||.|||.||||||
UCAGUUGGAAAUUU
1088
1089
29
49
AGCUAAUCAAUGAGGAACUUGA-GACAUUU
||||||.|||.. |||..|.|| ||.||||
AGCUAAACAACC-GGAUGUGGAAGAGAUUU
1090
1091

29
51
AACUUGAGA---CAU-UUAAUUCUCGUUGGAGGGAACUAC
||||.||.| ||| ||..||...||||||||.|.||.|
AACUAGAAAUGCCAUCUUCCUUGAUGUUGGAGGUACCUGC
1092
1093
29
53
UUGAGACAUUUAAUUCUCGUUGGAGGGAACUACAUGAAGA
||||.|.|.||.|...||..|||...|||.||||.|||.|
UUGAAAGAAUUCAGAAUCAGUGGGAUGAAGUACAAGAACA
1094
1095
29
55
CUUGAAAA-UUUGAUGC--GACAUUCAGAGGAUAACCCAAAUCAGAUUCGCAUAUUGGCACAGACCC-UAACAGAUGGC
||.||||| |||..||| |.|.|.||||.|.|.|..|||.|...|.|..|.||..||.....|||| |||...|.|||
CUGGAAAAGUUUCUUGCCUGGCUUACAGAAGCUGAAACAACUGCCAAUGUCCUACAGGAUGCUACCCGUAAGGAAAGGC
1096
1097
29
57
AUUUGAUGCGACAUUC
|||.||.|||||.|||
AUUGGAGGCGACUUUC
1098
1099
29
59
GAAAAUUUGAUGCGACAUUCAGAGGAUAACCC----AAAUCAGAUUCGCAUAUUGGCACAGACCCUAACAGAUGGCGGAGUC-AUGGAUGAGCU
|||||.||||..|..||.||.|..||....|. |||..||||..|....||| |.||||.|.|..|..|....|||.| |.|||||||||
GAAAAAUUGAACCUGCACUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACCCUUG--AAAGACUCCAGGAACUUCAAGAGGCCACGGAUGAGCU
1100
1101
30
31
UAAGGAGGCAAAAGUUGCUUGAACAGAGCAUCCAGUCU
|||..|||..||.|..||| |..||.||..|||.||||
UAAUCAGGGGAAGGAGGCU-GCCCAAAGAGUCCUGUCU
1102
1103

30
32
ACAAGCAGUUGGCAGCUUAUAUUGCAGACAAGGUG
|.|.|||.|||.|.|| ||||.|.||||.|.|
AGAUGCACUUGCCUGC----AUUGGAAACAAAGAG
1104
1105
30
33
AGGAGACUGAAAAAUCCUUACA-CUUAAUCCAGGAGUCCC-----UCACAUUCAUUGACAAGCAGUUGGCAGC
||.||||.|||||..||..|.| |||.||..|.||||..| |.|.|||...|.|.||..||.|||.|||
AGCAGACGGAAAAUCCCAAAGAACUUGAUGAAAGAGUAACAGCUUUGAAAUUGCAUUAUAAUGAGCUGGGAGC
1106
1107
30
34
UUGACA-AGCAGUUGGCAGCUU---AUAUUGCA--GACAAGGUGGAC-GCAGCUCAA---AUGCCU
|||||| |...|.||||||||. ||||.|.| |||||.|.|..| ||||.|.|| ||||||
UUGACAGAAUGGCUGGCAGCUACAGAUAUGGAAUUGACAAAGAGAUCAGCAGUUGAAGGAAUGCCU
1108
1109
30
35
GUAAGGAGGCAAAAGUUGCUUGAACAGAGCAUCCAGUCUGCCCAGGAG--ACUGAAAA
|.|||.||| |.|.||||.|.|||.|.|. |..||||||.|..|..|| ||||.|.|
GCAAGAAGG-AGACGUUGGUGGAAGAUAA-ACUCAGUCUUCUGAAUAGUAACUGGAUA
1110
1111
30
36
ACAAGCAGUUGGCAGCUUAUAUUGCAGACAAGGUGGACG-CAGCUCAAA-UGCCUCA
|.||.||..|||.|.||| |||...|.||.||||||. ||.|.|||| ||..|||
AGAAACACAUGGAAACUU---UUGACCAGAAUGUGGACCACAUCACAAAGUGGAUCA
1112
1113
30
37
CAAAAGUUGCUUGAAC
|||||.||||||||||
CAAAAAUUGCUUGAAC
1114
1115
30
38
CAGCUUAUAUUGCAGACAA
||||...|.||.|||||||
CAGCAGCUGUUACAGACAA
1116
1117

30
39
CAGCUUAUAUUGCAGACAA
||||...|.||.|||||||
CAGCAGCUGUUACAGACAA
1116
1117
30
40
CAUUGACAAGCAGUUGGC-AGCUUA
||||||.||..|.||.|| |||.||
CAUUGAAAAAAAAUUAGCCAGCCUA
1118
1119
30
41
GUGGACGCAGCUCAAAUGC--CUCAGGAAGCCCAG
|||||..||.||||.||.| |||||.||||.|.|
GUGGAGCCAACUCAGAUCCAGCUCAGCAAGCGCUG
1120
1121
30
42
CCAGUCUGCCCAGGAGACUGAAAAAUCCUUACACUUAAUCCAGGAGUCCCUCA
||..|.|||..||||...||||.|...|||..|...|. |||||||.||.|
CCUCUGUGCUAAGGACUUUGAAGAUCUCUUUAAGCAAG---AGGAGUCUCUGA
1122
1123
30
44
CUCAAAUGCCUCAGGA
|.|||||.|||.||.|
CACAAAUUCCUGAGAA
1124
1125
30
46
CUUGAACAGAGCAUCCAGU
||.|||.||||||.|.|.|
CUGGAAAAGAGCAGCAACU
1126
1127
30
47
UGCUUGAACAGAGCAUCCAGUCUGCCCAGGAGACUGAAAAAUCCUUACACUUAA--UCCAGGAGUC
||||||.| ||.|| |||..|..||||||.|||...|.|.|..|||..|..||| ||.||.||.|
UGCUUGUA-AGUGC-UCCCAUAAGCCCAGAAGAGCAAGAUAAACUUGAAAAUAAGCUCAAGCAGAC
1128
1129

30
48
AUUGACAAGCAGUUGGCAGCUUAUA
|||...||.|||||||.|..|||||
AUUAGGAAUCAGUUGGAAAUUUAUA
1130
1131
30
49
UGUAAGGAGGCAAAAGUUG--CUUGAACAGAGCAUCCAGUCUGCC
|.|||.| ||||..|.||| |..|.|.|.|.||.|||.||.|||
UCUAAAG-GGCAGCAUUUGUACAAGGAAAAACCAGCCACUCAGCC
1132
1133
30
51
GCUUGAACAGAGCAUCCAGUCUGCC
|||||.|||||.|.|.|.|.|||.|
GCUUGGACAGAACUUACCGACUGGC
1134
1135
30
53
GGAGGCAAAAGUUGCUUGAA
||||||||.|||||..||||
GGAGGCAACAGUUGAAUGAA
1136
1137
30
55
GCAAAAGUUGCUUG
|.|||||||.||||
GGAAAAGUUUCUUG
1138
1139
30
57
AAAAAUCCUUACA
|||||||||.|.|
AAAAAUCCUGAGA
1140
1141
30
59
UGAACAGAGCAUCCAGUCUGCCC
|||.||..|.||||.|.|.||||
UGAUCAAGGGAUCCUGGCAGCCC
1142
1143

30
60
UGACAAGCAGUUGGCAGCUUAU
|||..|.|||.|||.|||||.|
UGAACACCAGAUGGAAGCUUCU
1144
1145
31
32
ACAAGUCA-UGAGAUCAGUUUAGAAGAAAUGAAGAAACA
|||||..| |.||||.|.||||||.|||.||||||..||
ACAAGAAAGUAAGAUGAUUUUAGAUGAAGUGAAGAUGCA
1146
1147
31
33
AAGUCAUGAGAUCAGUUU--AGAAGAAAUGAAGAAACAUAAUCAGGGGAAGGAGGCUGCCCAAAGAGU
|||.|..||..||||.|| |.|..|||.|.|||...|.||||. .||.||...||...|||||||
AAGACUGGACGUCAGAUUGUACAGAAAAAGCAGACGGAAAAUCC---CAAAGAACUUGAUGAAAGAGU
1148
1149
31
34
GAUUUGACAAGUCAUGAGAUCAGUU-UAGAAGAAAUG
||.|||||| |.||||||||.. |.||||.||||
GAAUUGACA----AAGAGAUCAGCAGUUGAAGGAAUG
1150
1151
31
35
AGAAGAAAUGAAGAAACAUAA
|.||||.||..|||||||.||
AAAAGAGAUUGAGAAACAGAA
1152
1153
31
36
UUUAGAAGAAAUGAAGAAACAUAAUC
|||.||.|||....|||||.|.||.|
UUUGGAUGAAUCAGAGAAAAAGAAAC
1154
1155
31
37
CAAUCUGAUUUGACAAGU-CAUGAGAUCAGUUUAG
|||.|.|...||||.|.| ||.||.||.|||..||
CAAACCGCGGUGACCACUGCAGGAAAUUAGUAGAG
1156
1157

31
38
UCCAAUCUGAUUUGACAAGUCAUGAGAUCAGUUUAGAAGAAAUGAAGAAACAU
||||.|| .|||| |||..||..||.|||||||....|.||..|.|||.||
UCCAUUC--CUUUG--AAGGAAUUGGAGCAGUUUAACUCAGAUAUACAAAAAU
1158
1159
31
39
AUGAGAUCAGUUUAGAAGAAAUGAAGAAACAUAAUCAG
||||||..|....|||.|||||.||||.|.|..|.|||
AUGAGAGAAAGCGAGAGGAAAUAAAGAUAAAACAGCAG
1160
1161
31
40
UCAUGAGAUCAGUUUAGAAGAAAU-GAAGAAACAUAAUC
||.|||.|| |.||.||.||.|| |||.|||.||.|.|
UCCUGAAAU--GCUUGGAUGACAUUGAAAAAAAAUUAGC
1162
1163
31
41
AUUUGACAAGUCAUGAGAUCAGUUUAGAAGA
|.||||.|....||..|.|||||||.|||||
AAUUGAGAGCAAAUUUGCUCAGUUUCGAAGA
1164
1165
31
42
GAAGAAAUGAAGA
|||||||.||.||
GAAGAAACGAUGA
1166
1167
31
44
AAGAAAUGAAGAAACAUAAUCAGGGG---AAGGAGGCUGCCCA
|.||.||.||||.|..|||||||.|| |..||.||||..||
AUGAUAUAAAGAUAUUUAAUCAGUGGCUAACAGAAGCUGAACA
1168
1169
31
46
UAGAAGAAAUGAAGAA
||||||||...|||||
UAGAAGAACAAAAGAA
1170
1171

31
47
AAGUCAUGAGAUCAGUUUAGAAGAAAUGAAGAAACAU---AAUCAGGGGAAGGAGGC
||||..|...||.||...||||||.....|.||||.| |||.||...|||.||.|
AAGUGCUCCCAUAAGCCCAGAAGAGCAAGAUAAACUUGAAAAUAAGCUCAAGCAGAC
1172
1173
31
48
AAAUCCAAUCUGAUUUGACAAGUCAUGAGAUCAGUUUAGAAGAAA---UGAAGA
||||..||.||.|..|.|.|...|.||.| |||.||..||.||| ||||||
AAAUUGAAGCUCAAAUAAAAGACCUUGGG--CAGCUUGAAAAAAAGCUUGAAGA
1174
1175
31
49
GGGGAAG-GAGGCUGCCCAAAGAG
|.||||| ||...||.|.||||.|
GUGGAAGAGAUUUUGUCUAAAGGG
1176
1177
31
51
UCUGAUUUGACAAGUCAUGAGAUCA
||||.||...|||||.||.|.||||
UCUGCUUGAUCAAGUUAUAAAAUCA
1178
1179
31
53
GGAAGGAGGCUGCCCAAAGAGU
|||||||||.|.||.|.|.|||
GGAAGGAGGGUCCCUAUACAGU
1180
1181
31
55
UAGAAGAAAUGAAGAAACA
||.||||..|||.||||||
UAAAAGAGCUGAUGAAACA
1182
1183
31
57
AUUUGACAAGUCAUGAGAUCAGUUUAGAAGAA
|||.||...|.|.|...|.|||||.|||||.|
AUUGGAGGCGACUUUCCAGCAGUUCAGAAGCA
1184
1185

31
59
UAAUCAGGGGAAGGAGGCUGCCC
|.||||.||||....|||.||||
UGAUCAAGGGAUCCUGGCAGCCC
1186
1187
31
60
AUCAGUUUAGAAGAAAUGAAGA
|.||.|.|.|||||..||||.|
AGCACUCUGGAAGACCUGAACA
1188
1189
32
33
UGAAGUGAAGAUGCACUUGCCUGCAUUGGAAACAAAGAGUGUGGAACAGGAAGUAGUACAGUCACAGC
||||||||||....|..|| |.|.|||..|.|||||.||. ||...|..|.||||||..|.|||
UGAAGUGAAGUCUGAAGUG---GAAAUGGUGAUAAAGACUGG---ACGUCAGAUUGUACAGAAAAAGC
1190
1191
32
34
GUAAGAUGAUUUUAGAUGAAGUGAAGAUGCACUUGCCUGCAU---UGGAAACAAAGAGUGUGGAA
|||||||| ..|.|.|||.||||..| ||||.|.|.|| |||.|.|.|....|.|||||
GUAAGAUG---CGAAAGGAAAUGAAUGU---CUUGACAGAAUGGCUGGCAGCUACAGAUAUGGAA
1192
1193
32
35
AAACAAAGAGUGUGGAACAGGAAGU
|||.|.|||.||.|.|||||.|.||
AAAAAGAGAUUGAGAAACAGAAGGU
1194
1195
32
36
AUUCCAGAAAC-CAGCCAA-- UUUUGAGCAGCGUCUACAAGAAAGUAAGAUGAUUUUAGAUGAAGUGAAGAUGCACUUGCCUGCAUUGGAAACAAAGA
||.|||||||| ||...|| ||||||.|||..|.|..|..|.|..|..|.|....|...|.|.|...|.|..|..|||..||.||..||.|.|||||
AUACCAGAAACACAUGGAAACUUUUGACCAGAAUGUGGACCACAUCACAAAGUGGAUCAUUCAGGCUGACACACUUUUGGAUGAAUCAGAGAAAAAGA
1196
1197

32
37
UCACAGCUAAAUCAUUG
|||.||||.||.|||.|
UCAGAGCUCAACCAUCG
1198
1199
32
38
GAGUGUGGAACAGGAAG
||.|.||.||.||||||
GAAUCUGAAAGAGGAAG
1200
1201
32
39
GGAAACAAAGAGUGUGGAACAGGAAGUAGUACAGUCACAGCUAAAU
|||||.||||| |..|||||.|..|..|||||.||.|.|..|||
GGAAAUAAAGA---UAAAACAGCAGCUGUUACAGACAAAACAUAAU
1202
1203
32
40
UACAAGAAAGUAAGAUGAUUUUAGAUGAAGUGAAGAUGCACUUGCCUG-CAUUGGAAACAAA
|||||||. |.|.|.|||| |||....|||| |||| |||..|| |||||.|||.|||
UACAAGAG-GCAGGCUGAU----GAUCUCCUGAA-AUGC--UUGGAUGACAUUGAAAAAAAA
1204
1205
32
41
GCAUUGGAAACAAAGAGUGUGGAACAGGAAGUAGUAC--AGUCACAGCUAAAUCAUUGUGUG
|.||||.|.|..||||..|.|||.|.|.|.|.|||.| ||.|| ||||.|....||||.||
GAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAGUGCGUAGGCA-AGCUGAGGGCUUGUCUG
1206
1207
32
42
AAGUAA-GAUGAUUUUAGAUGAAGUGAAGAUGCACUUGCCUGCAUUGGAAA
|||.|| ||||||..| |||||. |||||| |.||||| |||||||
AAGAAACGAUGAUGGU-GAUGAC-UGAAGA----CAUGCCU---UUGGAAA
1208
1209

32
44
GUUUCGAUUAUUCCAGAAACCAGCCAAUUUUGAGCAGCGUCUACAAGAAAGUAAGAUGAUUUUAGAU GAAGUGAAGAUGCACUUGCCUGC--AUUGGAAACA
||||..|||||...|.|||. |..|||.|.|||.|.|||..||||..| ||..|.|||....||| |||..||..|.||||. |||||.||||
GUUUUCAUUAUGAUAUAAAG-----AUAUUUAAUCAGUGGCUAACAGAAGCU--GAACAGUUUCUCAGAA----AGACACAAAUUCCUGAGAAUUGGGAACA
1210
1211
32
46
AUGAAGUUUCGAUUAUUCCAGA--AACCAGCCAAUUUUGAGCAGCGUCUACAAGAAA
||.|..||.|.|.|||.|||.. ||||.|..||. |||||||..|||.||||||
AUAACAUUGCUAGUAUCCCACUUGAACCUGGAAAA---GAGCAGCAACUAAAAGAAA
1212
1213
32
47
GAGCAGCGUCUACAAGAAAGUAAGAUGA
|||||...|..||..||||.||||.|.|
GAGCAAGAUAAACUUGAAAAUAAGCUCA
1214
1215
32
48
AGAAAGUAAGAUGAUUUUA-GAUGAAGUGAAGAUGCACUUGCCUGCAUUGGAAACAAAGAGUGUGGAACAGGAAGUAGUACAGUCACAGCUAAAUCAU
|||||..|.||..|.||.| |.|.||.|.|| |..|..|.|.|.|| |.||||.||||..||..||.|..|||| || |||.||||||||
AGAAACAAGGAGAAAUUGAAGCUCAAAUAAA-AGACCUUGGGCAGC--UUGAAAAAAAGCUUGAAGACCUUGAAG-AG--------CAGUUAAAUCAU
1216
1217
32
49
AGAAACCAGCCAAU
|.||||||||||.|
AAAAACCAGCCACU
1218
1219

32
51
UUGAGCAGCGUCUACAAGAAAGUAAGAUGAUUUUAGAUGAAGU-GAAGAU
||||.||...|.||.||..|...|.|.||||..|.|.|||..| ||.|||
UUGAUCAAGUUAUAAAAUCACAGAGGGUGAUGGUGGGUGACCUUGAGGAU
1220
1221
32
53
UGGAAACAAAG--AGU-GUGGAACAGGAAGUAGUACAGUC-ACAGCUAA
|||||.|.||| ||. |..||.||||...|||.||||.| |.|||.||
UGGAAGCUAAGGAAGAAGCUGAGCAGGUCUUAGGACAGGCCAGAGCCAA
1222
1223
32
55
CAGAAACCA--GCCAAUUUUGAGCAGCGU-CUACAAGAAAGUAAGAUGAUUUUAGAUGA
|.|||||.| ||||||.|....|||..| ||||..|.|||.|| |.|.|..||||.||
CUGAAACAACUGCCAAUGUCCUACAGGAUGCUACCCGUAAGGAA-AGGCUCCUAGAAGA
1224
1225
32
57
AGCCAAUUUUGAGCAGCG
|||||.||.|||.|||.|
AGCCAGUUCUGACCAGUG
1226
1227
32
59
GAUGAAGUGAAGAUGCACUUGCCUGCAUUGGAAACAAAGA
||..||.||||..||||||...|||..|.|.|.|.|||.|
GAAAAAUUGAACCUGCACUCCGCUGACUGGCAGAGAAAAA
1228
1229
32
60
AGAUGCACUUGCCUGCAUUGGAAACAAAGAGUGUGGAAC
||..|.|.|||| ||.|..||||.|.|..|||.|..||
AGGAGAAAUUGC--GCCUCUGAAAGAGAACGUGAGCCAC
1230
1231
33
34
ACUUGUAUAAAAGUCUGAGUGAAGUGAAGUCUGAAGUGG
|.|||.|..||.|.|| |||.|..||.|.||||||||.|
AGUUGAAGGAAUGCCU-AGUAAUUUGGAUUCUGAAGUUG
1232
1233

33
35
AAUCCCAAAGAACUUGAUGAAAGAGUAACAGCUUUGAAAUUGCAUUAUAAUGAGCUGGGAG
|.||..|||||..|||| ||||.||.|...||.....||..|.||.|.| |||.|.||||
ACUCAAAAAGAGAUUGA-GAAACAGAAGGUGCACCUGAAGAGUAUCACA--GAGGUAGGAG
1234
1235
33
38
AGCAGACGGAAAAUCCCAAAGA-----ACUUGAUGAAAGA
|||||..||..||||..||||| ||||.|..|||||
AGCAGGGGGUGAAUCUGAAAGAGGAAGACUUCAAUAAAGA
1236
1237
33
39
AACUUGUAUAAAAGUCUGAGUGAAGUGAAGUCUGAAGUGGAAAUGGUGAUAAAGACUGGACGUCAGAUUGUACAGAAAAAGCAGA
|||||..|..||||..|.|..||.|.||.......||.||||||...|||||| ||..|||.|..||||||.|||.||.|
AACUUACAACAAAGAAUCACAGAUGAGAGAAAGCGAGAGGAAAUAAAGAUAAA------ACAGCAGCUGUUACAGACAAAACAUA
1238
1239
33
40
GAAGUGAAGUCUGAA-GUGGAAAU--GGUGAUAAAGACUGGACGUCAGAUUGUA-CAGAAAAAG---CAGACGGAAAAUCCC---AAAGAACUUGAUGAAAGAGUAACA
||..|||.||||.|| |..||||. ||...||.|.|.|...|.|||| |.||| |||.|.||| |||.|.||..|||.| |||....|.|||||.|..|.||.|
GAUUUGAGGUCUCAAAGAAGAAAAAAGGCUCUAGAAAUUUCUCAUCAG-UGGUAUCAGUACAAGAGGCAGGCUGAUGAUCUCCUGAAAUGCUUGGAUGACAUUGAAAAA
1240
1241
33
41
UCAGAUU--GUACAGAAAAAGCAGACGGAAAAU
||||||. |..|||.||..||.|.|||.||||
UCAGAUCCAGCUCAGCAAGCGCUGGCGGGAAAU
1242
1243

33
42
UGAAGUGGAAAUGGUGAUAAAGACUGGA
|||||.....|||.||.|.|.|||||.|
UGAAGAAACGAUGAUGGUGAUGACUGAA
1244
1245
33
44
AAAGA-ACUUGAUGAAAGAGUAACAG
||||| |.||.||.|..|..||||||
AAAGAUAUUUAAUCAGUGGCUAACAG
1246
1247
33
46
AACUUGUAUAAAAGUCUGAGUGAAGUGAAG
||||...|.|||||..||||. ||||.|||
AACUAAAAGAAAAGCUUGAGC-AAGUCAAG
1248
1249
33
47
GGAAAAUCCCAAAGAACUUGAUGAAA---GAGUAACAGCU-UUGAAAUUGC
||.||.||.||||.||.|..|||||| |||.|.|.|.. |||.||.|||
GGGAAUUCUCAAACAAUUAAAUGAAACUGGAGGACCCGUGCUUGUAAGUGC
1250
1251
33
48
AAAAUCCCAAAGAACUUGAUGA
||||.|...||||.|||||.||
AAAAGCUUGAAGACCUUGAAGA
1252
1253
33
49
CUGAAGUGGAAAUGGUGAUAAAGACUGGACGUCAGA--UUGUACA--GAAAAAGCAGAC
|.||.|||||| |.|||...|.||..|.|.|||. ||||||| ||||||.|||.|
CGGAUGUGGAA---GAGAUUUUGUCUAAAGGGCAGCAUUUGUACAAGGAAAAACCAGCC
1254
1255
33
51
CAGACGGAAAAUCCCAAAGAACUUGAUGAAAGAG-UAACAGCUUUG--AAAUUGCA
||.||...||||.|||.....|||||||...||| ||.|.|||.|| |.|||.||
CAAACUAGAAAUGCCAUCUUCCUUGAUGUUGGAGGUACCUGCUCUGGCAGAUUUCA
1256
1257

33
53
AGAACUUGAUGAAAGAGU---AACAGCUUUGAAAU--UGCAUUAUAAUGAGCUGGGAGCAAAG
|||||..||.|.||.||| |..|..|.|.|||. |.||..|.|||| |||||.|||.|||
AGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAAGGAUUCAACACAAUG-GCUGGAAGCUAAG
1258
1259
33
55
AAAGAACUUGAUGAAAGAGUAACA
|||||.|| |||||||.|.|..||
AAAGAGCU-GAUGAAACAAUGGCA
1260
1261
33
57
GAAGUGAAGUCUGA--AGUGGAA
||||..|..||||| |||||||
GAAGCCAGUUCUGACCAGUGGAA
1262
1263
33
59
AGUCUGAGUGAAGUGAAGUCUGAAGUGGAAAUGGUGAUAAAG-ACUGGACGUCAGAUUGU-ACAGAAAAAGC----AGACG---GAAAAUCCCAAAGAACUUGAUGA
||.||||| ||.||.||..||||...|||||...|||....| ||| |..|.||.||. |.|||||||.. ||||. ||||..|.|.|.||||||.|.||
AGGCUGAG-GAGGUCAAUACUGAGUGGGAAAAAUUGAACCUGCACU---CCGCUGACUGGCAGAGAAAAAUAGAUGAGACCCUUGAAAGACUCCAGGAACUUCAAGA
1264
1265
33
60
CAAAGAACUUGAU-GAAAGAGUAACAGCUUUGAAAUU
|||.||.||||.| |..||..||.||..||.|..|||
CAAUGACCUUGCUCGCCAGCUUACCACUUUGGGCAUU
1266
1267
34
35
GCUACAGAUAUGGA-AUUGACAAAGAGAUCA-GCAGUUGAAG
|||||..|.|..|| |||||.|||.|||... |||..|||||
GCUACUCAAAAAGAGAUUGAGAAACAGAAGGUGCACCUGAAG
1268
1269

34
36
GAAAGGAAAUGAAUGUCUUGAC-AGAAUG
||||...|..|||..|.||||| ||||||
GAAACACAUGGAAACUUUUGACCAGAAUG
1270
1271
34
37
GAAAUGAAUGUCUUGACAGAAUGGCUGGCAGCUACA
|||.||||||.|.|......|..|.|||...|||||
GAACUGAAUGACAUACGCCCAAAGGUGGACUCUACA
1272
1273
34
38
AGAAAUGCUUGAA--AUUGUCCCGUAAGAUGCGAAAGGAAAUGAAUGUCUUGACAGAAUGGCUGGCAGCUACAGAUAUG
|.||.|||||||| |.||.....|.|.||.|...|||...|||||.|... |.||.|.|.||...| ||.|||||||
AAAAUUGCUUGAACCACUGGAGGCUGAAAUUCAGCAGGGGGUGAAUCUGAA-AGAGGAAGACUUCAA--UAAAGAUAUG
1274
1275
34
39
AAGGAAAUGAAUGUCUUG-ACAGAAUGGCUGGCAGCUACAGAUAUGGAAUUGACAAAGAGAUCAGCAGUUGAAGGAAUGC
|||..|||||..||..|| |.|..|....|.|||...|..............||||||| |||| |||.|||..|||.||
AAGACAAUGAGGGUACUGUAAAAGAAUUGUUGCAAAGAGGAGACAACUUACAACAAAGA-AUCA-CAGAUGAGAGAAAGC
1276
1277
34
41
GAUAUGGAAUUGACAAAGAG--AUCAGCAGUUGAAGGAA-UGCCUAG
|||..|||||||...||||. |..||.||.||||.|.| |||.|||
GAUCGGGAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAGUGCGUAG
1278
1279
34
42
AAAUUGUCCCGUAAGAUGCGA--AAGGAAAUGAAUG
|.|.|||||...||||..||| |.||..||||.||
ACACUGUCCGUGAAGAAACGAUGAUGGUGAUGACUG
1280
1281
34
44
AGAAAUGCUUGA-AAUUGUCCCGUAAGAUGCGAAAGGAAAUGAAUGUCUUGA
|.||||.|.||| ||||| |.||.||||.|||...||....|.||||.|
ACAAAUUCCUGAGAAUUG----GGAACAUGCUAAAUACAAAUGGUAUCUUAA
1282
1283

34
46
AAAUGAAUGUCUUGACAGAAU
|||.||||.|||||.||||||
AAAAGAAUAUCUUGUCAGAAU
1284
1285
34
47
AAAGCAACAGUUGGAGAAAUGCUUGAAAUUG-UCCCGUAAGAUGCGAAAGGAAAUGAAUGUCUUGACAGAAUGG-CUGGCAGCUACAGAUAUGGAAUUGACAAAG
||.|.|||.|..|||....||||||.||.|| ||||.||||....|||..|.|| ||....|||||.|..|.|. |..|||| |||.||.|....|.||.||||
AAUGAAACUGGAGGACCCGUGCUUGUAAGUGCUCCCAUAAGCCCAGAAGAGCAA-GAUAAACUUGAAAAUAAGCUCAAGCAG--ACAAAUCUCCAGUGGAUAAAG
1286
1287
34
48
UUGGAGAAAUGCUUGAA
|||.|.|||.|||||||
UUGAAAAAAAGCUUGAA
1288
1289
34
49
CAGAUAUGGAA------UUGACAAAGAGAUCAGCAGUUG---AAGGAAUGCCUAGUAAUUUGGAUUCUGAAG
|.|||.||||| |||.|.|| ||..|||||.||| ||||||...|.||..|.|..|....|||||
CGGAUGUGGAAGAGAUUUUGUCUAA-AGGGCAGCAUUUGUACAAGGAAAAACCAGCCACUCAGCCAGUGAAG
1290
1291
34
51
AGGAAUGCCUAGUAAUUUGGAUUCUGAAGUUGCCUG
||.||||||...|...||| ||..||.||.|.||||
AGAAAUGCCAUCUUCCUUG-AUGUUGGAGGUACCUG
1292
1293

34
53
GAAAGAA---AGCAACAGUUGGA-GAAAUGCUUGAAAUUGUCCCGUAA--GAUGCGAAAG------GAAAUG---AAUGUCUUGACAGAAUGGCUGGCAGCUACAGA
||||||| ||.|.||||.||| |||.|.|..|||....|.|.|.|. ||.||.|.|| |||||| ||.|..|..|||.|||||||||.|||||..||
GAAAGAAUUCAGAAUCAGUGGGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAAGGAUUCAACACAAUGGCUGGAAGCUAAGGA
1294
1295
34
55
ACAGUUGGAGAAAUGCUUGAAAUUGUCCCGUAAGAUGCGAAAGGAAAUGAAUGUCU
||||..|..||||....||..|.|||||...|.|||||.|...|.||.|||.|.||
ACAGAAGCUGAAACAACUGCCAAUGUCCUACAGGAUGCUACCCGUAAGGAAAGGCU
1296
1297
34
57
GGCUGGCAGCUACAGAUAUGGAAUUGACAAAGAGAUCAGCAGUUGAAGGA
|||.||||.|||..|.....||.||..||.. ||.||||.||..|||.||
GGCAGGCACCUAUUGGAGGCGACUUUCCAGC-AGUUCAGAAGCAGAACGA
1298
1299
34
59
UGGAAUUGACAAAGAGAUCAG-CAGUUGAAGGAAUGCCUAGUAAUUU
|||.|..||.|||.||||.|| |..|||||.||.| |.||.||.||
UGGCAGAGAAAAAUAGAUGAGACCCUUGAAAGACU--CCAGGAACUU
1300
1301
34
60
AGUAAUUUGGAUUCUGAA
||.||||..|..||||||
AGAAAUUGCGCCUCUGAA
1302
1303
35
36
GCAAGAAGGAGACGU
||||.|||.||||||
GCAAAAAGAAGACGU
1304
1305

35
37
UGGGCAAGAAGGAGACGUUGGUGGAAGA
||..||||.||.|.|| |||.|||.|.|
UGACCAAGCAGCAAAC-UUGAUGGCAAA
1306
1307
35
38
GCUACUCAAAAAGAGAUUGAGAAACAGAAGG-UGCACCUGA--AGAGUAUCACAGAGGUAGGAGAGGCCUUGAAAACAGUUUUG
|.||..||||||..|.||||...||.|.||| ||.|..|.| ||.|.||.|....|..||..||.|.|||.||.|.||.|.||
GAUAUACAAAAAUUGCUUGAACCACUGGAGGCUGAAAUUCAGCAGGGGGUGAAUCUGAAAGAGGAAGACUUCAAUAAAGAUAUG
1308
1309
35
39
GCUACUCAAAAAGAGAUUGAGAAACAGAAGGUGCACCUGA----AGAGUAUCACAGAGGUAGGAGAG
|.||||..|||||| ||||....|.|||.|...||.||.| |.||.||||||||.|...||.||
GGUACUGUAAAAGA-AUUGUUGCAAAGAGGAGACAACUUACAACAAAGAAUCACAGAUGAGAGAAAG
1310
1311
35
40
CUCAAA-AAGAGAUUGAGAAACAGAAGGUGCACCUGAAGAGUAUCACAGAGGUAGGAGAGGC
|||||| ||||.|....|....||||..|.|.|.|.|...|||||| |||..||||||
CUCAAAGAAGAAAAAAGGCUCUAGAAAUUUCUCAUCAGUGGUAUCA-----GUACAAGAGGC
1312
1313
35
41
GAGUAUCACAGAGGUAGGA-GAGGCCUUGAAAACAGUUU-UGGGCAAGAAGGAGACGUUGGUGGAAGAU
|.|.||..||||.|.||.| ||||...||||..||||.. |.||||||..| ||...|||...||.|||
GGGAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAGUGCGUAGGCAAGCUG-AGGGCUUGUCUGAGGAU
1314
1315
35
42
GGCCUUGAAAACAGUUUUGGGCAAGAAGGAGACGUUG
|.|.|||||.|....|||..|||||| ||||.|..||
GACUUUGAAGAUCUCUUUAAGCAAGA-GGAGUCUCUG
1316
1317

35
44
AAAAAGAGAUUGAGAAACAGAAGGU----GCACCUGAAGAGUAUCACAGA
|.|||||.|||. ||.|||..|.| |.|.|||||.|||.||.||||
AUAAAGAUAUUU--AAUCAGUGGCUAACAGAAGCUGAACAGUUUCUCAGA
1318
1319
35
46
GCUACUCAAA-AAGAGAUUGAGAAACAGAAG
||.|||.||| ||.||.|||||.||...|||
GCAACUAAAAGAAAAGCUUGAGCAAGUCAAG
1320
1321
35
47
UGGAAGAUAAACUCAGUCUUCUGAAUAGUAACUGGAUA
|.|||.||||.||||..|.....|||....|.||||||
UUGAAAAUAAGCUCAAGCAGACAAAUCUCCAGUGGAUA
1322
1323
35
48
UGAGAAACAGAAGGUGCACCUGAAGAGUA--UCACAGAGGUAGGAGAGGCCUUGAAAACAGUUUUG
|||||||| ||||.|.|..|||||...| |.|.|||..|.||..|| ||||||||.|...|||
UGAGAAAC--AAGGAGAAAUUGAAGCUCAAAUAAAAGACCUUGGGCAG--CUUGAAAAAAAGCUUG
1324
1325
35
49
AACAGUUUUGGGCAAGAAGGAGACGUUGGUGGAAGAUAAACUCAGUC
||.||.|||.|.|.|.|.||...|.||.||..|||..|||..|||.|
AAGAGAUUUUGUCUAAAGGGCAGCAUUUGUACAAGGAAAAACCAGCC
1326
1327
35
51
AAAAAGAGAUUGAGAAACAGAAGGUGCACCUGAAGAGUAUCACAGAGGU
||||..|.|..|.|..|..|..||||..|.|||.|| |||||..|||.|
AAAAUCACAGAGGGUGAUGGUGGGUGACCUUGAGGA-UAUCAACGAGAU
1328
1329
35
53
AAACAGAAGGUGCA--CCUGAAGAGUAUCACAGA
|.||||.||.|||| ||..||||..||||||||
AUACAGUAGAUGCAAUCCAAAAGAAAAUCACAGA
1330
1331

35
55
AAAAGAGAUUGAGAAACA
|||||||.|...||||||
AAAAGAGCUGAUGAAACA
1332
1333
35
57
UAGGAGAGGCCUUGAAAACAGUUUUGGGCAAGAAGGA
|.||||..|.|||...|.|||||..|....||||.||
UUGGAGGCGACUUUCCAGCAGUUCAGAAGCAGAACGA
1334
1335
35
59
UCAAAAA-GAGAUUGAGAAACAGAAGGUGCAC-CUGAAGAGUAUCACAGAGG--UAGGAGAGGCC-UUGAAA
||||.|. |||...||.|||..|||..||||| |.|..||.|..||.|||.. |||..|||.|| ||||||
UCAAUACUGAGUGGGAAAAAUUGAACCUGCACUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACCCUUGAAA
1336
1337
35
60
UCAAAAAGAGAUUGAGAAACAGAAGGUGCACCUGA
||.|..|||.||||.|...|.|||.|.|.||.|||
UCGAGGAGAAAUUGCGCCUCUGAAAGAGAACGUGA
1338
1339
36
37
ACUUUUGACCAGAAUGUGGAC----CACAUCACAAAG
||.|..|.||| ||.|||||| |||.|.||.|||
ACAUACGCCCA-AAGGUGGACUCUACACGUGACCAAG
1340
1341
36
38
AGGCUGACA--CACUUUUGGAUGAAUCAGAGAAAAAGAAACCCCAGCAAAAAGAAG
|||||||.| ||.....||.||||||.||.|.|...|.||..||..|||.|.|.|
AGGCUGAAAUUCAGCAGGGGGUGAAUCUGAAAGAGGAAGACUUCAAUAAAGAUAUG
1342
1343
36
39
AUGAAUCAGAGAAAA-AGAAACCCCAGCAAAAAGAAGA
|.||||||.|||..| |||||.|......|||..||||
AAGAAUCACAGAUGAGAGAAAGCGAGAGGAAAUAAAGA
1344
1345

36
40
UUGGAUGAAUCAGAGAAAAAGAA
|||||||| ||..||||||.||
UUGGAUGA--CAUUGAAAAAAAA
1346
1347
36
41
GAAUCAGAGAAAAAGAAACCCCAGCAAAAAGAAG
||||...||||.||||||....|||..||.|.||
GAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAG
1348
1349
36
42
AGAAUGUGGACCACAUCACAAAG
||||...|.||.||.||.|||.|
AGAAGUGGAACAACUUCUCAAUG
1350
1351
36
44
AGUGGAUCAUUCAGGCUGACACACUUUUGGAUGAAUCAGAGAAAAAGAAACCCCAGCAAAAAGAAGACGUGCUUAA
|||||.|.|...|.||||| |||.|||. |||||.|.|.|.|||..||.|..||..|...||.||||.||
AGUGGCUAACAGAAGCUGA-ACAGUUUC-------UCAGAAAGACACAAAUUCCUGAGAAUUGGGAACAUGCUAAA
1352
1353
36
46
AAACCCCAGCAAAAAGAAGACGUGCUUAAG
|||...||||||..|.||||...||||.||
AAAGAGCAGCAACUAAAAGAAAAGCUUGAG
1354
1355
36
47
AAAAGAAACCCCAGCAAAAAGA
||||.||.|.|.||||.|.|.|
AAAAUAAGCUCAAGCAGACAAA
1356
1357
36
48
GAAACACAUGGAAACUUUUGACCA
|||.||..||||||.||.|.||||
GAAUCAGUUGGAAAUUUAUAACCA
1358
1359

36
49
AAAAAGAAACCCCAGCAA
|.||.||||..|||||.|
ACAAGGAAAAACCAGCCA
1360
1361
36
51
UGGACCACAUCACAAAGUGGAUCAUUCAGGCUGA
|.||..|.||||...||..|||||| ||.||.||
UUGAGGAUAUCAACGAGAUGAUCAU-CAAGCAGA
1362
1363
36
53
CAGAAACACAUGGAAACUUUUGACCAGAAUGU
|||||.|..| ||.|||..||||....|||||
CAGAACCGGA-GGCAACAGUUGAAUGAAAUGU
1364
1365
36
55
CAGAAUGUGGACCACAUCACAAAGUGGAUCAUUCAGGCUGACACACUUUUGGA
|||||..||.|.||..|..|||.|| |.|.||||.||..||.|.|..|||
CAGAAGCUGAAACAACUGCCAAUGU----CCUACAGGAUGCUACCCGUAAGGA
1366
1367
36
57
UGUGGACCACAUCACAAAGUGGAUCAUUCAGGCUGACA--CACUU-UUGGAUG
||||| |.|||.|..||||..|||.|.|.|.||.|.|| |||.| |||||.|
UGUGG-CUACAGCUGAAAGAUGAUGAAUUAAGCCGGCAGGCACCUAUUGGAGG
1368
1369
36
59
ACCAGAAUGUGGACCACAUCACAAAGUGG--AUCAUUCAGGCUGACACACUUUUGGAUGAAUCAGAGAAAAAGAAA
|.|||..||.|||...||..||..||||| |..|||.|..||| |||.|...||..|| .||||||||||.|.|
AGCAGGCUGAGGAGGUCAAUACUGAGUGGGAAAAAUUGAACCUG-CACUCCGCUGACUG--GCAGAGAAAAAUAGA
1370
1371
36
60
GAAUACCAGAAA--CACAUGGAAACUUUUG
|||.|||.|||. ||.||||||.|||.||
GAAGACCUGAACACCAGAUGGAAGCUUCUG
1372
1373

37
38
GAUUUGCAGCCAUUUCACACAGAAUUA
||.|||.|||..|||.||.||||..||
GAAUUGGAGCAGUUUAACUCAGAUAUA
1374
1375
37
39
UUAAAGGCAGAACUGAAUG
|||.||.||.|||..||||
UUACAGACAAAACAUAAUG
1376
1377
37
40
AAAUUAGUAGAGCC--CCAAAUCUCAGAGCUCAA
|||||||.. |||| ||..|.|.|||||.|.||
AAAUUAGCC-AGCCUACCUGAGCCCAGAGAUGAA
1378
1379
37
41
AGUAGAGCCCCAAAUCUCAGA----GCUCAACCAUCGAUUUGCAGCCAUUUCACACAGAAUU
|||.||||| |.|||||| |||||.|.|.||.|. ||.|..|.||.|.|...||||
AGUGGAGCC----AACUCAGAUCCAGCUCAGCAAGCGCUG-GCGGGAAAUUGAGAGCAAAUU
1380
1381
37
42
AUUAGUAGAGCCCCAAAU-CUCAGAGCUC
|||||.||.|...|||.| ||||..||||
AUUAGAAGUGGAACAACUUCUCAAUGCUC
1382
1383
37
44
AGAGCCCCAAAUCUCAGAG
|.||.|.|||||..|.|||
AAAGACACAAAUUCCUGAG
1384
1385
37
46
AGAGCUCAACCAUCGAUUUGCAGCCAUUUCACACAGAAUUAA
|||.|..||..||...||..|||. ||||||.|.|||.||||
AGAACAAAAGAAUAUCUUGUCAGA-AUUUCAAAGAGAUUUAA
1386
1387

37
47
CAUACGCCCAAAGGUGGACUCUACACGUGA
||||.|||||.|.|.|.|...||.||.|||
CAUAAGCCCAGAAGAGCAAGAUAAACUUGA
1388
1389
37
48
UUUGCAGCCAUUUCACACAGAAUUAAG
|||.|||...|||..|..||||..|||
UUUCCAGAGCUUUACCUGAGAAACAAG
1390
1391
37
49
GCAGCCAUUUCACACAGAA
|||||..||..|||..|||
GCAGCAUUUGUACAAGGAA
1392
1393
37
53
AAAUCUCAGAGCUCAA
|||||.||||...|||
AAAUCACAGAAACCAA
1394
1395
37
55
CAAGCAGCAAACUUGAUGGCAAACCGCGGUGACCACUGCAGGAAAUUAGUAGAGC
||.|..||.|.|...|.||.||..|.|...||..|||.||.|..|.||..|||||
CAGGAUGCUACCCGUAAGGAAAGGCUCCUAGAAGACUCCAAGGGAGUAAAAGAGC
1396
1397
37
57
GUUUAAAGGCAGAACUGAAUGACAUACG
|||.|.|.||||||| ||...|||||.|
GUUCAGAAGCAGAAC-GAUGUACAUAGG
1398
1399
37
59
GCAAACUUGAUGGCAAACCGCGGUGACCACUGCAGGAAAUUAGUAGAGCCCC
|.|||.||||......||..||.||||......||.|||.|||..|||.|||
GAAAAAUUGAACCUGCACUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACCC
1400
1401

37
60
ACGUGA-CCAAG-CAGCAAACUUGAUGGCAAACCGCGGUGACCACUGCAGGAAAUUAG-UAGAGCCCCA-AAUCUCAGAGCUC
|||||| |||.| ||...|.||||.|.||.| |.|.||||||...||.|.|.|| |....||..| ||.|||||..|||
ACGUGAGCCACGUCAAUGACCUUGCUCGCCA-----GCUUACCACUUUGGGCAUUCAGCUCUCACCGUAUAACCUCAGCACUC
1402
1403
38
39
UAUACAAAAAUUGCUUGAACCACUGGAGGCUGAAAUU-CAGCAGGGGGUGA---AUCUGAAAGAGGAAGACUUCAAUAAAGAUA
|.||.||.|||||.|..||..| ||||.| ||.|| ||.||..|..|.| ||..||.|.||..|||... ||||||||||
UGUAAAAGAAUUGUUGCAAAGA--GGAGAC--AACUUACAACAAAGAAUCACAGAUGAGAGAAAGCGAGAGGA-AAUAAAGAUA
1404
1406
38
40
AGGCU---GAAAUUCAGCAGGGGGUGAAUCUGAA--AGAGGAAGACU
||||| ||||||...||...|..|.|||.|.| |||||.||.||
AGGCUCUAGAAAUUUCUCAUCAGUGGUAUCAGUACAAGAGGCAGGCU
1407
1408
38
41
AAUUGGAGCAGUUUA----ACUCAGAUAUACAAAAAUU
||||.|..||||||. |||||..|.|.||.|||||
AAUUUGCUCAGUUUCGAAGACUCAACUUUGCACAAAUU
1409
1410
38
42
UUCAGCAGGGGGUGAAUCUGAA
||.||||.|.||.|..||||||
UUAAGCAAGAGGAGUCUCUGAA
1411
1412

38
44
GAAUUGGAGCAGUUUAACUCAGAUAUACAAAAAUUGCU
|||...||.|||||| ||||||.|.|||.|||||.||
GAAGCUGAACAGUUU--CUCAGAAAGACACAAAUUCCU
1413
1414
38
46
AAAAUUGCUUGAA--CCACUGGAGGCUGAAAUUCAGCAG
||.||||||.|.| |||||.||..|||.||...|||||
AACAUUGCUAGUAUCCCACUUGAACCUGGAAAAGAGCAG
1415
1416
38
47
AAAAAUUGCUUGAACCACUGGAGG
||.||||...|||| ||||||||
AACAAUUAAAUGAA--ACUGGAGG
1417
1418
38
48
UUGAAGGAAUUG--GAGCAGUUUAA
||||||...||| ||||||||.||
UUGAAGACCUUGAAGAGCAGUUAAA
1419
1420
38
49
GAAUCUGAAAGAGGA
|||.||||||.||.|
GAAACUGAAAUAGCA
1421
1422
38
51
AAAUUCAGCAGGGGGUGA
|||.||| |||.||||||
AAAAUCA-CAGAGGGUGA
1423
1424
38
53
UUGAAGGAAUU--GGAGCAGUUUAACUCAGAUAUACAAAAAUUGCUUGAACCACUGGAGGC
|||||.||||| |.|.||||...|. ||..|||||.||...|||.|.. ||.||||||
UUGAAAGAAUUCAGAAUCAGUGGGAU---GAAGUACAAGAACACCUUCAGA-ACCGGAGGC
1425
1426

38
55
AUUGGAGCAGUUUAACUCAGAUAUACAAAAAUUGCUUGAACCACUG---GAGGCUGAAA
|.||.|.|||||...|...||..|..||||.||.||||.....||. ||.|||||||
ACUGCAACAGUUCCCCCUGGACCUGGAAAAGUUUCUUGCCUGGCUUACAGAAGCUGAAA
1427
1428
38
57
GAAAUUCAGCAGGGGGUGAAUCUGAAAGAGGAAGACUUCA
|||.|||.|..|.||.|..|.||||||||.||.||.||.|
GAACUUCUGGUGUGGCUACAGCUGAAAGAUGAUGAAUUAA
1429
1430
38
59
AGGGGGUGAAU-CUGAAAGAGGAAGACUUCAA
|||.|||.||| ||||..| ||||.|.||.||
AGGAGGUCAAUACUGAGUG-GGAAAAAUUGAA
1431
1432
38
60
UCUGAAAGAGGAAG
||||||||||.|.|
UCUGAAAGAGAACG
1433
1434
39
40
GAGAGGAAAUAAAGAUAAA
||||.||||..||.|||||
GAGAUGAAAGGAAAAUAAA
1435
1436
39
41
AGAGGAGACAACUUACAACAA----AG-AAUCACAGAUGAGAGAAAGCGAGAGGAAAU
||.||||.|||||.|.|.|.| || ||.|.|.| |.|.||||..|||||.||||
AGUGGAGCCAACUCAGAUCCAGCUCAGCAAGCGCUG--GCGGGAAAUUGAGAGCAAAU
1437
1438
39
44
AGGAAAUAAAGAUAAAACAGCAGCUGUUA-CAGA
|.||.|||||||||....|.|||..|.|| ||||
AUGAUAUAAAGAUAUUUAAUCAGUGGCUAACAGA
1439
1440

39
46
AACUUACAACAAAGAAUCACAGAUGAGAGAAAGCGAGAGGAAAUAAAG
|||.|..||.|.||.|.||...|..||| |||||..|||.||.|.|||
AACCUGGAAAAGAGCAGCAACUAAAAGA-AAAGCUUGAGCAAGUCAAG
1441
1442
39
47
AGGGUACUGUAAAAGAAUUGUUGCAAAGAGGAGACAACUUACAACAAAGAA-UCACAGAUGAGAGAAAGCGAGAGGAAAUAAAGAUAAAACAGCAGCUGUUACAGACAAAAC
||||.|.|.|.|||.||||.....||||.||||....|.|.|....|||.. ||.||.|.|.....|||.|..|| |||||..|.||| |..||||....||||||||.|
AGGGAAUUCUCAAACAAUUAAAUGAAACUGGAGGACCCGUGCUUGUAAGUGCUCCCAUAAGCCCAGAAGAGCAAG---AUAAACUUGAAA-AUAAGCUCAAGCAGACAAAUC
1443
1444
39
48
GAGAAAGCGAGAGGAAAUAAAGAUAAAACAGCAG
||||||....|||.||.|.|||.|.|||.|..||
GAGAAACAAGGAGAAAUUGAAGCUCAAAUAAAAG
1445
1446
39
49
UGUAAAAGAAUUGUUGCAAAGAGGAGACAACUUACAACAAAGAAUCA
||.||.|||.||..|..||||.|.||......|||||..||.||.||
UGGAAGAGAUUUUGUCUAAAGGGCAGCAUUUGUACAAGGAAAAACCA
1447
1448
39
51
AAAGAAUCACAGAUGAGAGAAAGCGAGAGGAAAUAAAGAUA
|.|.|||||||||.| |.||..|.|.|.|....|.|.||||
AUAAAAUCACAGAGG-GUGAUGGUGGGUGACCUUGAGGAUA
1449
1450

39
53
AAUGAAGA--CAAUGAGGGUACUGUAAAAGAAUUGUUGCA-AAGAGGAGACAAC-- UUACAACAAAGAAUCACAGAUGAGAGAAAGCGAGAGGAAA-UAAAGAUAAAAC--AGCAGCUGUUA
|||..||| ||.|| ||.|...|||.|||||....|.|| ||..||||.|||| ||..|..|||...|.|..|||...|.|.|..|...||||. |||.||..||.| |||||.|.|||
AAUUCAGAAUCAGUG- GGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAAGGAUUCAACACAAUGGCUGGAAG CUAAGGAAGAAGCUGAGCAGGUCUUA
1451
1452
39
55
GAAGACAAUGAGGGUACUGUAAAAGAAUUGUUGCAA
||||||....||||. ||||||||..||.||.||
GAAGACUCCAAGGGA---GUAAAAGAGCUGAUGAAA
1453
1454
39
57
GUUACAGACAAAACAUAAUG
|.|||||...|||.||.|||
GCUACAGCUGAAAGAUGAUG
1455
1456
39
59
CAAAGAAUCACAGAUGAGA
||.||||..|.||||||||
CAGAGAAAAAUAGAUGAGA
1457
1458
39
60
UGAGAGAAAGCGAGAG
|||.|||.|.||.|||
UGAAAGAGAACGUGAG
1459
1460
40
41
AUCUCCUGAAAUGCUUGGAUGACAUUGAAAAAAAAUUAGC
|.|||...||..|||.|...||.|||||.|..|||||.||
AGCUCAGCAAGCGCUGGCGGGAAAUUGAGAGCAAAUUUGC
1461
1462

40
42
AAAAAAGGCUCUAGAAAUUUCUCAU
|.|.|.|.||.|.|||||||||.||
AGACAUGCCUUUGGAAAUUUCUUAU
1463
1464
40
44
AGGCUCUAGAAAUUUCUCAUCAGUGG-UAUCAGUA
|.|.|.||.|.||.|.|.|||||||| ||.|||.|
AUGAUAUAAAGAUAUUUAAUCAGUGGCUAACAGAA
1465
1466
40
46
AUGAUCUCCUGAAAUGCUUGGAUGACAUUGAAAAAAAAUUAGCCAG---
CCUACCUGAGCCCAGAGAUGAAAGGAAAAUAAA
||||..|..|...|||.|||||.||. |.|.|.||..|.||.|| ||.||.|||.||..||.|.||...|.||.||||
AUGAAUUUGUUUUAUGGUUGGAGGAA--- GCAGAUAACAUUGCUAGUAUCCCACUUGAACCUGGAAAAGAGCAGCAACUAAA
1467
1468
40
47
AAAGAAGAAAAAAGGCUCUAGAA-AUUUCUCAUCAGUGG
|||...|||||.|.||||.||.| |....||..||||||
AAACUUGAAAAUAAGCUCAAGCAGACAAAUCUCCAGUGG
1469
1470
40
48
AAAUGCUUGGAUGACAUUGAAAAAAAAUUA
|||.|||||.| |||.|||||.|..|.|||
AAAAGCUUGAA-GACCUUGAAGAGCAGUUA
1471
1472
40
49
UUGAAAAAAAAUUAGCCAGCCUACCUGAGCCCAGAGAUG
|||.|.||..|..|.||||||. ||.|||| ||.||.|
UUGUACAAGGAAAAACCAGCCA--CUCAGCC-AGUGAAG
1473
1474

40
51
UGGAUGACAUUGA
|||.||||.||||
UGGGUGACCUUGA
1475
1476
40
53
AAUUUCUCAUCAGUGGUAUCA-GUACAAGAGGCAGGCUGAUGAUCUCCUGAAAUGCUUGGAUGACAUUGAAAA
||||....||||||||.||.| ||||||||. ||...|.|..|.|....|.||...|||.||||.||...|||
AAUUCAGAAUCAGUGGGAUGAAGUACAAGAA-CACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAA
1477
1478
40
55
UUGAGGUCUCAAAGA-AGAAAAAAGGCUCUAGAAA
|.||.|.|||.|||. ||.||||..|||...||||
UAGAAGACUCCAAGGGAGUAAAAGAGCUGAUGAAA
1479
1480
40
57
AGAAAUUUCUCAUCAGUGGUAUC
||..|.||||.|.||||||.|.|
AGCCAGUUCUGACCAGUGGAAGC
1481
1482
40
59
AAGAAAAAAGGCUCUAGAAAUUUCUCAUCAGUGGUAUCAGUACAAGAGGCAGGCUGAUGAUCUCCUGAAAUGCUUGGAUG ACAUUGAAAAAAAAUUAGCCAGC--//
|.||||...||||...||..|...|..|.|||||.|..|.|..||...|||..|.|.|||....|.||.|....|.|||||.|......|||.|.| ||||.
ACGAAAGCAGGCUGAGGAGGUCAAUACUGAGUGGGAAAAAUUGAACCUGCACUCCGCUGACUGGCAGAGAAAAAUAGAUG AGACCCUUGAAAGACU--CCAGGAA//
//CUACCUGAGCCCAGAGAUGAAAGGAAAAUAAAG
||.|..|||.|||..|||||...|.|..|.|||
//CUUCAAGAGGCCACGGAUGAGCUGGACCUCAAG
1483
1484

40
60
AGAAAUUUCUCAUCAGUGGUAUCAGUACAAGAGGCAGGCUGAUGAUCU
|||||||.|.|.||. |.|..||.||..|||.||.|...||||.||
AGAAAUUGCGCCUCU---GAAAGAGAACGUGAGCCACGUCAAUGACCU
1485
1486
41
42
AAGAAAGAGGAG---CUGAA
|||.|||||||| |||||
AAGCAAGAGGAGUCUCUGAA
1487
1488
41
44
AAUUUGCUCAGUUUCG----AAGACUCAACUU
||..||..|||||||. |||||.|||.||
AAGCUGAACAGUUUCUCAGAAAGACACAAAUU
1489
1490
41
46
GAAGAAAG-AGGAGCUGAAUGCAGUGCGUAGGCAAG
|||.|.|| ||.|.||.||.|.|..||.|..|||||
GAAAAGAGCAGCAACUAAAAGAAAAGCUUGAGCAAG
1491
1492
41
47
GGGAAUUGCAGAAGAAGAAAGAGGAGCUGAAUG--CAGUGCGU
|||||||....||.||..||..|.|.|||.|.| |.||||.|
GGGAAUUCUCAAACAAUUAAAUGAAACUGGAGGACCCGUGCUU
1493
1494
41
48
AGAAGAAGAAAGAGGAGCUGAA
|.|||.|||||..|.||||.||
ACAAGGAGAAAUUGAAGCUCAA
1495
1496
41
49
CAGAUCCAGCUCAGCAAGCGCUGGCGGGAAA
|||.||.||||.|.|||.||...|.||.|.|
CAGUUCAAGCUAAACAACCGGAUGUGGAAGA
1497
1498

41
53
AAUUGCAG-AAG--AAGAAAGAGGAGCUGAAUGCAGUGCGUAGGCAAG--CUGAGG---GCUUGUCUGA-GGAUGG-- GGCCGCAAUGGCAGUGGAGCCAACUCAGA
|||.||.| ||| |||.|||| |||||| ||||..|.||||..|| |.|||. |||||..|.| |||.|| ||.|.|.||. ||||.||..|||..||.|
AAUGGCUGGAAGCUAAGGAAGA--AGCUGA-- GCAGGUCUUAGGACAGGCCAGAGCCAAGCUUGAGUCAUGGAAGGAGGGUCCCUAUA-CAGUAGAUGCAAUCCAAA
1499
1500
41
55
UUGCAGAAGAAGAAAGA
||.||||||..||||.|
UUACAGAAGCUGAAACA
1501
1502
41
57
UCGGGAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAGUGCGUAGGCA
||.||..|.||...||..||||||.|| |||||..||...|.|||||
UCUGGUGUGGCUACAGCUGAAAGAUGA--UGAAUUAAGCCGGCAGGCA
1503
1504
41
59
CGGGAAUUGCAGAAGAAGAAAGAGGAGCUGAAUGCAGUGCGUAGGCAAGCUGAGG
|.||||.|.||..||...|..||.||||||.|......||...|.||||||||||
CAGGAACUUCAAGAGGCCACGGAUGAGCUGGACCUCAAGCUGCGCCAAGCUGAGG
1505
1506
41
60
GAGCCAACUCA--GAUCCAGCUCAGCAAGC
||||||..||| ||.|..|||| ||.|||
GAGCCACGUCAAUGACCUUGCUC-GCCAGC
1507
1508
42
44
CUAUUAGAAGUGGAACAACUUCUCA
|||..|||||..|||||..||||||
CUAACAGAAGCUGAACAGUUUCUCA
1509
1510

42
46
UGAAAUCACUCAUGUCUCACAAGCCCUAUUAGAAGUGGAACAACU
|.|.||..||..|.||.|||..|..|....|.|||.|.|.|||||
UAACAUUGCUAGUAUCCCACUUGAACCUGGAAAAGAGCAGCAACU
1511
1512
42
47
UCUCACAAGCCCUAUUAGAAGUGGAACAACUUCUCAAU
||.||.|||||| |..|||....||..|||||...|||
UCCCAUAAGCCC-AGAAGAGCAAGAUAAACUUGAAAAU
1513
1514
42
48
UAAGGACUUUGAAGAUCUCUUUAAGCA
|.|.|||.|||||||.|..||.||.||
UGAAGACCUUGAAGAGCAGUUAAAUCA
1515
1516
42
49
CACACUGUCCGUGAAG
|||.|.|.|.||||||
CACUCAGCCAGUGAAG
1517
1518
42
51
AGAAACGAUGAUGGUGA-UGAC--UGAAGACAU
|.|.|.|.||||||||. |||| |||.||.||
ACAGAGGGUGAUGGUGGGUGACCUUGAGGAUAU
1519
1520
42
53
CACACUGUCCGUGAAGAAACGAUGAUGGUGAUGA---CUGAAGACAUGCC
||||.||.|.|..|...||.||.||.|.|||..| ||.|.||||.|||
CACAAUGGCUGGAAGCUAAGGAAGAAGCUGAGCAGGUCUUAGGACAGGCC
1521
1522
42
55
AGAAG-UGGAACAACUUCUCAAUGCUCCU
||||| ||.|||||||.| ||||| ||||
AGAAGCUGAAACAACUGC-CAAUG-UCCU
1523
1524

42
57
GAAAUUUCUUAUGUGCCUUCUACUUA
|.||.||||..||||.||.|..||.|
GGAACUUCUGGUGUGGCUACAGCUGA
1525
1526
42
59
ACUGUCCGUGAAGAAACGAUGA
||||.|.|.|||.||..|||||
ACUGGCAGAGAAAAAUAGAUGA
1527
1528
42
60
AGAAGUGGAACAACUUCUCAAUGCUCCUGACCUCUGUGCUAAGGACUUUG
||||...||.|.||.| |||||..|.||..|.|.. |||.|..||||||
AGAACGUGAGCCACGU--CAAUGACCUUGCUCGCCA-GCUUACCACUUUG
1529
1530
43
44
AAUGGGAAAAAGUUAA---CAAAAUGUA
|.||||||.|.|.||| ||||..|||
AUUGGGAACAUGCUAAAUACAAAUGGUA
1531
1532
43
46
GAAGACAGCAGCAUUGCAAAGUGCAACGCCUGUGGAA
|||.|.||||||| .|.||..|.||.||.||.|.||
GAAAAGAGCAGCA--ACUAAAAGAAAAGCUUGAGCAA
1533
1534
43
47
AAGAUAGUCUACAACA-AAGCUCAGG
||||||..||..||.| |||||||.|
AAGAUAAACUUGAAAAUAAGCUCAAG
1535
1536
43
48
GCUCUCUCCCAGCUUGAUUUCCAAUGGGAAAAAGUUAACAAAAUGUACAAGGACCGACAA
|.|.|||||.|....||.| ||.|.|||||....||||.||....||.|.||..|||.|
GUUAUCUCCUAUUAGGAAU--CAGUUGGAAAUUUAUAACCAACCAAACCAAGAAGGACCA
1537
1538

43
49
AAAGUUAACAAAAUGUACAAGGACCGACAAG
||||...|..|..||||||||||...||.||
AAAGGGCAGCAUUUGUACAAGGAAAAACCAG
1539
1540
43
51
UUGCAAAGUGCAAC--GCCUGUGGAAAGGGUGAAGCUACAGGAAGCUCUCUCCCAGCUUGAU
|.|||.|.|.|||| |.|| ||||.||.....|.|.||.|| ||.||.|.|||||||
UGGCAGAUUUCAACCGGGCU-UGGACAGAACUUACCGACUGG-----CUUUCUCUGCUUGAU
1541
1542
43
53
CAGCUUGAUUUCCAAUGGGAAAAAGUUAACAAAAUGUACAAGGA
||.|||.|...||...||.||.|..|.||..||||||..|||||
CACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAAGGA
1543
1544
43
55
UGCAACGCCUGUGGAAAGGGU
|||.||.|.|..|||||||.|
UGCUACCCGUAAGGAAAGGCU
1545
1546
43
57
GGUGAAGCUACAG
||||..|||||||
GGUGUGGCUACAG
1547
1548
43
59
AAUGGGAAAAAGUUAAC
|.|||||||||.|.|||
AGUGGGAAAAAUUGAAC
1549
1550
43
60
CUGUGGAAAGGGUGAAG-CUACA-GGAAGCU
||.|||||....||||. |.|.| |||||||
CUCUGGAAGACCUGAACACCAGAUGGAAGCU
1551
1552

44
45
UUAAUCAGUGGCUAACAGAAG--CUG--AACAGUUUCUCAGAAAGACACAA
|.||||.|.|| |..|||.|| ||| |||||.|. |||||.|||.|.||
UGAAUCUGCGG-UGGCAGGAGGUCUGCAAACAGCUG-UCAGACAGAAAAAA
1553
1554
44
54
CAGUGGCUAACAGAAGCUGA
|||||||..|||.|.|..||
CAGUGGCAGACAAAUGUAGA
1555
1556
44
56
AGAAAGACACAAAUUCCUGAGA
|.|.||.||.|||.||||||||
AAACAGCCAAAAAAUCCUGAGA
1557
1558
45
46
GCAACUGGGGAAGAAAUAAUUCAGCAA
||||||. .||||||...||.|||||
GCAACUA--AAAGAAAAGCUUGAGCAA
1559
1560
45
47
CAGCGGCAAACUGUUGUCAGAACAUUGAAUGCAACUGGGGAA
|.|||.||.....||.|||.|..|||.||||.||||||.|.|
CUGCGCCAGGGAAUUCUCAAACAAUUAAAUGAAACUGGAGGA
1561
1562
45
48
UUGGGAAGCCUGAA
|||||.|||.||||
UUGGGCAGCUUGAA
1563
1564
45
49
AGAUGCCAGUAUUC-UACA-GGAAAAA
|.|.|.|||.|||. |||| |||||||
AAAGGGCAGCAUUUGUACAAGGAAAAA
1565
1566

45
51
CAGCAAUCCUCAAAA-ACAGAUGCCA
|.||.|||..||||. |.|.||||||
CUGCCAUCUCCAAACUAGAAAUGCCA
1567
1568
45
53
UCAGAACAUUGAAUGCAACUGGGGAA-GAAAUAAUUCAGCAAUCCUCAAAAACAGAUGCCAGUAUUCUACAGGAAAAA
||||||| .|.|.|||||.|..||| |||||..|..||.|.|| ||.||| |||.|.|.|..||| |||||.||
UCAGAAC--CGGAGGCAACAGUUGAAUGAAAUGUUAAAGGAUUC----AACACA-AUGGCUGGAAGCUA-AGGAAGAA
1569
1570
45
55
AAACAGAUGCCAGUAUUCUACAGGA
|||||..|||||.|.|.||||||||
AAACAACUGCCAAUGUCCUACAGGA
1571
1572
45
57
AUUGGGAAGCCUGAAUCUG--CGGUGGCAGGAGGUCUGCA
|||.|||||||.|. |||| |.||||.|| .|||||||
AUUUGGAAGCCAGU-UCUGACCAGUGGAAG--CGUCUGCA
1573
1574
45
59
CUGCAAACAGCUGUCAGACAGAAAAAA
|||||..|.||||.|.|.||||.||||
CUGCACUCCGCUGACUGGCAGAGAAAA
1575
1576
45
60
CCUCAAAAACAGAUGCCAGUAUUCUACAG
|||.||.|.||||||..||. ||||.|||
CCUGAACACCAGAUGGAAGC-UUCUGCAG
1577
1578
46
54
CACUUGAACCUGGAAAAGAGCAGCAACUAAAAGAAAA
||..|||..|..||||||..||.....|||.|||.||
CAGAUGAUACCAGAAAAGUCCACAUGAUAACAGAGAA
1579
1580

46
56
AACCUGGAAAAGAGCAGCAACUAAA
||||||||..|.|.||||.|..|||
AACCUGGAUGAAAACAGCCAAAAAA
1581
1582
47
48
AGAAGAGCAAGAUAAACUUGAAAAUAAGCU
|.||||.|..|...|.||||||||.|||||
AAAAGACCUUGGGCAGCUUGAAAAAAAGCU
1583
1584
47
49
AAACUUGAAAAUAAGCUCAAGCAGACAAAUCUCCAGUGGA
|||||..||.|..||.||||||..|..||.|....|||||
AAACUGAAAUAGCAGUUCAAGCUAAACAACCGGAUGUGGA
1585
1586
47
51
AGAUAAACUUGAAAAUAAGCUCAAGCAGA
|.||.|||..||..||.| |||||||||
AUAUCAACGAGAUGAUCA--UCAAGCAGA
1587
1588
47
53
AACAAUUAAAUGAAA
||||.||.|||||||
AACAGUUGAAUGAAA
1589
1590
47
55
UGGAAGAGUUGCCCCUGCGCCAGGGAA
||.||.||||.||||||..||.||.||
UGCAACAGUUCCCCCUGGACCUGGAAA
1591
1592
47
57
UUACUGGUGGAAGAGU-UGCCCCUG---CGCCAGGGAAUUCU
|.||..|||||||.|| |||.|||. |..||||.|.||||
UGACCAGUGGAAGCGUCUGCACCUUUCUCUGCAGGAACUUCU
1593
1594

47
59
UACUG-GUGG- AAGAGUUGCCCCUGCGCCAGGGAAUUCUCAAACAAUUAAAUGAAACUGGAGGACCCGUGCUUGUAAGUGCUCCCAUAAGC CCAGAAGAGCAAG-AUAAACUUGAAAAUAAGCU----//
||||| |||| ||.|.|||..||||| |.|.|.|..||....|.|..|||.|.||.||..|. ||||.|||. ||||...||...||..||...|.| ||.|.||.||....|||||
UACUGAGUGGGAAAAAUUGAACCUGC-------ACUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACC--CUUGAAAGA-CUCCAGGAACUUCAAGAGGCCACGGAUGAGCUGGACCUCAAGCUGCGC//
//CAAGCAGA
|||||.||
//CAAGCUGA
1595
1596
47
60
UGGUGGAAGAGUUGCCCCUGCGCCAGGGAAUUCUCAAACAAUUAAAUGA
|.|.|||..|.||||.|||..|..||.|||.. |.|..||..|.|||||
UCGAGGAGAAAUUGCGCCUCUGAAAGAGAACG-UGAGCCACGUCAAUGA
1597
1598
48
49
GAAAUUGAAGCUCAAA-UAAAAGACC
|||||.|.||.||||. ||||..|||
GAAAUAGCAGUUCAAGCUAAACAACC
1599
1600
48
51
CUUGGGCAGCUUGAAAAAAAGCUUGAAGA
||..|||||.||..||....|||||.|.|
CUCUGGCAGAUUUCAACCGGGCUUGGACA
1601
1602
48
53
UGAGAAACAA--GGA-GAAAUUGAAGCUCAAAUAAAAGACCUUGGGCAGC--UUGAAAAAAAGCUUGAAG
|.||||.||. ||| |||.|..|||..||..|..|..|||...||||.| |||||..|||..||.|||
UCAGAAUCAGUGGGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAAG
1603
1604

48
55
GCAGCUUGAAAAAAAGCUUGAAGACCUUGAAGAGCAGUUAAAUCAUCUGCUGCUGU
|.|.||.|||||....||||.....||| |.||.||.|.||.||.||||...|||
GGACCUGGAAAAGUUUCUUGCCUGGCUU--ACAGAAGCUGAAACAACUGCCAAUGU
1605
1606
48
57
UUGAAGACCUUGAAGAGCAGUUAAAUCAUCUGCUGCUGU
|.||||.|..|...||.||||..||.|.|||||..||.|
UGGAAGCCAGUUCUGACCAGUGGAAGCGUCUGCACCUUU
1607
1608
48
59
GGAGAAAUUGAAGCUCAAAUAAAAGACCUUGGGCAGCUUGAAAAAAAGCUUGAAGACCUUGAA
|||.||||||||.||..|.|.......|| |||||. ||||||.||.| ||...|||||||
GGAAAAAUUGAACCUGCACUCCGCUGACU--GGCAGA--GAAAAAUAGAU-GAGACCCUUGAA
1609
1610
48
60
CAAGGAGAAAUUGAAGCUCAAAUAAAAGACCUUGGGCAGCUUGAA
|.|||||||||||...|||..| ||.|||.|.||.||..|.|.||
CGAGGAGAAAUUGCGCCUCUGA-AAGAGAACGUGAGCCACGUCAA
1611
1612
49
51
CAACCGGAUGUGGA-AGAGAUU
|||||||...|||| |||..||
CAACCGGGCUUGGACAGAACUU
1613
1614
49
53
UGAAAUAGCAGUUCAAGCUAAACAACCGGAUG
||||.||..||..||. ||..|.|||||||.|
UGAAGUACAAGAACAC-CUUCAGAACCGGAGG
1615
1616
49
55
GAAACUGAAAUAGCAGUUCAAGCUAAACAACCGGAUGUGGAAGAGAUU-UUGUCU
||||||.|.|.|..|.|.|||......|..|.|||..|||||.||.|| |||.||
GAAACUCAUAGAUUACUGCAACAGUUCCCCCUGGACCUGGAAAAGUUUCUUGCCU
1617
1618

49
57
AGCAGUUCA--AGCUAAACAA
||||||||| |||..|||.|
AGCAGUUCAGAAGCAGAACGA
1619
1620
49
59
UCAAGCUAAAC-AACCGGAUGUGG--AAGAGAUUUUGUC
|||||||...| ||.|.||.|||. |||.|||..||.|
UCAAGCUGCGCCAAGCUGAGGUGAUCAAGGGAUCCUGGC
1621
1622
49
60
GCAGUUCAAGCUAAACAACCGGAUGUGGAAGAGA
|||.|||.||...||....||..|.||.||||||
GCACUUCGAGGAGAAAUUGCGCCUCUGAAAGAGA
1623
1624
50
51
AAGUUAGAAGAUCUGAGCUCUGAGUGGAAGGCGGUAAACCGUUU--ACUUCAA-GAGCUGAGGGCAAAGCAG
||||||.||.|||..||. |.||| |.||.||...|||.|.. |..|||| |||.|||.....||||||
AAGUUAUAAAAUCACAGA---GGGUG-AUGGUGGGUGACCUUGAGGAUAUCAACGAGAUGAUCAUCAAGCAG
1625
1626
50
53
UUAGAAGAUCUGAGCUCUGAGUGGAAGGCGGUAAACCGUUUACUUCAAGAGCUGAGGGCAAAGCAGCCUGACCUAGCUCCUGGACUGACCACUAUUG
||..||||..|.||.. |.|||||.|.|..|||.|.......|||||..|.|.||||..|.||..|..|||..| |.|...|||.|.|.|||.||.|
UUGAAAGAAUUCAGAA-UCAGUGGGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAU-GUUAAAGGAUUCAACACAAUGG
1627
1628
50
55
AGGAAGUUAGAAGAUCUGA
|||.|||.| ||||.||||
AGGGAGUAA-AAGAGCUGA
1629
1630

50
57
AGAUCUGAGCUCUGAGUGGAAGGCGGUAAACCGUUUACUUCAAGAGCU
||.|||||.| ||||||||....|..|||.||..||.||.||.||
AGUUCUGACC----AGUGGAAGCGUCUGCACCUUUCUCUGCAGGAACU
1631
1632
50
59
ACUUCAAGAGCUGAGGGCAAAGCAGCCUGACCU--AGCUCC
||||||||||...|.||...|||.| ||||| ||||.|
ACUUCAAGAGGCCACGGAUGAGCUG---GACCUCAAGCUGC
1633
1634
50
60
UGACCUAGCUCCUGGACUGACCACUAUUGG
||||||.||||.....||.||||||.|.||
UGACCUUGCUCGCCAGCUUACCACUUUGGG
1635
1636
51
52
AUAUCAACGAGAUGAUCAUCAAGCAGAAG
||.|.||..|.|.||.||.|||.||..||
AUUUGAAAAACAAGACCAGCAAUCAAGAG
1637
1638
51
58
ACUAAGGAAACUGCCAUC
|||||.|||.|||..|||
ACUAAAGAACCUGUAAUC
1639
1640
52
53
UUGGAAGAACUCAUUACCGCUGCCCAAAAUUUGAAAAACA-----AGACCAGCAAUCAAGAGGCUAGAACAAUCAUUACGGAUCGAA
|||.|||||.|||..|.|..||.....||.|..||.|||| |||.|.|.|..|||.||...|....|||..|.|.||||..||
UUGAAAGAAUUCAGAAUCAGUGGGAUGAAGUACAAGAACACCUUCAGAACCGGAGGCAACAGUUGAAUGAAAUGUUAAAGGAUUCAA
1641
1642

52
55
UUGGAAGAA-CUCAU
||||||||| |||||
UUGGAAGAAACUCAU
1643
1644
52
57
CCAGCAAUCAAGAGGCUAGAACAAU
||||||.|..|||.|| |||||.||
CCAGCAGUUCAGAAGC-AGAACGAU
1645
1646
52
59
UUGAAAAACAAGACCAGCAA--UCAAGAGGCUA
||||||.||. ||||.|| |||||||||.|
UUGAAAGACU---CCAGGAACUUCAAGAGGCCA
1647
1648
52
60
UGGAAGAACUCAUUACC
|||||||.||.|..|||
UGGAAGACCUGAACACC
1649
1650
53
58
CUGAGCAGGUCUUAGGACAGGCCAGAG
|.||||||. |||.|||..|.|.||||
CAGAGCAGC-CUUUGGAAGGACUAGAG
1651
1652
54
55
CUGAAACUUCUCCGGGAUUAUUCUGCAG-AUGAUACCAGAAAAG
|||||||..||.| .|.|.|.||.||| |||.||||.|.||.|
CUGAAACAACUGC--CAAUGUCCUACAGGAUGCUACCCGUAAGG
1653
1654
54
57
CAGUGGCAGACAAAUGUAGAU
|||..|||||...|||||.||
CAGAAGCAGAACGAUGUACAU
1655
1656

54
59
CUCCGCC-AGUGGCAGACAAAUGUAGAUGUGGCAAAUGACUUGGCCCUGAAACUUC
||||||. |.|||||||.|||..||||||.|.|...|||......||.|.||||||
CUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACCCUUGAAAGACUCCAGGAACUUC
1657
1658
54
60
UCCGCCAGUGGCAGACAAAUGUAGAUGUGGCAAAUGACUUGGCCCUGAAACUU
|.||||..||..|||.||....||....|.||| ||||.|.||.|...|.|||
UGCGCCUCUGAAAGAGAACGUGAGCCACGUCAA-UGACCUUGCUCGCCAGCUU
1659
1660
55
56
GAAGCUGAAACAACUGCCAAUGUCCUACAGGAUGCUACCCGUAAGGAAAGGCU------CCUAGAAGACUCCAAGG
||||||.|.|||..||...||..|...|.|||||..|.|.|..|..|||..|| |||.||||..|||.|.|
GAAGCUCACACAGAUGUUUAUCACAACCUGGAUGAAAACAGCCAAAAAAUCCUGAGAUCCCUGGAAGGUUCCGAUG
1661
1662
56
57
ACAGCCAAAAAAUCCUGAGAUCC-CUGGAAGGUUCCGAU
|||||..|||.||..|||..|.. |.||.|||..||.||
ACAGCUGAAAGAUGAUGAAUUAAGCCGGCAGGCACCUAU
1663
1664
56
59
GGUGAAAUUGAAGCU-CACACAGAUGUUUAUCACA---ACCUGGAUGAAAACAGCCAAAAAAUCCUGAGAUCCCUGGAAGGUUCCGAUGA
||..||||||||.|| |||.|.|.||..|..||.| |..|.|||||.|.|....|||.|.|||.|..|...|..||.|...|.|||||
GGAAAAAUUGAACCUGCACUCCGCUGACUGGCAGAGAAAAAUAGAUGAGACCCUUGAAAGACUCCAGGAACUUCAAGAGGCCACGGAUGA
1665
1666
58
59
ACAGAGCAGCCUUUGGAAGGACUAGAGAAACUCUACCAGG
|.|||..||.|..|.|||.||||..||.||||..|..|||
AUAGAUGAGACCCUUGAAAGACUCCAGGAACUUCAAGAGG
1667
1668
58
60
CUUCAAGAGGGAAUUG
||||.||..|.|||||
CUUCGAGGAGAAAUUG
1669
1670

56
60
CUCCAAGGUGAAAUUGAAGCUCACACAGA
|..|.|||.|||||||...|||..|.|||
CUUCGAGGAGAAAUUGCGCCUCUGAAAGA
1742
1743
10
18
CAGCUUUAGAAGAA
|||..|||.|||||
CAGACUUAAAAGAA
1766
1767
10
18
AUUUCUAAUGAUGUGGAAG
||||..|||..|..|||||
AUUUGCAAUCUUUCGGAAG
1768
1769
10
30
CAUUUGGAAGCUCCU---GAAGACAAG
||.||||.||||..| |.|||||||
CAGUUGGCAGCUUAUAUUGCAGACAAG
1770
1771
10
30
GGAGAGUGAAGUAAACCUGGACCGUUAUCAAACAG
|||||.||||. ||.|||....|.|.|||.|..||
GGAGACUGAAA-AAUCCUUACACUUAAUCCAGGAG
1772
1773
45
55
AUGCAACUGGGGAAGAAA
|.||..||..||||||||
AGGCUGCUUUGGAAGAAA
1774
1775
45
55
AGCCUGAAUCUGCGGUGGCAGGAGGUC
|||..||..||||..|||.||.|..||
AGCGAGAGGCUGCUUUGGAAGAAACUC
1776
1777

Таблица 3
Перечень предпочтительных последовательностей оснований олигонуклеотидов по изобретению. Олигонуклеотиды, содержащие эти последовательности оснований, способны связываться с высоко сходными областями (участки последовательности с >50% идентичностью) в двух различных экзонах DMD (как проиллюстрировано в таблице 2), и они способны индуцировать пропускание этих двух экзонов и любых экзонов между ними с образованием транскрипта DMD в рамке считывания.
Соединение Последовательность* SEQ ID NO Первый экзон 8 - Второй экзон 19 PS830 GUGAUGUACAUUAAGAUGGACUUC 1671 GYGZYGYZXZYYZZGZYGGZXYYX 1672 YGGZXYYXYYZYXYGGZY 1722 YXYGZZXYYXYXZGXYY 1723 Первый экзон 9 - Второй экзон 22 YXZGZGGYGGYGZXZYZZG 1724 YXZYZGYXGGYGZXZXYZZG 1725 Первый экзон 9 - Второй экзон 30 YXYXZYZYXXXYGYGXYZGZXYG 1726 GZZYXGZGGXYYZGGYGZZGZZG 1727 YYXZGYXYXXYGGGXZGZXYG 1728 GZXYXXYGGZYYZZGYGYZZGG 1729 Первый экзон 10 - Второй экзон 13, 14, 15, 18, 20, 27, 30, 31, 32, 35, 42, 44, 47, 48, 55, 57 или 60 PS811 CUUCCUUCCGAAAGAUUGCAAAUUC 1673 XYYXXYYXXGZZZGZYYGXZZZYYX 1674 PS814 GACUUGUCUUCAGGAGCUUCC 1675 GZXYYGYXYYXZGGZGXYYXX 1676 PS815 CAAAUGACUUGUCUUCAGGAGCUUC 1677 XZZZYGZXYYGYXYYXZGGZGXYYX 1678 PS816 CUGCCAAAUGACUUGUCUUCAGGAG 1679 XYGXXZZZYGZXYYGYXYYXZGGZG 1680 PS1168 CUGCCDDDUGDCUUGUCUUCDGGDG 1681 PS1050 CCAAAUGACUUGUCU 1682

CCAAAYGACYYGYCY 1683 PS1059 CAAAUGACUUGUCUUCAGGAG 1684 PS1138 CAAAUGACUUGUCUUCAGGAG 1685 PS1170 CDDDUGDCUUGUCUUCDGGDG 1686 ZYGZXYYGYXYYXZGGZGGZG 1687 PS1016 CAGUCUCCUGGGCAGACUGGAUGCUC 1688 XZGYXYXXYGGGXZGZXYGGZYGXYX 1689 ZYGZZXYGXXZZZYGZXYYGYX 1690 ZYZZGXYGXXZZXYGXYYGYX 1691 GYXXZGGYYYZXYYXZXY 1692 GYXXZXXYYGYXYGXZZY 1693 XYYXYZZZGXYGYYYGZ 1694 XYYXXYGZGGXZYYYGZ 1695 YYYGZYZZXGGYXXZGGYYYZXYYXZ 1696 ZGGXZYYYGZGXYGXGYXXZ 1697 Первый экзон 23 - Второй экзон 42 YXYYXGZXZYXYXYYYXZXZGY 1698 GXGXYYYXYYXGZXZYXYX 1699 ZZYYYXZGZGGGXGXYYYXYYX 1700 YXYYXZGYXZYXZXXZYXZYXGY 1701 GGXZYGYXYYXZGYXZYXZX 1702 ZZYYYXXZZZGGXZYGYXYYX 1703 Первый экзон 45 - Второй экзон 51 YGGXZYXYGYGYYYGZGGZYYGXYG 1730 YGGXZYYYXYZGYYYGGZGZYGGXZG 1731 Первый экзон 45 - Второй экзон 53 YYXXZXZGYYGXZYYXZZYGYYXYGZ 1732 YYXZZXYGYYGXXYXXZGYYXYGZ 1733 YYXXYGYZGZZYZXYGGXZYXYGY 1734 YYXZZXYGYYGXXYXXGGYYXYGZ 1735 XYYYZZXZYYYXZYYXZZXYGYYGX 1736 YYXYYXXYYZGXYYXXZGXXZYYGYGYY 1737 Первый экзон 45 - Второй экзон 55 UCCUGUAGAAUACUGGCAUCUGUUU 1704 YXXYGYZGZZYZXYGGXZYXYGYYY 1705

PS1185 UCCUGUDGDDUDCUGGCDUCUGUUU 1706 PS1186 UCCUGUDGDDUDCUGGCDUCUGU 1707 UCCUGUAGAAUACUGGCAUCUGU 1708 YXXYGYZGZZYZXYGGXZYXYGY 1709 PS1187 UCCUGUDGGDUDUUGGCDGUUGUUU 1710 UCCUGUAGGAUAUUGGCAGUUGUUU 1711 YXXYGYZGGZYZYYGGXZGYYGYYY 1712 PS1188 UCCUGUDGGDUDUUGGCDGUUGU 1713 UCCUGUAGGAUAUUGGCAGUUGU 1714 YXXYGYZGGZYZYYGGXZGYYGY 1715 UCCUGUAGGACAUUGGCAGUUGU 1716 YXXYGYZGGZXZYYGGXZGYYGY 1717 UCCUGUAGGACAUUGGCAGUUGUUU 1718 YXXYGYZGGZXZYYGGXZGYYGYYY 1719 Первый экзон 45 - Второй экзон 60 ZZYZXYGGXZYXYGYYGYYGZGG 1738 XYGYZGZZYZXYGGXZYXYGYY 1739 GXYYXXZYXYGGYGYYXZGG 1740 XYGXZGZZGXYYXXZYXYGGY 1741 Первый экзон 56 - Второй экзон 60 YXYGYGYGZGXYYXZZYYYXZXXYYGGZG 1720 YCYYYXZGZGGXGXZZYYYXYXXYXGZZG 1721 *D=2,6-диаминопурин; C=5-метилцитозин; X=C или 5-метилцитозин, Y=U или 5-метилурацил; Z=A или 2,6-диаминопурин

Таблица 6
Перечень наиболее предпочтительных и/или дополнительных комбинаций экзонов, наиболее предпочтительных и/или дополнительных областей идентичности экзонов, и наиболее предпочтительных и/или дополнительных олигонуклеотидов с их последовательностями оснований, химическими модификациями и идентификационными номерами последовательностей, где *= LNA, C=5-метилцитозин, U=5-метилурацил, D=2,6-диаминопурин, X=C или 5-метилцитозин, Y=U или 5-метилурацил, Z=A или 2,6-диаминопурин, и < > все 2'-фторнуклеотиды (как в SEQ ID NO: 1844).

Примеры 1-5

Материалы и способы

Конструирование олигонуклеотидов в первую очередь было основано на обратной комплементарности с конкретными высоко сходными участками последовательности в двух различных экзонах DMD, как идентифицировано в EMBOSS Matcher и как описано в таблице 2. Следующими учитываемыми параметрами последовательности были присутствие частично открытых/закрытых структур РНК в указанных участках последовательности (как предсказано с помощью RNA structure версии 4.5 или РНК mfold версии 3.5 (Zuker, M.) и/или присутствие предполагаемых участков связывания SR-белка в указанных участках последовательности (как предсказано с помощью программного обеспечения ESE-finder (Cartegni L, et al. 2002 и Cartegni L, et al., 2003). Все AON были синтезированы в Prosensa Therapeutics B.V. (Leiden, Netherlands) или были получены из коммерческого источника (ChemGenes, США), и они содержат 2'-O-метил-РНК и полноразмерные фосфоротиоатные (PS) основные цепи. Все олигонуклеотиды представляли собой 2'-O-метилфосфоротиоатную РНК, и их синтезировали в масштабе 10 мкмоль с использованием устройства для синтеза OP-10 (GE/ÄKTA Oligopilot), с помощью стандартных протоколов для фосфорамидитов. Олигонуклеотиды расщепляли и из них удаляли защитные группы двухстадийным способом (обработка DIEA, а затем концентрированным NH4OH), очищали с помощь ВЭЖХ и растворяли в воде, и добавляли избыток NaCl для обмена ионами. После упаривания соединения перерастворяли в воде, обессоливали с помощью FPLC и лиофилизировали. Масс-спектрометрия подтвердила идентичность всех соединений, и чистота (определенная с помощью UPLC) была найдена приемлемой для всех соединений (>80%). Для экспериментов in vitro, описанных в настоящем описании, приготавливали 50 мкМ рабочие растворы AON в фосфатном буфере (pH 7,0).

Культивирование тканей, трансфекция и анализ способом ОТ-ПЦР

Дифференцированные здоровые контрольные мышечные клетки человека (мышечные трубочки) трансфицировали в 6-луночных планшетах при стандартной концентрации AON 400 нМ в соответствии со стандартными рабочими методиками, не относящимися к GLP. Для трансфекции использовали полиэтиленимин (ExGen500; Fermentas Netherlands) (2 мкл на мкг AON, в 0,15 M NaCl). Упомянутые выше методики трансфекции были адаптированы из ранее описанных материалов и способов (Aartsma-Rus A., et al., 2003). Через 24 часа после трансфекции РНК выделяли и анализировали способом ОТ-ПЦР. В кратком изложении, для получения кДНК использовали случайную смесь гексамеров (1,6 мкг/мкл; Roche Netherlands) в реакции с обратной транскриптазой (RT) на 500-1000 нг исходной РНК. Затем проводили анализ ПЦР на 3 мкл кДНК для каждого образца, и он включал первую и гнездовую ПЦР с использованием праймеров, специфичных к гену DMD (см. таблицы 4 и 5). Выделение РНК и анализ ОТ-ПЦР проводили в соответствии со стандартными рабочими методиками, не относящимися к GLP, адаптированными из ранее описанных материалов и способов (Aartsma-Rus A., et al., 2002; и Aartsma-Rus A., et al., 2003). Продукты ОТ-ПЦР анализировали гель-электрофорезом (2% агарозные гели). Полученные фрагменты ОТ-ПЦР количественно определяли с помощью анализа DNA Lab-on-a-Chip analysis (Agilent Technologies USA; DNA 7500 LabChips). Данные обрабатывали с помощью программного обеспечения "Agilent 2100 Bioanalyzer" и Excel 2007. Оценивали соотношение меньших продуктов транскрипции (содержащих ожидаемое пропускание множества экзонов) и общего количества продуктов транскрипции (что соответствует эффективности пропускания в процентах), и прямо сравнивали с количеством продуктов транскрипции в нетрансфицированных клетках. Фрагменты ПЦР также выделяли из агарозных гелей (набор для экстракции из геля QIAquick gel extraction kit, Qiagen Netherlands) для подтверждения последовательности (секвенирование по методу Сенгера, BaseClear, Нидерланды).

Таблица 4
Наборы праймеров для ПЦР, использованные для обнаружения пропускания экзонов-мишеней
Экзоны-мишени 1-я ПЦР 2-я ПЦР прямой обратный прямой обратный 10-18 h7f h20r h8f h19r 10-30 h7f h32r h8f h31r 10-47 h8f h50r h9f h49r 10-57 h8f h64r h9f h63r2 45-55 h43f2 h57r h44f h56r

Таблица 5
Последовательности праймеров
ID праймера Последовательность (5'→3') h7f agtcagccacacaacgactg h8f caaggccacctaaagtgactaaa h9f gagctatgcctacacacagg h43f2 cctgtggaaagggtgaagc h44f gcgatttgacagatctgttg h19r gcatcttgcagttttctgaac h20r actggcagaattcgatccac h31r tgtgcaacatcaatctgagac h32r tagacgctgctcaaaattgg h49r cactggctgagtggctgg h50r tcagtccaggagctaggtc h56r cgtctttgtaacaggactgc h57r tctgaactgctggaaagtcg h63r2 gagctctgtcattttgggatg h64r gggccttctgcagtcttcgga (SEQ ID NO: 1745-1759)

Результаты

Пример 1. Нацеливание на участок последовательности с высоким сходством в экзонах 10 и 18 посредством AON в различных положениях

Исходя из высоко сходного участка последовательностей (63%) в экзонах 10 (SEQ ID NO: 109) и 18 (SEQ ID NO: 110) конструировали серию AON, распределенных по указанному участку последовательности, на 100% обратно комплементарные либо экзону 10 (PS814; SEQ ID NO: 1675, PS815; SEQ ID NO: 1677, PS816; SEQ ID NO: 1679) или либо экзону 18 (PS811; SEQ ID NO: 1673). После трансфекции в контрольных культурах мышечных трубочек здорового человека анализ ОТ-ПЦР продемонстрировал, что все четыре AON были способны индуцировать пропускание экзонов с 10 по 18 (что подтверждено с помощью анализа последовательности) (фиг.1). PS811 и PS816 обладают наиболее высокими процентами обратной комплементарности с обоими экзонами (фиг. 1B), и они были наиболее эффективными с эффективностью пропускания экзонов с 10 по 18, составляющей 70% и 66%, соответственно (фиг.1C). PS814 был наименее эффективным, что может быть связано с его расположением и/или более короткой длиной (21 против 25 нуклеотидов) и, таким образом, более низкой аффинностью или стабильностью. В необработанных клетках не наблюдали пропускания экзонов с 10 по 18 (NT). Эти результаты были высоко воспроизводимыми (пропускание экзонов с 10 по 18 посредством PS816 при 20/20 различных трансфекциях) и демонстрируют, что пропускание мультиэкзонного участка с 10 по 18 экзоны является осуществимым с использованием одного AON, который способен связываться как с экзоном 10, так и с экзоном 18, в области с высоким сходством последовательности (63%), и который способен индуцировать пропускание этих экзонов и всех экзонов между ними. Хотя в этой области транскрипта могут быть получены дополнительные фрагменты с пропусканием множества экзонов, полученный транскрипт, в котором экзон 9 был прямо сплайсирован с экзоном 19 (транскрипт в рамке считывания), был наиболее распространенным во всех экспериментах.

Пример 2. Нацеливание на участок последовательности с высоким сходством в экзоне 10 и 18 посредством AON различной длины

Учитывая высоко сходные участки последовательности в экзонах 10 (SEQ ID NO: 109) и 18 (SEQ ID NO: 110), авторы настоящего изобретения оценивали эффект AON различной длины для идентификации наиболее эффективной минимальный длины. После трансфекции PS816 (25-мер; SEQ ID NO: 1679), PS1059 (21-мер; SEQ ID NO: 1684) или PS1050 (15-мер; SEQ ID NO: 1682) в контрольных мышечных клетках здорового человека (т.е. дифференцированных мышечных трубочках), анализ ОТ-ПЦР продемонстрировал, что все три AON были способны индуцировать пропускание экзонов с 10 по 18 (что подтверждено с помощью анализа последовательности) (фиг.2A, B). PS816 и PS1059 были наиболее эффективными (68% и 79%, соответственно). Наиболее короткий PS1050 был менее эффективным (25%). В необработанных клетках (NT) не наблюдали пропускания экзонов с 10 по 18. Эти результаты указывают на то, что пропускание мультиэкзонного участка с 10 по 18 экзоны является осуществимым с использованием AON из 15, 21 и 25 нуклеотидов. Также ожидается, что будут действовать более длинные AON. 21-мерный PS1059 был наиболее эффективным наиболее коротким кандидатом. 15-мер PS1050 был наименее эффективным, что может быть связано с его уменьшенной обратной комплементарностью экзону 18 (47%; фиг.2B) и/или уменьшенной аффинностью связывания с РНК-мишенью или стабильностью. Для повышения Tm и, таким образом, аффинности связывания и стабильности дуплекса, 15-меров в целях повышения их биоактивности могут требоваться модификации оснований. Наиболее многочисленным полученным продуктом-транскриптом в этом эксперименте вновь был продукт, в котором экзон 9 был прямо сплайсирован с экзоном 19 (транскрипт в рамке считывания).

Пример 3. Нацеливание на участок последовательности с высоким сходством в экзоне 10 и 18 посредством AON с модифицированной химической структурой оснований

Конкретные характеристики выбранной химической структуры AON, по меньшей мере частично, влияет на доставку AON к транскрипту-мишени: путь введения, биостабильность, биораспределение, внутритканевое распределение и клеточный захват и транспорт. Кроме того, считается, что дальнейшая оптимизация химической структуры олигонуклеотида повысит аффинность связывания и стабильность, повысит активность, улучшит безопасность и/или снизит затраты вследствие уменьшения длины или усовершенствования методик синтеза и/или очистки. В высоко сходном участке последовательностей в экзонах 10 (SEQ ID NO: 109) и 18 (SEQ ID NO: 110) авторы настоящего изобретения оценивали эффект AON на основе 2'-O-метил-РНК с различными модифицированными основаниями (такими как 5-замещенные пиримидины и 2,6-диаминопурины). После трансфекции PS816 (AON с регулярной 2'-O-метил РНК; SEQ ID NO: 1679), PS1168 (PS816, но в котором все As заменены на 2,6-диаминопурин; SEQ ID NO: 1681), PS1059 (AON с регулярной 2'-O-метилфосфоротиоатной РНК; SEQ ID NO: 1684), PS1138 (PS1059, но в котором все Cs заменены на 5-метилцитозин; SEQ ID NO: 1685), или PS1170 (PS1059, но в котором все As заменены на 2,6-диаминопурин; SEQ ID NO: 1686) (фиг.3B) в контрольных мышечных клетках здорового человека (т.е. дифференцированные мышечные трубочки). Анализ ОТ-ПЦР продемонстрировал, что все пять AON были способны индуцировать пропускание экзонов с 10 по 18 (что подтверждено с помощью анализа последовательности) (фиг.3). PS816 был наиболее эффективным (88%). Хотя модификации оснований в этих конкретных последовательностях не повышали биоактивность еще более, они могли иметь более положительный эффект на биораспределение, стабильность и/или безопасность, так что менее эффективные соединения все еще являются предпочтительными для клинической разработки. Эти результаты указывают на то, что пропускание мультиэкзонного участка с 10 по 18 экзоны является осуществимым с использованием AON с модифицированными основаниями. Наиболее многочисленным полученным транскриптом-продуктом в этом эксперименте вновь был транскрипт, в котором экзон 9 был прямо сплайсирован с экзоном 19 (транскрипт в рамке считывания).

Пример 4. PS816 индуцирует пропускание других мультиэкзонных участков в рамке считывания

Высоко сходный участок последовательности в экзонах 10 (SEQ ID NO: 109) и 18 (SEQ ID NO: 110) также (частично) присутствует в экзонах 30 (SEQ ID NO: 128), 31 (SEQ ID NO: 130), 32 (SEQ ID NO: 132), 42 (SEQ ID NO: 152), 47 (SEQ ID NO: 158), 48 (SEQ ID NO: 160), 57(SEQ ID NO: 170) и 60 (SEQ ID NO: 174) (фиг.4A, B, таблица 2). Таким образом, авторы настоящего изобретения сфокусировались на выявлении пропускания мультиэкзонных участков после трансфекции 400 нМ PS816 (SEQ ID NO: 1679). Авторы настоящего изобретения использовали различные наборы праймеров (таблица 4 и 5) для этой цели. Действительно, с помощью анализа ОТ-ПЦР авторы настоящего изобретения выявили пропускание в рамке считывания экзонов с 10 по 30, экзонов с 10 по 42, экзонов с 10 по 47, экзонов с 10 по 57 и/или экзонов с 10 по 60 в множественных экспериментах (подтверждено с помощью анализа последовательности), которое не наблюдалось в необработанных клетках. В качестве примера, на фиг.4C представлено индуцированное PS816 пропускание экзонов с 10 по 18, экзонов с 10 по 30 и экзонов с 10 по 47. Несмотря на дополнительные случаи пропускания множества экзонов (как в рамке считывания, так и не в рамке считывания), полученный транскрипт, в котором экзон 9 был прямо сплайсирован с экзоном 19 (транскрипт в рамке считывания), был наиболее воспроизводимым и оказался наиболее многочисленным во всех экспериментах. Эти результаты подтверждают, что в гене DMD может быть индуцировано пропускание множества экзонов с использованием одного AON, который способен связываться с участком последовательности, который высоко сходен между двумя различными экзонами и способен индуцировать пропускание этих экзонов и всех экзонов между ними с образованием транскрипта DMD в рамке считывания.

Пример 5. Нацеливание на участок последовательности с высоким сходством в экзоне 45 и 55 с помощью AON с модифицированной химической структурой оснований

Исходя из высоко сходного (80%) участка последовательности в экзонах 45 (SEQ ID NO: 1571) и 55 (SEQ ID NO: 1572) была сконструирована серия AON, распределенных по всему указанному участку последовательности, либо на 100% обратно комплементарных экзону 45 (PS1185; SEQ ID NO: 1706, PS1186; SEQ ID NO: 1707), либо на 96% обратно комплементарных экзону 55 (с одним несоответствием оснований) (PS1188; SEQ ID NO: 1713) (фиг.5A). Во всех трех AON As были заменены на 2,6-диаминопурин. После трансфекции в контрольных культурах мышечных трубочек здорового человека анализ ОТ-ПЦР продемонстрировал, что PS1185, PS1186 и PS1188 были способны индуцировать пропускание экзонов с 45 по 55 (что подтверждено с помощью анализа последовательности) (фиг.5B). В необработанных клетках (NT) не наблюдали пропускания экзонов с 45 по 55. Эти результаты демонстрируют, что пропускание другого мультиэкзонного участка с 45 по 55 экзоны является осуществимым с использованием одного AON, который способен связываться как с экзоном 45, так и с экзоном 55 в области с высоким сходством последовательности (80%), и который способен индуцировать пропускание этих экзонов и всех экзонов между ними. Полученный транскрипт, в котором экзон 44 был прямо сплайсирован с экзоном 56, находится в рамке считывания, и он был выявлен во множестве экспериментов. Что касается экспериментов с пропусканием экзонов с 10 по 18 (пример 3), авторы настоящего изобретения вновь продемонстрировали, что можно эффективно использовать AON с модифицированными основаниями. Более того, результаты, полученные с помощью PS1188, указывают на то, что AON не должен быть на 100% обратно комплементарным одному из экзонов-мишеней, но также может быть сконструирован в качестве гибридных структур, в которых отсутствует 100% обратная комплементарность с каким-либо экзоном-мишенью.

Описание чертежей

Фиг. 1. A) Локализация PS811 (SEQ ID NO: 1673), PS814 (SEQ ID NO: 1675), PS815 (SEQ ID NO: 1677) и PS816 (SEQ ID NO: 1679) в участке последовательности, который является высоко сходным (63%) в экзоне 10 и экзоне 18. B) Характеристики и эффективность AON. Указан процент обратной комплементарности (обр. компл.) каждого AON в отношении либо экзона 10, либо экзона 18. C) Анализ способом ОТ-ПЦР. В мышечных клетках здорового человека (т.е. дифференцированных мышечных трубочках) все четыре AON были эффективными в отношении индукции пропускания мультиэкзонного участка с 10 экзона по 18 экзон. PS811 и PS816 были наиболее эффективными. В рамках слева на фигуре представлено содержание амплифицированных способом ПЦР продуктов транскриптов. (M: маркер размера ДНК; NT: не обработанные клетки).

Фиг. 2. A) Анализ ОТ-ПЦР. В мышечных клетках здорового человека (т.е. дифференцированных мышечных трубочках) исследовали AON с различной длиной, однако с одинаковой центральной последовательностью-мишенью в участке последовательности, который является высоко сходным (63%) в экзоне 10 и экзоне 18. PS816 (SEQ ID NO: 1679), 25-мер, и PS1059 (SEQ ID NO: 1684), 21-мер, были наиболее эффективными (пропускание экзонов 10 и 18 составляет 68% и 79%, соответственно). 15-мер PS1050 (SEQ ID NO: 1682) был менее эффективным. В рамках слева на фигуре представлено содержание амплифицированных способом ПЦР продуктов-транскриптов. (M: маркер размера ДНК; NT: необработанные клетки). B) Характеристики и эффективность AON. Указан процент обратной комплементарности (обр. компл.) каждого AON в отношении либо экзона 10, либо экзона 18.

Фигура 3. A) Анализ ОТ-ПЦР. В мышечных клетках здорового человека (т.е. дифференцированные мышечные трубочки) исследовали AON с различной химической структурой оснований: PS816 (AON с регулярной 2'-O-метилфосфоротиоатной РНК; SEQ ID NO: 1679), PS1168 (PS816, но в котором все As заменены на 2,6-диаминопурин; SEQ ID NO: 1681), PS1059 (AON с регулярной 2'-O-метилфосфоротиоатной РНК; SEQ ID NO: 1684), PS1138 (PS1059, но в котором все Cs заменены на 5-метилцитозины; SEQ ID NO: 1685) или PS1170 (PS1059, но в котором все As заменены на 2,6-диаминопурины; SEQ ID NO: 1686). Пропускание экзонов с 10 по 18 наблюдали для всех исследованных AON. PS816 был наиболее эффективным (88%). В этих конкретных последовательностях модификации оснований не повышали далее биоактивность. В рамках слева на фигуре указаны амплифицированные способом ПЦР продукты-транскрипты. (M: маркер размера ДНК; NT: не обработанные клетки). B) Характеристики и эффективность AON.

Фиг. 4. A) Высоко сходные участки последовательности в экзонах 10, 18, 30 и 47 в качестве множественных мишеней для PS816. SEQ ID NO относятся к полноразмерному выравниванию экзонов EMBOSS (как в таблице 2). Серым цветом выделена часть последовательности, которая не была включена в выравнивание EMBOSS, но которая является соседней с частью с высокой обратной комплементарностью с PS816. B) Обзор выравнивания экзонов и процентов обратной комплементарности (обр. компл.) с PS816. C) Анализ ОТ-ПЦР. С помощью PS816 может быть индуцировано пропускание мультиэкзонного участка, обозначаемое в настоящем описание как пропускание экзонов с 10 по 18, экзонов с 10 по 30 и экзонов с 10 по 47. Полученные транскрипты находятся в рамке считывания. Они не были выявлены в необработанных клетках (NT). В рамках слева и справа на фигуре представлено содержание амплифицированных способом ПЦР продуктов транскриптов. (M: маркер размера ДНК).

Фиг. 5. A) Локализация PS1185 (SEQ ID NO: 1706), PS1186 (SEQ ID NO: 1707) и PS1188 (SEQ ID NO: 1713) в участке последовательности, который является высоко сходным (80%) в экзоне 45 и экзоне 55. В таблице обобщенно представлены характеристики AON. Указан процент обратной комплементарности (обр. компл.) каждого AON в отношении либо экзона 45, либо экзона 55. B) Анализ ОТ-ПЦР. В мышечных клетках здорового человека (т.е. дифференцированные мышечные трубочки) все три AON были эффективными в отношении индукции пропускания мультиэкзонного участка с 45 по 55 экзоны. В рамках слева на фигуре представлено содержание амплифицированных способом ПЦР продуктов транскриптов. (M: маркер размера ДНК; NT: необработанные клетки).

Список ссылок

Aartsma-Rus A, Bremmer-Bout M, Janson AA, den Dunnen JT, van Ommen GJ, van Deutekom JC. Targeted exon skipping as a potential gene correction therapy for Duchenne muscular dystrophy. See 1 article found using an alternative search: Neuromuscul Disord. 2002; 12:S71-7.

Aartsma-Rus A, Janson AA, Kaman WE, Bremmer-Bout M, den Dunnen JT, Baas F, van Ommen GJ, van Deutekom JC. Therapeutic antisense-induced exon skipping in cultured muscle cells from six different DMD patients. Hum Mol Genet. 2003; 12(8):907-14.

Aartsma-Rus A, Janson AA, Kaman WE, Bremmer-Bout M, van Ommen GJ, den Dunnen JT, van Deutekom JC. Antisense-induced multiexon skipping for Duchenne muscular dystrophy makes more sense. Am. J. Hum. Genet. 2004; Jan 74(1):83-92.

Alloza I et al., Genes Immun 2012; 13(3):253-257.

Abeliovich A et al., J Neurochem 2006; 99:1062-1072.

van Ommen GJ, van Deutekom J, Aartsma-Rus A. The therapeutic potential of antisense-mediated exon skipping. Curr Opin Mol Ther. 2008; 10(2):140-9.

Andrade MA, Perez-Iratxeta C, Ponting CP. Protein repeats: structures, functions, and evolution. J Struct Biol. 2001; 134(2-3):117-31.

Arai K, Uchiyama N, Wada T. Synthesis and properties of novel 2'-O-alkoxymethyl-modified nucleic acids. Bioorg Med Chem Lett. 2011; 21(21):6285-7.

Béroud C, Tuffery-Giraud S, Matsuo M, Hamroun D, Humbertclaude V, Monnier N, Moizard MP, Voelckel MA, Calemard LM, Boisseau P, Blayau M, Philippe C, Cossée M, Pagès M, Rivier F, Danos O, Garcia L, Claustres M. Multiexon skipping leading to an artificial DMD protein lacking amino acids from exons 45 through 55 could rescue up to 63% of patients with Duchenne muscular dystrophy. Hum Mutat. 2007; Feb;28(2):196-202.

Bomont P et al., Nat Genet 2000; 26(3):370-374.

Cartegni L, Chew SL, Krainer AR. Listening to silence and understanding nonsense: exonic mutations that affect splicing. Nat Rev Genet 2002; 3(4):285-98.

Cartegni L, Wang J, Zhu Z, Zhang MQ, Krainer AR. ESEfinder: A web resource to identify exonic splicing enhancers. Nucleic Acids Res 2003; 31(13):3568-71.

Chabriat H et al., Lancet Neurol 2009; 8(7):643-653.

Cheng AJ and Van Dyke MW. Oligodeoxyribonucleotide length and sequence effects on intramolecular and intermolecular G-quartet formation. Gene. 1997; 197(l-2):253-60.

Cirak S, Arechavala-Gomeza V, Guglieri M, Feng L, Torelli S, Anthony K, Abbs S, Garralda ME, Bourke J, Wells DJ, Dickson G, Wood MJ, Wilton SD, Straub V, Kole R, Shrewsbury SB, Sewry C, Morgan JE, Bushby K, Muntoni F. Exon skipping and dystrophin restoration in patients with Duchenne muscular dystrophy after systemic phosphorodiamidate morpholino oligomer treatment: an open-label, phase 2, dose-escalation study. Lancet. 2011; 378(9791):595-605.

Cirak S et al., Brain 2010; 133(Pt 7):2123-2135.

Diebold SS, Massacrier C, Akira S, Paturel C, Morel Y, Reis e Sousa C. Nucleic acid agonists for Toll-like receptor 7 are defined by the presence of uridine ribonucleotides. Eur J Immunol; 2006; 36(12):3256-67.

Dhanoa BS et al., Hum Genomics 2013; 7(1):13.

Dorn A, Kippenberger S. Clinical application of CpG-, non-CpG-, and antisense oligodeoxynucleotides as immunomodulators. Curr Opin Mol Ther. 2008; 10(1):10-20.

Dubosq-Bidot L et al., Eur Heart J 2009; 30(17):2128-2136.

Ehmsen J. et al., J. Cell Sci. 2002, 115 (Pt14):2801-2803.

Fiorillo C et al., Neurogenetics 2012; 13(3):195-203.

Friedman JS et al., Am J Hum genet 2009; 84(6):792-800.

Goemans NM, Tulinius M, van den Akker JT, Burm BE, Ekhart PF, Heuvelmans N, Holling T, Janson AA, Platenburg GJ, Sipkens JA, Sitsen JM, Aartsma-Rus A, van Ommen GJ, Buyse G, Darin N, Verschuuren JJ, Campion GV, de Kimpe SJ, van Deutekom JC. Systemic administration of PRO051 in Duchenne's muscular dystrophy. N Engl J Med. 2011; 364(16):1513-22.

Goyenvalle A, Wright J, Babbs A, Wilkins V, Garcia L, Davies KE. Engineering Multiple U7snRNA Constructs to Induce Single and Multiexon-skipping for Duchenne Muscular Dystrophy. Mol Ther. 2012 Jun; 20(6):1212-21.

Heemskerk H, de Winter C, van Kuik P, Heuvelmans N, Sabatelli P, Rimessi P, Braghetta P, van Ommen GJ, de Kimpe S, Ferlini A, Aartsma-Rus A, van Deutekom JC. Preclinical PK and PD studies on 2'-O-methyl-phosphorothioate RNA antisense oligonucleotides in the mdx mouse model. Mol Ther. 2010; 18(6):1210-7.

Heneka MT et al., Nature2013; 493(7434):674-678.

Hodgetts S, Radley H, Davies M, Grounds MD. Reduced necrosis of dystrophic muscle by depletion of host neutrophils, or blocking TNFalpha function with Etanercept in mdx mice. Neuromuscul Disord. 2006; 16(9-10):591-602.

Hovnanian A, Cell Tissue Res 2013; 351(2):289-300.

Huang JY et al., Hum Reprod 2013; 28(4):1127-1134.

Knauf F et al., Kidney Int 2013; doi:10.1038/ki.2013.207.

Krieg AM, Yi AK, Matson S, Waldschmidt TJ, Bishop GA, Teasdale R, Koretzky GA, Klinman DM. CpG motifs in bacterial DNA trigger direct B-cell activation. Nature. 1995; 374(6522):546-9.

Krieg, AM. The role of CpG motifs in innate immunity. Curr. Opin. Immunol. 2000; 12:35-43.

Kumar L, Pharm. Technol. 2008, 3, 128.

Louis-Dit-Picard H et al., Nat Genet 2012; 44(4):456-460.

Macaya RF, Waldron JA, Beutel BA, Gao H, Joesten ME, Yang M, Patel R, Bertelsen AH, Cook AF. Structural and functional characterization of potent antithrombotic oligonucleotides possessing both quadruplex and duplex motifs. Biochemistry. 1995; 34(13):4478-92.

Manzur AY, Kuntzer T, Pike M, Swan A. Glucocorticoid corticosteroids for Duchenne muscular dystrophy. Cochrane Database Syst Rev. 2008; (1):CD003725.

Monaco A.P., et al., Genomics 1988; 2:90-95.

Peacock H, Fucini RV, Jayalath P, Ibarra-Soza JM, Haringsma HJ, Flanagan WM, Willingham A, Beal PA. Nucleobase and ribose modifications control immunostimulation by a microRNA-122-mimetic RNA. J. Am. Chem. Soc. 2011, 133(24):9200-3.

Mollie A et al., Hum Genet 2011; 129(6):641-654.

Moller RS et al., Epilepsia 2013; 54(2):256-264.

Noris P et al., Blood 2011; 117(24):6673-6680.

Popovic PJ, DeMarco R, Lotze MT, Winikoff SE, Bartlett DL, Krieg AM, Guo ZS, Brown CK, Tracey KJ, Zeh HJ 3rd. High mobility group B1 protein suppresses the human plasmacytoid dendritic cell response to TLR9 agonists. J of Immunol 2006; 177:8701-8707.

Puente XS et al., Nature 2011; 475(7354):101-105.

Raciti GA et al., Diabetologia 2011; 54(11):2911-2922.

Rantamaki T et al., Am J Hum Genet 1999; 64(4):993-1001.

Remington: The Science and Practice of Pharmacy, 20th Edition. Baltimore, MD: Lippincott Williams & Wilkins, 2000.

Sirmaci A et al., Am J Hum Genet 2011; 89(2):289-294.

Stuart HM et al., Am J Hum Genet 2013; 92(2):259-264.

Suzuki K, Doi T, Imanishi T, Kodama T, Tanaka T. Oligonucleotide aggregates bind to the macrophage scavenger receptor. Eur J Biochem. 1999; 260(3):855-60.

Uchida K et al., Immunology 2005; 116(1):53-63.

van Deutekom JC, Janson AA, Ginjaar IB, Frankhuizen WS, Aartsma-Rus A, Bremmer-Bout M, den Dunnen JT, Koop K, van der Kooi AJ, Goemans NM, de Kimpe SJ, Ekhart PF, Venneker EH, Platenburg GJ, Verschuuren JJ, van Ommen GJ. Local dystrophin restoration with antisense oligonucleotide PRO051. N Engl J Med. 2007; 357(26):2677-86.

van Vliet L, de Winter CL, van Deutekom JC, van Ommen GJ, Aartsma-Rus A. Assessment of the feasibility of exon 45-55 multiexon skipping for Duchenne muscular dystrophy. BMC Med Genet. 2008, Dec 1; 9:105.

Wagner, H., Bacterial CpG DNA activates immune cells to signal infectious danger Adv. Immunol. 1999; 73: 329-368.

Yokota T, Duddy W, Partridge T. Optimizing exon skipping therapies for DMD. Acta Myol. 2007; 26(3):179-84.

Yokota T, Hoffman E, Takeda S. Antisense oligo-mediated multiple exon skipping in a dog model of duchenne muscular dystrophy. Methods Mol Biol. 2011; 709:299-312.

Zuker M. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 2003; 31(13), 3406-3415.

Похожие патенты RU2674600C2

название год авторы номер документа
ОЛИГОНУКЛЕОТИД ДЛЯ ЛЕЧЕНИЯ ПАЦИЕНТОВ С МЫШЕЧНОЙ ДИСТРОФИЕЙ 2013
  • Ван Детеком Юдит Кристина Теодора
RU2789279C2
Система направленного изменения сплайсинга в гене MARK2 2023
  • Первушин Дмитрий Давидович
  • Скворцов Дмитрий Александрович
  • Маргасюк Сергей Дмитриевич
  • Петрова Марина Викторовна
  • Власенок Мария Александровна
  • Завилейский Лев Георгиевич
RU2810907C1
АНТИСМЫСЛОВЫЕ НУКЛЕИНОВЫЕ КИСЛОТЫ 2011
  • Ватанабе Наоки
  • Сатоу Йоухей
  • Такеда Син'Ики
  • Нагата Тецуя
RU2567664C2
МОДУЛЯТОРЫ И МОДУЛЯЦИЯ РНК РЕЦЕПТОРА КОНЕЧНЫХ ПРОДУКТОВ ГЛУБОКОГО ГЛИКИРОВАНИЯ 2020
  • Уилтон, Стивен
  • Томас, Мерлин Кристофер
  • Розадо, Карлос
  • Пикеринг, Раэлен Джейн
RU2820247C2
АНТИСМЫСЛОВЫЕ НУКЛЕИНОВЫЕ КИСЛОТЫ 2012
  • Ватанабе Наоки
  • Сео Харуна
  • Такеда Син'Ити
  • Нагата Тецуя
RU2619184C2
АНТИСМЫСЛОВЫЕ НУКЛЕИНОВЫЕ КИСЛОТЫ 2018
  • Ватанабе, Наоки
  • Сео, Харуна
  • Такеда, Син`Ити
  • Нагата, Тецуя
RU2681470C1
АНТИСМЫСЛОВЫЕ НУКЛЕИНОВЫЕ КИСЛОТЫ 2012
  • Ватанабе Наоки
  • Сео Харуна
  • Такеда Син'Ити
  • Нагата Тецуя
RU2651468C1
АНТИСМЫСЛОВЫЕ НУКЛЕИНОВЫЕ КИСЛОТЫ 2015
  • Вакаяма Тацуси
  • Сео Харуна
  • Сатоу Йоухей
  • Такеда Син'Ити
  • Нагата Тецуя
RU2702424C2
АНТИСМЫСЛОВЫЕ НУКЛЕИНОВЫЕ КИСЛОТЫ 2015
  • Вакаяма, Тацуси
  • Сео, Харуна
  • Сатоу, Йоухей
  • Такеда, Син`Ити
  • Нагата, Тецуя
RU2730681C2
НОВЫЙ СПОСОБ ЛЕЧЕНИЯ ПИГМЕНТНОГО РЕТИНИТА 2020
  • Флетчер Сью
  • Питу Ианта
  • Грейнок Джейна
  • Уилтон Стив Д
  • Чэнь Фред К
RU2817702C2

Иллюстрации к изобретению RU 2 674 600 C2

Реферат патента 2018 года ОЛИГОНУКЛЕОТИД ДЛЯ ЛЕЧЕНИЯ ПАЦИЕНТОВ С МЫШЕЧНОЙ ДИСТРОФИЕЙ

Данное изобретение относится к биотехнологии. Предложен олигонуклеотид для обеспечения пропуска двух или более экзонов пре-мРНК дистрофина. Также рассмотрена композиция для обеспечения пропуска двух или более экзонов пре-мРНК дистрофина, способ и применение олигонуклеотида и композиции для предупреждения, замедления, смягчения и/или лечения мышечной дистрофии Дюшенна (DMD) и мышечной дистрофии Беккера (BMD). Настоящее изобретение может найти дальнейшее применение в терапии различных заболеваний, вызванных мутациями в гене дистрофина. 4 н. и 1 з.п. ф-лы, 5 ил., 6 табл., 5 пр.

Формула изобретения RU 2 674 600 C2

1. Олигонуклеотид для обеспечения пропуска двух или более экзонов пре-мРНК дистрофина, содержащий последовательность оснований или ее часть, как определено в SEQ ID NO: 1679, и имеющий длину 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов, где указанная часть соответствует последовательности оснований, меньшей на 1, 2, 3, 4 или 5 нуклеотидов, чем определено в указанной последовательности оснований.

2. Композиция для обеспечения пропуска двух или более экзонов пре-мРНК дистрофина, содержащая олигонуклеотид по п.1 и необязательно дополнительно содержащая фармацевтически приемлемый носитель, разбавитель, эксципиент, соль, адъювант и/или растворитель, где концентрация олигонуклеотидов в композиции находится в пределах от 0,02 до 400 нМ.

3. Композиция по п.2, где указанная композиция содержит два или более идентичных олигонуклеотидов, как определено в п.1, связанных противоионом, предпочтительно кальцием.

4. Способ предупреждения, замедления, смягчения и/или лечения мышечной дистрофии Дюшенна (DMD) или мышечной дистрофии Беккера (BMD) у индивидуума, причем указанный способ включает введение указанному индивидууму олигонуклеотида по п.1 или композиции по п.2 или 3.

5. Применение олигонуклеотида по п.1 или композиции по п.2 или 3 для предупреждения, замедления, смягчения и/или лечения BMD или DMD.

Документы, цитированные в отчете о поиске Патент 2018 года RU2674600C2

Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1
Способ приготовления лака 1924
  • Петров Г.С.
SU2011A1
Пломбировальные щипцы 1923
  • Громов И.С.
SU2006A1
Способ восстановления хромовой кислоты, в частности для получения хромовых квасцов 1921
  • Ланговой С.П.
  • Рейзнек А.Р.
SU7A1
Приспособление для суммирования отрезков прямых линий 1923
  • Иванцов Г.П.
SU2010A1
AARTSMA-RUS A
et al
"Antisense-induced multiexon skipping for Duchenne muscular dystrophy makes more sense." The American Journal of Human Genetics, 2004; 74(1): 83-92.

RU 2 674 600 C2

Авторы

Ван Детеком Юдит Кристина Теодора

Даты

2018-12-11Публикация

2013-07-03Подача