НЕВИРУСНЫЕ ДНК-ВЕКТОРЫ И ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ ДЛЯ ЭКСПРЕССИИ ТЕРАПЕВТИЧЕСКОГО СРЕДСТВА НА ОСНОВЕ ФАКТОРА VIII (FVIII) Российский патент 2024 года по МПК C12N15/86 A61P25/28 A61K9/51 A61K48/00 

Описание патента на изобретение RU2812852C2

РОДСТВЕННЫЕ ЗАЯВКИ

[0001] Настоящая заявка испрашивает приоритет согласно предварительной заявке США №62/817904, поданной 13 марта 2019 г., и предварительной заявке США №62/856432, поданной 3 июня 2019 г., содержание каждой из которых полностью включено в данный документ посредством ссылки.

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

[0002] Настоящая заявка включает перечень последовательностей, который был подан в электронном виде в формате ASCII, а также последовательности в Таблицах 1-9 в данном документе, каждая из которых полностью включена в данный документ посредством ссылки. Указанная копия в формате ASCII, созданная 11 марта 2020 г., названа 131698-06020_SL.txt и имеет размер 116781 байтов.

ОБЛАСТЬ ТЕХНИКИ

[0003] Настоящее изобретение относится к области генной терапии, включая невирусные векторы для экспрессии трансгена или выделенных полинуклеотидов у субъекта или в клетке. Настоящее раскрытие также относится к конструкциям нуклеиновых кислот, промоторам, векторам и клеткам-хозяевам, включая полинуклеотиды, а также к способам доставки экзогенных последовательностей ДНК в целевую клетку, ткань, орган или организм. Например, настоящее раскрытие обеспечивает способы применения невирусных зкДНК-векторов для экспрессии фактора VIII (FVIII) из клетки, например, экспрессии терапевтического белка FVIII для лечения субъекта, страдающего гемофилией А. Способы и композиции можно применять, например, для лечения заболевания путем экспрессии FVIII в клетке или ткани субъекта, нуждающегося в этом.

УРОВЕНЬ ТЕХНИКИ

[0004] Целью генной терапии является улучшение клинических исходов у пациентов, страдающих либо генетическими мутациями, либо приобретенными заболеваниями, вызванными аберрацией в профиле экспрессии генов. Генная терапия включает лечение или предотвращение медицинских состояний, вызванных дефектными генами или аномальной регуляцией или экспрессией, например, недостаточной экспрессией или избыточной экспрессией, что может привести к нарушению, заболеванию, злокачественному новообразованию и т.д. Например, заболевание или нарушение, вызванное дефектным геном, можно лечить, предотвращать или облегчать путем доставки пациенту корректирующего генетического материала, или можно лечить, предотвращать или облегчать путем изменения или подавления у пациента дефектного гена, например, с помощью корректирующего генетического материала, приводящего к терапевтической экспрессии генетического материала в организме пациента.

[0005] Основой генной терапии является обеспечение транскрипционной кассеты с активным генным продуктом (иногда называемым трансгеном), например, который может приводить к положительному эффекту усиления функции, отрицательному эффекту потери функции или другому исходу. Такие исходы можно отнести к экспрессии терапевтического белка, такого как антитело, функциональный фермент или слитый белок. Генную терапию также можно применять для лечения заболевания или злокачественного новообразования, вызванного другими факторами. Моногенные нарушения у человека можно лечить путем доставки нормального гена в целевые клетки и его экспрессии в них. Доставку и экспрессию корректирующего гена в клетках-мишенях пациента можно осуществлять с применением многочисленных способов, включая применение сконструированных вирусов и вирусных векторов для доставки генов. Среди многочисленных доступных векторов вирусного происхождения (например, рекомбинантный ретровирус, рекомбинантный лентивирус, рекомбинантный аденовирус и т.п.) рекомбинантный аденоассоциированный вирус (рААВ) приобретает все большую популярность в генной терапии в качестве многоцелевого вектора.

[0006] Аденоассоциированные вирусы (ААВ) принадлежат к семейству Parvoviridae и, более конкретно, составляют род депендопареоеирусое. Векторы, происходящие из ААВ (т.е. рекомбинантные ААВ (рААВ) или ААВ-векторы), являются привлекательным способом доставки генетического материала, поскольку (i) они способны инфицировать (трансдуцировать) широкий спектр типов неделящихся и делящихся клеток, включая миоциты и нейроны; (ii) они лишены вирусных структурных генов, что уменьшает ответы клеток хозяина на вирусную инфекцию, например, опосредуемые интерфероном ответы; (iii) вирусы дикого типа считаются непатологичными у человека; (iv) в отличие от ААВ дикого типа, которые способны интегрироваться в геном клетки хозяина, дефектные по репликации ААВ-векторы лишены гена rep и обычно персистируют в виде эписом, что ограничивает риск инсерционного мутагенеза или генотоксичности; и (ν) по сравнению с другими векторными системами ААВ-векторы обычно считаются относительно слабыми иммуногенами и, следовательно, не вызывают значительного иммунного ответа (см. ii), обеспечивая, таким образом, персистенцию векторной ДНК и, потенциально, долговременную экспрессию терапевтических трансгенов.

[0007] Однако применение частиц ААВ в качестве вектора для доставки генов имеет несколько серьезных недостатков. Одним из основных недостатков, ассоциированных с рААВ, является ограниченная емкость вирусной упаковки, составляющая примерно 4,5 тыс.п.о. гетерологичной ДНК (Dong et al, 1996; Athanasopoulos et al, 2004; Lai et al, 2010), вследствие этого применение ААВ-векторов ограничено их способностью кодировать белки размером менее 150000 Да. Вторым недостатком является то, что в результате распространенности инфекции ААВ дикого типа среди населения кандидаты на генную терапию с использованием рААВ должны проходить скрининг на наличие нейтрализующих антител, устраняющих вектор из организма пациента. Третий недостаток связан с иммуногенностью капсида, которая препятствует повторному введению пациентам, которые не были отстранены от начального лечения. Иммунная система пациента может отвечать на вектор, который фактически выступает в роли «бустерной» прививки, стимулирующей выработку высоких титров антител к ААВ иммунной системой, которые исключают возможность лечения в будущем. В некоторых недавних сообщениях выражены опасения, касающиеся иммуногенности в ситуациях, подразумевающих применение высоких доз. Другой заметный недостаток заключается в относительно медленном начале ААВ-опосредуемой экспрессии генов, учитывая, что одноцепочечная ДНК ААВ должна быть преобразована в двухцепочечную ДНК до экспрессии гетерологичного гена.

[0008] Кроме того, обычные вирионы ААВ с капсидами получают путем введения плазмиды или плазмид, содержащих геном ААВ, гены rep и гены cap (Grimm et al., 1998). Однако было обнаружено, что такие вирусные векторы на основе заключенного в капсид ААВ неэффективно трансдуцируют определенные типы клеток и тканей, а капсиды также индуцируют иммунный ответ.

[0009] Соответственно, применение векторов на основе аденоассоциированного вируса (ААВ) для генной терапии ограничено из-за однократного введения пациентам (вследствие иммунного ответа пациента), ограниченного диапазона трансгенного генетического материала, подходящего для доставки в ААВ-векторах ввиду минимальной емкости вирусной упаковки (около 4,5 тыс.п.о.), и медленной ААВ-опосредуемой экспрессии генов.

[0010] Существует большая неудовлетворенная потребность в модифицирующих заболевание видах терапии при гемофилии А. Современные виды терапии обременительны и требуют внутривенных (в/в) введений. Во-первых, эти инъекционные препараты фактора VIII не обеспечивают непрерывную доставку факторов, при этом минимальные уровни допускают эпизоды кровотечения. Во-вторых, отсутствуют одобренные виды генной терапии гемофилии А, а виды терапии на основе ААВ не могут применяться у 25%-40% пациентов из-за уже существующих антител. ААВ может быть введен только один раз, и полученные уровни фактора VIII могут быть недостаточно высокими, чтобы быть эффективными, или могут превышать нормальные, уровни доз не поддаются титрованию. В-третьих, многие пациенты, страдающие гемофилией А, не могут использовать эти виды терапии из-за выработки нейтрализующих антител к этим экзогенным, искусственным факторам свертывания крови.

[0011] Соответственно, в данной области существует потребность в технологии, которая обеспечивает экспрессию терапевтического белка FVIII в клетке, ткани или организме субъекта для лечения гемофилии А.

КРАТКОЕ ОПИСАНИЕ

[0012] Технология, описанная в данном документе, относится к способам и композициям для лечения гемофилии А путем экспрессии белка фактора VIII (FVIII) с бескапсидного (например, невирусного) ДНК-вектора с ковалентно замкнутыми концами (называемого в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), причем указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты FVIII или ее варианты, оптимизированные по кодонам. Этот зкДНК-вектор можно применять для получения белков FVIII для лечения, мониторинга и диагностики. Применение зкДНК-векторов, экспрессирующих FVIII, у субъекта для лечения гемофилии А подходит для: (i) обеспечения модифицирующих заболевание уровней фермента FVIII, (ii) минимально инвазивной доставки, (iii) повторяемости и дозирования до достижения эффекта, (iv) быстрого начала терапевтического эффекта, (v) устойчивой экспрессии корректирующего фермента FVIII в печени, (vi) восстановления функции цикла мочевины, и/или (vii) титрования для достижения соответствующих фармакологических уровней дефектного фермента.

[0013] Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий FVIII, необязательно присутствует в составе липосомных наночастиц (ЛНЧ) для лечения гемофилии А. ЗкДНК-векторы, описанные в данном документе, могут обеспечивать одно или более преимуществ, включая, но не ограничиваясь перечисленными, обеспечение модифицирующих заболевание уровней фактора VIII, минимальную инвазивность при доставке, повторяемость и дозирование до достижения эффекта, обеспечение быстрого начала терапевтического эффекта в течение нескольких дней после терапевтического вмешательства, устойчивую экспрессию корректирующих уровней фактора VIII в кровотоке, возможность титрования для достижения соответствующих фармакологических уровней дефектного фактора коагуляции и/или обеспечение способов лечения другого типа гемофилии, включая, но не ограничиваясь этим, дефицит фактора VIII.

[0014] Соответственно, настоящее изобретение, описанное в данном документе, относится к бескапсидному (например, невирусному) ДНК-вектору с ковалентно замкнутыми концами (называемому в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), содержащему гетерогенный ген, кодирующий FVIII, чтобы обеспечить экспрессию терапевтического белка FVIII в клетке. В соответствии с одним аспектом в настоящем раскрытии предложен бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетер о логичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из любой из последовательностей в Таблице 1. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из любой из последовательностей в Таблице 9. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из группы, состоящей из SEQ ID NO: 207, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 199, SEQ ID NO: 208, SEQ ID NO: 211 и SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 214.

[0015] Согласно одному варианту реализации в данном документе раскрыт бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1.

[0016] Согласно одному варианту реализации последовательность в Таблице 1 выбрана из группы, состоящей из SEQ ID NO: 380, SEQ ID NO: 381, SEQ ID NO: 382, SEQ ID NO: 383, SEQ ID NO: 384, SEQ ID NO: 385, SEQ ID NO: 386, SEQ ID NO: 387, SEQ ID NO: 388, SEQ ID NO: 389, SEQ ID NO: 390, SEQ ID NO: 391, SEQ ID NO: 392, SEQ ID NO: 393, SEQ ID NO: 394, SEQ ID NO: 395, SEQ ID NO: 396 и SEQ ID NO: 397. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 380. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 381. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 382. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 383. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 384. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 385. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 386. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 387. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 388. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 389. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 390. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 391. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 392. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 393. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 394. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 395. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 396. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 397.

[0017] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую последовательность в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из последовательности в Таблице 9.

[0018] Согласно одному варианту реализации последовательность в Таблице 9 выбрана из группы, состоящей из SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 204, SEQ ID NO: 205, SEQ ID NO: 206, SEQ ID NO: 207, SEQ ID NO: 208, SEQ ID NO: 209, SEQ ID NO: 210, SEQ ID NO: 211, SEQ ID NO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ ID NO: 216 и SEQ ID NO: 217. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 197. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 198. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 199. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 200. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 201. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 202. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 203. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 204. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 205. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 206. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 207. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 208. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 209. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 210. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 211. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 212. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 213. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 214. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 215. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 216. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 217.

[0019] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 210.

[0020] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 214.

[0021] ЗкДНК-векторы для экспрессии продукции белка FVIII, описанные в данном документе, представляют собой бескапсидные линейные дуплексные молекулы ДНК, образованные из непрерывной цепи комплементарной ДНК с ковалентно замкнутыми концами (линейная, непрерывная и неинкапсидированная структура), которые содержат последовательность 5' инвертированного концевого повтора (ITR) и последовательность 3'-ITR, причем указанные 5-ITR и 3'-ITR могут иметь одинаковую симметричную трехмерную организацию по отношению друг к другу (т.е. симметричную или по существу симметричную) или, альтернативно, 5'-ITR и 3'-ITR могут иметь различную трехмерную организацию по отношению друг к другу (т.е. асимметричные ITR). Кроме того, ITR могут происходить из одного и того же или разных серотипов. Согласно некоторым вариантам реализации зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и В-В' в трехмерном пространстве (т.е. они одинаковы или являются зеркальными отображениями по отношению друг к другу). Согласно некоторым вариантам реализации один ITR может происходить из одного серотипа ААВ, а другой ITR может происходить из другого серотипа ААВ.

[0022] Соответственно, некоторые аспекты технологии, описанной в данном документе, относятся к зкДНК-вектору для улучшенной экспрессии и/или продукции белка описанного выше белка FVIII, который содержит последовательности ITR, фланкирующие гетерологичную последовательность нуклеиновой кислоты, содержащую любую последовательность нуклеиновой кислоты FVIII, раскрытую в Таблицах 5, при этом указанные последовательности ITR выбраны из любых из: (i) по меньшей мере одного ITR дикого типа (WT) и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию. ЗкДНК-векторы, раскрытые в данном документе, могут быть получены в эукариотических клетках и поэтому лишены прокариотических модификаций ДНК и загрязнения бактериальными эндотоксинами в клетках насекомых.

[0023] Способы и композиции, описанные в данном документе, частично относятся к открытию невирусного бескапсидного ДНК-вектора с ковалентно замкнутыми концами (зкДНК-векторы), который можно применять для экспрессии по меньшей мере одного белка FVIII или более чем одного белка FVIII из клетки, включая, но не ограничиваясь ими, клетки печени.

[0024] Соответственно, в данном документе в одном аспекте предложены ДНК-векторы (например, зкДНК-векторы), содержащие по меньшей мере одну гетерологичную последовательность нуклеиновой кислоты, кодирующую по меньшей мере один трансген, кодирующий белки FVIII, функционально связанный с промотором, расположенную между двумя различными последовательностями инвертированных концевых повторов (ITR) ААВ, причем один из ITR содержит функциональный сайт концевого разрешения ААВ и сайт связывания Rep, и один из ITR содержит делецию, вставку или замену относительно другого ITR; при этом указанный трансген кодирует белок FVIII; и при этом указанная ДНК при расщеплении рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, отличается наличием характерных полос линейной и непрерывной ДНК по сравнению с контрольными линейными и прерывистыми ДНК при анализе на неденатурирующем геле. Другие аспекты включают доставку белка FVIII путем его экспрессии in vivo с зкДНК-вектора, описанного в данном документе, и, кроме того, лечение гемофилии А с применением зкДНК-векторов, кодирующих FVIII. В данном документе также предусмотрены клетки, содержащие зкДНК-вектор, кодирующий FVIII, описанный в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.

[0025] Аспекты настоящего изобретения относятся к способам получения зкДНК-векторов, которые можно применять для экспрессии белка FVIII в клетке, как описано в данном документе. Другие варианты реализации относятся к зкДНК-вектору, полученному с помощью способа, предложенного в данном документе. Согласно одному варианту реализации бескапсидный (например, невирусный) ДНК-вектор (зкДНК-вектор) для продукции белка FVIII получают из плазмиды (называемой в данном документе «зкДНК-плазмидой»), содержащей полинуклеотидную матрицу экспрессионной конструкции, содержащую, в указанном порядке: первый 5'-инвертированный концевой повтор (например, ITR ААВ); гетерологичную последовательность нуклеиновой кислоты; и 3'-ITR (например, ITR ААВ), причем указанные 5'-ITR и 3'-ITR могут быть асимметричными по отношению друг к другу или симметричными (например, WT-ITR или модифицированные симметричные ITR), как определено в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.

[0026] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с помощью ряда средств, которые будут известны обычному квалифицированному специалисту после прочтения этого раскрытия. Например, полинуклеотидная матрица экспрессионной конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус. Согласно одному варианту реализации зкДНК-плазмида содержит сайт рестрикционного клонирования (например, SEQ ID NO: 123 и/или 124), функционально расположенный между ITR, в который может быть вставлена экспрессионная кассета, содержащая, например, промотор, функционально связанный с трансгеном, например, нуклеиновой кислотой, кодирующей FVIII. Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII получают из полинуклеотидной матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса), содержащей симметричные или асимметричные ITR (модифицированные ITR или WT ITR).

[0027] В пермиссивной клетке-хозяине, в присутствии, например, Rep, полинуклеотидная матрица, имеющая по меньшей мере два ITR, реплицируется с получением зкДНК-векторов, экспрессирующих белок FVIII. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.д.) посредством белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора. Белки Rep и сайты связывания Rep различных серотипов ААВ хорошо известны обычным специалистам в данной области техники. Обычный специалист в данной области техники понимает необходимость выбора белка Rep из серотипа, который связывается с последовательностью нуклеиновой кислоты и реплицирует ее, на основе по меньшей мере одного функционального ITR. Например, если компетентный по репликации ITR происходит из серотипа 2 ААВ, соответствующий Rep будет из серотипа ААВ, который работает с этим серотипом, такого как ITR ААВ2 с Rep ААВ2 или ААВ4, но не Rep ААВ5, который не работает. После репликации зкДНК-вектор с ковалентно замкнутыми концами продолжает накапливаться в пермиссивных клетках, и зкДНК-вектор предпочтительно является достаточно стабильным с течением времени в присутствии белка Rep в стандартных условиях репликации, например, для накопления в количестве, составляющем по меньшей мере 1 пг/клетку, предпочтительно по меньшей мере 2 пг/клетку, предпочтительно по меньшей мере 3 пг/клетку, более предпочтительно по меньшей мере 4 пг/клетку, еще более предпочтительно по меньшей мере 5 пг/клетку.

[0028] Соответственно, один аспект настоящего изобретения относится к способу получения зкДНК-вектора для экспрессии таких белков FVIII, включающему этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в клетках-хозяевах и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR с получением зкДНК-вектора для экспрессии белка FVIII в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, налагаемое вирионами. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.

[0029] Наличие пригодного для экспрессии белка FVIII зкДНК-вектора, выделенного из клеток-хозяев, можно подтвердить путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на денатурирующем и неденатурирующем гелях для подтверждения наличия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.

[0030] В данном документе также предложены способы экспрессии белка FVIII, который имеет терапевтическое применение, с применением зкДНК-вектора в клетке или у субъекта. Такие белки FVIII можно применять для лечения гемофилии А. Соответственно, в данном документе предложены способы лечения гемофилии А, включающие введение зкДНК-вектора, кодирующего терапевтический белок FVIII, субъекту, нуждающемуся в этом. В соответствии с некоторыми вариантами реализации зкДНК-вектор, кодирующий терапевтический белок FVIII, выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-векгора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23. В соответствии с некоторыми вариантами реализации уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40% по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40%, примерно 45%, примерно 50%, примерно 55%, примерно 60%, примерно 65%, примерно 70%, примерно 75% по сравнению с контролем.

[0031] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к невирусному бескапсидному ДНК-вектору с ковалентно замкнутыми концами (зкДНК-вектору), причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, функционально расположенную между двумя последовательностями инвертированных концевых повторов, при этом указанные последовательности ITR могут быть асимметричными или симметричными, или по существу симметричными, в соответствии с определением этих терминов в данном документе, при этом по меньшей мере один из ITR содержит функциональный сайт концевого разрешения и сайт связывания Rep, и необязательно указанная гетер о логичная последовательность нуклеиновой кислоты кодирует трансген (например, белок FVIII), и при этом указанный вектор не находится в вирусном капсиде.

[0032] Эти и другие аспекты настоящего изобретения более подробно описаны ниже.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0033] Варианты реализации настоящего раскрытия, кратко обобщенные выше и более подробно обсуждаемые ниже, будут понятны со ссылкой на иллюстративные варианты реализации раскрытия, представленные на прилагаемых чертежах. Однако прилагаемые чертежи иллюстрируют только типичные варианты реализации настоящего раскрытия и поэтому не должны рассматриваться, как ограничивающие объем, поскольку раскрытие может допускать другие не менее эффективные варианты реализации.

[0034] ФИГ. 1А иллюстрирует примерную структуру зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, содержащего асимметричные ITR. Согласно этому варианту реализации примерный зкДНК-вектор содержит экспрессионную кассету, содержащую промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования (R3/R4) между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - ITR дикого типа ААВ2 слева (на 5'-конце) и модифицированным ITR справа (на 3'-конце) от экспрессионной кассеты, поэтому два ITR, фланкирующие экспрессионную кассету, асимметричны по отношению друг к другу.

[0035] ФИГ. 1 В иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - модифицированным ITR слева (на 5'-конце) и ITR дикого типа справа (на 3'-конце) от экспрессионной кассеты.

[0036] ФИГ. 1С иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR, с экспрессионной кассетой, содержащей энхансер/промотор, трансген FVIII, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет встраивать трансген FVIII в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR), которые асимметричны по отношению друг к другу; модифицированным ITR слева (на 5'-конце) и модифицированным ITR справа (на 3-конце) от экспрессионной кассеты, причем указанные 5'-ITR и 3'-ITR оба представляют собой модифицированные ITR, но имеют разные модификации (т.е. они не имеют одинаковых модификаций).

[0037] ФИГ. 1D иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем 849849949 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.

[0038] ФИГ. 1Е иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем указанные 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.

[0039] ФИГ. 1F иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные WT-ITR или по существу симметричные WT-ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген (например, FVIII), вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.

[0040] ФИГ. 1G иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген (например, FVIII), посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.

[0041] ФИГ. 2А представляет Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 (SEQ ID NO: 52) с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE'), а также показывает сайт концевого разрешения (TRS). RBE содержит группу из 4 дуплексных тетрамеров, которые, как полагают, взаимодействуют либо с Rep 78, либо с Rep 68. Кроме того, также полагают, что RBE' взаимодействует с комплексом Rep, собранным на ITR дикого типа или мутированном ITR в конструкции. Области D и D' содержат сайты связывания факторов транскрипции и другую консервативную структуру. ФИГ. 2 В показывает предполагаемую Rep-катализируемую никирующую и лигирующую активность в левом ITR дикого типа (SEQ ID NO: 53), включая Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE), а также показывает сайт концевого разрешения (TRS) и область D и D', содержащую несколько сайтов связывания факторов транскрипции и другую консервативную структуру.

[0042] ФИГ. 3А представляет первичную структуру (полинуклеотидную последовательность) (слева) и вторичную структуру (справа) RBE-содержащих частей плеча А-А', а также плеча С-С' и В-В' левого ITR дикого типа ААВ2 (SEQ ID NO: 54). ФИГ. 3В показывает примерную последовательность мутированного ITR (также называемого модифицированным ITR) для левого ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) части RBE плеча А-А', плеча С и плеча В-В' примерного мутированного левого ITR (ITR-1, слева) (SEQ ID NO: 113). ФИГ. 3С показывает первичную структуру (слева) и вторичную структуру (справа) RBE-содержащей части петли А-А' и плеч В-В' и С-С' правого ITR дикого типа ААВ2 (SEQ ID NO: 55). ФИГ. 3D показывает примерный правый модифицированный ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) RBE-содержащей части плеча А-А', В-В' и плеча С примерного мутантного правого ITR (ITR-1, справа) (SEQ ID NO: 114). Любая комбинация левого и правого ITR (например, ITR ААВ2 или другого вирусного серотипа или синтетических ITR) может использоваться, как описано в данном документе. Каждая из полинуклеотидных последовательностей на ФИГ. 3A-3D относится к последовательности, используемой в геноме плазмиды или бакмиды/бакуловируса, применяемых для получения зкДНК, как описано в данном документе. Также на каждой из ФИГ. 3A-3D приведены соответствующие вторичные структуры зкДНК, выведенные на основании конфигураций зкДНК-вектора в геноме плазмиды или бакмиды/бакуловируса и предсказанных значений свободной энергии Гиббса.

[0043] ФИГ. 4А представляет собой схему, иллюстрирующую подготовительный способ получения инфицированных бакуловирусом клеток насекомых (ВИС), которые можно применять для получения зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, в способе, описанном на схеме на ФИГ. 4В. ФИГ. 4В представляет собой схему примерного способа получения зкДНК, и ФИГ. 4С иллюстрирует биохимический метод и способ подтверждения получения зкДНК-вектора. ФИГ. 4D и ФИГ. 4Е представляют собой схематические иллюстрации, описывающие способ идентификации наличия зкДНК в ДНК, собранной из осадков клеток, полученных во время способов продуцирования зкДНК на ФИГ. 4В. ФИГ. 4D схематически показывает ожидаемые полосы примерной зкДНК, оставленной неразрезанной или расщепленной рестрикционной эндонуклеазой, а затем подвергнутой электрофорезу либо на нативном геле, либо на денатурирующем геле. Самая левая схема представляет собой нативный гель и показывает несколько полос, свидетельствующих о том, что в дуплексной и неразрезанной форме зкДНК существует по меньшей мере в мономерном и димерном состояниях, наблюдаемых как быстрее мигрирующий мономер меньшего размера и медленнее мигрирующий димер, размер которого в два раза превышает размер мономера. На второй слева схеме показано, что при разрезании зкДНК рестрикционной эндонуклеазой исходные полосы исчезают и появляются быстрее мигрирующие (например, меньшие по размеру) полосы, соответствующие ожидаемым размерам фрагментов, оставшихся после расщепления. В денатурирующих условиях исходная дуплексная ДНК является одноцепочечной и мигрирует как молекула, размер которой в два раза превышает размер, наблюдаемый на нативном геле, поскольку комплементарные цепи ковалентно связаны. Таким образом, на второй схеме справа расщепленная зкДНК показывает распределение полос, сходное с наблюдаемым на нативном геле, но полосы мигрируют как фрагменты, размер которых в два раза превышает размер их аналогов на нативном геле. На самой правой схеме показано, что неразрезанная зкДНК в денатурирующих условиях мигрирует в виде одноцепочечного раскрытого кольца, поэтому размер наблюдаемых полос в два раза превышает размер полос, наблюдаемых в нативных условиях, в которых кольцо не раскрыто. На этой фигуре «тыс.п.о.» используется для обозначения относительного размера нуклеотидных молекул на основании, в зависимости от контекста, либо длины нуклеотидной цепи (например, для одноцепочечных молекул, наблюдаемых в денатурирующих условиях), либо числа пар оснований (например, для двухцепочечных молекул, наблюдаемых в нативных условиях). ФИГ. 4Е показывает ДНК, имеющую прерывистую структуру. ЗкДНК может быть разрезана рестрикционной эндонуклеазой, имеющей один сайт распознавания в зкДНК-векторе, с получением двух фрагментов ДНК с разными размерами (1 тыс.п.о. и 2 тыс.п.о.) как в нейтральных, так и в денатурирующих условиях. ФИГ. 4Е также показывает зкДНК, имеющую линейную и непрерывную структуру. ЗкДНК-вектор может быть разрезан рестрикционной эндонуклеазой с получением двух фрагментов ДНК, которые мигрируют как 1 тыс. п. о. и 2 тыс. п. о. в нейтральных условиях, но в денатурирующих условиях цепи остаются соединенными и образуют одиночные цепи, которые мигрируют как 2 тыс. п. о. и 4 тыс. п. о.

[0044] ФИГ. 5 представляет собой примерное изображение анализа на денатурирующем геле примеров зкДНК-векторов с (+) или без (-) расщепления эндонуклеазами (EcoRI для зкДНК-конструкций 1 и 2; BamH1 для зкДНК-конструкций 3 и 4; SpeI для зкДНК-конструкций 5 и 6; и XhoI для зкДНК-конструкций 7 и 8). Конструкции 1-8 описаны в Примере 1 международной заявки РСТ PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Размеры выделенных звездочкой полос были определены и указаны внизу рисунка.

[0045] ФИГ. 6 отображает результаты экспериментов, описанных в Примере 7, и конкретно показывает изображения IVIS, полученные у мышей, получавших контроль ЛНЧ-поли(С) (крайняя слева мышь), и четырех мышей, получавших ЛНЧ-зкДНК-люциферазу (все, кроме крайней слева мыши). У четырех мышей, обработанных зкДНК, наблюдается значительная флуоресценция в области печени мыши.

[0046] ФИГ. 7 отображает результаты эксперимента, описанного в Примере 8. Темные точки указывают на наличие белка, полученного в результате экспрессии трансгена с зкДНК, и демонстрируют ассоциацию введенной ЛНЧ-зкДНК с гепатоцитами.

[0047] ФИГ. 8А и 8В отображают результаты исследований на глазах, описанных в Примере 9. ФИГ. 8А показывает типичные изображения IVIS из глаз крысы, в которые инъецировали JetPEI®-зкДНК-люциферазу (вверху слева), по сравнению с неинъецированным глазом той же крысы (вверху справа) или глазом крысы, в который инъецировали плазмиду-ДНК люциферазы (внизу слева), и неинъецированным глазом той же крысы (внизу справа). ФИГ. 8В показывает график средней светимости, наблюдаемой в обработанных глазах или соответствующих необработанных глазах в каждой из групп обработки. Крысы, обработанные зкДНК, демонстрировали длительную значительную флуоресценцию (и, следовательно, экспрессию трансгена люциферазы) в течение 99 дней, что существенно разнилось с крысами, получавшими плазмиду-люциферазу, у которых наблюдалась минимальная относительная флуоресценция (и, следовательно, экспрессия трансгена люциферазы).

[0048] ФИГ. 9А и 9В отображают результаты исследования устойчивости зкДНК и повторного введения дозы у мышей Rag2, описанного в Примере 10. ФИГ. 9А показывает график зависимости полного потока от времени, наблюдаемой у получавших ЛНЧ-зкДНК-Luc мышей c57bl/6 дикого типа или мышей Rag2. ФИГ. 9В представляет график, показывающий влияние повторной дозы на уровни экспрессии трансгена люциферазы у мышей Rag2, при этом после введения повторной дозы наблюдали повышенную стабильную экспрессию (стрелка указывает время введения повторной дозы).

[0049] ФИГ. 10 представляет данные исследования экспрессии люциферазы с зкДНК у обработанных мышей, описанного в Примере 11, показывающие полный поток в каждой группе мышей на протяжении исследования. Высокие уровни неметилированного CpG коррелировали с более низким полным потоком, наблюдаемым у мышей с течением времени, в то время как использование специфического для печени промотора коррелировало с продолжительной стабильной экспрессией трансгена с зкДНК-вектора на протяжении по меньшей мере 77 дней.

[0050] ФИГ. 11А и 11В показывают гидродинамическую доставку зкДНК-вектора, экспрессирующего FVIII. ФИГ. 11А показывает уровни экспрессии FVIII в образцах сыворотки на день 3 и 7 от мышей после гидродинамической инъекции трех различных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или контрольного зкДНК-вектора (только зкДНК, экспрессирующая люциферазу) (показано как Носитель). Два из трех зкДНК-векторов, экспрессирующих FVIII, показали экспрессию FVIII. ФИГ. 11В представляет собой график зависимости ответа от дозы для уровней экспрессии FVIII в образцах сыворотки в течение 30-дневного периода от мышей после гидродинамической инъекции небольшого или большого количества трех разных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или небольших количеств зкДНК-вектора в качестве контроля носителя (экспрессирующего только люциферазу).

[0051] ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.

[0052] ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.

[0053] ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.

[0054] ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005 мкг-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.

[0055] ФИГ. 16 представляет собой график, который отображает концентрацию FVIII в плазме (MP/мл) через 7 дней после гидродинамической доставки исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0056] В данном документе предложен способ лечения гемофилии А с применением зкДНК-вектора, содержащего одну или более нуклеиновых кислот, которые кодируют терапевтический белок FVIII или его фрагмент. В данном документе также предложены зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие одну или более гетер о логичных нуклеиновых кислот, которые кодируют белок FVIII. Согласно некоторым вариантам реализации экспрессия белка FVIII может включать секрецию терапевтического белка из клетки, в которой он экспрессируется. В качестве альтернативы, в некоторых вариантах реализации экспрессированный белок FVIII может действовать или функционировать (например, оказывать свой эффект) внутри клетки, в которой он экспрессируется. Согласно некоторым вариантам реализации зкДНК-вектор экспрессирует белок FVIII в печени, мышце (например, скелетной мышце) субъекта или в другой части тела, которая может функционировать как депо для продукции и секреции терапевтического белка FVIII во многие системные компартменты.

I. Определения

[0057] Если в данном документе не указано иное, научные и технические термины, используемые применительно к настоящей заявке, должны иметь значения, обычно известные обычным специалистам в области техники, к которой относится данное раскрытие. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения. Определения обычных терминов в иммунологии и молекулярной биологии можно найти в The Merck Manual of Diagnosis and Therapy, 19 изд., опубликовано Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ред.), Fields Virology, 6 изд., опубликовано Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ред.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, опубликовано Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); и Robert A. Meyers (ред.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, опубликовано VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, опубликовано Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (ред.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, опубликовано Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4 изд., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ред.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ред.), John Wiley and Sons, Inc., 2005; и Current Protocols in Immunology (CPI) (John E. Coligan, ADA Μ Kruisbeek, David Η Margulies, Ethan Μ Shevach, Warren Strobe, (ред.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), содержание которых полностью включено в данный документ посредством ссылки).

[0058] В данном документе термины «введение», «введенный» и их варианты относятся к введению субъекту композиции или агента (например, терапевтической нуклеиновой кислоты или иммуносупрессора, описанных в данном документе) и включают одновременное и последовательное введение одной или более композиций или агентов. «Введение» может относиться, например, к терапевтическим, фармакокинетическим, диагностическим, исследовательским методам, к плацебо и к экспериментальным методам. «Введение» также включает способы лечения in vitro и ex vivo. Введение композиции или агента субъекту осуществляют любым подходящим путем, включая перорально, через легкие, интраназально, парентерально (внутривенно, внутримышечно, внутрибрюшинно или подкожно), ректально, введение в лимфатическую систему, внутрь опухоли или местно. Введение субъекту композиции или агента осуществляют с помощью электропорации. Введение включает самостоятельное введение и введение другим лицом. Введение может быть осуществлено любым подходящим путем. Подходящий путь введения позволяет композиции или агенту выполнять их предусмотренную функцию. Например, если подходящим путем является внутривенный, композицию вводят путем введения указанной композиции или агента в вену субъекта.

[0059] В данном документе выражения «терапевтическое средство на основе нуклеиновой кислоты», «терапевтическая нуклеиновая кислота» и «ТНК» используются взаимозаменяемо и относятся к любому варианту терапевтического средства с использованием нуклеиновых кислот в качестве активного компонента терапевтического агента для лечения заболевания или нарушения. В данном документе указанные выражения относятся к терапевтическим средствам на основе РНК и терапевтическим средствам на основе ДНК. Неограничивающие примеры терапевтических средств на основе РНК включают мРНК, антисмысловую РНК и олигонуклеотиды, рибозимы, аптамеры, интерферирующие РНК (РНКи), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК). Неограничивающие примеры терапевтических средств на основе ДНК включают миникольцо ДНК, миниген, вирусную ДНК (например, геном лентивируса или ААВ) или невирусные синтетические ДНК-векторы, линейную дуплексную ДНК с замкнутыми концами (зкДНК/CELiD), плазмиды, бакмиды, ДНК-векторы doggybone (dbDNA™), минималистичный вектор для иммунологически определенной экспрессии гена (MIDGE), невирусный ДНК-вектор с минимальной цепью (линейный ковалентно замкнутый ДНК-вектор) или гантелеобразный минимальный ДНК-вектор («гантелеобразную ДНК»).

[0060] В данном документе «эффективное количество» или «терапевтически эффективное количество» терапевтического агента, такого как терапевтический белок FVIII или его фрагмент, представляет собой количество, достаточное для получения целевого эффекта, например, лечения или предотвращения гемофилии А. Подходящие анализы для измерения экспрессии целевого гена или целевой последовательности включают, например, исследование уровней белка или РНК с применением методик, известных специалистам в данной области техники, таких как дот-блоттинг, Нозерн-блоттинг, гибридизация in situ, ИФА, иммунопреципитация, функциональный ферментный анализ, а также фенотипические анализы, известные специалистам в данной области техники. Однако уровни дозировки основаны на различных факторах, включая тип повреждения, возраст, массу тела, пол, медицинское состояние пациента, тяжесть состояния, путь введения и конкретный применяемый активный агент. Соответственно, схема дозирования может значительно изменяться, однако может быть определена обычным путем лечащим врачом с применением стандартных способов. Кроме того, термины «терапевтическое количество», «терапевтически эффективные количества» и «фармацевтически эффективные количества» включают профилактические или превентивные количества композиций согласно описанному изобретению. В профилактических или превентивных приложениях описанного изобретения фармацевтические композиции или лекарственные средства вводят пациенту, подверженному или по иным причинам имеющему риск развития заболевания, нарушения или состояния, в количестве, достаточном для того чтобы устранить или уменьшить риск, уменьшить степень тяжести или отсрочить начало указанного заболевания, нарушения или состояния, включая биохимические, гистологические и/или поведенческие симптомы указанного заболевания, нарушения или состояния, его осложнения, и промежуточные патологические фенотипы, возникающие в ходе развития указанного заболевания, нарушения или состояния. Обычно предпочтительным является применение максимальной дозы, т.е. самой высокой безопасной дозы в соответствии с некоторым медицинским заключением. В соответствии с некоторыми вариантами реализации заболевание, нарушение или состояние представляет собой гемофилию А. Термины «доза» и «дозировка» используются в данном документе взаимозаменяемо.

[0061] В данном документе термин «терапевтический эффект» относится к последствиям лечения, результаты которого оценивают как целевые и благоприятные. Терапевтический эффект может включать, прямо или опосредованно, остановку, уменьшение или устранение проявления заболевания. Терапевтический эффект также может включать, прямо или опосредованно, остановку, уменьшение или устранение прогрессирования проявления заболевания.

[0062] Для любого терапевтического агента, описанного в данном документе, терапевтически эффективное количество может быть изначально определено на основании предварительных исследований in vitro и/или в моделях на животных. Терапевтически эффективная доза также может быть определена на основании данных у человека. Применяемая доза может быть скорректирована на основании относительных биодоступности и эффективности вводимого соединения. Коррекция дозы для достижения максимальной эффективности на основе описанных выше способов и других хорошо известных способов находится в пределах возможностей обычного специалиста в данной области техники. Общие принципы определения терапевтической эффективности, с которыми можно ознакомиться в главе 1 руководства Goodman and Oilman, The Pharmacological Basis of Therapeutics, 10 изд., McGraw-Hill (New York) (2001), включенного в данный документ посредством ссылки, обобщены ниже.

[0063] Фармакокинетические принципы обеспечивают основу для модификации схемы дозирования для получения целевой степени терапевтической эффективности с минимумом неприемлемых нежелательных явлений. Дополнительные рекомендации по модификации дозировки могут быть получены в ситуациях, когда концентрация лекарственного средства в плазме может быть измерена и соотнесена с терапевтическим окном.

[0064] В данном документе термины «гетерологичная нуклеотидная последовательность» и «трансген» используются взаимозаменяемо и относятся к представляющей интерес нуклеиновой кислоте (отличной от нуклеиновой кислоты, кодирующей полипептид капсида), которая встроена в зкДНК-вектор и может быть доставлена и экспрессирована зкДНК-вектором, раскрытым в данном документе.

[0065] В данном документе термины «экспрессионная кассета» и «транскрипционная кассета» используются взаимозаменяемо и относятся к линейному участку нуклеиновых кислот, который включает трансген, функционально связанный с одним или более промоторами или другими регуляторными последовательностями, достаточными для направления транскрипции трансгена, но который не содержит кодирующих капсид последовательностей, других векторных последовательностей или областей инвертированных концевых повторов. Экспрессионная кассета может дополнительно содержать одну или более цис-действующих последовательностей (например, промоторов, энхансеров или репрессоров), один или более интронов и один или более посттранскрипционных регуляторных элементов.

[0066] Термины «полинуклеотид» и «нуклеиновая кислота», используемые в данном документе взаимозаменяемо, относятся к полимерной форме нуклеотидов любой длины, будь то рибонуклеотиды или дезоксирибонуклеотиды. Таким образом, этот термин включает одно-, двух- или многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, включающий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания. «Олигонуклеотид» обычно относится к полинуклеотидам, содержащим от примерно 5 до примерно 100 нуклеотидов одно- или двухцепочечной ДНК. Однако для целей настоящего раскрытия верхнего предела длины олигонуклеотида не существует. Олигонуклеотиды также известны как «олигомеры» или «олиго» (oligos) и могут быть выделены из генов или химически синтезированы с помощью способов, известных в данной области техники. Термины «полинуклеотид» и «нуклеиновая кислота» следует понимать как включающие, применительно к описываемым вариантам реализации, одноцепочечные (такие как смысловые или антисмысловые) и двухцепочечные полинуклеотиды. ДНК может быть в форме, например, антисмысловых молекул, плазмидной ДНК, дуплексов ДНК-ДНК, предварительно конденсированной ДНК, продуктов ПЦР, векторов (Р1, РАС, ВАС, ΥАС, искусственные хромосомы), экспрессионных кассет, химерных последовательностей, хромосомной ДНК или производных и комбинаций указанных групп. ДНК может быть в форме миникольца, плазмиды, бакмиды, минигена, ДНК с минимальной цепью (линейного ковалентно замкнутого ДНК-вектора), линейной дуплексной ДНК с замкнутыми концами (CELiD или зкДНК), ДНК doggybone (dbDNA™), гантелеобразной ДНК, минималистичного вектора для иммунологически определенной экспрессии гена (MIDGE), вирусного вектора или невирусных векторов. РНК может быть в форме короткой интерферирующей РНК (киРНК), дцРНК-субстрата Dicer, короткой шпилечной РНК (кшРНК), асимметричной интерферирующей РНК (аиРНК), микроРНК (миРНК), мРНК, рРНК, тРНК, вирусной РНК (вРНК) и их комбинаций. Нуклеиновые кислоты включают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки или связи остова, которые являются синтетическими, природными и неприродными, и которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Примеры таких аналогов и/или модифицированных остатков включают, без ограничения, фосфотиоаты, фосфодиамидат-морфолиновый олигомер (морфолино), фосфоамидаты, метилфосфонаты, хиральные метилфосфонаты, 2'-О-метилрибонуклеотиды, замкнутую нуклеиновую кислоту (LNA™) и пептидные нуклеиновые кислоты (ПНК). За исключением конкретно указанных ограничений термин включает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Если не указано иное, подразумевается также, что конкретная последовательность нуклеиновой кислоты также включает ее консервативно модифицированные варианты (например, вырожденные замены кодонов), аллели, ортологи, однонуклеотидные полиморфизмы (SNP) и комплементарные последовательности, а также последовательность, указанную явным образом.

[0067] «Нуклеотиды» содержат сахар дезоксирибозу (ДНК) или рибозу (РНК), основание и фосфатную группу. Нуклеотиды соединены между собой посредством фосфатных групп.

[0068] «Основания» включают пурины и пиримидины, которые, в частности, включают природные соединения аденин, тимин, гуанин, цитозин, урацил, инозин и природные аналоги, а также синтетические производные пуринов и пиримидинов, которые включают, но не ограничиваются перечисленными, модификации, которые вводят новые реакционноспособные группы, такие как, но не ограничиваясь перечисленными, амины, спирты, тиолы, карбоксилаты и алкилгалогениды.

[0069] В данном документе термин «интерферирующая РНК» или «РНКи», или «последовательность интерферирующей РНК» включает одноцепочечную РНК (например, зрелую миРНК, олигонуклеотиды оцРНКи, олигонуклеотиды оцДНКи), двухцепочечную РНК (т.е. дуплексную РНК, такую как киРНК, дцРНК-субстрат Dicer, кшРНК, аиРНК или пре-миРНК), гибрид ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941) или гибрид ДНК-ДНК (см., например, публикацию РСТ № WO 2004/104199), который способен уменьшать или ингибировать экспрессию целевого гена или последовательности (например, опосредуя разрушение или ингибируя трансляцию мРНК, которые комплементарны последовательности интерферирующей РНК), когда интерферирующая РНК находится в той же клетке, что и целевой ген или последовательность. Таким образом, интерферирующая РНК относится к одноцепочечной РНК, которая комплементарна последовательности мРНК-мишени, или к двухцепочечной РНК, образованной двумя комплементарными цепями или одной самокомплементарной цепью. Интерферирующая РНК может иметь существенную или полную идентичность с целевым геном или последовательностью или может содержать область несовпадения (т.е. мотив несовпадения). Последовательность интерферирующей РНК может соответствовать полноразмерному целевому гену или его подпоследовательности. Предпочтительно молекулы интерферирующих РНК синтезируют химическим путем. Раскрытия каждого из упомянутых выше патентных документов полностью включены в данный документ посредством ссылки для всех целей.

[0070] Интерферирующая РНК включает «короткую интерферирующую РНК» или «киРНК», например, интерферирующую РНК из примерно 15-60, 15-50 или 15-40 (дуплекс) нуклеотидов в длину, более типично примерно 15-30, 15-25 или 19-25 (дуплекс) нуклеотидов в длину и предпочтительно составляет примерно 20-24, 21-22 или 21-23 (дуплекс) нуклеотида в длину (например, каждая комплементарная последовательность двухцепочечной киРНК составляет 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 нуклеотидов в длину, предпочтительно примерно 20-24, 21-22 или 21-23 нуклеотида в длину, и двухцепочечная киРНК составляет примерно 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 пар оснований в длину, предпочтительно примерно 18-22, 19-20 или 19-21 пару оснований в длину). Дуплексы киРНК могут содержать 3'-липкие концы, имеющие от примерно 1 до примерно 4 нуклеотидов или от примерно 2 до примерно 3 нуклеотидов, и 5-фосфатные концы. Примеры киРНК включают, без ограничения, двухцепочечную полинуклеотидную молекулу, собранную из двух одноцепочечных молекул, причем одна цепь является смысловой цепью, а другая представляет собой комплементарную антисмысловую цепь; двухцепочечную полинуклеотидную молекулу, собранную из одноцепочечной молекулы, в которой смысловая и антисмысловая области соединены линкером на основе нуклеиновой кислоты или на основе, отличной от нуклеиновой кислоты; двухцепочечную полинуклеотидную молекулу со шпилечной вторичной структурой, имеющей самокомплементарные смысловые и антисмысловые области; и кольцевую одноцепочечную полинуклеотидную молекулу с двумя или более петлевыми структурами и стеблем, имеющим самокомплементарные смысловые и антисмысловые области, причем кольцевой полинуклеотид может подвергаться процессингу in vivo или in vitro с получением активной двухцепочечной молекулы киРНК. В данном документе термин «киРНК» включает дуплексы РНК-РНК, а также гибриды ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941).

[0071] В данном документе термин «конструкция нуклеиновой кислоты» относится к молекуле нуклеиновой кислоты, будь то одноцепочечная или двухцепочечная, которая выделена из природного гена или которая модифицирована так, чтобы она содержала сегменты нуклеиновых кислот, с помощью способа, который в прочих случаях не существовал бы в природе, или является синтетической. Термин «конструкция нуклеиновой кислоты» является синонимом термина «экспрессионная кассета», когда конструкция нуклеиновой кислоты содержит контрольные последовательности, необходимые для экспрессии кодирующей последовательности согласно настоящему раскрытию. «Экспрессионная кассета» включает кодирующую последовательность ДНК, функционально связанную с промотором.

[0072] Под «гибридизуемая» или «комплементарная» или «по существу комплементарная» подразумевается, что нуклеиновая кислота (например, РНК) включает последовательность нуклеотидов, которая позволяет ей нековалентно связываться, т.е. формировать пары оснований по Уотсону-Крику и/или пары оснований G/U, «ренатурировать» или «гибридизироваться» с другой нуклеиновой кислотой специфичным для последовательности, антипараллельным образом (т.е. нуклеиновая кислота специфично связывается с комплементарной нуклеиновой кислотой) в соответствующих условиях температуры и ионной силы раствора in vitro и/или in vivo. Как известно в данной области техники, стандартное спаривание оснований по Уотсону-Крику включает: спаривание аденина (А) с тимидином (Т), спаривание аденина (А) с урацилом (U) и спаривание гуанина (G) с цитозином (С). Кроме того, в данной области техники также известно, что при гибридизации двух молекул РНК (например, дцРНК) гуаниновое (G) основание спаривается с урацилом (U). Например, спаривание оснований G/U частично отвечает за вырожденность (т.е. избыточность) генетического кода в случае спаривания оснований анти-кодонов тРНК с кодонами в мРНК. Применительно к настоящему раскрытию гуанин (G) связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению считается комплементарным урацилу (U), и наоборот. Таким образом, когда пара оснований G/U может быть получена в определенном нуклеотидном положении связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению, это положение не рассматривается как некомплементарное, а вместо этого считается комплементарным.

[0073] Термины «пептид», «полипептид» и «белок» используются в данном документе взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты, и полипептиды, имеющие модифицированные пептидные остовы.

[0074] Последовательность ДНК, которая «кодирует» конкретный белок FVIII, представляет собой последовательность нуклеиновой кислоты ДНК, которая транскрибируется в конкретную РНК и/или белок. Полинуклеотид ДНК может кодировать РНК (мРНК), которая транслируется в белок, или полинуклеотид ДНК может кодировать РНК, которая не транслируется в белок (например, тРНК, рРНК или нацеливающую на ДНК РНК; также называемые «некодирующими» РНК или «нкРНК»).

[0001] В данном документе термин «слитый белок», в используемом в данном документе значении, относится к полипептиду, который содержит белковые домены по меньшей мере из двух разных белков. Например, слитый белок может содержать (i) FVIII или его фрагмент и (ii) по меньшей мере один белок, не относящийся к GOI. Слитые белки, охватываемые данным документом, включают, но не ограничиваются перечисленными, антитело или Fc или антигенсвязывающий фрагмент антитела, слитый с белком FVIII, например, внеклеточным доменом рецептора, лигандом, ферментом или пептидом. Белок FVIII или его фрагмент, который является частью слитого белка, может представлять собой моноспецифичное антитело или биспецифичное или мультиспецифичное антитело.

[0075] В данном документе термин «ген безопасной гавани генома» или «ген безопасной гавани» относится к гену или локусам, в которые последовательность нуклеиновой кислоты может быть вставлена так, чтобы последовательность могла интегрироваться и функционировать предсказуемым образом (например, экспрессировать белок, представляющий интерес) без существенных отрицательных последствий для активности эндогенного гена или стимуляции рака. Согласно некоторым вариантам реализации ген безопасной гавани также представляет собой локусы или ген, в которых вставленная последовательность нуклеиновой кислоты может экспрессироваться эффективнее и на более высоких уровнях, чем в сайте, не являющемся «безопасной гаванью».

[0076] В данном документе термин «доставка гена» означает способ, с помощью которого чужеродную ДНК переносят в клетки-хозяева для приложений генной терапии.

[0077] В данном документе термин «концевой повтор» или «TR» включает любой вирусный концевой повтор или синтетическую последовательность, которая содержит по меньшей мере одну минимальную требуемую точку начала репликации и область, содержащую палиндромную шпилечную структуру. Связывающая Rep последовательность («RBS») (также называемая RBE (связывающий Rep элемент)) и сайт концевого разрешения («TRS») вместе составляют «минимальную требуемую точку начала репликации» и, соответственно, TR содержит по меньшей мере одну RBS и по меньшей мере один TRS. Каждый из TR, обратно комплементарных по отношению друг к другу в пределах определенного участка полинуклеотидной последовательности, как правило, называют «инвертированным концевым повтором» или «ITR». Применительно к вирусу ITR опосредуют репликацию, упаковку вируса, интеграцию и освобождение провируса. Как было неожиданно обнаружено, согласно настоящему изобретению TR, которые не являются обратно комплементарными по всей их длине, все еще могут выполнять обычные функции ITR и, таким образом, в данном документе термин ITR относится к TR в геноме зкДНК или зкДНК-векторе, который способен опосредовать репликацию зкДНК-вектора. Обычный специалист в данной области техники поймет, что в зкДНК-векторах сложной конфигурации может присутствовать более двух пар ITR или асимметричных ITR. ITR может представлять собой ITR ААВ или ITR, не принадлежащий ААВ, или может быть получен из ITR ААВ или ITR, не принадлежащего ААВ. Например, ITR может происходить из семейства Parvoviridae, которое включает парвовирусы и депендовирусы (например, собачий парвовирус, бычий парвовирус, мышиный парвовирус, свиной парвовирус, парвовирус человека В-19), или шпилька SV40, которая служит точкой начала репликации SV40, может применяться в качестве ITR, который может быть дополнительно модифицирован путем усечения, замены, делеции, вставки и/или добавления. Вирусы семейства Parvoviridae состоят из двух подсемейств: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих беспозвоночных. Депендопарвовирусы включают вирусное семейство аденоассоциированных вирусов (ААВ), которые способны к репликации у позвоночных животных-хозяев, включая, но не ограничиваясь перечисленными, человека, виды приматов, бычьих, собачьих, лошадиных и овечьих. Для удобства в данном документе ITR, расположенный в 5-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».

[0078] «ITR дикого типа» или «WT-ITR» относится к последовательности природной последовательности ITR в ААВ или другом депендовирусе, которая сохраняет, например, активность связывания Rep и никирующую способность Rep. Нуклеотидная последовательность WT-ITR из любого серотипа ААВ может незначительно отличаться от канонической природной последовательности из-за вырожденности генетического кода или дрейфа, и, таким образом, последовательности WT-ITR, предусмотренные для применения в данном документе, включают последовательности WT-ITR, образующиеся в результате природных изменений, происходящих в процессе продуцирования (например, ошибки репликации).

[0079] В данном документе термин «по существу симметричные WT-ITR» или «пара по существу симметричных WT-ITR» относится к паре WT-ITR в одном геноме зкДНК или зкДНК-векторе, которые оба представляют собой ITR дикого типа, которые имеют обратно комплементарные последовательности по всей их длине. Например, ITR может считаться последовательностью дикого типа, даже если он содержит один или более нуклеотидов, отличающихся от канонической природной последовательности, при условии, что указанные изменения не влияют на свойства и общую трехмерную структуру последовательности. Согласно некоторым аспектам отличающиеся нуклеотиды представляют собой консервативные изменения последовательности. В качестве одного неограничивающего примера, последовательность, имеющая по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной, например, с использованием BLAST при настройках по умолчанию), также имеет симметричную трехмерную пространственную организацию с другой последовательностью WT-ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. По существу симметричный WT-ITR содержит одинаковые петли А, С-С' и В-В' в трехмерном пространстве. То, что по существу симметричный WT-ITR представляет собой WT, может быть функционально подтверждено путем определения наличия в нем функционального сайта связывания Rep (RBE или RBE') и сайта концевого разрешения (TRS), который спаривается с соответствующим белком Rep. Могут быть протестированы другие функции, включая экспрессию трансгена в пермиссивных условиях, но необязательно.

[0080] В данном документе выражения «модифицированный ITR» или «mod-ITR», или «мутантный ITR» используются в данном документе взаимозаменяемо и относятся к ITR, который содержит мутацию по меньшей мере в одном или более нуклеотидах по сравнению с WT-ITR из того же серотипа. Указанная мутация может приводить к изменению в одной или более из областей А, С, С', В, В' в ITR и может приводить к изменению трехмерной пространственной организации (т.е. его трехмерной структуры в геометрическом пространстве) по сравнению с трехмерной пространственной организацией WT-ITR из того же серотипа.

[0081] В данном документе термин «асимметричные ITR», также называемые «парами асимметричных ITR», относится к паре ITR в одном геноме зкДНК или зкДНК-векторе, которые не являются обратно комплементарными по их полной длине. В качестве одного неограничивающего примера, асимметричный ITR в паре не имеет симметричной трехмерной пространственной организации со своим когнатным ITR так, что их трехмерные структуры имеют разные формы в геометрическом пространстве. Другими словами, асимметричные ITR в паре имеют разные общие геометрические структуры, т.е. они имеют разную организацию их петель А, С-С' и В-В' в трехмерном пространстве (например, один ITR может иметь короткое плечо С-С' и/или короткое плечо В-В' по сравнению с когнатным ITR). Различие по последовательности между двумя ITR может быть обусловлено добавлением, делецией, усечением или точечной мутацией одного или более нуклеотидов. Согласно одному варианту реализации один ITR из пары асимметричных ITR может представлять собой последовательность ITR дикого типа ААВ, а другой ITR представляет собой модифицированный ITR, как определено в данном документе (например, последовательность ITR, не относящуюся к дикому типу, или синтетическую последовательность). Согласно другому варианту реализации ни один ITR из пары асимметричных ITR не является последовательностью ААВ дикого типа, и указанные два ITR представляют собой модифицированные ITR, которые имеют разные формы в геометрическом пространстве (т.е. разную общую геометрическую структуру). Согласно некоторым вариантам реализации один mod-ITR из пары асимметричных ITR может иметь короткое плечо С-С', а другой ITR может иметь другую модификацию (например, одно плечо или короткое плечо В-В' и т.д.) так, что они имеют различную трехмерную пространственную организацию по сравнению с когнатным асимметричным mod-ITR.

[0082] В данном документе термин «симметричные ITR» относится к паре ITR в одном зкДНК-геноме или зкДНК-векторе, которые представляют собой последовательности дикого типа или мутированные (например, модифицированные относительно дикого типа) депендовирусные последовательности ITR и обратно комплементарны по всей их длине. В одном неограничивающем примере оба ITR представляют собой последовательности ITR дикого типа из ААВ2. В другом примере ни один из ITR не является последовательностью ITR дикого типа ААВ2 (т.е. они представляют собой модифицированные ITR, также называемые мутантными ITR) и может отличаться по последовательности от ITR дикого типа вследствие добавления, делеции, замены, усечения или точечной мутации нуклеотида. Для удобства в данном документе ITR, расположенный в 5'-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3'-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».

[0083] В данном документе термин «по существу симметричные модифицированные ITR» или «пара по существу симметричных mod-ITR» относится к паре модифицированных ITR в одном геноме зкДНК или зкДНК-векторе, которые оба имеют обратно комплементарные последовательности по всей их длине. Например, модифицированный ITR может считаться по существу симметричным, даже если он имеет некоторые нуклеотидные последовательности, отличающиеся от обратно комплементарной последовательности, при условии, что указанные изменения не влияют на свойства и общую форму. В качестве одного неограничивающего примера представлена последовательность, которая имеет по меньшей мере 85%, 90%, 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной с помощью BLAST при настойках по умолчанию), а также имеет симметричную трехмерную пространственную организацию в отношении ее когнатного модифицированного ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. Иными словами, пара по существу симметричных модифицированных ITR имеет одинаково организованные в трехмерном пространстве петли А, С-С' и В-В'. Согласно некоторым вариантам реализации ITR из пары mod-ITR могут иметь разные обратно комплементарные нуклеотидные последовательности, но все же иметь одинаковую симметричную трехмерную пространственную организацию, т.е. оба ITR содержат мутации, которые приводят к одинаковой общей трехмерной форме. Например, один ITR (например, 5'-ITR) в паре mod-ITR может происходить из одного серотипа, а другой ITR (например, 3'-ITR) может происходить из другого серотипа, однако оба могут иметь одинаковую соответствующую мутацию (например, если 5'-ITR имеет делецию в области С, то когнатный модифицированный 3'-ITR из другого серотипа имеет делецию в соответствующем положении в области С') так, что пара модифицированных ITR имеет одинаковую симметричную трехмерную пространственную организацию. Согласно таким вариантам реализации каждый ITR в паре модифицированных ITR может происходить из разных серотипов (например, ААВ1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12), таких как комбинация ААВ2 и ААВ6, при этом модификация в одном ITR отображается в соответствующем положении в когнатном ITR из другого серотипа. Согласно одному варианту реализации пара по существу симметричных модифицированных ITR относится к паре модифицированных ITR (mod-ITR) при условии, что различие в нуклеотидных последовательностях между указанными ITR не влияет на свойства или общую форму, и они имеют по существу одинаковую форму в трехмерном пространстве. В качестве неограничивающего примера представлен mod-ITR, который имеет по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с каноническим mod-ITR, как определено с помощью стандартных способов, хорошо известных в данной области техники, таких как BLAST (Basic Local Alignment Search Tool) или BLASTN, при настройках по умолчанию, а также имеет симметричную трехмерную пространственную организацию так, что их трехмерная структура имеет одинаковую форму в геометрическом пространстве. Пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR.

[0084] Термин «фланкирование» относится к относительному положению одной последовательности нуклеиновой кислоты по отношению к другой последовательности нуклеиновой кислоты. Обычно в последовательности ABC А и С фланкируют В. То же самое верно для расположения АхВхС. Соответственно, фланкирующая последовательность предшествует фланкируемой последовательности или следует за ней, но не обязательно должна быть смежной с фланкируемой последовательностью или непосредственно прилегать к ней. Согласно одному варианту реализации термин «фланкирование» относится к концевым повторам на каждом конце линейного дуплексного зкДНК-вектора.

[0085] В данном документе термины «лечить», «осуществлять лечение» и/или «лечение» включают подавление, по существу ингибирование, замедление или обращение прогрессирования состояния, по существу облегчение клинических симптомов состояния или по существу предотвращение появления клинических симптомов состояния, получение благоприятных или целевых клинических результатов. В соответствии с некоторыми вариантами реализации состояние представляет собой гемофилию А. Лечение также относится к достижению одного или более из следующих: (а) уменьшения степени тяжести нарушения; (b) ограничения развития симптомов, характерных для нарушения (ий), которое лечат; (с) ограничения ухудшения симптомов, характерных для нарушения (ий), которое лечат; (d) ограничения рецидивирования нарушения (ий) у пациентов, ранее имевших указанное нарушение (ия); и (е) ограничения рецидивирования симптомов у пациентов, ранее не имевших симптомов указанного нарушения (ий). Благоприятные или целевые клинические результаты, такие как фармакологические и/или физиологические эффекты, включают, но не ограничиваются перечисленными, предотвращение наступления заболевания, нарушения или состояния у субъекта, который может быть предрасположен к указанному заболеванию, нарушению или состоянию, но еще не испытывает симптомов или у него еще не проявляются симптомы указанного заболевания (профилактическое лечение), облегчение симптомов указанного заболевания, нарушения или состояния, уменьшение интенсивности заболевания, нарушения или состояния, стабилизацию (т.е., отсутствие ухудшения) указанного заболевания, нарушения или состояния, предотвращение распространения указанного заболевания, нарушения или состояния, задержку или замедление прогрессирования указанного заболевания, нарушения или состояния, облегчение или временное облегчение указанного заболевания, нарушения или состояния, и комбинации перечисленных, а также увеличение продолжительности выживания по сравнению с ожидаемым выживанием без лечения.

[0086] В данном документе термин «увеличение», «усиление», «повышение» (и подобные термины) обычно относится к акту увеличения, прямо или опосредовано, концентрации, уровня, функции, активности или поведения относительно природного, ожидаемого или среднего, или относительно контрольного состояния.

[0087] В данном документе термин «минимизировать», «уменьшать», «снижать» и/или «ингибировать» (и подобные термины) обычно относится к акту уменьшения, прямо или опосредовано, концентрации, уровня, функции, активности, поведения относительно природного, ожидаемого, среднего, или относительно контрольного состояния.

[0088] В данном документе термин «зкДНК-геном» относится к экспрессионной кассете, которая дополнительно включает по меньшей мере одну область инвертированного концевого повтора. ЗкДНК-геном может дополнительно содержать одну или более спейсерных областей. Согласно некоторым вариантам реализации зкДНК-геном включен в виде межмолекулярного дуплексного полинуклеотида ДНК в плазмиду или вирусный геном.

[0089] В данном документе термин «спейсерная область зкДНК» относится к промежуточной последовательности, которая разделяет функциональные элементы в зкДНК-векторе или геноме зкДНК. Согласно некоторым вариантам реализации спейсерные области зкДНК удерживают два функциональных элемента на целевом расстоянии для оптимальной функциональности. Согласно некоторым вариантам реализации спейсерные области зкДНК обеспечивают или увеличивают генетическую стабильность зкДНК-генома, например, в плазмиде или бакуловирусе. Согласно некоторым вариантам реализации спейсерные области зкДНК облегчают подготовленные генетические манипуляции с зкДНК-геномом, обеспечивая удобное расположение для сайтов клонирования и т.п. Например, согласно определенным аспектам олигонуклеотидный «полилинкер», содержащий несколько сайтов рестрикционных эндонуклеаз, или последовательность не из открытой рамки считывания, сконструированная так, чтобы в ней отсутствовали известные сайты связывания белка (например, транскрипционного фактора), могут быть размещены в зкДНК-геноме для разделения цис-действующих факторов, например, с помощью 6-членной, 12-членной, 18-членной, 24-членной, 48-членной, 86-членной, 176-членной вставки и т.д. между сайтом концевого разрешения и расположенным в 5-направлении транскрипционным регуляторным элементом. Аналогичным образом, спейсер может быть встроен между последовательностью сигнала полиаденилирования и 3'-сайтом концевого разрешения.

[0090] В данном документе термины «сайт связывания Rep», «элемент связывания Rep», «RBE» и «RBS» используются взаимозаменяемо и относятся к сайту связывания белка Rep (например, Rep 78 ААВ или Rep 68 ААВ), который после связывания белком Rep позволяет белку Rep выполнять его сайт-специфичную эндонуклеазную активность в отношении последовательности, включающей RBS. Последовательность RBS и ее обратно комплементарная последовательность вместе образуют один RBS. Последовательности RBS известны в данной области техники и включают, например, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), представляющую собой последовательность RBS, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность RBS, включая другие известные последовательности RBS ААВ и другие известные природные или синтетические последовательности RBS. Не ограничиваясь какой-либо теорией, считается, что нуклеазный домен белка Rep связывается с дуплексной нуклеотидной последовательностью GCTC и, соответственно, происходит прямое связывание и стабильная сборка двух известных белков Rep ААВ на дуплексном олигонуклеотиде 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3' (SEQ ID NO: 60). Кроме того, растворимые агрегированные конформеры (т.е. неопределенное число взаимосвязанных белков Rep) диссоциируют и связываются с олигонуклеотидами, которые содержат сайты связывания Rep. Каждый белок Rep взаимодействует как с азотистыми основаниями, так и с фосфодиэфирным остовом на каждой цепи. Взаимодействия с азотистыми основаниями обеспечивают специфичность в отношении последовательности, в то время как взаимодействия с фосфодиэфирным остовом неспецифичны или менее специфичны в отношении последовательности и стабилизируют комплекс белка с ДНК.

[0091] В данном документе термины «сайт концевого разрешения» и «TRS» используются в данном документе взаимозаменяемо и относятся к области, в которой Rep образует тирозин-фосфодиэфирную связь с 5'-тимидином с образованием 3'-ОН, который служит субстратом для удлинения ДНК с помощью клеточной ДНК-полимеразы, например, ДНК-полимеразы дельта или ДНК-полимеразы эпсилон. В качестве альтернативы, комплекс Rep-тимидин может принимать участие в скоординированной реакции лигирования. Согласно некоторым вариантам реализации TRS включает, как минимум, неспаренный тимидин. Согласно некоторым вариантам реализации никирующую эффективность TRS по меньшей мере отчасти можно контролировать за счет расстояния между ним и RBS в пределах одной молекулы. Если акцепторный субстрат представляет собой комплементарный ITR, тогда полученный продукт представляет собой внутримолекулярный дуплекс. Последовательности TRS известны в данной области техники и включают, например, 5'-GGTTGA-3' (SEQ ID NO: 61), представляющую собой гексануклеотидную последовательность, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность TRS, включая другие известные последовательности TRS ААВ и другие известные природные или синтетические последовательности TRS, такие как AGTT (SEQ ID NO: 62), GGTTGG (SEQ ID NO: 63), AGTTGG (SEQ ID NO: 64), AGTTGA (SEQ ID NO: 65), и другие мотивы, такие как RRTTRR (SEQ ID NO: 66).

[0092] В данном документе термин «зкДНК-плазмида» относится к плазмиде, которая содержит зкДНК-геном в виде межмолекулярного дуплекса.

[0093] В данном документе термин «зкДНК-бакмида» относится к геному инфекционного бакуловируса, содержащему зкДНК-геном в виде межмолекулярного дуплекса, который способен размножаться в Е. coli в виде плазмиды и, соответственно, может выполнять роль челночного вектора для бакуловируса.

[0094] В данном документе термин «зкДНК-бакуловирус» относится к бакуловирусу, который содержит зкДНК-геном в виде межмолекулярного дуплекса в геноме бакуловируса.

[0095] В данном документе термины «инфицированная зкДНК-бакуловирусом клетка насекомого» и «зкДНК-ВПС» используются взаимозаменяемо и относятся к клетке беспозвоночного животного-хозяина (включая, но не ограничиваясь этим, клетку насекомого (например, клетку Sf9)), инфицированной зкДНК-бакуловирусом.

[0096] В данном документе термин «зкДНК» относится к бескапсидной линейной двухцепочечной (дц) дуплексной ДНК с замкнутыми концами для невирусного переноса генов, синтетической или другой. Подробное описание зкДНК приведено в международной заявке PCT/US 2017/020828, поданной 3 марта 2017 г., содержание которой полностью явным образом включено в данный документ посредством ссылки. Некоторые способы получения зкДНК, содержащей различные последовательности и конфигурации инвертированных концевых повторов (ITR), с использованием клеточных методов описаны в Примере 1 международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., каждая из которых полностью включена в данный документ посредством ссылки. Некоторые способы получения синтетических зкДНК-векторов, содержащих различные последовательности и конфигурации ITR, описаны, например, в международной заявке PCT/US 2019/14122, поданной 18 января 2019 г., содержание которой полностью включено в данный документ посредством ссылки.

[0097] В данном документе термин «ДНК-вектор с замкнутыми концами» относится к бескапсидному ДНК-вектору по меньшей мере с одним ковалентно замкнутым концом, причем по меньшей мере часть вектора имеет структуру внутримолекулярного дуплекса.

[0098] В данном документе термины «зкДНК-вектор» и «зкДНК» используются взаимозаменяемо и относятся к ДНК-вектору с замкнутыми концами, содержащему по меньшей мере один концевой палиндром. Согласно некоторым вариантам реализации зкДНК содержит два ковалентно замкнутых конца.

[0099] В данном документе термин «нзДНК» или «никированная зкДНК» относится к ДНК с замкнутыми концами, содержащей одноцепочечный разрыв или пропуск размером 1-100 пар оснований в области «стебля» или спейсерной области, расположенной в 5'-направлении относительно открытой рамки считывания (например, промотора и трансгена, подлежащего экспрессии).

[00100] В данном документе термины «пропуск» и «одноцепочечный разрыв» используются взаимозаменяемо и относятся к прерванной части синтетического ДНК-вектора согласно настоящему изобретению, создавая участок части одноцепочечной ДНК в двухцепочечной в других местах зкДНК. Пропуск может иметь от 1 пары оснований до 100 пар оснований в длину в одной цепи дуплексной ДНК. Типичные пропуски, разработанные и созданные с применением способов, описанных в данном документе, и синтетические векторы, полученные с применением указанных способов, могут иметь, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 или 60 пар оснований в длину. Примерные пропуски в настоящем раскрытии могут иметь от 1 пары оснований до 10 пар оснований в длину, от 1 до 20 пар оснований в длину, от 1 до 30 пар оснований в длину.

[00101] Как определено в данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.

[00102] В данном документе термины «смысловой» и «антисмысловой» относятся к ориентации структурного элемента на полинуклеотиде. Смысловой и антисмысловой варианты элемента обратно комплементарны друг другу.

[00103] В данном документе термин «синтетический ААВ-вектор» и «получение ААВ-вектора синтетическим путем» относится к ААВ-вектору и синтетическим способам его получения в полностью бесклеточной среде.

[00104] В данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.

[00105] В данном документе термин «эффекторный белок» относится к полипептиду, который обеспечивает детектируемый показатель, либо, например, как репортерный полипептид, либо, более предпочтительно, как полипептид, уничтожающий клетку, например, токсин, или агент, придающий клетке чувствительность к уничтожению выбранным агентом или при его отсутствии. Эффекторные белки включают любой белок или пептид, который непосредственно нацелен на ДНК и/или РНК клетки-хозяина или повреждает их. Например, эффекторные белки могут включать, но не ограничиваются перечисленными, рестрикционную эндонуклеазу, которая нацелена на последовательность ДНК клетки-хозяина (будь то геномный или внехромосомный элемент), протеазу, которая расщепляет полипептид-мишень, необходимый для выживания клетки, ингибитор ДНК-гиразы и токсин рибонуклеазного типа. Согласно некоторым вариантам реализации экспрессия эффекторного белка, контролируемая синтетическим биологическим контуром, описанным в данном документе, может принимать участие в качестве фактора в другом синтетическом биологическом контуре, что расширяет диапазон и сложность восприимчивости системы биологического контура.

[00106] Транскрипционные регуляторы относятся к транскрипционным активаторам и репрессорам, которые либо активируют, либо репрессируют транскрипцию представляющего интерес гена, такого как FVIII. Промоторы представляют собой области нуклеиновой кислоты, которые инициируют транскрипцию конкретного гена. Транскрипционные активаторы, как правило, связываются поблизости от транскрипционных промоторов и привлекают РНК-полимеразу для непосредственной инициации транскрипции. Репрессоры связываются с транскрипционными промоторами и стерически затрудняют инициацию транскрипции РНК-полимеразой. Другие транскрипционные регуляторы могут служить либо активаторами, либо репрессорами в зависимости от места их связывания и условий в клетке и в окружающей среде. Неограничивающие примеры классов транскрипционных регуляторов включают, но не ограничиваются перечисленными, белки гомеодомена, белки с цинковыми пальцами, белки с мотивом «крылатая спираль» (белки Forkhead) и белки с лейциновой молнией.

[00107] В данном документе «репрессорный белок» или «индукторный белок» представляет собой белок, который связывается с элементом регуляторной последовательности и репрессирует или активирует, соответственно, транскрипцию последовательностей, функционально связанных с указанным элементом регуляторной последовательности. Предпочтительные репрессорные и индукторные белки, описанные в данном документе, чувствительны к присутствию или отсутствию по меньшей мере одного вносимого агента или фактора внешней среды. Предпочтительные белки, описанные в данном документе, являются модульными по форме и содержат, например, отделяемые ДНК-связывающие и связывающие вводимые агенты, или реагирующие на них, элементы или домены.

[00108] В данном документе термин «носитель» включает любые и все возможные растворители, дисперсионные среды, основы, покрытия, разбавители, антибактериальные и противогрибковые агенты, изотонические и замедляющие абсорбцию агенты, буферы, растворы-носители, суспензии, коллоиды и т.п. Применение таких сред и агентов для фармацевтически активных веществ хорошо известно в данной области техники. В композиции также могут быть включены вспомогательные активные ингредиенты. Выражение «фармацевтически приемлемый» относится к молекулярным частицам и композициям, которые не приводят к токсической, аллергической или схожей нежелательной реакции при введении хозяину.

[00109] В данном документе термин «домен, реагирующий на вводимый агент» представляет собой домен транскрипционного фактора, который связывает или иначе отвечает на условие или вводимый агент таким способом, который придает восприимчивость присоединенного к нему ДНК-связывающего слитого домена к наличию указанного условия или вводимого агента. Согласно одному варианту реализации наличие указанного условия или вводимого агента приводит к конформационному изменению в отвечающем на вводимый агент домене, или в белке, с которым он слит, которое модифицирует модулирующую транскрипцию активность транскрипционного фактора.

[00110] Термин «in vivo» относится к анализам или способам, которые реализуют на организме или в организме, таком как многоклеточное животное. Согласно некоторым аспектам, описанным в данном документе, считается, что способ или применение реализуют «in vivo», если используется одноклеточный организм, такой как бактерия. Термин «ех vivo» относится к способам и вариантам применения, которые выполняют с использованием живой клетки с интактной мембраной, находящейся вне организма многоклеточного животного или растения, например, эксплантатов, культивируемых клеток, включая первичные клетки и линии клеток, трансформированных линий клеток, а также экстрагированных тканей или клеток, включая клетки крови, помимо прочего. Термин «in vitro» относится к анализам и способам, которые не требуют присутствия клетки с интактной мембраной, например, клеточных экстрактов, и могут относиться к введению программируемого синтетического биологического контура в бесклеточной системе, такой как среда, не содержащая клеток или клеточных систем, таких как клеточные экстракты.

[00111] В данном документе термин «промотор» относится к любой последовательности нуклеиновой кислоты, которая регулирует экспрессию другой последовательности нуклеиновой кислоты за счет управления транскрипцией указанной последовательности нуклеиновой кислоты, которая может представлять собой гетерологичный целевой ген, кодирующий белок или РНК. Промоторы могут быть конститутивными, индуцируемыми, репрессируемыми, тканеспецифическими или могут представлять собой любую комбинацию перечисленных. Промотор представляет собой контрольную область последовательности нуклеиновой кислоты, в которой осуществляется контроль инициации и скорости транскрипции остальной части последовательности нуклеиновой кислоты. Промотор также может содержать генетические элементы, с которыми могут связываться регуляторные белки и молекулы, такие как РНК-полимераза и другие транскрипционные факторы. Согласно некоторым вариантам реализации аспектов, описанных в данном документе, промотор может управлять экспрессией транскрипционного фактора, который регулирует экспрессию самого промотора. В последовательности промотора может быть расположен сайт инициации транскрипции, а также связывающие белки домены, отвечающие за связывание РНК-полимеразы. Эукариотические промоторы часто, однако не всегда, будут содержать «ТАТА»-боксы и «САТ»-боксы. Различные промоторы, включая индуцируемые промоторы, могут применяться для управления экспрессией трансгенов в зкДНК-векторах, раскрытых в данном документе. Последовательность промотора может быть ограничена на ее 3'-конце сайтом инициации транскрипции и простирается в восходящем направлении (в 5'-направлении), включая минимальное количество оснований или элементов, необходимых для инициации транскрипции на уровнях, детектируемых выше фона.

[00112] В данном документе термин «энхансер» относится к цис-действующей регуляторной последовательности (например, 50-1500 пар оснований), которая связывает один или более белков (например, белки-активаторы или транскрипционный фактор) для повышения транскрипционной активации последовательности нуклеиновой кислоты. Энхансеры могут быть расположены на расстоянии до 1000000 пар оснований выше сайта начала гена или ниже сайта начала гена, который они регулируют. Энхансер может быть расположен в пределах интронной области или в экзонной области неродственного гена.

[00113] Можно сказать, что промотор управляет экспрессией или управляет транскрипцией последовательности нуклеиновой кислоты, которую он регулирует.Выражения «функционально связанный», «функционально расположенный», «с функциональной связью», «под контролем» и «под транскрипционным контролем» указывают, что промотор находится в корректном функциональном положении и/или ориентации относительно последовательности нуклеиновой кислоты, которую он регулирует, для контроля инициации транскрипции и/или экспрессии указанной последовательности. В данном документе «инвертированный промотор» относится к промотору, в котором последовательность нуклеиновой кислоты располагается в обратной ориентации так, что цепь, которая была смысловой, становится некодирующей цепью, и наоборот. Последовательности инвертированных промоторов могут применяться в различных вариантах реализации для регуляции состояния переключателя. Кроме того, согласно различным вариантам реализации промотор может применяться в сочетании с энхансером.

[00114] Промотор может представлять собой промотор, который в естественных условиях ассоциирован с геном или последовательностью, а также может быть получен путем выделения некодирующих 5'-последовательностей, расположенных в 5'-направлении относительно кодирующего сегмента и/или экзона определенного гена или последовательности. Такой промотор может быть назван «эндогенным». Аналогичным образом, согласно некоторым вариантам реализации, энхансер может быть представлен энхансером, который в естественных условиях ассоциирован с последовательностью нуклеиновой кислоты и расположен либо в 3', либо в 5'-направлении от указанной последовательности.

[00115] Согласно некоторым вариантам реализации кодирующий сегмент нуклеиновой кислоты расположен под контролем «рекомбинантного промотора» или «гетерологичного промотора», оба указанных термина относятся к промотору, который обычно не ассоциирован с кодируемой последовательностью нуклеиновой кислоты, с которой промотор функционально связан, в ее естественной среде. Рекомбинантный или гетерологичный энхансер относится к энхансеру, обычно не ассоциированному с конкретной последовательностью нуклеиновой кислоты в ее естественной среде. Такие промоторы или энхансеры могут включать промоторы или энхансеры других генов; промоторы или энхансеры, выделенные из любой другой прокариотической, вирусной или эукариотической клетки; и синтетические промоторы или энхансеры, которые не являются «природными», т.е. содержат различные элементы разных транскрипционных регуляторных областей и/или изменяющие экспрессию мутации, введенные с применением способов генетического конструирования, известных в данной области техники. Наряду с получением последовательностей нуклеиновых кислот промоторов и энхансеров синтетическим путем, последовательности промоторов могут быть получены с использованием рекомбинантного клонирования и/или технологии амплификации нуклеиновых кислот, включая ПЦР, применительно к синтетическим биологическим контурам и модулям, раскрытым в данном документе (см., например, патент США №4683202, патент США №5928906, каждый из которых включен в данный документ посредством ссылки). Кроме того, также предусмотрена возможность применения контрольных последовательностей, которые управляют транскрипцией и/или экспрессией последовательностей в неядерных органеллах, таких как митохондрии, хлоропласты и т.п.

[00116] Как описано в данном документе, «индуцируемый промотор» представляет собой промотор, который характеризуется инициацией или усилением транскрипционной активности в присутствии, под влиянием или при контакте с индуктором или индуцирующим агентом. «Индуктор» или «индуцирующий агент», как определено в данном документе, может быть эндогенным или обычно является экзогенным соединением или белком, которые вводят таким образом, чтобы обеспечить их активность по индукции транскрипционной активности индуцируемого промотора. Согласно некоторым вариантам реализации индуктор или индуцирующий агент, т.е. химическое вещество, соединение или белок, сам может быть получен в результате транскрипции или экспрессии последовательности нуклеиновой кислоты (т.е. индуктор может представлять собой индукторный белок, экспрессируемый другим компонентом или модулем), который сам может находиться под контролем индуцируемого промотора. Согласно некоторым вариантам реализации индуцируемый промотор индуцируется в отсутствие определенных агентов, таких как репрессор. Примеры индуцируемых промоторов включают, но не ограничиваются перечисленными, чувствительные к тетрациклину, металлотионину, экдизону промоторы, промоторы вирусов млекопитающих (например, поздний промотор аденовируса; и промотор длинного концевого повтора вируса опухоли молочной железы мышей (MMTV-LTR)) и другие чувствительные к стероидам промоторы, чувствительные к рапамицину промоторы и т.п.

[00117] Термины «регуляторные последовательности ДНК», «контрольные элементы» и «регуляторные элементы», используемые в данном документе взаимозаменяемо, относятся к транскрипционным и трансляционным контрольным последовательностям, таким как промоторы, энхансеры, сигналы полиаденилирования, терминаторы, сигналы разрушения белка и т.п., которые обеспечивают и/или регулируют транскрипцию некодирующей последовательности (например, нацеливающей на ДНК РНК) или кодирующей последовательности (например, сайт-направленного модифицирующего полипептида или полипептида Cas9/Csn1) и/или регулируют трансляцию кодируемого полипептида.

[00118] «Функционально связанный» относится к размещению в непосредственной близости, при котором описываемые так компоненты находятся во взаимосвязи, позволяющей им функционировать предусмотренным для них образом. Например, промотор функционально связан с кодирующей последовательностью, если указанный промотор влияет на ее транскрипцию или экспрессию. «Экспрессионная кассета» включает гетер о логичную последовательность ДНК, которая функционально связана с промотором или другой регуляторной последовательностью, достаточными для управления транскрипцией трансгена в зкДНК-векторе. Подходящие промоторы включают, например, тканеспецифические промоторы. Промоторы также могут происходить из ААВ.

[00119] В данном документе термин «субъект» относится к человеку или животному, которому предоставляют лечение, включая профилактическое лечение, с применением зкДНК-вектора в соответствии с настоящим изобретением. Обычно животное представляет собой позвоночное животное, такое как, но не ограничиваясь перечисленными, примат, грызун, домашнее животное или промысловое животное. Приматы включают, но не ограничиваются перечисленными, шимпанзе, яванских макак, коат и макак, например, макак-резусов. Грызуны включают мышей, крыс, сурков, хорьков, кроликов и хомяков. Домашние и промысловые животные включают, но не ограничиваются перечисленными, коров, лошадей, свиней, оленей, бизона, буйвола, виды кошачьих, например, домашнюю кошку, виды собачьих, например, собаку, лису, волка, виды птиц, например, курицу, эму, страуса, и рыб, например, форель, сома и лосося. В определенных вариантах реализации аспектов, описанных в данном документе, субъект представляет собой млекопитающее, например, примата или человека. Субъект может быть мужского или женского пола. Кроме того, субъект может быть младенцем или ребенком. Согласно некоторым вариантам реализации субъект может представлять собой новорожденного или нерожденного субъекта, например, субъекта in utero. Предпочтительно субъект представляет собой млекопитающее. Млекопитающее может представлять собой человека, не являющегося человеком примата, мышь, крысу, собаку, кошку, лошадь или корову, однако указанные примеры не являются ограничивающими. Млекопитающие, отличные от человека, могут быть предпочтительно использованы в качестве субъектов в моделях заболеваний и нарушений на животных. Кроме того, способы и композиции, описанные в данном документе, могут быть использованы для одомашненных животных и/или домашних животных. Человек-субъект может быть любого возраста, пола, расы или этнической группы, например, может быть европеоидом (белым), азиатом, африканцем, черным, афроамериканцем, афроевропейцем, испаноамериканцем, представителем ближневосточного этноса и т.д. Согласно некоторым вариантам реализации субъект может представлять собой пациента или другого субъекта в клинических условиях. Согласно некоторым вариантам реализации субъект уже проходит курс лечения. Согласно некоторым вариантам реализации субъект представляет собой эмбрион, плод, новорожденного, младенца, ребенка, подростка или взрослую особь. Согласно некоторым вариантам реализации субъект представляет собой плод человека, новорожденного человека, младенца-человека, ребенка-человека, подростка-человека или взрослого человека. Согласно некоторым вариантам реализации субъект представляет собой эмбрион животного или эмбрион, не принадлежащий человеку, или эмбрион примата, не являющегося человеком. Согласно некоторым вариантам реализации субъект представляет собой эмбрион человека.

[00120] В данном документе термин «клетка-хозяин» включает любой тип клеток, которые являются восприимчивыми к трансформации, трансфекции, трансдукции и т.п. с использованием конструкции нуклеиновой кислоты или зкДНК-вектора для экспрессии согласно настоящему изобретению. В качестве неограничивающих примеров, клетка-хозяин может представлять собой выделенную первичную клетку, плюрипотентные стволовые клетки, CD34+ клетки, индуцированные плюрипотентные стволовые клетки или любую из ряда иммортализованных клеточных линий (например, клетки HepG2). В качестве альтернативы, клетка-хозяин может представлять собой клетку in situ или in vivo в ткани, органе или организме.

[00121] Термин «экзогенный» относится к веществу, присутствующему в клетке, отличной от его природного источника. В данном документе термин «экзогенный» может относиться к нуклеиновой кислоте (например, нуклеиновой кислоте, кодирующей полипептид) или к полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обычно не обнаруживаются, и введение нуклеиновой кислоты или полипептида в такую клетку или организм является желательным. В качестве альтернативы, «экзогенный» может относиться к нуклеиновой кислоте или полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обнаруживаются в относительно низких количествах, и увеличение количества нуклеиновой кислоты или полипептида в клетке или организме является желательным, например, для получения эктопической экспрессии или уровней. В отличие от этого термин «эндогенный» относится к веществу, которое является нативным для биологической системы или клетки.

[00122] Термин «идентичность последовательности» относится к сродству между двумя нуклеотидными последовательностями. Для целей настоящего раскрытия степень идентичности последовательностей между двумя дезоксирибонуклеотидными последовательностями определяется с использованием алгоритма Нидлмана-Вунша (Needleman and Wunsch, 1970, выше), реализованного в программе Needle пакета EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et at, 2000, выше), предпочтительно, версии 3.0.0 или более поздней. Используемые необязательные параметры представляют собой штраф за открытие пропуска 10, штраф за продление пропуска 0,5 и матрицу замены EDNAFULL (версия EMBOSS NCBI NUC4.4). Выходной показатель Needle, называемый «наибольшей длиной идентичного фрагмента» (полученный с применением опции «-nobrief») используют в качестве процента идентичности и вычисляют следующим образом: (Идентичные дезоксирибонуклеотиды×100)/(Длина выравнивания - Общее число пропусков в выравнивании). Длина выравнивания составляет предпочтительно по меньшей мере 10 нуклеотидов, предпочтительно по меньшей мере 25 нуклеотидов, более предпочтительно по меньшей мере 50 нуклеотидов и наиболее предпочтительно по меньшей мере 100 нуклеотидов.

[00123] В данном документе термин «гомология» или «гомологичный» определяется как процент нуклеотидных остатков, которые идентичны нуклеотидным остаткам в соответствующей последовательности на хромосоме-мишени после выравнивания последовательностей и введения пробелов, при необходимости, для достижения максимального процента идентичности последовательностей. Выравнивание с целью определения процента гомологии нуклеотидной последовательности может быть достигнуто различными путями, известными в данной области техники, например, с применением общедоступного компьютерного программного обеспечения, такого как программное обеспечение BLAST, BLAST-2, ALIGN, ClustalW2 или Megalign (DNASTAR). Специалисты в данной области техники могут определить соответствующие параметры для выравнивания последовательностей, включая любые алгоритмы, необходимые для достижения максимального выравнивания по всей длине сравниваемых последовательностей. Согласно некоторым вариантам реализации последовательность нуклеиновой кислоты (например, последовательность ДНК), например, гомологичное плечо, считается «гомологичной», когда последовательность по меньшей мере на 70%, по меньшей мере на 75%, по меньшей мере на 80%, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98%, по меньшей мере на 99% или более идентична соответствующей нативной или неотредактированной последовательности нуклеиновой кислоты (например, геномной последовательности) клетки-хозяина.

[00124] В данном документе термин «гетерологичный» означает нуклеотидную или полипептидную последовательность, которая не обнаружена в нативной нуклеиновой кислоте или белке, соответственно. Гетерологичная последовательность нуклеиновой кислоты может быть связана с природной последовательностью нуклеиновой кислоты (или ее вариантом) (например, путем генетического конструирования) с получением химерной нуклеотидной последовательности, кодирующей химерный полипептид. Гетерологичная последовательность нуклеиновой кислоты может быть соединена с вариантом полипептида (например, путем генетического конструирования) с получением нуклеотидной последовательности, кодирующей слитый вариант полипептида.

[00125] «Вектор» или «экспрессионный вектор» представляет собой репликон, такой как плазмида, бакмида, фаг, вирус, вирион или космида, к которому может быть присоединен другой сегмент ДНК, т.е. «вставка», чтобы вызвать репликацию присоединенного сегмента в клетке. Вектор может представлять собой конструкцию нуклеиновой кислоты, разработанную для доставки в клетку-хозяина или для переноса между разными клетками-хозяевами. В данном документе вектор может быть вирусным или невирусным по происхождению и/или в конечной форме, однако для цели настоящего раскрытия «вектор» обычно относится к зкДНК-вектору в соответствии с использованием этого термина в данном документе. Термин «вектор» включает любой генетический элемент, который способен к репликации, когда он ассоциирован с надлежащими контрольными элементами, и который может переносить генные последовательности в клетки. Согласно некоторым вариантам реализации вектор может представлять собой экспрессионный вектор или рекомбинантный вектор.

[00126] В данном документе термин «экспрессионный вектор» относится к вектору, который управляет экспрессией РНК или полипептида с последовательностей, связанных с транскрипционными регуляторными последовательностями на векторе. Экспрессируемые последовательности часто, но не обязательно, будут гетер о логичными по отношению к клетке. Экспрессионный вектор может содержать дополнительные элементы, например, экспрессионный вектор может иметь две системы репликации, что позволяет поддерживать его в двух организмах, например, в клетках человека для экспрессии и в прокариотическом хозяине для клонирования и амплификации. Термин «экспрессия» относится к клеточным процессам, участвующим в продуцировании РНК и белков и, в соответствующих случаях, в секретировании белков, включая, где это применимо, но не ограничиваясь перечисленными, например, транскрипцию, процессинг транскрипта, трансляцию и укладку, модификацию и процессинг белка. «Продукты экспрессии» включают РНК, транскрибированную с гена, и полипептиды, полученные путем трансляции мРНК, транскрибированной с гена. Термин «ген» означает последовательность нуклеиновой кислоты, которая транскрибируется (ДНК) в РНК in vitro или in vivo, когда она функционально связана с соответствующими регуляторными последовательностями. Ген может включать, но не обязательно, области, предшествующие кодирующей области и следующие за ней, например, 5'-нетранслируемые (5'-UTR) или «лидерные» последовательности и 3'-UTR или «трейлерные» последовательности, а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).

[00127] Под «рекомбинантным вектором» подразумевается вектор, который включает гетерологичную последовательность нуклеиновой кислоты или «трансген», который способен к экспрессии in vivo. Следует понимать, что векторы, описанные в данном документе, в некоторых вариантах реализации, можно комбинировать с другими подходящими композициями и видами терапии. Согласно некоторым вариантам реализации вектор является эписомальным. Применение подходящего эписомального вектора обеспечивает средство поддержания представляющего интерес нуклеотида у субъекта в многокопийной внехромосомной ДНК, что устраняет потенциальные эффекты интеграции в хромосому.

[00128] В данном документе выражение «генетическое заболевание» относится к заболеванию, частично или полностью, прямо или опосредованно, вызванному одной или более аномалиями в геноме, в частности, к состоянию, присутствующему с момента рождения. Аномалия может представлять собой мутацию, вставку или делецию. Аномалия может влиять на кодирующую последовательность гена или его регуляторную последовательность. Генетическое заболевание может представлять собой, но не ограничивается перечисленными, мышечную дистрофию Дюшенна (МДД), гемофилию, муковисцидоз, хорею Хантингтона, семейную гиперхолестеринемию (дефект рецептора ЛПНП), гепатобластому, болезнь Вильсона, врожденную печеночную порфирию, наследственные нарушения метаболизма печени, синдром Леша-Нихана, серповидноклеточную анемию, талассемию, пигментную ксеродерму, анемию Фанкони, пигментный ретинит, атаксию-телеангиэктазию, синдром Блума, ретинобластому и болезнь Тея-Сакса.

[00129] В данном документе термин «ингибирующий полинуклеотид» относится к молекуле ДНК или РНК, которая уменьшает или предотвращает экспрессию (транскрипцию или трансляцию) второго (целевого) полинуклеотида. Ингибирующие полинуклеотиды включают антисмысловые полинуклеотиды, рибозимы и внешние направляющие последовательности. Термин «ингибирующий полинуклеотид» дополнительно включает молекулы ДНК и РНК, например, РНКи, которые кодируют существующие ингибирующие молекулы, такие как молекулы ДНК, которые кодируют рибозимы.

[00130] В данном документе «подавление гена» или «подавленный ген» в отношении активности молекулы РНКи, например, киРНК или миРНК, относится к снижению в клетке уровня мРНК гена-мишени.

[00131] В данном документе термин «РНКи» относится к любому типу интерферирующей РНК, включая, но не ограничиваясь перечисленными, киРНК, кшРНКи, эндогенную микроРНК и искусственную микроРНК. Например, он включает последовательности, ранее идентифицированные как киРНК, независимо от механизма последующего процессинга РНК (т.е., несмотря на то, что киРНК, как полагают, имеют специфичный способ процессинга in vivo, приводящий к расщеплению мРНК, такие последовательности могут быть включены в векторы между фланкирующими последовательностями, описанными в данном документе). Термин «РНКи» может включать как молекулы РНКи, подавляющие ген, так и эффекторные молекулы РНКи, которые активируют экспрессию гена.

[00132] В данном документе термин «содержащий» или «содержит» используется в отношении композиций, способов и их соответствующего компонента (компонентов), существенных для указанного способа или композиции, но допускающих включение не указанных элементов, будь то существенных или нет.

[00133] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие элементов, которые не влияют существенным образом на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации. Использование термина «содержащий» указывает на включение, а не на ограничение.

[00134] Термин «состоящий из» относится к композициям, способам и их соответствующим компонентам, описанным в данном документе, которые не включают никаких элементов, не перечисленных в указанном описании варианта реализации.

[00135] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие дополнительных элементов, которые не оказывают существенного влияния на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации настоящего изобретения.

[00136] В настоящем описании и прилагаемой формуле изобретения термины в единственном числе (соотв. «а», «an» и «the» в исходном тексте на английском языке) включают их эквиваленты во множественном числе, если иное явным образом не следует из контекста. Соответственно, например, ссылка на «способ» включает один или более способов и/или этапов типа, описанного в данном документе, и/или таких, которые будут понятны специалистам в данной области техники после прочтения настоящего раскрытия, и т.п. Аналогичным образом, предусмотрено, что термин «или» включает «и», если из контекста явным образом не следует иное. Несмотря на то, что при практической реализации или тестировании настоящего раскрытия могут применяться способы и материалы, сходные или эквивалентные тем, которые описаны в данном документе, ниже описаны подходящие способы и материалы. В данном документе «например» (сокращение «e.g.» в исходном тексте на английском языке, произошедшее от латинского выражения «exempli gratia») указывает на неограничивающий пример. Соответственно, «например» синонимично термину «к примеру».

[00137] Группы альтернативных элементов или вариантов реализации настоящего изобретения, раскрытых в данном документе, не должны рассматриваться как ограничения. На каждый член группы можно ссылаться и заявлять его индивидуально или в любой комбинации с другими членами группы или другими элементами, представленными в данном документе. Один или более членов группы могут быть включены или исключены из группы по соображениям удобства и/или патентоспособности. При любом таком включении или исключении в данном документе считается, что описание изобретения содержит группу, измененную таким образом, чтобы она удовлетворяла условию письменного описания всех групп Маркуша, используемых в прилагаемой формуле изобретения.

[00138] Согласно некоторым вариантам реализации любого из аспектов раскрытие, описанное в данном документе, не касается способа клонирования людей, способов модификации генетической идентичности зародышевой линии человека, вариантов применения эмбрионов человека в промышленных или коммерческих целях, или способов модификации генетической идентичности животных, которые могут причинить им страдания без какой-либо существенной медицинской пользы для человека или животного, а также животных, полученных с помощью таких способов.

[00139] Определения других терминов приведены в данном документе в описании различных аспектов настоящего изобретения.

[00140] Все патенты и другие публикации; включая литературные ссылки, выданные патенты, опубликованные заявки на патент и заявки на патент, находящиеся на рассмотрении одновременно с настоящей заявкой; упомянутые в настоящем описании, явным образом включены в данный документ посредством ссылки с целью описания и раскрытия, например, методологий, описанных в таких публикациях, которые могут быть использованы в связи с технологией, описанной в данном документе. Эти публикации представлены исключительно по причине их раскрытия до даты подачи настоящей заявки. Ничто в этом отношении не должно истолковываться как признание того, что авторы изобретения не обладают правами на более раннее изобретение по отношению к такому раскрытию в силу предшествующего изобретения или по любой другой причине. Все утверждения, касающиеся дат, или представления относительно содержания этих документов основаны на информации, доступной заявителям, и не являются допущением каким-либо образом признания правильности дат или содержания этих документов.

[00141] Описание вариантов реализации настоящего раскрытия не должно рассматриваться как исчерпывающее или ограничивающее настоящее изобретение точной раскрытой формой. Несмотря на то, что в данном документе в иллюстративных целях описаны конкретные варианты реализации и примеры раскрытия, возможны различные эквивалентные модификации в пределах объема раскрытия, как будет понятно специалистам в соответствующей области техники. Например, хотя этапы или функции способа представлены в указанном порядке, согласно альтернативным вариантам реализации функции могут выполняться в другом порядке, или функции могут выполняться по существу одновременно. Принципиальные положения настоящего раскрытия, предоставленные в данном документе, могут быть применены к другим процедурам или способам в зависимости от ситуации. Различные варианты реализации, описанные в данном документе, могут быть объединены для обеспечения дополнительных вариантов реализации. Аспекты настоящего раскрытия могут быть модифицированы, при необходимости, для применения композиций, функций и концепций вышеупомянутых ссылок и приложения для обеспечения дополнительных вариантов реализации настоящего раскрытия. Кроме того, из соображений биологической функциональной эквивалентности могут быть сделаны некоторые изменения в структуре белка, не влияющие на биологическое или химическое действие в качественном или количественном отношении. Эти и другие изменения могут быть выполнены в раскрытии в свете подробного описания. Все такие модификации предусмотрены, как включенные в объем прилагаемой формулы изобретения.

[00142] Конкретные элементы любого из вышеприведенных вариантов реализации могут быть объединены или заменены элементами других вариантов реализации. Кроме того, хотя преимущества, ассоциированные с некоторыми вариантами реализации настоящего раскрытия, были описаны в контексте этих вариантов реализации, другие варианты реализации также могут демонстрировать такие преимущества, и не все варианты реализации должны обязательно демонстрировать такие преимущества, чтобы попадать в объем раскрытия.

[00143] Описанная в данном документе технология дополнительно иллюстрируется следующими примерами, которые никоим образом не следует истолковывать как дополнительные ограничения. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения.

II. Экспрессия белка FVIII с зкДНК-вектора

[00144] Технология, описанная в данном документе, в целом направлена на экспрессию и/или продукцию белка FVIII в клетке с невирусного ДНК-вектора, например, зкДНК-вектора, описанного в данном документе. ЗкДНК-векторы для экспрессии белка FVIII описаны в данном документе в разделе, озаглавленном «зкДНК-векторы в целом». В частности, зкДНК-векторы для экспрессии белка FVIII содержат пару ITR (например, симметричных или асимметричных, как описано в данном документе), а между парой ITR нуклеиновую кислоту, кодирующую белок FVIII, как описано в данном документе, функционально связанную с промотором или регуляторной последовательностью. Отличительным преимуществом зкДНК-векторов для экспрессии белка FVIII по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже полноразмерный белок FVIII размером 6,8 тыс. п.о. может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы, описанные в данном документе, можно применять для экспрессии терапевтического белка FVIII у субъекта, нуждающегося в этом, например, субъекта, страдающего гемофилией А.

[00145] Как будет понятно, технологии зкДНК-векторов, описанные в данном документе, могут быть адаптированы к любому уровню сложности или могут применяться модульно, причем экспрессия различных компонентов белка FVIII может контролироваться независимо. Например, конкретно предусмотрено, что технологии зкДНК-векторов, разработанные в данном документе, могут быть простыми, как применение одного зкДНК-вектора для экспрессии одной гетерологичной генной последовательности (например, белка FVIII), или могут быть сложными, как применение нескольких зкДНК-векторов, когда каждый вектор экспрессирует несколько белков FVIII или ассоциированных кофакторов, или вспомогательных белков, каждый из которых независимо контролируется разными промоторами. Варианты реализации ниже конкретно предусмотрены в данном документе и могут быть адаптированы специалистом в данной области техники при необходимости.

[00146] Согласно одному варианту реализации один зкДНК-вектор можно применять для экспрессии одного компонента белка FVIII. В качестве альтернативы, один зкДНК-вектор можно применять для экспрессии нескольких компонентов (например, по меньшей мере 2) белка FVIII под контролем одного промотора (например, сильного промотора), необязательно с использованием последовательности (ей) IRES, чтобы обеспечить надлежащую экспрессию каждого из компонентов, например, кофакторов или вспомогательных белков.

[00147] В данном документе также предусмотрен, в другом варианте реализации, один зкДНК-вектор, содержащий по меньшей мере две вставки (например, экспрессирующие тяжелую цепь или легкую цепь), причем экспрессия каждой вставки находится под контролем ее собственного промотора. Промоторы могут включать несколько копий одного и того же промотора, несколько разных промоторов или любую их комбинацию. Специалист в данной области техники поймет, что желательной часто является экспрессия компонентов белка FVIII на разных уровнях экспрессии, что позволяет контролировать стехиометрию отдельных экспрессируемых компонентов для обеспечения эффективного укладывания и комбинирования белка FVIII в клетке.

[00148] Специалист в данной области техники может предусмотреть дополнительные варианты технологий зкДНК-векторов или адаптировать их из методов получения белка с использованием стандартных векторов.

А. Нуклеиновые кислоты

[00149] В данном документе предложена характеристика и разработка молекул нуклеиновых кислот для потенциального терапевтического применения. В соответствии с некоторыми вариантами реализации нуклеиновые кислоты для терапевтического применения кодируют белок FVIII. Согласно некоторым вариантам реализации в соответствующих случаях описана химическая модификация олигонуклеотидов с целью изменения и улучшения свойств in vivo (доставки, стабильности, времени жизни, укладки, специфичности в отношении мишени), а также их биологической функции и механизма, которые напрямую коррелируют с терапевтическим приложением.

[00150] Иллюстративные терапевтические нуклеиновые кислоты согласно настоящему раскрытию, которые могут быть иммуностимулирующими и требуют применения иммуносупрессоров, раскрытых в данном документе, могут включать, но не ограничиваются перечисленными, минигены, плазмиды, миникольца, короткую интерферирующую РНК (киРНК), микроРНК (миРНК), антисмысловые олигонуклеотиды (ASO), рибозимы, двухцепочечную ДНК с замкнутыми концами (например, зкДНК, CELiD, линейную ковалентно замкнутую ДНК («с минимальной цепью»), doggybone (dbDNA™), протеломерную ДНК с замкнутыми концами или гантелеобразную линейную ДНК), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК), мРНК, тРНК, рРНК и вирусные ДНК-векторы, вирусный РНК-вектор; и любую их комбинацию.

[00151] киРНК или миРНК, которые могут отрицательно регулировать внутриклеточные уровни конкретных белков посредством процесса, называемого РНК-интерференцией (РНКи), также предусмотрены настоящим изобретением в качестве терапевтических средств на основе нуклеиновых кислот. После введения киРНК или миРНК в цитоплазму клетки-хозяина указанные конструкции двухцепочечной РНК связываются с белком, называемым RISC. Комплекс RISC удаляет смысловую цепь киРНК или миРНК. Комплекс RISC в комбинации с комплементарной мРНК расщепляет мРНК и высвобождает разрезанные цепи. РНКи осуществляется путем индукции специфичного разрушения мРНК, что приводит к отрицательной регуляции соответствующего белка.

[00152] Антисмысловые олигонуклеотиды (ASO) и рибозимы, которые ингибируют трансляцию мРНК в белок, могут представлять собой терапевтические средства на основе нуклеиновых кислот. В случае антисмысловых конструкций указанные одноцепочечные дезоксинуклеиновые кислоты имеют последовательность, комплементарную последовательности мРНК целевого белка, и способны связываться с мРНК посредством спаривания оснований по Уотсону-Крику. Такое связывание предотвращает трансляцию целевой мРНК и/или запускает разрушение транскрипта мРНК РНКазой Н. В результате антисмысловой олигонуклеотид имеет повышенную специфичность действия (т.е. отрицательную регуляцию специфического белка, связанного с заболеванием).

[00153] Согласно любому из способов, предложенных в данном документе, терапевтическая нуклеиновая кислота может представлять собой терапевтическую РНК. Терапевтическая РНК может представлять собой ингибитор трансляции мРНК, агент РНК-интерференции (РНКи), каталитически активную молекулу РНК (рибозим), транспортную РНК (тРНК) или РНК, которая связывает транскрипт мРНК (ASO), белок или другой молекулярный лиганд (аптамер). Согласно любому из способов, предложенных в данном документе, агент РНКи может представлять собой двухцепочечную РНК, одноцепочечную РНК, микроРНК, короткую интерферирующую РНК, короткую шпилечную РНК или образующий триплекс олигонуклеотид.

[00154] В соответствии с некоторыми вариантами реализации терапевтическая нуклеиновая кислота представляет собой двухцепочечную ДНК с замкнутыми концами, например, зкДНК. В соответствии с некоторыми вариантами реализации экспрессия и/или продукция терапевтического белка в клетке происходит с невирусного ДНК-вектора, например, зкДНК-вектора. Отличительным преимуществом зкДНК-векторов для экспрессии терапевтического белка по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже большой терапевтический белок может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы можно применять для экспрессии терапевтического белка у субъекта, нуждающегося в этом.

[00155] В общем случае зкДНК-вектор для экспрессии терапевтического белка, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.

[00156] Согласно некоторым вариантам реализации трансген, кодирующий белок FVIII, также может кодировать секреторную последовательность так, что белок FVIII направляется в аппарат Гольджи и эндоплазматический ретикулум (ЭР), где будет происходить укладка белка FVIII в правильную конформацию молекулами-шаперонами при его прохождении через ЭР и высвобождении из клетки. Примерные секреторные последовательности включают, но не ограничиваются перечисленными, VH-02 (SEQ ID NO: 88) и VK-A26 (SEQ ID NO: 89) и сигнальную последовательность IgK (SEQ ID NO: 126), а также секреторный сигнал Glue, обеспечивающий секрецию меченого белка из цитозоля (SEQ ID NO: 188), секреторную последовательность TMD-ST, которая направляет меченый белок в аппарат Гольджи (SEQ ID NO: 189).

[00157] Регуляторные переключатели также можно использовать для точной настройки экспрессии белка FVIII так, что белок FVIII экспрессируется предусмотренным образом, включая, но не ограничиваясь этим, экспрессию белка FVIII на целевом уровне экспрессии или в целевом количестве, или, в качестве альтернативы, в присутствии или в отсутствие конкретного сигнала, включая событие клеточной передачи сигнала. Например, как описано в данном документе, экспрессия белка FVIII с зкДНК-вектора может быть включена или выключена при возникновении конкретного состояния, как описано в разделе данного документа, озаглавленном «Регуляторные переключатели».

[00158] Например, и только в целях иллюстрации, белки FVIII можно применять для выключения нежелательной реакции, такой как слишком высокий уровень продукции белка FVIII. Ген FVIII может содержать сигнальный пептидный маркер для доставки белка FVIII в целевую клетку. Однако в любой ситуации может быть желательно регулировать экспрессию белка FVIII. ЗкДНК-векторы легко приспосабливаются к использованию регуляторных переключателей.

[00159] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих белок FVIII. Таким образом, даже полноразмерный FVIII, а также необязательно любые кофакторы или вспомогательные белки могут быть экспрессированы с одного зкДНК-вектора. Кроме того, в зависимости от необходимой стехиометрии можно экспрессировать несколько сегментов одного и того же белка FVIII и можно использовать один и тот же или разные промоторы, а также можно использовать регуляторные переключатели для точной настройки экспрессии каждой области. Например, как показано в Примерах, можно применять зкДНК-вектор, который содержит двойную промоторную систему, так, что для каждого домена белка FVIII используется разный промотор. Применение зкДНК-плазмиды для получения белка FVIII может включать уникальную комбинацию промоторов для экспрессии доменов белка FVIII, что приводит к правильным соотношениям каждого домена для образования функционального белка FVIII. Соответственно, в некоторых вариантах реализации, зкДНК-вектор можно применять для экспрессии различных областей белка FVIII по отдельности (например, под контролем другого промотора).

[00160] Согласно другому варианту реализации белок FVIII, экспрессируемый с зкДНК-векторов, дополнительно содержит дополнительную функциональную возможность, такую как флуоресценция, ферментативная активность, сигнал секреции или активатор иммунных клеток.

[00161] Согласно некоторым вариантам реализации зкДНК, кодирующая белок FVIII, может дополнительно содержать линкерный домен, например. В данном документе «линкерный домен» относится к олиго- или полипептидной области от примерно 2 до 100 аминокислот в длину, которая связывает любые домены/области белка FVIII, описанного в данном документе. Согласно некоторым вариантам реализации линкеры могут включать или могут состоять из гибких остатков, таких как глицин и серии, так, что смежные белковые домены могут свободно перемещаться относительно друг друга. Более длинные линкеры могут использоваться, когда желательно гарантировать, что два смежных домена не будут стерически мешать друг другу. Линкеры могут быть расщепляемыми или нерасщепляемыми. Примеры расщепляемых линкеров включают линкеры 2А (например, Т2А), 2А-подобные линкеры или их функциональные эквиваленты и их комбинации. Линкер может представлять собой линкерную область Т2А, происходящую из вируса Thosea asigna.

[00162] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, FVIII и т.д., и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.

В. зкДНК-векторы, экспрессирующие белок FVIII

[00163] ЗкДНК-вектор для экспрессии белка FVIII, имеющий одну или более последовательностей, кодирующих целевой FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих белок FVIII.

[00164] Для достижения высокоэффективной и точной сборки белка FVIII в некоторых вариантах реализации конкретно предусмотрено, что белок FVIII содержит лидерную последовательность для эндоплазматического ретикулума (ЭР) для направления его в ЭР, где происходит укладка белка. Например, последовательность, которая направляет экспрессированный белок (белки) в ЭР для укладки.

[00165] Согласно некоторым вариантам реализации сигнал клеточной или внеклеточной локализации (например, секреторный сигнал, сигнал ядерной локализации, сигнал митохондриальной локализации и т.д.) содержится в зкДНК-векторе, чтобы направлять секрецию или целевую субклеточную локализацию FVIII так, что белок FVIII может связываться с внутриклеточной мишенью (мишенями) (например, внутри тела) или внеклеточной мишенью (мишенями).

[00166] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, обеспечивает сборку и экспрессию любого целевого белка FVIII модульным способом. В данном документе термин «модульный» относится к элементам в зкДНК-экспрессирующей плазмиде, которые можно легко удалить из конструкции. Например, модульные элементы в зкДНК-генерирующей плазмиде, содержат уникальные пары сайтов рестрикции, фланкирующие каждый элемент в конструкции, что обеспечивает исключительное манипулирование отдельными элементами (см., например, ФИГ. 1A-1G). Таким образом, платформа зкДНК-вектора может обеспечивать экспрессию и сборку любой целевой конфигурации белка FVIII. В данном документе в различных вариантах реализации предложены плазмидные зкДНК-векторы, которые могут уменьшить и/или минимизировать количество манипуляций, необходимых для сборки целевого зкДНК-вектора, кодирующего белок FVIII.

С. Примерные белки FVIII, экспрессируемые зкДНК-векторами

[00167] В частности, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать, например, но не ограничиваясь перечисленными, белки FVIII, а также их варианты и/или активные фрагменты для применения в лечении, профилактике и/или облегчении одного или более симптомов гемофилии А. В одном аспекте гемофилия А представляет собой гемофилию А человека.

(i) Терапевтические белки FVIII и их фрагменты

[00168] По существу любой вариант терапевтического белка FVIII или его фрагмента (например, функциональный фрагмент) может кодироваться и экспрессироваться с зкДНК-вектора, как описано в данном документе. Специалист в данной области техники поймет, что терапевтический белок FVIII включает все варианты сплайсинга и ортологи белка FVIII. Терапевтический белок FVIII включает интактные молекулы, а также их фрагменты (например, функциональные).

[00169] Фактор VIII

[00170] Фактор VIII представляет собой неферментный кофактор активированного фактора свертывания крови IX (FIXa), который при протеолитической активации взаимодействует с FLXa с образованием прочного нековалентного комплекса, который связывается с фактором X (FX) и активирует его.

[00171] Ген или белок фактора VIII также может называться F8, фактор коагуляции VIII, прокоагулянтный компонент, антигемофильный фактор, F8C, AHF, DXS1253E, FVIII, НЕМА или F8B. Экспрессия гена фактора VIII тканеспецифична и в основном наблюдается в клетках печени. Самый высокий уровень мРНК и белков фактора VIII детектировался в синусоидных клетках печени; значительные количества фактора VIII также присутствуют в гепатоцитах и клетках Купфера (резидентные макрофаги синусоидов печени). Умеренные уровни белка фактора VIII детектируются в сыворотке и плазме. Белок фактора VIII экспрессируется на низких и умеренных уровнях в фетальном головном мозге, сетчатке, почке и семеннике.

[00172] мРНК фактора VIII экспрессируется во многих тканях организма, включая костный мозг, цельную кровь, лейкоциты, лимфатические узлы, тимус, головной мозг, кору головного мозга, мозжечок, сетчатку, спинной мозг, большеберцовый нерв, сердце, артерию, гладкую мышцу, скелетную мышцу, тонкий кишечник, толстую кишку, адипоциты, почку, печень, легкое, селезенку, желудок, пищевод, мочевой пузырь, поджелудочную железу, щитовидную железу, слюнную железу, надпочечник, гипофиз, молочную железу, кожу, яичник, матку, плаценту, простату и семенник. Ген FVIII, локализованный на длинном плече Х-хромосомы, занимает область длиной приблизительно 186 тыс. п.о. и состоит из 26 экзонов (69-3106 п.о.) и интронов (от 207 п.о. до 32,4 тыс. п.о.). Общая длина кодирующей последовательности этого гена составляет 9 тыс. п.о.

[00173] Зрелый полипептид фактора VIII содержит структурные домены А1-А2-В-А3-С1-С2. Три кислых субдомена, которые обозначаются a1-a3-A1(a1)-A2(a2)-B-(a3)A3-C1-C2, локализуются на границах доменов А и играют важную роль во взаимодействии между FVIII и другими белками (в частности, с тромбином). Мутации в этих субдоменах снижают уровень активации фактора VIII тромбином.

[00174] Белок фактора VIII (изоформа фактора коагуляции VIII) представляет собой препробелок [Homo sapiens]; номер доступа: NP_000123.1 (2351 амк.) и имеет следующую последовательность:

[00176] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, несколько полноразмерных терапевтических белков FVIII могут быть экспрессированы с одного зкДНК-вектора.

[00177] Экспрессия терапевтического белка FVIII или его фрагмента с зкДНК-вектора может быть достигнута как в пространстве, так и во времени с использованием одного или более индуцируемых или репрессируемых промоторов, известных в данной области техники или описанных в данном документе, включая регуляторные переключатели, описанные в данном документе.

[00178] Согласно одному варианту реализации терапевтический белок FVIII представляет собой «вариант терапевтического белка», который относится к терапевтическому белку FVIII, имеющему измененную аминокислотную последовательность, композицию или структуру по сравнению с соответствующим нативным терапевтическим белком FVIII. Согласно одному варианту реализации FVIII представляет собой функциональный вариант (например, дикий тип). Подходящей также может быть экспрессия мутантного варианта белка FVIII, такого как точечная мутация или делеционная мутация, которая приводит к гемофилии А, например, для создания модели заболевания на животных и/или для оценки лекарственных средств для лечения гемофилии А. Доставка мутантных или модифицированных белков FVIII в модельную систему на основе клеток или на животных может быть выполнена для создания модели заболевания. Такую модель на основе клеток или на животных можно использовать для исследований и/или скрининга лекарственных средств. Терапевтический белок FVIII, экспрессируемый с зкДНК-векторов, может дополнительно содержать последовательность/фрагмент, который придает дополнительную функциональность, такую как флуоресценция, ферментативная активность или сигнал секреции. Согласно одному варианту реализации вариант терапевтического белка FVIII содержит ненативную последовательность метки для идентификации (например, иммунную метку), которая позволяет отличить его от эндогенного терапевтического белка FVIII в реципиентной клетке-хозяине.

[00179] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, терапевтического белка FVIII, и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.

[00180] Согласно одному варианту реализации последовательность, кодирующая терапевтический белок FVIII, может быть получена из существующей клетки-хозяина или линии клеток, например, путем обратной транскрипции мРНК, полученной от хозяина, и амплификации последовательности с использованием ПЦР.

(ii) ЗкДНК-векторы, экспрессирующие терапевтический белок FVIII

[00181] ЗкДНК-вектор, имеющий одну или более последовательностей, кодирующих целевой терапевтический белок FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих терапевтический белок FVIII или его функциональный фрагмент.Примерные кассетные вставки для получения зкДНК-векторов, кодирующих терапевтические белки FVIII, отображены на Фигурах 1A-1G. Согласно одному варианту реализации зкДНК-вектор содержит последовательность FVIII, перечисленную в Таблице 1 в данном документе.

(iii) Терапевтические белки FVIII и варианты их применения для лечения гемофилии А

[00182] ЗкДНК-векторы, описанные в данном документе, можно применять для доставки терапевтических белков FVIII для лечения гемофилии А, ассоциированной с нефизиологической экспрессией белка FVIII и/или мутациями в белках FVIII.

[00183] ЗкДНК-векторы, описанные в данном документе, можно применять для экспрессии любого целевого терапевтического белка FVIII. Примерные терапевтические белки FVIII включают, но не ограничиваются им, любой белок FVIII, экспрессируемый последовательностями, педставленными в Таблице 1 в данном документе.

[00184] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII является функциональным для лечения гемофилии А. Согласно некоторым вариантам реализации терапевтический белок FVIII не вызывает реакции иммунной системы.

[00185] Согласно другому варианту реализации зкДНК-векторы, кодирующие терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), можно применять для получения химерного белка. Таким образом, в данном документе конкретно предусмотрено, что зкДНК-вектор, экспрессирующий химерный белок, можно вводить, например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников. Согласно некоторым вариантам реализации, когда зкДНК-вектор, экспрессирующий FVIII, вводят младенцу или вводят субъекту in utero, зкДНК-вектор, экспрессирующий FVIII, можно вводить в любую одну или более тканей, выбранных из: печени, надпочечников, сердца, кишечника, легкого и желудка, или в стволовую клетку-предшественника клеток печени для лечения гемофилии A in vivo или ex vivo.

[00186] Гемофилия:

[00187] Гемофилия А представляет собой генетический дефицит фактора свертывания крови VIII, который вызывает повышенное кровотечение и обычно поражает мужчин. В большинстве случаев он наследуется как Х-сцепленный рецессивный признак, хотя имеются случаи, которые возникают в результате спонтанных мутаций. В отношении симптомов гемофилии А различают эпизоды внутреннего или внешнего кровотечения. Индивидуумы с более тяжелой формой гемофилии страдают более тяжелыми и более частыми кровотечениями, в то время как другие с легкой формой гемофилии, как правило, имеют более незначительные симптомы, за исключением случаев хирургического вмешательства или серьезной травмы. Больные с гемофилией умеренной степени тяжести имеют различные симптомы, которые проявляются в диапазоне от тяжелой до легкой форм.

[00188] Современные способы лечения для предотвращения кровотечений у людей, страдающих гемофилией А, включают лекарственный препарат фактора VIII. Большинство индивидуумов с тяжелой формой гемофилии нуждаются в регулярном введении внутривенного рекомбинантного фактора VIII или его плазматического концентрата. Рекомбинантный фактор свертывания крови VIII является одним из наиболее сложных белков для промышленного изготовления из-за низкой эффективности транскрипции его гена, значительной внутриклеточной потери его пробелка во время посттрансляционного процессинга и нестабильности секретируемого белка. Больные с легкой формой гемофилии могут контролировать свое состояние с помощью десмопрессина, лекарственного средства, которое высвобождает из стенок кровеносных сосудов фактор VIII, хранящийся в них.

[00189] Существует много осложнений, связанных с лечением гемофилии А. У детей можно ввести легкодоступный внутривенный порт, чтобы свести к минимуму частую травматическую внутривенную канюляцию. Однако эти порты ассоциированы с высокой частотой инфицирования и риском образования сгустков на кончике катетера, что делает его бесполезным. Вирусные инфекции могут быть распространены у больных гемофилией из-за частых переливаний крови, которые подвергают пациентов риску заражения инфекциями, передаваемыми через кровь, такими как ВИЧ, гепатит В и гепатит С.Прионные инфекции также могут передаваться при переливаниях крови. Еще одно терапевтическое осложнение гемофилии А представляет собой выработку ингибирующих антител к фактору VIII из-за частых инфузий. Они вырабатываются, когда организм распознает введенный путем инфузий фактор VIII как чужеродный, поскольку организм не продуцирует свою собственную копию. У таких индивидуумов активированный фактор VII, предшественник фактора VIII в коагуляционном каскаде, может быть введен путем инфузий для лечения кровоизлияния у индивидуумов с гемофилией и антителами к замещающему фактору VIII.

[00190] Коагуляционный каскад

[00191] Коагуляция, также известная как свертывание, представляет собой процесс, при котором кровь превращается из жидкости в гель, образуя сгусток крови. Это потенциально приводит к гемостазу, прекращению кровопотери из поврежденного сосуда с последующим восстановлением. Механизм коагуляции включает активацию, адгезию и агрегацию тромбоцитов наряду с отложением и созреванием фибрина. Нарушения коагуляции представляют собой патологические состояния, которые могут привести к кровотечению (кровоизлиянию или синяку) или обструктивному свертыванию (тромбозу).

[00192] Коагуляция начинается почти мгновенно после того, как повреждение кровеносного сосуда повредило эндотелий, выстилающий кровеносный сосуд. Воздействие крови на субэндотелиальное пространство инициирует два процесса: изменения в тромбоцитах и воздействие субэндотелиального тканевого фактора на плазматический фактор VII, что в конечном итоге приводит к образованию фибрина. Тромбоциты немедленно образуют пробку в месте повреждения; это называется первичным гемостазом. Одновременно происходит вторичный гемостаз: дополнительные факторы коагуляции или факторы свертывания, помимо фактора VII (включая фактор VIII), отвечают сложным каскадом с образованием нитей фибрина, которые укрепляют тромбоцитарную пробку.

[00193] Коагуляционный каскад вторичного гемостаза имеет два исходных пути, которые приводят к образованию фибрина. Они включают путь контактной активации (также известный как внутренний путь) и путь тканевого фактора (также известный как внешний путь), которые оба приводят к одним и тем же фундаментальным реакциям, которые продуцируют фибрин. Первичный путь инициации коагуляции крови представляет собой путь тканевого фактора (внешний). Пути представляют собой ряд реакций, в которых зимоген (неактивный предшественник фермента) сериновой протеазы и ее гликопротеиновый кофактор активируются, чтобы стать активными компонентами, которые затем катализируют следующую реакцию в каскаде, что в конечном итоге приводит к образованию перекрестно-сшитого фибрина. Факторы коагуляции обычно обозначаются римскими цифрами с добавленной строчной буквой «а», указывающей на активную форму.

[00194] Факторы коагуляции обычно представляют собой сериновые протеазы (ферменты), которые действуют путем расщепления нисходящих белков. Исключение составляют тканевой фактор, FV, FVIII, FXIII. Тканевый фактор, FV и FVIII представляют собой гликопротеины, а фактор XIII представляет собой трансглутаминазу. Факторы коагуляции циркулируют в виде неактивных зимогенов. Таким образом, коагуляционный каскад классически делится на три пути. Путь тканевого фактора и путь контактной активации оба активируют «конечный общий путь» фактора X, тромбина и фибрина.

[00195] Основная роль пути тканевого фактора (внешнего) заключается в создании «тромбинового взрыва», процесса, с помощью которого происходит быстрое высвобождение тромбина, наиболее важного компонента коагуляционного каскада с точки зрения его функций активации обратной связи. FVIIa циркулирует в большем количестве, чем любой другой активированный фактор коагуляции. Процесс включает следующие этапы:

[00196] Этап 1: После повреждения кровеносного сосуда FVII покидает кровоток и вступает в контакт с тканевым фактором (TF), экспрессируемым на клетках, несущих тканевой фактор (стромальные фибробласты и лейкоциты), с образованием активированного комплекса (TF-FVIIa).

[00197] Этап 2: TF-FVIIa активирует FIX и FX.

[00198] Этап 3: Сам FVII активируется тромбином, FXIa, FXII и FXa.

[00199] Этап 4: Активация FX (с образованием FXa) TF-FVIIa почти сразу ингибируется ингибитором пути тканевого фактора (TFPI).

[00200] Этап 5: FXa и его кофактор FVa образуют протромбиназный комплекс, который активирует протромбин в тромбин.

[00201] Этап 6: Затем тромбин активирует другие компоненты коагуляционного каскада, включая FV и FVIII (который образует комплекс с FIX), а также активирует и высвобождает FVIII из комплекса с фактором фон Виллебранда (vWF).

[00202] Этап 7: FVIIIa представляет собой кофактор FIXa, и вместе они образуют «теназный» комплекс, который активирует FX; и таким образом цикл продолжается.

[00203] Путь контактной активации (внутренний) начинается с образования первичного комплекса высокомолекулярного кининогена (HMWK), прекалликреина и FXII (фактора Хагемана) на коллагене. Прекалликреин превращается в калликреин, a FXII становится FXIIa. FXIIa превращает FXI в FXIa. Фактор Х1а активирует FIX, который со своим кофактором FVIIIa образует теназный комплекс, который активирует FX в FXa. Незначительную роль, которую играет путь контактной активации в инициировании образования сгустка, можно проиллюстрировать тем фактом, что пациенты с тяжелым дефицитом FXII, HMWK и прекалликреина не имеют нарушения гемостаза. Вместо этого система контактной активации в большей степени вовлечена в воспаление и врожденный иммунитет.

[00204] Конечный общий путь, который является общим для внутреннего и внешнего путей коагуляции, включает превращение протромбина в тромбин и фибриногена в фибрин. Тромбин выполняет множество функций, помимо превращения фибриногена в фибрин, строительный блок гемостатической пробки. Кроме того, он является наиболее важным активатором тромбоцитов, и помимо этого он активирует факторы VIII и V и их ингибитор, белок С (в присутствии тромбомодулина), а также активирует фактор XIII, который образует ковалентные связи, которые перекрестно сшивают полимеры фибрина, которые образуются из активированных мономеров.

[00205] После активации посредством путей контактного фактора или тканевого фактора коагуляционный каскад поддерживается в протромботическом состоянии за счет продолжающейся активации FVIII и FIX с образованием теназного комплекса, пока он не будет подавлен антикоагулянтными путями. Способы включают введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к количеству введенной композиции зкДНК, которое приводит к экспрессии белка в «терапевтически эффективном количестве» для лечения заболевания или нарушения.

[00206] Диапазоны дозировок для композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), зависят от эффективности (например, эффективности промотора) и включают количества, достаточно большие для получения целевого эффекта, например, экспрессии целевого терапевтического белка FVIII для лечения фенилкетонурии (гемофилии А). Дозировка не должна быть настолько большой, чтобы вызывать неприемлемые нежелательные побочные эффекты. Обычно дозировка будет варьироваться в зависимости от конкретных характеристик зкДНК-вектора, эффективности экспрессии, а также в зависимости от возраста, состояния и пола пациента. Дозировка может быть определена специалистом в данной области техники и, в отличие от обычных ААВ-векторов, также может быть скорректирована индивидуальным врачом в случае любого осложнения, поскольку зкДНК-векторы не содержат активирующие иммунную систему капсидные белки, которые препятствуют повторному дозированию.

[00207] Введение композиций зкДНК, описанных в данном документе, можно повторять в течение ограниченного периода времени. Согласно некоторым вариантам реализации дозы вводят периодически или с помощью импульсного введения. Согласно предпочтительному варианту реализации указанные выше дозы вводят в течение нескольких месяцев. Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Также предусмотрены «бустерные» обработки с течением времени. Кроме того, уровень экспрессии можно титровать по мере роста субъекта.

[00208] Терапевтический белок FVIII может быть экспрессирован у субъекта в течение по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Долговременная экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы.

[00209] В данном документе термин «терапевтически эффективное количество» представляет собой количество экспрессированного терапевтического белка FVIII или его функционального фрагмента, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера заболевания или уменьшения конкретного симптома заболевания (см. «Измерение эффективности» ниже). Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК.

[00210] Точные количества зкДНК-вектора, необходимые для введения, зависят от суждения практикующего врача и являются индивидуальными для каждого индивидуума. Подходящие схемы введения также являются вариабельными, но типичным является начальное введение с последующими повторными дозами с одним или более интервалами с последующей инъекцией или другим введением. В качестве альтернативы, предусмотрена непрерывная внутривенная инфузия, достаточная для поддержания концентраций в крови в диапазонах, указанных для видов терапии in vivo, в частности, для лечения острых заболеваний/нарушений.

[00211] Агенты, которые можно применять в способах и композициях, описанных в данном документе, можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, внутримышечно, подкожно, внутрь полости, а также они могут быть доставлены с помощью перистальтических средств, при необходимости, или других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно. Он также может быть введен in utero.

[00212] Эффективность данного лечения гемофилии А может быть определена квалифицированным врачом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы заболевания или нарушения изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим FVIII или его функциональный фрагмент. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации заболевания или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование заболевания, например, прекращение или замедление прогрессирования заболевания или нарушения; или (2) облегчение заболевания, например, вызывающее регресс симптомов; и (3) предотвращение или снижение вероятности развития заболевания, или предотвращение вторичных заболеваний/нарушений, ассоциированных с указанным заболеванием, таких как печеночная или почечная недостаточность. Эффективное количество для лечения заболевания означает такое количество, которое, при введении нуждающемуся в этом млекопитающему, является достаточным для обеспечения эффективного лечения, в соответствии с определением этого термина в данном документе, этого заболевания.

[00213] Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для гемофилии А. Стандартные методы анализа показателей гемофилии А известны в данной области техники.

[00214] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также может кодировать кофакторы или другие полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, киРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)), которые можно применять в сочетании с белком FVIII, экспрессируемым с зкДНК. Кроме того, экспрессионные кассеты, содержащие последовательность, кодирующую белок FVIII, также могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как р-лактамаза, р-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.

[00215] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты для экспрессии белка FVIII, который является функциональным для лечения гемофилии А. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.

III. ЗкДНК-вектор в целом для применения в получении терапевтических белков FVIII

[00216] Варианты реализации настоящего изобретения основаны на способах и композициях, содержащих линейные дуплексные векторы с замкнутыми концами (зкДНК), которые могут экспрессировать трансген FVIII. Согласно некоторым вариантам реализации трансген представляет собой последовательность, кодирующую белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, не ограничены размером, что обеспечивает, например, экспрессию всех компонентов, необходимых для экспрессии трансгена, с одного вектора. ЗкДНК-вектор для экспрессии белка FVIII предпочтительно является дуплексным, например, самокомплементарным, по меньшей мере в части молекулы, такой как экспрессионная кассета (например, зкДНК не является двухцепочечной кольцевой молекулой). ЗкДНК-вектор имеет ковалентно замкнутые концы и, таким образом, устойчив к расщеплению экзонуклеазой (например, экзонуклеазой I или экзонуклеазой III), например, более часа при 37°С.

[00217] В общем случае зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.

[00218] В данный документ включены способы и композиции, содержащие зкДНК-вектор для продукции белка FVIII, которые могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц. В данном документе раскрыты неограничивающие примерные системы на основе липосомных наночастиц, предусмотренные для применения. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК-вектором, полученным указанным способом, раскрыт в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая полностью включена в данный документ.

[00219] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, не имеют ограничений по упаковке, налагаемых ограниченным пространством внутри вирусного капсида. ЗкДНК-векторы представляют собой жизнеспособную продуцируемую эукариотами альтернативу плазмидным ДНК-векторам, продуцируемым прокариотами, в отличие от инкапсулированных геномов ААВ. Это позволяет вставлять контрольные элементы, например, регуляторные переключатели, раскрытые в данном документе, большие трансгены, множественные трансгены и т.д.

[00220] ФИГ. 1А-1Е схематически показывают неограничивающие примерные зкДНК-векторы для экспрессии белка FVIII или соответствующую последовательность зкДНК-плазмид. ЗкДНК-векторы для экспрессии белка FVIII являются бескапсидными и могут быть получены из плазмиды, кодирующей в указанном порядке: первый ITR, экспрессионную кассету, содержащую трансген, и второй ITR. Экспрессионная кассета может включать одну или более регуляторных последовательностей, которые обеспечивают и/или контролируют экспрессию трансгена, например, экспрессионная кассета может содержать один или более из следующих элементов в указанном порядке: энхансер/промотор, ORF репортера (трансгена), посттранскрипционный регуляторный элемент (например, WPRE) и сигнал полиаденилирования и терминации (например, BGH поли(А)).

[00221] Экспрессионная кассета также может содержать участок внутренней посадки рибосомы (IRES) и/или элемент 2А. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторный переключатель, которые описаны в данном документе в разделе, озаглавленном «Регуляторные переключатели», для контроля и регуляции экспрессии белка FVIII, и могут включать, при необходимости, регуляторный переключатель, который представляет собой «аварийный выключатель» (kill switch) для обеспечения контролируемой гибели клетки, содержащей зкДНК-вектор.

[00222] Экспрессионная кассета может содержать более 4000 нуклеотидов, 5000 нуклеотидов, 10000 нуклеотидов или 20000 нуклеотидов, или 30000 нуклеотидов, или 40000 нуклеотидов, или 50000 нуклеотидов, или любой диапазон примерно от 4000 до 10000 нуклеотидов, или 10000-50000 нуклеотидов, или более 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 75000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 1000 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 5000 нуклеотидов. Векторы зкДНК не имеют ограничений по размеру ААВ-векторов, заключенных в капсид, что позволяет доставлять экспрессионную кассету большого размера для обеспечения эффективной экспрессии трансгена. Согласно некоторым вариантам реализации зкДНК-вектор лишен специфического для прокариот метилирования.

[00223] ЗкДНК-экспрессионная кассета может включать, например, экспрессируемую экзогенную последовательность (например, открытую рамку считывания) или трансген, который кодирует белок, который либо отсутствует, либо не активен, либо обладает недостаточной активностью у субъекта-реципиента, или ген, который кодирует белок, имеющий целевой биологический или терапевтический эффект. Трансген может кодировать продукт гена, функция которого может заключаться в корректировке экспрессии дефектного гена или транскрипта. В принципе, экспрессионная кассета может включать любой ген, который кодирует белок, полипептид или РНК, который либо снижен, либо отсутствует из-за мутации, или который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего раскрытия.

[00224] Экспрессионная кассета может содержать любой трансген (например, кодирующий белок FVIII), например, белок FVIII, который можно применять для лечения гемофилии А у субъекта, то есть терапевтический белок FVIII. ЗкДНК-вектор можно применять для доставки и экспрессии любого белка FVIII, представляющего интерес, у субъекта, по отдельности или в комбинации с нуклеиновыми кислотами, кодирующими полипептиды, или некодирующими нуклеиновыми кислотами (например, РНКи, miR и т.д.), а также экзогенных генов и нуклеотидных последовательностей, включая вирусные последовательности, в геноме субъектов, например, последовательности вируса ВИЧ и тому подобное. Предпочтительно зкДНК-вектор, раскрытый в данном документе, применяют для терапевтических целей (например, для медицинских, диагностических или ветеринарных целей) или для иммуногенных полипептидов. Согласно определенным вариантам реализации зкДНК-вектор можно применять для экспрессии любого гена, представляющего интерес, у субъекта, который включает один или более полипептидов, пептидов, рибозимов, пептидных нуклеиновых кислот, миРНК, РНКи, антисмысловых олигонуклеотидов, антисмысловых полинуклеотидов или РНК (кодирующих или некодирующих; например, киРНК, кшРНК, микро-РНК и их антисмысловых аналогов (например, antagoMiR)), антител, слитых белков или любую их комбинацию.

[00225] Экспрессионная кассета также может кодировать полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, миРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)). Экспрессионные кассеты могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как β-лактамаза, β-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.

[00226] Последовательности, обеспеченные в экспрессионной кассете, экспрессионная конструкция зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут быть оптимизированы по кодонам для целевой клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека, путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Херндон, Виржиния, 20171) или другой общедоступной базы данных. Согласно некоторым вариантам реализации нуклеиновая кислота, кодирующая белок FVIII, оптимизирована для экспрессии у человека и/или представляет собой FVIII человека или его функциональный фрагмент, как известно в данной области техники.

[00227] Трансген, экспрессируемый зкДНК-вектором для экспрессии белка FVIII, как описано в данном документе, кодирует белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII отличаются от экспрессионных векторов на основе плазмид по многим структурным признакам. ЗкДНК-векторы могут обладать одним или более из следующих признаков: отсутствие исходной (т.е. не вставленной) бактериальной ДНК, отсутствие прокариотической точки начала репликации, самодостаточность, т.е. им не требуются никакие последовательности, кроме двух ITR, включая сайт связывания Rep и сайт концевого разрешения (RBS и TRS), и экзогенную последовательность между ITR, присутствие последовательностей ITR, которые образуют шпильки, и отсутствие метилирования ДНК бактериального типа или фактически любого другого метилирования, которое считается аномальным у млекопитающего-хозяина. В целом векторы согласно настоящему изобретению предпочтительно не содержат никакой прокариотической ДНК, но предусмотрено, что некоторая прокариотическая ДНК может быть вставлена в виде экзогенной последовательности, в качестве неограничивающего примера, в промоторной или энхансерной области. Еще один важный признак, отличающий зкДНК-векторы от экспрессионных векторов на основе плазмид, заключается в том, что зкДНК-векторы представляют собой одноцепочечные линейные ДНК с замкнутыми концами, в то время как плазмиды всегда представляют собой двухцепочечные ДНК.

[00228] ЗкДНК-векторы для экспрессии белка FVIII, продуцируемые с помощью способов, предложенных в данном документе, предпочтительно имеют линейную и непрерывную структуру, а не прерывистую структуру, согласно определению с помощью анализа с использованием расщепления рестрикционными ферментами (ФИГ. 4D). Как полагают, линейная и непрерывная структура более устойчива к атаке клеточными эндонуклеазами, а также с меньшей вероятностью рекомбинируется и вызывает мутагенез. Таким образом, зкДНК-вектор в виде линейной и непрерывной структуры является предпочтительным вариантом реализации. Непрерывный, линейный, одноцепочечный, с внутримолекулярным дуплексом зкДНК-вектор может иметь ковалентно связанные концевые участки без последовательностей, кодирующих белки капсида ААВ. Эти зкДНК-векторы структурно отличаются от плазмид (включая зкДНК-плазмиды, описанные в данном документе), которые представляют собой кольцевые дуплексные молекулы нуклеиновых кислот бактериального происхождения. Комплементарные цепи плазмид могут быть разделены после денатурации с получением двух молекул нуклеиновых кислот, в то время как зкДНК-векторы, которые имеют комплементарные цепи, представляют собой единую молекулу ДНК и, следовательно, остаются единой молекулой даже после денатурации. Согласно некоторым вариантам реализации зкДНК-векторы, описанные в данном документе, могут быть получены без метилирования оснований ДНК прокариотического типа, в отличие от плазмид. Таким образом, зкДНК-векторы и зкДНК-плазмиды различаются как по структуре (в частности, линейная в сопоставлении с кольцевой), так и с точки зрения методов, используемых для получения и очистки этих различных объектов (см. ниже), а также с точки зрения метилирования ДНК, которое относится к прокариотическому типу для зкДНК-плазмид и эукариотическому типу для зкДНК-вектора.

[00229] Существует несколько преимуществ применения зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, по сравнению с экспрессионными векторами на основе плазмид, такие преимущества включают, но не ограничиваются перечисленными: 1) плазмиды содержат последовательности бактериальной ДНК и подвергаются метилированию, специфическому для прокариотов, например, метилированию 6-метиладенозина и 5-метилцитозина, в то время как последовательности бескапсидного ААВ-вектора имеют эукариотическое происхождение и не подвергаются метилированию, специфическому для прокариотов; в результате бескапсидные ААВ-векторы с меньшей вероятностью индуцируют воспалительные и иммунные ответы по сравнению с плазмидами; 2) в то время как плазмиды требуют присутствия гена устойчивости во время производственного способа, зкДНК-векторы не требуют; 3) в то время как кольцевая плазмида не доставляется в ядро при введении в клетку и требует чрезмерной нагрузки, чтобы преодолеть разрушение клеточными нуклеазами, зкДНК-векторы содержат вирусные цис-элементы, т.е. ITR, которые придают устойчивость к нуклеазам и могут быть сконструированы для нацеливания и доставки в ядро. Предполагается, что минимальными определяющими элементами, необходимыми для функции ITR, являются сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTTGG-3' (SEQ ID NO: 64) для AAB2) плюс вариабельная палиндромная последовательность, обеспечивающая образование шпильки; и 4) зкДНК-векторы не имеют избыточной представленности динуклеотидов CpG, часто обнаруживаемых в плазмидах прокариотического происхождения, которые, как сообщается, связывают члена Toll-подобного семейства рецепторов, вызывая опосредуемый Т-клетками иммунный ответ. Напротив, трансдукция бескапсидными ААВ-векторами, описанными в данном документе, может быть эффективно нацелена на типы клеток и тканей, которые трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки. IV. Инвертированные концевые повторы (ITR)

[00230] Как раскрыто в данном документе, зкДНК-векторы для экспрессии белка FVIII содержат трансген или гетерологичную последовательность нуклеиновой кислоты, расположенные между двумя последовательностями инвертированных концевых повторов (ITR), причем указанные последовательности ITR могут представлять собой пару асимметричных ITR или пару симметричных или по существу симметричных ITR, в соответствии с определением этих терминов в данном документе. ЗкДНК-вектор, раскрытый в данном документе, может содержать последовательности ITR, которые выбраны из любых из: (i) по меньшей мере одного WT ITR и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию, при этом указанные способы согласно настоящему раскрытию могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц.

[00231] Согласно некоторым вариантам реализации последовательность ITR может происходить из вирусов семейства Parvoviridae, которое включает два подсемейства: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих насекомых. Подсемейство Parvovirinae (называемое парвовирусами) включает род Dependovirus, члены которого, в большинстве условий, нуждаются в коинфекции вспомогательным вирусом, таким как аденовирус или вирус герпеса, для эффективной инфекции. Род Dependovirus включает аденоассоциированный вирус (ААВ), который обычно инфицирует людей (например, серотипы 2, 3А, 3В, 5 и 6) или приматов (например, серотипы 1 и 4), а также родственные вирусы, которые инфицируют других теплокровных животных (например, аденоассоциированные вирусы бычьих, собачьих, лошадиных и овечьих). Парвовирусы и другие члены семейства Parvoviridae в общих чертах описаны в Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Chapter 69 в FIELDS VIROLOGY (3d Ed. 1996).

[00232] Несмотря на то, что ITR, приведенные в качестве примера в описании и Примерах в данном документе, представляют собой WT-ITR ААВ2, обычный специалист в данной области техники понимает, что, как было указано выше, можно использовать ITR из любого известного парвовируса, например, депендовируса, такого как ААВ (например, из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ 5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261, химерные ITR или ITR из любого синтетического ААВ. Согласно некоторым вариантам реализации ААВ может инфицировать теплокровных животных, например, птичьи (ПААВ), бычьи (БААВ), собачьи, лошадиные и овечьи аденоассоциированные вирусы. Согласно некоторым вариантам реализации ITR происходит из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусиного парвовируса (номер доступа в GenBank NC 001701); змеиного парвовируса 1 (номер доступа в GenBank NC 006148). Согласно некоторым вариантам реализации 5' WT-ITR может происходить из одного серотипа, а 3' WT-ITR может происходить из другого серотипа, как обсуждается в данном документе.

[00233] Обычному специалисту известно, что последовательности ITR имеют общую структуру двухцепочечного соединения Холлидея, которое обычно представляет собой Т-образную или Y-образную шпилечную структуру (см., например, ФИГ. 2А и ФИГ. 3А), где каждый WT-ITR образован двумя палиндромными плечами или петлями (В-В' и С-С), встроенными в большее палиндромное плечо (А-А'), и одноцепочечной последовательностью D (при этом порядок этих палиндромных последовательностей определяет «флип» или «флоп» ориентацию ITR). См., например, структурный анализ и сравнение последовательностей ITR из различных серотипов ААВ (ААВ1-ААВ6), описанные в Grimm et at, J. Virology, 2006; 80(1); 426-439; Yan et at, J. Virology, 2005; 364-379; Duan et ai, Virology 1999; 261; 8-14. Обычный специалист в данной области техники может легко определить последовательности WT-ITR из любого серотипа ААВ для использования в зкДНК-векторе или зкДНК-плазмиде на основе примерных последовательностей ITR ААВ2, предложенных в данном документе. См., например, сравнение последовательностей ITR из разных серотипов ААВ (ААВ1-ААВ6, птичий ААВ (ПААВ) и бычий ААВ (БААВ)), описанное в Grimm et al., J. Virology, 2006; 80(1); 426-439; в котором показан % идентичности левого ITR ААВ2 с левым ITR из других серотипов: ААВ-1 (84%), ААВ-3 (86%), ААВ-4 (79%), ААВ-5 (58%), ААВ-6 (левый ITR) (100%) и ААВ-6 (правый ITR) (82%).

А. Пары симметричных ITR

[00234] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), представляющую интерес нуклеотидную последовательность (например, экспрессионную кассету, описанную в данном документе) и второй ITR ААВ, причем указанный первый ITR (5' ITR) и второй ITR (3' ITR) симметричны или по существу симметричны по отношению друг к другу, то есть зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С и В-В' в трехмерном пространстве. В таком варианте реализации пара симметричных ITR или пара по существу симметричных ITR может представлять собой модифицированные ITR (например, mod-ITR), которые не являются ITR дикого типа. Пара mod-ITR может иметь одну и ту же последовательность, которая имеет одну или более модификаций относительно ITR дикого типа, и они обратно комплементарны друг другу (инвертированы). Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разные последовательности, но соответствующую или одинаковую симметричную трехмерную форму.

(i) ITR дикого типа

[00235] Согласно некоторым вариантам реализации симметричные ITR или по существу симметричные ITR относятся к дикому типу (WT-ITR), как описано в данном документе. Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию.

[00236] Соответственно, как раскрыто в данном документе, зкДНК-векторы содержат трансген или гетер о логичную последовательность нуклеиновой кислоты, расположенные между двумя фланкирующими последовательностями инвертированных концевых повторов дикого типа (WT-ITR), которые либо обратно комплементарны (инвертированы) по отношению друг к другу, либо, альтернативно, являются по существу симметричными по отношению друг к другу, то есть пара WT-ITR имеет симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации последовательность ITR дикого типа (например, WT-ITR ААВ) содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO: 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62).

[00237] Согласно одному аспекту зкДНК-векторы для экспрессии белка FVIII могут быть получены из векторного полинуклеотида, который кодирует гетер о логичную нуклеиновую кислоту, функционально расположенную между двумя последовательностями инвертированных концевых повторов WT (WT-ITR) (например, WT-ITR ААВ). Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации 5' WT-ITR происходит из одного серотипа ААВ, а 3' WT-ITR происходит из того же или другого серотипа ААВ. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR являются зеркальными отображениями друг друга, то есть они симметричны. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR происходят из одного и того же серотипа ААВ.

[00238] WT-ITR хорошо известны. Согласно одному варианту реализации два ITR происходят из одного и того же серотипа ААВ2. Согласно некоторым вариантам реализации можно использовать WT из других серотипов. Существует ряд гомологичных серотипов, например, ААВ2, ААВ4, ААВ6, ААВ8. Согласно одному варианту реализации можно применять высокогомологичные ITR (например, ITR со сходной петлевой структурой). Согласно другому варианту реализации можно применять WT-ITR ААВ, которые различаются в большей степени, например, ААВ2 и ААВ5, и еще в одном варианте реализации можно применять ITR, который по существу представляет собой WT, то есть он имеет основную петлевую структуру WT, но некоторые консервативные нуклеотидные изменения, которые не изменяют и не влияют на свойства. При использовании WT-ITR из одного и того же вирусного серотипа можно дополнительно использовать одну или более регуляторных последовательностей. Согласно определенным вариантам реализации регуляторная последовательность представляет собой регуляторный переключатель, который позволяет модулировать активность зкДНК, например, экспрессию кодируемого белка FVIII.

[00239] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к зкДНК-вектору для экспрессии белка FVIII, причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, кодирующую белок FVIII, функционально расположенную между двумя последовательностями инвертированных концевых повторов дикого типа (WT-ITR), при этом указанные WT-ITR могут происходить из одного и того же серотипа, разных серотипов или по существу симметричны по отношению друг к другу (т.е. они имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и B-B' в трехмерном пространстве). Согласно некоторым вариантам реализации симметричные WT-ITR содержат функциональный сайт концевого разрешения и сайт связывания Rep. Согласно некоторым вариантам реализации гетерологичная последовательность нуклеиновой кислоты кодирует трансген, и при этом вектор не находится в вирусном капсиде.

[00240] Согласно некоторым вариантам реализации WT-ITR являются одинаковыми, но обратно комплементарными по отношению друг к другу. Например, последовательность AACG в 5' ITR может представлять собой CGTT (т.е. обратно комплементарную последовательность) в 3' ITR в соответствующем сайте. В одном примере смысловая цепь 5' WT-ITR содержит последовательность ATCGATCG, а соответствующая смысловая цепь 3' WT-ITR содержит CGATCGAT (т.е. обратно комплементарную последовательность ATCGATCG). Согласно некоторым вариантам реализации WT-ITR зкДНК дополнительно содержит сайт концевого разрешения и сайт связывания репликационного белка (RPS) (иногда называемый сайтом связывания репликативного белка), например, сайт связывания Rep.

[00241] Примерные последовательности WT-ITR для применения в зкДНК-векторах для экспрессии белка FVIII, содержащих WT-ITR, представлены в Таблице 3 в данном документе, в которой показаны пары WT-ITR (5' WT-ITR и 3' WT-ITR).

[00242] В качестве иллюстративного примера согласно настоящему раскрытию предложен зкДНК-вектор для экспрессии белка FVIII, содержащий промотор, функционально связанный с трансгеном (например, гетерологичной последовательностью нуклеиновой кислоты), с регуляторным переключателем или без него, причем указанная зкДНК лишена капсидных белков и: (а) продуцируется с зкДНК-плазмиды (например, см. ФИГ. 1F-1G), которая кодирует WT-ITR, при этом каждый WT-ITR имеет одинаковое количество внутримолекулярных дуплексных пар оснований в его шпилечной вторичной конфигурации (предпочтительно исключая делецию любой концевой петли AAA или ТТТ в этой конфигурации по сравнению с этими референсными последовательностями), и (b) идентифицирована как зкДНК с использованием анализа для идентификации зкДНК с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях в Примере 1.

[00243] Согласно некоторым вариантам реализации фланкирующие WT-ITR по существу симметричны друг другу. Согласно этому варианту реализации 5' WT-ITR может происходить из одного серотипа ААВ, а 3' WT-ITR может происходить из другого серотипа ААВ так, что WT-ITR не являются идентичными обратно комплементарными последовательностями. Например, 5' WT-ITR может происходить из ААВ2, а 3' WT-ITR может происходить из другого серотипа (например, ААВ1, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12). Согласно некоторым вариантам реализации WT-ITR могут быть выбраны из двух разных парвовирусов, выбранных из любого из: ААВ1, ААВ2, ААВЗ, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Согласно некоторым вариантам реализации такая комбинация WT ITR представляет собой комбинацию WT ITR из ААВ2 и ААВ6. Согласно одному варианту реализации WT-ITR являются по существу симметричными, когда один ITR инвертирован относительно другого ITR, который идентичен по меньшей мере на 90%, идентичен по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, и имеет ту же симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации пара WT-ITR по существу симметрична, поскольку они имеют симметричную трехмерную пространственную организацию, например, имеют одинаковую трехмерную организацию плеч А, С-С', В-В' и D. Согласно одному варианту реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS). Согласно некоторым вариантам реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS) и в дополнение к вариабельной палиндромной последовательности, обеспечивающей образование шпилечной вторичной структуры. Гомология может быть определена с применением стандартных способов, хорошо известных в данной области техники, таких как BLAST («Basic Local Alignment Search Tool»), BLASTN при настройках по умолчанию.

[00244] Согласно некоторым вариантам реализации структурный элемент ITR может представлять собой любой структурный элемент, который участвует в функциональном взаимодействии ITR с большим белком Rep (например, Rep 78 или Rep 68). Согласно определенным вариантам реализации структурный элемент обеспечивает селективность взаимодействия ITR с большим белком Rep, т.е. определяет, по меньшей мере частично, какой белок Rep функционально взаимодействует с ITR. Согласно другим вариантам реализации структурный элемент физически взаимодействует с большим белком Rep, когда белок Rep связан с ITR. Каждый структурный элемент может представлять собой, например, вторичную структуру ITR, нуклеотидную последовательность ITR, промежуток между двумя или более элементами или комбинацию любого из перечисленных выше. Согласно одному варианту реализации структурные элементы выбраны из группы, состоящей из плеча А и А', плеча В и В', плеча С и С', плеча D, сайта связывания Rep (RBE) и RBE' (т.е. комплементарная последовательность RBE) и сайта концевого разрешения (TRS).

[00245] Только в качестве примера, в Таблице 2 указаны примерные комбинации WT-ITR.

[00246] tgcatgc 2: Примерные комбинации WT-ITR из одного и того же серотипа или разных серотипов, или разных парвовирусов. Показанный порядок не указывает на положение ITR, например, «ААВ1, ААВ2» демонстрирует, что зкДНК может содержать WT ITR ААВ1 в 5'-положении и WT ITR ААВ2 в 3'-положении или наоборот WT ITR ААВ2 в 5'-положении, a WT ITR ААВ1 в 3'-положении. Сокращения: ААВ серотипа 1 (ААВ1), ААВ серотипа 2 (ААВ2), ААВ серотипа 3 (ААВ3), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12); геном AABrh8, AABrh10, AAB-DJ и AAB-DJ8 (например, NCBI: NC 002077; NC 001401; NC 001729; NC 001829; NC 006152; NC 006260; NC 006261), ITR из теплокровных животных (птичий ААВ (ПААВ), бычий ААВ (БААВ), собачий, лошадиный и овечий ААВ), ITR из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусь: гусиного парвовируса (номер доступа в GenBank NC 001701); змея: змеиного парвовируса 1 (номер доступа в GenBank NC 006148).

[00247] Только в качестве примера, в Таблице 3 представлены последовательности примерных WT-ITR из некоторых различных серотипов ААВ.

[00248] Согласно некоторым вариантам реализации нуклеотидная последовательность последовательности WT-ITR может быть модифицирована (например, путем модификации 1, 2, 3, 4 или 5 или более нуклеотидов или любого их диапазона), при этом указанная модификация представляет собой замену комплементарным нуклеотидом, например, G для С, и наоборот, и Т для А, и наоборот.

[00249] Согласно определенным вариантам реализации настоящего изобретения зкДНК-вектор для экспрессии белка FVIII не имеет WT-ITR, состоящего из нуклеотидной последовательности, выбранной из любой из: SEQ ID NO: 1, 2, 5-14. Согласно альтернативным вариантам реализации настоящего изобретения, если зкДНК-вектор имеет WT-ITR, содержащий нуклеотидную последовательность, выбранную из любой из: SEQ ID NO: 1, 2, 5-14, то фланкирующий ITR также представляет собой WT, и зкДНК-вектор содержит регуляторный переключатель, например, как раскрыто в данном документе и в международной заявке PCT/US 18/49996 (например, см. Таблицу 11 PCT/US 18/49996). Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, как раскрыто в данном документе, и выбранный WT-ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 1, 2, 5-14.

[00250] ЗкДНК-вектор, для экспрессии белка FVIII, описанный в данном документе, может включать структуры WT-ITR, которые сохраняют функциональные части RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В, с использованием ITR дикого типа для иллюстративных целей, показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей WT-ITR, которые содержат Rep-связывающий сайт (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один WT-ITR является функциональным. Согласно альтернативным вариантам реализации, в которых зкДНК-вектор для экспрессии белка FVIII содержит два WT-ITR, которые по существу симметричны друг другу, по меньшей мере один WT-ITR является функциональным и по меньшей мере один WT-ITR является нефункциональным.

В. Модифицированные ITR (mod-ITR) в целом для зкДНК-векторов, содержащих пары асимметричных ITR или пары симметричных ITR

[00251] Как обсуждается в данном документе, зкДНК-вектор для экспрессии белка FVIII может содержать пару симметричных ITR или пару асимметричных ITR. В обоих случаях один или оба из ITR могут представлять собой модифицированные ITR - различие заключается в том, что в первом случае (то есть симметричные mod-ITR), mod-ITR имеют одинаковую трехмерную пространственную организацию (т.е. имеют одинаковые конфигурации плеча А-А', С-С' и В-В'), в то время как во втором случае (т.е. асимметричные mod-ITR), mod-ITR имеют разную трехмерную пространственную организацию (т.е. имеют разную конфигурацию плеч А-А', С-С' и В-В').

[00252] Согласно некоторым вариантам реализации модифицированный ITR представляет собой ITR, который модифицирован путем делеции, вставки и/или замены по сравнению с последовательностью ITR дикого типа (например, ITR ААВ). Согласно некоторым вариантам реализации по меньшей мере один из ITR в зкДНК-векторе содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62). В одном варианте реализации по меньшей мере один из ITR представляет собой нефункциональный ITR. Согласно одному варианту реализации не каждый из разных или модифицированных ITR представляет собой ITR дикого типа из разных серотипов.

[00253] Конкретные изменения и мутации в ITR подробно описаны в данном документе, но в контексте ITR «измененный», «мутированный» или «модифицированный» указывает на то, что нуклеотиды были вставлены, удалены и/или заменены относительно дикого типа, референса или исходной последовательности ITR. Измененный или мутированный ITR может представлять собой модифицированный ITR. В данном документе «сконструированный» относится к аспекту манипулирования человеком. Например, полипептид считается «сконструированным», когда по меньшей мере один аспект полипептида, например, его последовательность, подвергся манипуляции человеком, чтобы отличаться от аспекта, который существует в природе.

[00254] Согласно некоторым вариантам реализации mod-ITR может быть синтетическим. Согласно одному варианту реализации синтетический ITR основан на последовательностях ITR более чем из одного серотипа ААВ. Согласно другому варианту реализации синтетический ITR не включает последовательность на основе ААВ. В еще одном варианте реализации синтетический ITR сохраняет структуру ITR, описанную выше, хотя имеет только некоторую часть последовательности, полученной из ААВ, или не имеет ее. Согласно некоторым аспектам синтетический ITR преимущественно может взаимодействовать с Rep дикого типа или Rep конкретного серотипа, или в некоторых случаях не будет распознаваться Rep дикого типа и будет распознаваться только мутированным Rep.

[00255] Квалифицированный специалист может определить соответствующую последовательность в других серотипах с помощью известных средств. Например, определение того, происходит ли изменение в области А, А', В, В', С, С' или D, и определение соответствующей области в другом серотипе. Для определения соответствующей последовательности можно использовать BLAST® (Basic Local Alignment Search Tool) или другие программы гомологического выравнивания с параметрами по умолчанию. Согласно настоящему изобретению также предложены популяции и множество зкДНК-векторов, содержащих mod-ITR из комбинации различных серотипов ААВ, то есть один mod-ITR может происходить из одного серотипа ААВ, а другой mod-ITR может происходить из другого серотипа. Не ограничиваясь какой-либо теорией, согласно одному варианту реализации один ITR может происходить или основываться на последовательности ITR ААВ2, а другой ITR зкДНК-вектора может происходить или основываться на любой одной или более последовательностях ITR ААВ серотипа 1 (ААВ1), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12).

[00256] Любой ITR парвовируса можно применять в качестве ITR или основного ITR для модификации. Предпочтительно парвовирус представляет собой депендовирус. Более предпочтительно ААВ. Выбранный серотип может быть основан на тканевом тропизме серотипа. ААВ2 обладает широким тканевым тропизмом, ААВ1 преимущественно нацелен на нейроны и скелетные мышцы, а ААВ5 преимущественно нацелен на нейроны, пигментный эпителий сетчатки и фоторецепторы. ААВ6 преимущественно нацелен на скелетные мышцы и легкие. ААВ8 преимущественно нацелен на печень, скелетные мышцы, сердце и ткани поджелудочной железы. ААВ9 преимущественно нацелен на печень, скелетную и легочную ткань. Согласно одному варианту реализации модифицированный ITR основан на ITR ААВ2.

[00257] Более конкретно, способность структурного элемента функционально взаимодействовать с конкретным большим белком Rep может быть изменена путем модификации структурного элемента. Например, нуклеотидная последовательность структурного элемента может быть модифицирована по сравнению с последовательностью ITR дикого типа. Согласно одному варианту реализации структурный элемент (например, плечо А, плечо А', плечо В, плечо В', плечо С, плечо С', плечо D, RBE, RBE' и TRS) ITR можно удалить и заменить структурным элементом дикого типа из другого парвовируса. Например, заменяющая структура может происходить из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, собачьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Например, ITR может представлять собой ITR ААВ2, а плечо А или А' или RBE могут быть заменены структурным элементом из ААВ5. В другом примере ITR может представлять собой ITR ААВ5, а плечи С или С', RBE и TRS могут быть заменены структурным элементом из ААВ2. В другом примере ITR ААВ может представлять собой ITR ААВ5, в котором плечи В и В' заменены В и В' ITR ААВ2.

[00258] Только в качестве примера, в Таблице 4 указаны примерные модификации по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях модифицированного ITR, где X указывает на модификацию по меньшей мере одной нуклеиновой кислоты (например, делецию, вставку и/или замену) в этом участке относительно соответствующего ITR дикого типа. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в любой из областей С и/или С', и/или В, и/или В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Например, если модификация приводит к получению любого из: одноплечевого ITR (например, одно плечо С-С' или одно плечо В-В'), или модифицированного плеча С-В' или плеча С'-В, или двухплечевого ITR по меньшей мере с одним усеченным плечом (например, усеченным плечом С-С' и/или усеченным плечом В-В'), по меньшей мере одно плечо или по меньшей мере одно из двух плеч ITR (где одно плечо может быть усечено) сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации усеченное плечо С-С' и/или усеченное плечо В-В' имеет три последовательных Т-нуклеотида (т.е. ТТТ) в концевой петле.

[00259] Таблица 4: Примерные комбинации модификаций по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в различных областях или плечах В-В' и С-С' ITR (X указывает модификацию нуклеотида, например, добавление, делецию или замену по меньшей мере одного нуклеотида в области).

[00260] Согласно некоторым вариантам реализации mod-ITR для применения в зкДНК-векторе для экспрессии белка FVIII содержит пару асимметричных ITR или пару симметричных mod-ITR, как раскрыто в данном документе, может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида в любой одной или более областях, выбранных из: между А' и С, между С и С', между С' и В, между В и В' и между В' и А. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях С или С' либо В или В' по-прежнему сохраняет концевую петлю структуры стебель-петля. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно альтернативным вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида А (т.е. AAA) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в любой одной или более из областей, выбранных из: А', А и/или D. Например, в некоторых вариантах реализации, модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А и/или А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области D.

[00261] Согласно одному варианту реализации нуклеотидная последовательность структурного элемента может быть модифицирована (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона) для получения модифицированного структурного элемента. Согласно одному варианту реализации конкретные модификации ITR приведены в данном документе в качестве примеров (например, SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или показанные на ФИГ. 7А-7В из PCT/US 2018/064242, поданной 6 декабря 2018 г. (например, SEQ ID NO 97-98, 101-103, 105-108, 111-112, 117-134, 545-54 в PCT/US 2018/064242)). Согласно некоторым вариантам реализации ITR может быть модифицирован (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона). Согласно другим вариантам реализации ITR может иметь по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более идентичности последовательности с одним из модифицированных ITR, имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или RBE-содержащим участком плеча А-А' и плеч С-С' и В-В', имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или представленных в Таблицах 2-9 (т.е. SEQ ID NO: 110-112, 115-190, 200-468) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.

[00262] Согласно некоторым вариантам реализации модифицированный ITR может, например, содержать удаление или делецию всего конкретного плеча, например, всего или части плеча А-А', или всего или части плеча В-В', или всего или части плеча С-С', или, альтернативно, удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований, образующих стебель петли, при условии, что конечная петля, кэпирующая стебель (например, одно плечо), все еще присутствует (например, см. ITR-21 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' (см., например, ITR-1 на ФИГ. 3В или ITR-45 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' и удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Предусмотрена любая комбинация удаления пар оснований, например, могут быть удалены 6 пар оснований в плече С-С' и 2 пары оснований в плече В-В'. В качестве иллюстративного примера, ФИГ. 3В показывает примерный модифицированный ITR по меньшей мере с 7 парами оснований, удаленными из каждой из части С и части С', заменой нуклеотида в петле между областями С и С' и делецией по меньшей мере одной пары оснований из каждой из области В и областей В' так, что модифицированный ITR содержит два плеча, из которых по меньшей мере одно плечо (например, С-С') усечено. Согласно некоторым вариантам реализации модифицированный ITR также содержит делецию по меньшей мере одной пары оснований из каждой из области В и областей В' так, что плечо В-В' также усечено относительно WT ITR.

[00263] Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 50 (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50) делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа. Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 30 делеций нуклеотидов относительно полноразмерной последовательности WT ITR. Согласно некоторым вариантам реализации модифицированный ITR имеет от 2 до 20 делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа.

[00264] Согласно некоторым вариантам реализации модифицированный ITR не содержит никаких делеций нуклеотидов в RBE-содержащей части областей А или А', чтобы не препятствовать репликации ДНК (например, связывание RBE белком Rep или образование одноцепочечного разрыва в сайте концевого разрешения). Согласно некоторым вариантам реализации модифицированный ITR, предусмотренный для применения в данном документе, имеет одну или более делеций в области В, В', С и/или С, как описано в данном документе.

[00265] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару симметричных ITR или пару асимметричных ITR, содержит регуляторный переключатель, как раскрыто в данном документе, и по меньшей мере один выбранный модифицированный ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187.

[00266] Согласно другому варианту реализации структура структурного элемента может быть модифицирована. Например, структурный элемент имеет изменение высоты стебля и/или количества нуклеотидов в петле. Например, высота стебля может составлять примерно 2, 3, 4, 5, 6, 7, 8 или 9 нуклеотидов или более или любое значение в пределах указанного диапазона. Согласно одному варианту реализации высота стебля может составлять от примерно 5 нуклеотидов до примерно 9 нуклеотидов и он функционально взаимодействует с Rep. Согласно другому варианту реализации высота стебля может составлять примерно 7 нуклеотидов и он функционально взаимодействует с Rep. В другом примере петля может иметь 3, 4, 5, 6, 7, 8, 9 или 10 нуклеотидов или более или любое значение в пределах указанного диапазона.

[00267] Согласно другому варианту реализации количество сайтов связывания GAGY или родственных GAGY сайтов связывания в RBE или продленном RBE может быть увеличено или уменьшено. В одном примере RBE или продленный RBE может содержать 1, 2, 3, 4, 5 или 6 или более сайтов связывания GAGY или любое значение в пределах указанного диапазона. Каждый сайт связывания GAGY может независимо представлять собой точную последовательность GAGY или последовательность, сходную с GAGY, при условии, что последовательность достаточна для связывания белка Rep.

[00268] Согласно другому варианту реализации расстояние между двумя элементами (такими как, но не ограничиваясь перечисленными, RBE и шпилька) может быть изменено (например, увеличено или уменьшено) для изменения функционального взаимодействия с большим белком Rep. Например, расстояние может составлять примерно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или 21 нуклеотид или более или любое значение в пределах указанного диапазона.

[00269] ЗкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, может включать структуру ITR, которая модифицирована относительно структуры ITR дикого типа ААВ2, раскрытой в данном документе, но все еще сохраняет функциональную часть RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей ITR, которые содержат сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один ITR (wt или модифицированный ITR) является функциональным. Согласно альтернативным вариантам реализации, когда зкДНК-вектор для экспрессии белка FVIII содержит два модифицированных ITR, которые отличаются или асимметричны по отношению друг к другу, по меньшей мере один модифицированный ITR является функциональным и по меньшей мере один модифицированный ITR является нефункциональным.

[00270] Согласно некоторым вариантам реализации модифицированный ITR (например, левый или правый ITR) зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, имеет модификации в плече петли, усеченном плече или спейсере. Примерные последовательности ITR, имеющие модификации в плече петли, усеченном плече или спейсере, перечислены в Таблице 2 (т.е. SEQ ID NO: 135-190, 200-233); Таблице 3 (например, SEQ ID NO: 234-263); Таблице 4 (например, SEQ ID NO: 264-293); Таблице 5 (например, SEQ ID NO: 294-318 в данном документе); Таблице 6 (например, SEQ ID NO: 319-468); и Таблице 7-9 (например, SEQ ID NO: 101-110, 111-112, 115-134) или в Таблице 10А или 10В (например, SEQ ID NO: 9, 100, 469-483, 484-499) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.

[00271] Согласно некоторым вариантам реализации модифицированный ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR, выбирают из любых или из комбинации ITR, приведенных в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 и 10A-10В международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.

[00272] Дополнительные примерные модифицированные ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR в каждом из указанных выше классов, представлены в Таблицах 5А и 5В. Прогнозируемая вторичная структура правых модифицированных ITR в Таблице 5А показана на ФИГ. 7А международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., и прогнозируемая вторичная структура левых модифицированных ITR в Таблице 5В показана на ФИГ. 7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ посредством ссылки.

[00273] В Таблице 5А и Таблице 5В представлены примерные правые и левые модифицированные ITR.

[00274] Таблица 5А: Примерные модифицированные правые ITR. Эти примерные модифицированные правые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).

[00275] ТАБЛИЦА 5В: Примерные модифицированные левые ITR. Эти примерные модифицированные левые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и комплементарную последовательность RBE (т.е. RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).

[00276] Согласно одному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ, причем указанный первый ITR (5'-ITR) и второй ITR (3'-ITR) являются асимметричными по отношению друг к другу, т.е. они имеют разную трехмерную пространственную конфигурацию по отношению друг к другу. В качестве примерного варианта реализации первый ITR может представлять собой ITR дикого типа, а второй ITR может представлять собой мутированный или модифицированный ITR или наоборот первый ITR может представлять собой мутированный или модифицированный ITR, а второй ITR может представлять собой ITR дикого типа. Согласно некоторым вариантам реализации первый ITR и второй ITR оба представляют собой mod-ITR, но имеют разные последовательности или разные модификации и, таким образом, не являются одинаковыми модифицированными ITR и имеют разные трехмерные пространственные конфигурации. Другими словами, зкДНК-вектор с асимметричными ITR содержит ITR, в которых любые изменения в одном ITR относительно WT-ITR не отражаются в другом ITR; или, альтернативно, если асимметричные ITR имеют пару модифицированных асимметричных ITR, они могут иметь различную последовательность и различную трехмерную форму по отношению друг к другу. Примерные асимметричные ITR в зкДНК-векторе для экспрессии белка FVIII и для применения в получении зкДНК-плазмиды представлены в Таблицах 5А и 5В.

[00277] Согласно альтернативному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит два симметричных mod-ITR, то есть оба ITR имеют одинаковую последовательность, но обратно комплементарны (инвертированы) друг другу. Согласно некоторым вариантам реализации пара симметричных mod-ITR содержит по меньшей мере одну или любую комбинацию делеции, вставки или замены относительно последовательности ITR дикого типа из того же серотипа ААВ. Добавления, делеции или замены в симметричных ITR одинаковы, но обратно комплементарны друг другу. Например, вставка 3 нуклеотидов в области С 5' ITR будет отражаться во вставке 3 обратно комплементарных нуклеотидов в соответствующем участке в области С' 3' ITR. Исключительно для целей иллюстрации, если добавление представляет собой AACG в 5' ITR, добавление представляет собой CGTT в 3' ITR в соответствующем сайте. Например, если смысловая цепь 5' ITR представляет собой ATCGATCG с добавлением AACG между G и А, это дает последовательность ATCGAACGATCG (SEQ ID NO: 51). Соответствующая смысловая цепь 3' ITR представляет собой CGATCGAT (обратно комплементарная последовательность ATCGATCG) с добавлением CGTT (т.е. обратно комплементарная последовательность AACG) между Т и С, что дает последовательность CGATCGTTCGAT (SEQ ID NO: 49) (обратно комплементарная последовательность ATCGAACGATCG) (SEQ ID NO: 51).

[00278] Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разную последовательность, но иметь соответствующую или одинаковую симметричную трехмерную форму. Например, один модифицированный ITR может происходить из одного серотипа, а другой модифицированный ITR может происходить из другого серотипа, но они имеют одинаковую мутацию (например, вставку, делецию или замену нуклеотидов) в одной и той же области. Другими словами, только для иллюстративных целей, 5'mod-ITR может происходить из ААВ2 и иметь делецию в области С, а 3' mod-ITR может происходить из ААВ5 и иметь соответствующую делецию в области С', и при условии, что 5'mod-ITR и 3'mod-ITR имеют одинаковую или симметричную трехмерную пространственную организацию, они предусмотрены для применения в настоящем изобретении в качестве пары модифицированных ITR.

[00279] Согласно некоторым вариантам реализации пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR. Только в качестве примера, по существу симметричные ITR могут иметь симметричную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве. Это может происходить, например, когда пара G-C модифицирована, например, в пару C-G или наоборот, или когда пара А-Т модифицирована в пару Т-А, или наоборот. Следовательно, используя приведенный выше иллюстративный пример модифицированного 5' ITR как ATCGAACGATCG (SEQ ID NO: 51) и модифицированного 3' ITR как CGATCGTTCGAT (SEQ ID NO: 49) (т.е. обратно комплементарной последовательности для ATCGAACGATCG (SEQ ID NO: 51)), эти модифицированные ITR все равно были бы симметричными, если бы, например, 5' ITR имел последовательность ATCGAACCATCG (SEQ ID NO: 50), где G в добавлении модифицирован на С, и по существу симметричный 3'-ITR имеет последовательность CGATCGTTCGAT (SEQ ID NO: 49), без соответствующей модификации Т в дополнение к а. Согласно некоторым вариантам реализации такая пара модифицированных ITR является по существу симметричной, поскольку пара модифицированных ITR имеет симметричную стереохимию.

[00280] Таблица 6 показывает примерные пары симметричных модифицированных ITR (т.е. левого модифицированного ITR и симметричного правого модифицированного ITR) для применения в зкДНК-векторе для экспрессии белка FVIII. Выделенный жирным шрифтом (красным) участок последовательностей идентифицирует часть последовательностей ITR (т.е. последовательности петель А-А', С-С' и В-В'), также показанных на ФИГ. 31А-46В. Эти примерные модифицированные ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).

[00281] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару асимметричных ITR, может содержать ITR с модификацией, соответствующей любой из модификаций в последовательностях ITR или неполных последовательностях ITR, представленных в любой одной или более из Таблиц 5А-5В в данном документе, или последовательностях, показанных на ФИГ. 7А-7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ, или раскрытых в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 или 10А-10В международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., полностью включенной в данный документ посредством ссылки.

V. Примерные зкДНК-векторы

[00282] Как описано выше, настоящее раскрытие относится к рекомбинантным экспрессионным зкДНК-векторам и зкДНК-векторам, которые кодируют белок FVIII, содержащим любой из: пары асимметричных ITR, пары симметричных ITR или пары по существу симметричных ITR, как описано выше. Согласно определенным вариантам реализации настоящее раскрытие относится к рекомбинантным зкДНК-векторам для экспрессии белка FVIII, имеющим фланкирующие последовательности ITR и трансген, причем указанные последовательности ITR являются асимметричными, симметричными или по существу симметричными по отношению друг к другу, как определено в данном документе, и зкДНК дополнительно содержит нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, содержащую нуклеиновую кислоту трансгена), расположенную между фланкирующими ITR, при этом указанная молекула нуклеиновой кислоты лишена последовательностей, кодирующих вирусный капсидный белок.

[00283] Экспрессионный зкДНК-вектор для экспрессии белка FVIII может представлять собой любой зкДНК-вектор, который можно удобно подвергнуть методикам рекомбинантной ДНК, включая нуклеотидную последовательность (и), описанную в данном документе, при условии, что по меньшей мере один ITR изменен. ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию совместимы с клеткой-хозяином, в которую должен быть введен зкДНК-вектор. Согласно определенным вариантам реализации зкДНК-векторы могут быть линейными. Согласно определенным вариантам реализации зкДНК-векторы могут существовать как внехромосомные объекты. Согласно определенным вариантам реализации зкДНК-векторы согласно настоящему раскрытию могут содержать элемент (ы), который позволяет интегрировать донорную последовательность в геном клетки-хозяина. В данном документе «трансген» и «гетер о логичная нуклеотидная последовательность» являются синонимами и кодируют белок FVIII, как описано в данном документе.

[00284] На ФИГ. 1A-1G показаны схемы функциональных компонентов двух неограничивающих плазмид, которые можно применять для получения зкДНК-вектора для экспрессии белка FVIII. ФИГ. 1А, 1B, 1D, 1F показывают конструкцию зкДНК-векторов или соответствующих последовательностей зкДНК-плазмид для экспрессии белка FVIII. ЗкДНК-векторы не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, кассету экспрессируемого трансгена и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. ЗкДНК-векторы для экспрессии белка FVIII не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, экспрессируемый трансген (белок или нуклеиновую кислоту) и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. Согласно некоторым вариантам реализации кассета экспрессируемого трансгена включает, при необходимости: энхансер/промотор, одно или более плеч гомологии, донорную последовательность, посттранскрипционный регуляторный элемент (например, WPRE, например, SEQ ID NO: 67), а также сигнал полиаденилирования и терминации (например, BGH поли(А), например, SEQ ID NO: 68).

[00285] ФИГ. 5 изображает гель, подтверждающий продуцирование зкДНК из нескольких плазмидных конструкций с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4А выше и в Примерах.

А. Регуляторные элементы

[00286] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторные переключатели, описанные в данном документе, для регуляции экспрессии трансгена или аварийный выключатель, который может уничтожить клетку, содержащую зкДНК-вектор, кодирующий белок FVIII. Регуляторные элементы, включая регуляторные переключатели, которые можно применять в настоящем изобретении, более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.

[00287] В вариантах реализации вторая нуклеотидная последовательность включает регуляторную последовательность и нуклеотидную последовательность, кодирующую нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность гена функционально связана с нуклеотидной последовательностью, кодирующей нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность пригодна для контроля экспрессии нуклеазы в клетке-хозяине. Согласно определенным вариантам реализации регуляторная последовательность включает подходящую промоторную последовательность, способную направлять транскрипцию гена, функционально связанного с промоторной последовательностью, такого как нуклеотидная последовательность, кодирующая нуклеазу (нуклеазы) согласно настоящему раскрытию. Согласно определенным вариантам реализации вторая нуклеотидная последовательность включает интронную последовательность, связанную с 5'-концом нуклеотидной последовательности, кодирующей нуклеазу. Согласно определенным вариантам реализации последовательность энхансера обеспечена в 5-направлении относительно промотора для повышения эффективности промотора. Согласно определенным вариантам реализации регуляторная последовательность включает энхансер и промотор, причем вторая нуклеотидная последовательность включает интронную последовательность в 5-направлении от нуклеотидной последовательности, кодирующей нуклеазу, при этом интрон включает один или более сайтов расщепления нуклеазой, и при этом промотор функционально связан с нуклеотидной последовательностью, кодирующей нуклеазу.

[00288] ЗкДНК-векторы для экспрессии белка FVIII, полученные синтетическим путем или с использованием метода продуцирования на основе клеток, как описано в данном документе в Примерах, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов, таких как посттранскрипционный регуляторный элемент WHP (WPRE) (например, SEQ ID NO: 67) и BGH поли(А) (SEQ ID NO: 68). Подходящие экспрессионные кассеты для применения в экспрессионных конструкциях не имеют налагаемого вирусным капсидом ограничения по упаковке.

(i) Промоторы:

[00289] Обычный специалист в данной области техники поймет, что промоторы, используемые в зкДНК-векторах для экспрессии белка FVIII, как описано в данном документе, должны быть адаптированы в соответствии с конкретными последовательностями, на которые они оказывают промоторное действие. В соответствии с некоторыми вариантами реализации промотор представляет собой любой промотор или промоторную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.

[00290] В соответствии с некоторыми вариантами реализации промотор представляет собой промотор VandenDriessche (VD). В соответствии с некоторыми вариантами реализации промотор VD содержит SEQ ID NO: 191, представленную ниже:

[00291] В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 85% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 90% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 95% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 96% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 97% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 98% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 99% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор состоит из последовательности нуклеиновой кислоты SEQ ID NO: 191.

[00292] Экспрессионные кассеты зкДНК-вектора для экспрессии белка FVIII могут включать промотор, который может влиять на общие уровни экспрессии, а также на клеточную специфичность. В случае экспрессии трансгена, например, экспрессии белка FVIII, они могут включать высокоактивный немедленный ранний промотор вирусного происхождения. Экспрессионные кассеты могут содержать тканеспецифические эукариотические промоторы для ограничения экспрессии трансгена конкретными типами клеток и снижения токсических эффектов и иммунных ответов, обусловленных нерегулируемой эктопической экспрессией. Согласно некоторым вариантам реализации экспрессионная кассета может содержать промотор или синтетический регуляторный элемент, такой как промотор CAG (SEQ ID NO: 72). Промотор CAG содержит (i) ранний энхансерный элемент цитомегаловируса (CMV), (ii) промотор, первый экзон и первый интрон гена бета-актина курицы, и (iii) акцептор сплайсинга гена бета-глобина кролика. В качестве альтернативы, экспрессионная кассета может содержать промотор альфа-1-антитрипсина (ААТ) (SEQ ID NO: 73 или SEQ ID NO: 74), специфический для печени (LP1) промотор (SEQ ID NO: 75 или SEQ ID NO: 76) или промотор фактора удлинения-1-альфа (EF1a) человека (например, SEQ ID NO: 77 или SEQ ID NO: 78). Согласно некоторым вариантам реализации экспрессионная кассета включает один или более конститутивных промоторов, например, ретровирусный LTR-промотор вируса саркомы Рауса (RSV) (необязательно с энхансером RSV) или немедленный ранний промотор цитомегаловируса (CMV) (необязательно с энхансером CMV, например, SEQ ID NO: 79). В качестве альтернативы, можно применять индуцируемый промотор, нативный для трансгена промотор, тканеспецифический промотор или различные промоторы, известные в данной области техники.

[00293] Подходящие промоторы, включая те, которые описаны в данном документе, могут происходить из вирусов и, соответственно, могут называться вирусными промоторами, или они могут происходить из любого организма, в том числе прокариотических или эукариотических организмов. Для управления экспрессией с помощью любой РНК-полимеразы (например, pol I, pol II, pol III) могут применяться подходящие промоторы. Примерные промоторы включают, но не ограничиваются перечисленными, ранний промотор SV40, промотор длинного концевого повтора (LTR) вируса опухоли молочной железы мыши; большой поздний промотор аденовируса (Ad MLP); промотор вируса простого герпеса (HSV), промотор цитомегаловируса (CMV), такой как область немедленного раннего промотора CMV (CMVIE), промотор вируса саркомы Рауса (RSV), промотор U6 малой ядерной РНК человека (U6, например, SEQ ID NO: 80) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), улучшенный промотор U6 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), промотор H1 человека (H1) (например, SEQ ID NO: 81 или SEQ ID NO: 155), промотор CAG, промотор альфа-1-антитрипсина человека (НААТ) (например, SEQ ID NO: 82) и т.п. Согласно определенным вариантам реализации указанные промоторы изменяют на их содержащем интрон 3'-конце так, чтобы они включали один или более сайтов расщепления нуклеазами. Согласно определенным вариантам реализации ДНК, содержащая сайт(ы) расщепления нуклеазой, является чужеродной для ДНК промотора.

[00294] Согласно одному варианту реализации используемый промотор представляет собой нативный промотор гена, кодирующего терапевтический белок. Промоторы и другие регуляторные последовательности соответствующих генов, кодирующих терапевтические белки, известны и были охарактеризованы. Используемая промоторная область может дополнительно включать одну или более дополнительных регуляторных последовательностей (например, нативных), например, энхансеров (например, SEQ ID NO: 79 и SEQ ID NO: 83), включая энхансер SV40 (SEQ ID NO: 126).

[00295] Согласно некоторым вариантам реализации промотор также может представлять собой промотор из гена человека, такого как убиквитин С человека (hUbC), актин человека, миозин человека, гемоглобин человека, мышечный креатин человека или металлотионеин человека. Промотор также может представлять собой тканеспецифический промотор, такой как специфический для печени промотор, например, альфа-1-антитрипсина человека (НААТ), природный или синтетический. Согласно одному варианту реализации доставку в печень можно обеспечить с использованием специфичного нацеливания на эндогенный АроЕ композиции, содержащей зкДНК-вектор, которую направляют в гепатоциты за счет рецептора липопротеина низкой плотности (ЛНП), присутствующего на поверхности гепатоцита.

[00296] Неограничивающие примеры промоторов, подходящих для применения в соответствии с настоящим изобретением, включают любой из промоторов, описанных в данном документе, или любой из следующих: промотор CAG, например, (SEQ ID NO: 72), промотор НААТ (SEQ ID NO: 82), промотор EF1-α человека (SEQ ID NO: 77) или фрагмент промотора EF1a (SEQ ID NO: 78), промотор IE2 (например, SEQ ID NO: 84) и промотор EF1-α крысы (SEQ ID NO: 85), промотор mEF1 (SEQ ID NO: 59) или фрагмент промотора 1E1 (SEQ ID NO: 125).

(ii) Энхансеры

[00297] Согласно некоторым вариантам реализации зкДНК, экспрессирующая FVIII, содержит один или более энхансеров. Согласно некоторым вариантам реализации последовательность энхансера расположена в 5'-направлении относительно последовательности промотора. Согласно некоторым вариантам реализации последовательность энхансера расположена в 3'-направлении относительно последовательности промотора. В соответствии с некоторыми вариантами реализации энхансер представляет собой любой энхансер или энхансерную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.

(iii) Последовательности 5'-UTR и интронные последовательности

[00298] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 5'-UTR и/или интронную последовательность, которая расположена в 3'-направлении относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации 5'-UTR расположена в 5-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 5'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9А, которая полностью включена в данный документ посредством ссылки.

(iv) Последовательности 3'-UTR

[00299] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 3'-UTR, которая расположена в 5'-направлении относительно последовательности 3'-ITR. Согласно некоторым вариантам реализации 3'-UTR расположена в 3'-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 3'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9В, которая полностью включена в данный документ посредством ссылки.

Последовательности полиаденилирования:

[00300] Последовательность, кодирующая последовательность полиаденилирования, может быть включена в зкДНК-вектор для экспрессии белка FVIII для стабилизации мРНК, экспрессируемой с указанного зкДНК-вектора, и для содействия ядерному экспорту и трансляции. Согласно одному варианту реализации зкДНК-вектор не включает последовательность полиаденилирования. Согласно другим вариантам реализации зкДНК-вектор для экспрессии белка FVIII включает по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50 или более адениновых динуклеотидов. Согласно некоторым вариантам реализации последовательность полиаденилирования содержит примерно 43 нуклеотида, примерно 40-50 нуклеотидов, примерно 40-55 нуклеотидов, примерно 45-50 нуклеотидов, примерно 35-50 нуклеотидов или любой диапазон между указанными значениями.

[00301] Экспрессионные кассеты могут включать любую последовательность полиаденилирования, известную в данной области техники, или ее вариант. Согласно некоторым вариантам реализации последовательность полиаденилирования (поли(А)) выбрана из любой из последовательностей, перечисленных в международной заявке № PCT/US 2020/021328, например, в Таблице 10, которая полностью включена в данный документ посредством ссылки. Также можно использовать другие последовательности поли(А), широко известные в данной области техники, например, включая, но не ограничиваясь перечисленными, природную последовательность, выделенную из бычьего BGHpA (например, SEQ ID NO: 68) или SV40pA вируса (например, SEQ ID NO: 86) или синтетическую последовательность (SEQ ID NO: 87). Некоторые экспрессионные кассеты также могут включать последовательность 5'-энхансера позднего поли(А)-сигнала (USE) SV40. Согласно некоторым вариантам реализации последовательность USE можно применять в комбинации с SV40pA или гетерологичным сигналом поли(А). Последовательности поли(А) расположены в 3-направлении относительно трансгена, кодирующего белок FVIII.

Экспрессионные кассеты также могут включать посттранскрипционный элемент для повышения экспрессии трансгена. Согласно некоторым вариантам реализации для повышения экспрессии трансгена применяют посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WHP) (WPRE) (например, SEQ ID NO: 67). Можно применять другие элементы посттранскрипционного процессинга, такие как посттранскрипционный элемент из гена тимидинкиназы вируса простого герпеса или вируса гепатита В (HBV). С трансгенами могут быть связаны секреторные последовательности, например, последовательности VH-02 и VK-A26, например, SEQ ID NO: 88 и SEQ ID NO: 89.

(vi) Последовательности ядерной локализации

[00302] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более последовательностей ядерной локализации (NLS), например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. Согласно некоторым вариантам реализации одна или более NLS расположены на амино-конце или рядом с ним, на карбокси-конце или рядом с ним, или в их комбинации (например, одна или более NLS на амино-конце и/или одна или более NLS на карбокси-конце). В случае присутствия более чем одной NLS, каждая из них может быть выбрана независимо от других так, что одна NLS будет присутствовать более чем в одной копии и/или в комбинации с одной или более другими NLS, присутствующими в одной или более копиях. Неограничивающие примеры NLS приведены в Таблице 7.

В. Дополнительные компоненты зкДНК-векторов

[00303] ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию могут содержать нуклеотиды, которые кодируют другие компоненты для экспрессии гена. Например, для выбора событий нацеливания на конкретные гены защитная кшРНК может быть встроена в микроРНК и вставлена в рекомбинантный зкДНК-вектор, предназначенный для сайт-специфической интеграции в высокоактивный локус, такой как локус альбумина. Такие варианты реализации могут обеспечивать систему для отбора и размножения генетически модифицированных гепатоцитов in vivo в любом генетическом окружении, например, описанном в Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016. ЗкДНК-векторы согласно настоящему раскрытию могут содержать один или более селективных маркеров, которые позволяют проводить селекцию трансформированных, трансфицированных, трансдуцированных или подобных клеток. Селективный маркер представляет собой ген, продукт которого обеспечивает биоцидную или вирусную устойчивость, устойчивость к тяжелым металлам, прототрофию ауксотрофам, NeoR и т.п. Согласно определенным вариантам реализации в донорные последовательности включены маркеры для положительной селекции, такие как NeoR. Маркеры для отрицательной селекции могут быть включены после донорных последовательностей, например, последовательность нуклеиновой кислоты HSV-tk, кодирующая маркер для отрицательной селекции, может быть включена в конструкцию нуклеиновой кислоты после донорной последовательности.

С. Регуляторные переключатели

[00304] Молекулярный регуляторный переключатель представляет собой переключатель, который генерирует измеряемое изменение состояния в ответ на сигнал. Такие регуляторные переключатели можно подходящим образом комбинировать с зкДНК-векторами для экспрессии белка FVIII, описанными в данном документе, чтобы контролировать выход экспрессии белка FVIII с зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который служит для тонкой настройки экспрессии белка FVIII. Например, он может выполнять функцию биосдерживания зкДНК-вектора. Согласно некоторым вариантам реализации переключатель представляет собой двухпозиционный («ON/OFF») переключатель, который предназначен для запуска или остановки (т.е. прекращения) экспрессии белка FVIII в зкДНК-векторе контролируемым и регулируемым образом. Согласно некоторым вариантам реализации указанный переключатель может включать «аварийный выключатель», который может давать клетке, содержащей указанный зкДНК-вектор, команду для запуска механизма запрограммированной клеточной смерти после активации переключателя. Примерные регуляторные переключатели, предусмотренные для применения в зкДНК-векторе для экспрессии белка FVIII, могут применяться для регуляции экспрессии трансгена и более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.

(i) Бинарные регуляторные переключатели

[00305] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который может служить для контролируемой модуляции экспрессии белка FVIII. Например, экспрессионная кассета, расположенная между ITR зкДНК-вектора, может дополнительно содержать регуляторную область, например, промотор, цис-элемент, репрессор, энхансер и т.д., которая функционально связана с последовательностью нуклеиновой кислоты, кодирующей белок FVIII, причем указанная регуляторная область регулируется одним или более кофакторами или экзогенными агентами. В качестве неограничивающего примера, регуляторные области могут модулироваться низкомолекулярными переключателями или индуцируемыми или репрессируемыми промоторами. Неограничивающие примеры индуцируемых промоторов представляют собой индуцируемые гормонами или индуцируемые металлами промоторы. Другие примерные индуцируемые промоторные/энхансерные элементы включают, но не ограничиваются перечисленными, индуцируемый RU486 промотор, индуцируемый экдизоном промотор, индуцируемый рапамицином промотор и промотор металлотионеина.

(ii) Низкомолекулярные регуляторные переключатели

[00306] Различные известные из уровня техники регуляторные переключатели на основе малых молекул известны в данной области техники и могут быть скомбинированы с зкДНК-векторами для экспрессии белка FVIII, раскрытыми в данном документе, с получением контролируемого регуляторный переключателем зкДНК-вектора. Согласно некоторым вариантам реализации регуляторный переключатель может быть выбран из чего-либо одного или комбинации следующего: пара ортогональный лиганд/ядерный рецептор, например, вариант ретиноидного рецептора/LG335 и GRQCIMFI, вместе с искусственным промотором, контролирующим экспрессию функционально связанного трансгена, как раскрыто в Taylor et al. ВМС Biotechnology 10 (2010): 15; сконструированные рецепторы стероидов, например, модифицированный рецептор прогестерона с усеченным С-концом, который не может связывать прогестерон, но связывает RU486 (мифепристон) (патент США №5364791); рецептор экдизона дрозофилы (Drosophila) и его экдистероидные лиганды (Saez, et al., PNAS, 97(26)(2000), 14512-14517); или переключатель, контролируемый антибиотиком триметопримом (ТМР), как описано в Sando R 3rd; Nat Methods. 2013, 10(11): 1085-8. Согласно некоторым вариантам реализации регуляторный переключатель для контроля трансгена или экспрессируемый зкДНК-вектором представляет собой переключатель для активации пролекарств, такой как раскрытый в патентах США 8771679 и 6339070.

(iii) Регуляторные переключатели «с кодом доступа»

[00307] Согласно некоторым вариантам реализации регуляторный переключатель может представлять собой «переключатель с кодом доступа» или «контур с кодом доступа». Переключатели с кодом доступа позволяют точно настроить контроль экспрессии трансгена с зкДНК-вектора при возникновении конкретных условий, т.е. для осуществления экспрессии и/или репрессии трансгена должна иметься комбинация условий. Например, для осуществления экспрессии трансгена должны возникнуть по меньшей мере условия А и В. Регуляторный переключатель с кодом доступа может представлять собой любое число условий, например, по меньшей мере 2 или по меньшей мере 3, или по меньшей мере 4, или по меньшей мере 5, или по меньшей мере 6, или по меньшей мере 7 или более условий, наличие которых необходимо для осуществления экспрессии трансгена. Согласно некоторым вариантам реализации должны возникнуть по меньшей мере 2 условия (например, условия А, В), а в некоторых вариантах реализации должны возникнуть по меньшей мере 3 условия (например, А, В и С или А, В и D). Только в качестве примера, для осуществления экспрессии гена с зкДНК, содержащей регуляторный переключатель с кодом доступа «АВС», требуется наличие условий А, В и С. Условия А, В и С могут быть следующими; условие А представляет собой наличие состояния или заболевания, условие В представляет собой гормональный ответ, и условие С представляет собой ответ на экспрессию трансгена. Например, если трансген редактирует дефектный ген ЕРО, то условием А является наличие хронической болезни почек (ХБП), условие В осуществляется при наличии гипоксических условий в почках субъекта, условие С заключается в нарушении привлечения эритропоэтин-продуцирующих клеток (ЭПК) в почках; или, альтернативно, в нарушении активации HIF-2. При повышении уровней кислорода или достижении целевого уровня ЕРО трансген снова отключается до момента возникновения 3 условий, которые его опять включат.

[00308] Согласно некоторым вариантам реализации регуляторный переключатель с кодом доступа или «контур с кодом доступа», предусмотренный для применения в зкДНК-векторе, содержит гибридные транскрипционные факторы (TF) для расширения диапазона и уровня сложности сигналов окружающей среды, используемых для определения условий биосдерживания. В отличие от блокирующего (deadman) выключателя, который запускает гибель клетки при наличии заранее определенного условия, «контур с кодом доступа» позволяет обеспечить выживание клеток или экспрессию трансгена при наличии конкретного «кода доступа», и может быть легко перепрограммирован, что позволяет обеспечить экспрессию трансгена и/или выживание клеток только при наличии заранее заданного условия окружающей среды или кода доступа.

[00309] Любые и все комбинации регуляторных переключателей, раскрытых в данном документе, например, низкомолекулярные переключатели, переключатели на основе нуклеиновых кислот, гибридные переключатели на основе малых молекул и нуклеиновых кислот, посттранскрипционные регуляторные переключатели трансгенов, посттрансляционная регуляция, контролируемые излучением переключатели, опосредуемые гипоксией переключатели и другие регуляторные переключатели, известные специалистам в данной области техники, раскрытые в данном документе, могут применяться в регуляторном переключателе с кодом доступа, как раскрыто в данном документе. Регуляторные переключатели, предусмотренные для применения, также обсуждаются в обзорной статье Kis et al., JR Soc Interface. 12: 20141000 (2015) и обобщены в Таблице 1 статьи Kis. Согласно некоторым вариантам реализации регуляторный переключатель для применения в системе с кодом доступа может быть выбран из любых переключателей или их комбинации, раскрытых в Таблице 11 международной заявки на патент PCT/US18/49996, которая полностью включена в данный документ посредством ссылки.

(iv) Регуляторные переключатели на основе нуклеиновых кислот для контроля экспрессии трансгена

[00310] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК основан на механизме контроля на основе нуклеиновых кислот. Примерные механизмы контроля на основе нуклеиновых кислот известны в данной области техники и предусмотрены для применения. Например, такие механизмы включают рибопереключатели, такие как раскрытые, например, в US 2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, патенте США 9222093 и заявке на европейский патент ЕР288071, и раскрытые в обзорной статье Villa JK et al. Microbiol Spectr. 2018 May; 6(3). Также включены чувствительные к метаболитам транскрипционные биосенсоры, такие как раскрытые в WO2018/075486 и WO2017/147585. Другие известные в данной области техники механизмы, предусмотренные для применения, включают подавление трансгена с применением киРНК или молекулы РНКи (например, miR, кшРНК). Например, зкДНК-вектор может содержать регуляторный переключатель, кодирующий молекулу РНКи, которая комплементарна двум частям трансгена, экспрессируемого зкДНК-вектором. При экспрессии такой РНКи, даже если трансген (например, белок FVIII) экспрессируется зкДНК-вектором, будет происходить его подавление под действием комплементарной молекулы РНКи, а если РНКи не экспрессируется, при экспрессии трансгена (например, белка FVIII) зкДНК-вектором, подавление трансгена под действием РНКи не происходит.

[00311] Согласно некоторым вариантам реализации регуляторный переключатель представляет собой тканеспецифический самоинактивирующийся регуляторный переключатель, например, раскрытый в US2002/0022018, благодаря чему регуляторный переключатель преднамеренно выключает трансген (например, белок FVIII) в сайте, где в противном случае экспрессия трансгена могла бы быть неблагоприятной. Согласно некоторым вариантам реализации регуляторный переключатель представляет собой обратимую с помощью рекомбиназы систему экспрессии гена, например, раскрытую в US2014/0127162 и патенте США 8324436.

(v) Посттранскрипционные и посттрансляционные регуляторные переключатели.

[00312] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК-вектором представляет собой систему посттранскрипционной модификации. Например, такой регуляторный переключатель может представлять собой рибопереключатель-аптазим, чувствительный к тетрациклину или теофиллину, раскрытый в US2018/0119156, GB201107768, WO2001/064956A3, патенте ЕР 2707487 и Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et at., Elife. 2016 Nov 2;5. pii: e18858. Согласно некоторым вариантам реализации предусмотрено, что обычный специалист в данной области техники может закодировать как трансген, так и ингибиторную киРНК, которая содержит чувствительный к лиганду аптамер (отрицательный переключатель), в результате чего будет получен положительный переключатель, чувствительный к лиганду.

(vi) Другие примерные регуляторные переключатели

[00313] Любой известный регуляторный переключатель может быть использован в зкДНК-векторе для контроля экспрессии белка FVIII зкДНК-вектором, включая переключатели, запускаемые изменениями окружающей среды. Дополнительные примеры включают, но не ограничиваются перечисленными; метод ВОС согласно Suzuki et al., Scientific Reports 8; 10051 (2018); расширение генетического кода и нефизиологическую аминокислоту; контролируемые излучением или контролируемые ультразвуком положительные/отрицательные (on/off) переключатели (см., например, Scott S. et at, Gene Ther. 2000 Jul; 7(13): 1121-5; патенты США 5612318; 5571797; 5770581; 5817636; и WO 1999/025385 Al. Согласно некоторым вариантам реализации регуляторный переключатель контролируется имплантируемой системой, например, раскрытой в патенте США 7840263; US2007/0190028А1, в которой экспрессия гена контролируется одной или более формами энергии, включая электромагнитную энергию, что активирует промоторы, функционально связанные с трансгеном в зкДНК-векторе.

[00314] Согласно некоторым вариантам реализации регуляторный переключатель, предусмотренный для применения в зкДНК-векторе, представляет собой опосредуемый гипоксией или активируемый стрессом переключатель, например, такой как те, которые раскрыты в WO1999060142A2, патентах США 5834306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, а также элементы FROG, TOAD и NRSE и условно индуцируемые подавляющие элементы, включая элементы ответа на гипоксию (HRE), элементы ответа на воспаление (IRE) и активируемые сдвиговым напряжением элементы (SSAE), например, как раскрыто в патенте США 9394526. Такой вариант реализации можно применять для «включения» экспрессии трансгена с зкДНК-вектора после ишемии или в ишемических тканях и/или в опухолях.

(vii) «Аварийные выключатели»

[00315] Другие варианты реализации, описанные в данном документе, относятся к зкДНК-вектору для экспрессии белка FVIII, описанному в данном документе, содержащему аварийный выключатель. «Аварийный выключатель», раскрытый в данном документе, позволяет уничтожить клетку, содержащую указанный зкДНК-вектор, или подвергнуть ее программируемой клеточной гибели в качестве способа окончательного удаления введенного зкДНК-вектора из системы субъекта. Обычный специалист в данной области техники поймет, что применение «аварийных выключателей» в зкДНК-векторах для экспрессии белка FVIII, как правило, будет сопряжено с нацеливанием зкДНК-вектора на ограниченное число клеток, потеря которого является приемлемой для субъекта, или на тип клеток, апоптоз которых желателен (например, на раковые клетки). Во всех аспектах «аварийный выключатель», раскрытый в данном документе, разработан таким образом, чтобы обеспечить быстрое и надежное уничтожение клетки, содержащей зкДНК-вектор, в отсутствие входного сигнала выживания или другого заданного условия. Другими словами, «аварийный выключатель», кодируемый зкДНК-вектором для экспрессии белка FVIII, описанным в данном документе, может ограничивать выживание клетки, содержащей зкДНК-вектор, окружающей средой, задаваемой специфическими входными сигналами. Такие «аварийные выключатели» служат для обеспечения функции биологического сдерживания, если потребуется удалить зкДНК-вектор для экспрессии белка FVIII у субъекта или обеспечить отсутствие экспрессии с него кодируемого белка FVIII.

[00316] Другие «аварийные выключатели», известные обычному специалисту в данной области техники, предусмотрены для применения в зкДНК-векторе для экспрессии белка FVIII, раскрытом в данном документе, например, как раскрыто в US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, а также «аварийные выключатели», раскрытые в Jusiak et al., Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; и в Reinshagen et al, Science Translational Medicine, 2018, 11.

[00317] Соответственно, согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может содержать конструкцию нуклеиновой кислоты «аварийного выключателя», которая содержит нуклеиновую кислоту, кодирующую эффекторный токсин или репортерный белок, причем экспрессия эффекторного токсина (например, белка смерти) или репортерного белка контролируется с помощью заранее заданного условия. Например, предварительно заданным условием может быть наличие агента окружающей среды, такого как, например, экзогенный агент, без которого клетка по умолчанию будет экспрессировать эффекторный токсин (например, белок смерти) и будет уничтожена. Согласно альтернативным вариантам реализации предварительно заданным условием является наличие двух или более агентов окружающей среды, например, клетка будет выживать только при подаче двух или более необходимых экзогенных агентов, и без какого-либо из них клетка, содержащая зкДНК-вектор, уничтожается.

[00318] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII модифицируют для включения «аварийного выключателя» для разрушения клеток, содержащих указанный зкДНК-вектор, для эффективной остановки экспрессии in vivo трансгена, экспрессируемого указанным зкДНК-вектором (например, экспрессии белка FVIII). В частности, зкДНК-вектор дополнительно генетически сконструирован для экспрессии белка-переключателя, который не функционирует в клетках млекопитающих в нормальных физиологических условиях. Клетки, экспрессирующие белок-переключатель, будут разрушены только после введения лекарственного средства или воздействия условия окружающей среды, специфически нацеленных на указанный белок-переключатель, что остановит экспрессию терапевтического белка или пептида. Например, сообщалось, что клетки, экспрессирующие тимидинкиназу HSV, могут быть уничтожены при введении таких лекарственных средств как ганцикловир и цитозиндезаминаза. См., например, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), в Targets in Gene Therapy, под редакцией You (2011); и Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999). Согласно некоторым вариантам реализации зкДНК-вектор может содержать «аварийный выключатель» на основе киРНК, называемый DISE (гибель, индуцируемая устранением гена выживания, «Death Induced by Survival gene Elimination») (Murmann et al., Oncotarget. 2017; 8:84643-84658. Induction of DISE in ovarian cancer cells in vivo).

VI. Подробное описание способа получения зкДНК-вектора

А. Получение в целом

[00319] Некоторые способы получения зкДНК-вектора для экспрессии белка FVIII, содержащего пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, описаны в разделе IV международной заявки PCT/US18/49996, поданной 7 сентября 2018 г., которая полностью включена в данный документ посредством ссылки. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с использованием клеток насекомых, как описано в данном документе. Согласно альтернативным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен синтетическим способом и, в некоторых вариантах реализации, бесклеточным способом, как раскрыто в международной заявке PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки.

[00320] Как описано в данном документе, согласно одному варианту реализации, зкДНК-вектор для экспрессии белка FVIII может быть получен, например, с помощью способа, включающего этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в atca agcacaacat и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR для продуцирования зкДНК-вектора в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, такое как присутствующее в естественных условиях в ААВ-векторах или других вирусных векторах.

[00321] Присутствие зкДНК-вектора, выделенного из клеток-хозяев, может быть подтверждено путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на неденатурирующем геле для подтверждения присутствия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.

[00322] Согласно еще одному аспекту настоящего изобретения предложено применение линий клеток-хозяев, имеющих стабильно интегрированную в собственный геном полинуклеотидную матрицу для экспрессии ДНК-вектора (зкДНК-матрицу), в получении невирусного ДНК-вектора, например, как описано в Lee, L. et al. (2013) Plos One 8(8): e69879. Предпочтительно Rep добавляют к клеткам-хозяевам при MOI равной примерно 3. Когда линия клеток-хозяев представляет собой линию клеток млекопитающего, например, клетки НЕК293, линии клеток могут иметь стабильно интегрированную полинуклеотидную матрицу вектора, и второй вектор, такой как вирус герпеса, может использоваться для введения в клетки белка Rep, что позволяет вырезать и амплифицировать зкДНК в присутствии Rep и вспомогательного вируса.

[00323] Согласно одному варианту реализации клетки-хозяева, используемые для получения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, представляют собой клетки насекомых, и для доставки как полинуклеотида, который кодирует белок Rep, так и полинуклеотидной матрицы экспрессионной конструкции невирусного ДНК-вектора для зкДНК используют бакуловирус, например, согласно описанию на ФИГ. 4А-4С и в Примере 1. Согласно некоторым вариантам реализации клетку-хозяина конструируют так, чтобы она экспрессировала белок Rep.

[00324] Затем зкДНК-вектор собирают и выделяют из клеток-хозяев. Время сбора и извлечения зкДНК-векторов, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Согласно одному варианту реализации клетки культивируют в достаточных условиях и собирают через достаточное время после инфекции бакуловирусом, чтобы получить зкДНК-векторы, но до начала гибели большинства клеток из-за токсичности бакуловируса. ДНК-векторы могут быть выделены с применением наборов для очистки плазмид, таких как не содержащие эндотоксинов наборы для выделения плазмид (Endo-Free Plasmid Kits) от Qiagen. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для ДНК-векторов. Обычно могут быть использованы любые способы очистки нуклеиновых кислот.

[00325] ДНК-векторы могут быть очищены с помощью любых способов очистки ДНК, известных специалистам в данной области техники. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.

[00326] Наличие зкДНК-вектора для экспрессии белка FVIII может быть подтверждено путем расщепления векторной ДНК, выделенной из клеток, рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, и анализа как расщепленного, так и нерасщепленного ДНК-материала с использованием гель-электрофореза, чтобы подтвердить наличие характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК. ФИГ. 4С и ФИГ. 4D иллюстрируют один вариант реализации для идентификации наличия зкДНК-векторов с замкнутыми концами, продуцируемых с помощью способов, описанных в данном документе.

В. зкДНК-плазмида

[00327] ЗкДНК-плазмида представляет собой плазмиду, используемую для последующего получения зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-плазмида может быть сконструирована с использованием известных методик, чтобы обеспечить по меньшей мере элементы, перечисленные далее, в виде функционально связанных компонентов в направлении транскрипции: (1) модифицированную последовательность 5'-ITR; (2) экспрессионную кассету, содержащую цис-регуляторный элемент, например, промотор, индуцируемый промотор, регуляторный переключатель, энхансеры и т.п.; и (3) модифицированную последовательность 3'-ITR, причем указанная последовательность 3'-ITR симметрична относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации экспрессионная кассета, фланкированная ITR, содержит сайт клонирования для введения экзогенной последовательности. Экспрессионная кассета заменяет области, кодирующие rep и cap, геномов ААВ.

[00328] Согласно одному аспекту зкДНК-вектор для экспрессии белка FVIII получают из плазмиды, называемой в данном документе «зкДНК-плазмидой», кодирующей, в указанном порядке: первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), экспрессионную кассету, содержащую трансген, и мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ. Согласно альтернативным вариантам реализации зкДНК-плазмида кодирует, в указанном порядке: первый (или 5) модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные 5'- и 3'-ITR являются симметричными по отношению друг к другу. Согласно альтернативным вариантам реализации зкДНК-плазмид а кодирует, в указанном порядке: первый (или 5') модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмид а лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные модифицированные 5'- и 3'-ITR имеют одинаковые модификации (т.е. они являются обратно комплементарными или симметричными по отношению друг к другу).

[00329] Согласно дополнительному варианту реализации система зкДНК-плазмиды лишена последовательностей, кодирующих вирусный капсидный белок (т.е. лишена генов капсида ААВ, а также генов капсидов других вирусов). Кроме того, согласно конкретному варианту реализации зкДНК-плазмида также лишена последовательностей, кодирующих белок Rep ААВ. Соответственно, в предпочтительном варианте реализации зкДНК-плазмида лишена функциональных генов cap ААВ и rep ААВ, GG-3' для ААВ2, а также вариабельной палиндромной последовательности, обеспечивающей образование шпильки.

[00330] ЗкДНК-плазмида согласно настоящему изобретению может быть получена с использованием природных нуклеотидных последовательностей из геномов любых серотипов ААВ, хорошо известных в данной области техники. Согласно одному варианту реализации остов зкДНК-плазмиды происходит из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; из указателя вирусов Kotin and Smith («The Springer Index of Viruses»), доступного по ссылке, поддерживаемой Springer (веб-адрес: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (примечание: ссылки на указатель URL или базу данных подразумевают содержание доступного по ссылке ресурса URL или базы данных на фактическую дату подачи данной заявки). В конкретном варианте реализации остов зкДНК-плазмиды происходит из генома ААВ2. В другом конкретном варианте реализации остов зкДНК-плазмиды представляет собой синтетический остов, генетически сконструированный для включения на его 5'- и 3-концах ITR, происходящих из одного из указанных геномов ААВ.

[00331] ЗкДНК-плазмида необязательно может включать селектируемый или селективный маркер для использования при создании линии клеток, продуцирующей зкДНК-вектор. Согласно одному варианту реализации селективный маркер может быть вставлен после (т.е. в 3'-направлении) последовательности 3'-ITR. Согласно другому варианту реализации селективный маркер может быть вставлен перед (т.е. в 5'-направлении) последовательностью 5'-ITR. Подходящие селективные маркеры включают, например, маркеры, придающие устойчивость к лекарственному средству. Селективные маркеры могут представлять собой, например, гены устойчивости к бластицидину S, канамицину, генетицину и т.п. Согласно предпочтительному варианту реализации селективный маркер для отбора по чувствительности к лекарственному средству представляет собой ген устойчивости к бластицидину S.

[00332] Примерный зкДНК-вектор (например, рААВО) для экспрессии белка FVIII получают из плазмиды рААВ. Способ получения рААВ-вектора может включать: (а) доставку в клетку-хозяина плазмиды рААВ, как описано выше, при этом как клетка-хозяин, так и плазмида лишены генов, кодирующих капсидный белок, (b) культивирование клетки-хозяина в условиях, обеспечивающих продуцирование генома зкДНК; и (с) сбор клеток и выделение генома ААВ, продуцированного из указанных клеток.

C. Примерный способ получения зкДНК-векторов из зкДНК-плазмид

[00333] В данном документе также предложены способы получения бескапсидных зкДНК-векторов для экспрессии белка FVIII, в частности, способ с достаточно высоким выходом для обеспечения достаточного количества вектора для экспериментов in vivo.

[00334] Согласно некоторым вариантам реализации способ получения зкДНК-вектора для экспрессии белка FVIII включает следующие этапы: (1) введение конструкции нуклеиновой кислоты, содержащей экспрессионную кассету и последовательности двух симметричных ITR, в клетку-хозяина (например, клетки Sf9), (2) необязательно создание клональной линии клеток, например, с применением селективного маркера, присутствующего на плазмиде, (3) введение кодирующего Rep гена (либо путем трансфекции, либо инфекции бакуловирусом, несущим указанный ген) в указанную клетку насекомого; и (4) сбор клеток и очистку зкДНК-вектора. Конструкция нуклеиновой кислоты, содержащая экспрессионную кассету и последовательности двух ITR, описанная выше для получения зкДНК-вектора, может иметь форму зкДНК-плазмиды или бакмиды, или бакуловируса, полученных с использованием зкДНК-плазмиды, как описано ниже. Конструкция нуклеиновой кислоты может быть введена в клетку-хозяина путем трансфекции, вирусной трансдукции, стабильной интеграции или других способов, известных в данной области техники.

D. Линии клеток

[00335] Линии клеток-хозяев, используемые в получении зкДНК-вектора для экспрессии белка FVIII, могут включать линии клеток насекомых, происходящие из Spodoptera frugiperda, такие как клетки Sf9, Sf21, или клетки Trichoplusia ni, или линии клеток других беспозвоночных животных, позвоночных животных или других эукариотов, включая клетки млекопитающих. Также могут быть использованы другие линии клеток, известные обычному специалисту в данной области техники, такие как HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, моноциты, а также зрелые и незрелые дендритные клетки. Линии клеток-хозяев могут быть трансфицированы для стабильной экспрессии зкДНК-плазмиды для получения зкДНК-вектора с высоким выходом.

[00336] ЗкДНК-плазмиды могут быть введены в клетки Sf9 путем кратковременной трансфекции с использованием реагентов (например, липосомальных, фосфата кальция) или физических средств (например, электропорации), известных в данной области техники. В качестве альтернативы, могут быть созданы стабильные линии клеток Sf9 с зкДНК-плазмидой, стабильно интегрированной в их геномы. Такие стабильные линии клеток могут быть созданы путем включения селективного маркера в зкДНК-плазмиду согласно описанию выше. Если зкДНК-плазмида, используемая для трансфекции линии клеток, включает селективный маркер, например, для антибиотика, клетки, которые были трансфицированы зкДНК-плазмидой и интегрировали ДНК зкДНК-плазмиды в их геном, могут быть отобраны путем добавления антибиотика в среды для культивирования клеток. Затем устойчивые клоны клеток могут быть выделены с помощью методик разведения до получения отдельных клеток или переноса колоний и размножены.

Е. Выделение и очистка зкДНК-векторов:

[00337] Примеры способа получения и выделения зкДНК-векторов описаны на ФИГ. 4А-4Е и в конкретных примерах ниже. ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть получены из клеток-продуцентов, экспрессирующих белок (белки) Rep ААВ, дополнительно трансформированных зкДНК-плазмидой, зкДНК-бакмидой или зкДНК-бакуло вирусом. Плазмиды, которые можно применять для получения зкДНК-векторов, включают плазмиды, которые кодируют белок FVIII, или плазмиды, кодирующие один или более белков REP.

[00338] Согласно одному аспекту полинуклеотид кодирует белок Rep ААВ (Rep 78 или 68), доставляемый в клетку-продуцент в плазмиде (Rep-плазмиде), бакмиде (Rep-бакмиде) или бакуловирусе (Rep-бакуловирусе). Rep-плазмида, Rep-бакмида и Rep-бакуловирус могут быть получены с помощью способов, описанных выше.

[00339] В данном документе описаны способы получения зкДНК-вектора для экспрессии белка FVIII. Экспрессионные конструкции, используемые для получения зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут представлять собой плазмиду (например, зкДНК-плазмиды), бакмиду (например, зкДНК-бакмиду) и/или бакуловирус (например, зкДНК-бакуловирус). В качестве неограничивающего примера, зкДНК-вектор может быть получен из клеток, коинфицированных зкДНК-бакуловирусом и Rep-бакуловирусом. Белки Rep продуцированные с Rep-бакуловируса, могут реплицировать зкДНК-бакуловирус с получением зкДНК-векторов. В качестве варианта, зкДНК-векторы для экспрессии белка FVIII могут быть получены из клеток, стабильно трансфицированных конструкцией, содержащей последовательность, кодирующую белок Rep ААВ (Rep78/52), доставленной в Rep-плазмидах, Rep-бакмидах или Rep-бакуловирусе. зкДНК-бакуловирус может быть кратковременно трансфицирован в клетки, реплицирован с помощью белка Rep и может продуцировать зкДНК-векторы.

[00340] Бакмида (например, зкДНК-бакмида) может быть трансфицирована в пермиссивные клетки насекомых, такие как клетка Sf9, Sf21, Tni (Trichoplusia ni), клетка High Five, и генерировать зкДНК-бакуловирус, который представляет собой рекомбинантный бакуловирус, включающий последовательности, содержащие симметричные ITR и экспрессионную кассету. Клетки насекомых могут быть снова инфицированы зкДНК-бакуловирусом для получения следующего поколения рекомбинантного бакуловируса. Необязательно этап может быть повторен один или более раз для получения большего количества рекомбинантного бакуловируса.

[00341] Время сбора и извлечения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Обычно клетки могут быть собраны через период времени после инфекции бакуловирусом, достаточный для получения зкДНК-векторов (например, зкДНК-векторов), но до начала гибели большинства клеток из-за вирусной токсичности. ЗкДНК-векторы могут быть выделены из клеток Sf9 с использованием наборов для очистки плазмид, таких как наборы Qiagen ENDO-FREE PLASMID®. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для зкДНК-векторов. Обычно можно использовать любые известные в данной области техники способы очистки нуклеиновых кислот, а также коммерчески доступные наборы для экстракции ДНК.

[00342] В качестве альтернативы, очистку можно осуществлять путем щелочного лизиса клеточного осадка, центрифугирования полученного лизата и выполнения хроматографического разделения. В качестве одного неограничивающего примера, указанный способ можно выполнять путем загрузки супернатанта на ионообменную колонку (например, SARTOBIND Q®), которая удерживает нуклеиновые кислоты, с последующим элюированием (например, 1,2 М раствором NaCl) и выполнением дальнейшей хроматографической очистки на колонке для гель-фильтрации (например, на 6 Fast Flow GE). Бескапсидный ААВ-вектор затем выделяют, например, путем осаждения.

[00343] Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII также могут быть очищены в форме экзосом или микрочастиц. В данной области техники известно, что многие типы клеток высвобождают не только растворимые белки, но и сложные грузы белок/нуклеиновая кислота путем отделения мембранных микровезикул (Cocucci et al, 2009; ЕР 10306226.1). Такие везикулы включают микровезикулы (также называемые микрочастицами) и экзосомы (также называемые нановезикулами), и первые, и вторые содержат в качестве груза белки и РНК. Микровезикулы образуются в результате прямого отпочковывания плазматической мембраны, а экзосомы высвобождаются во внеклеточную среду при слиянии мультивезикулярных эндосом с плазматической мембраной. Соответственно, содержащие зкДНК-вектор микровезикулы и/или экзосомы могут быть выделены из клеток, трансдуцированных зкДНК-плазмидой или бакмидой, или бакуловирусом, полученным с использованием зкДНК-плазмиды.

[00344] Микровезикулы могут быть выделены путем фильтрации или ультрацентрифугирования культуральной среды при 20000×g, а экзосомы при 100000×g. Оптимальная продолжительность ультрацентрифугирования может быть определена экспериментально и зависит от конкретного типа клеток, из которых выделяют везикулы. Предпочтительно культуральную среду сначала очищают с помощью низкоскоростного центрифугирования (например, при 2000×g в течение 5-20 минут) и подвергают центробежному концентрированию с использованием, например, центрифужной колонки AMICON® (Millipore, Уотфорд, Великобритания). Микровезикулы и экзосомы могут быть дополнительно очищены с помощью FACS или MACS с использованием специфичных антител, распознающих конкретные поверхностные антигены, присутствующие на микровезикулах и экзосомах. Другие способы очистки микровезикул и экзосом включают, но не ограничиваются перечисленными, иммунопреципитацию, аффинную хроматографию, фильтрацию и магнитные гранулы, покрытые специфичными антителами или аптамерами. После очистки везикулы промывают, например, фосфатно-солевым буфером (ФСБ). Одним из преимуществ использования микровезикул или экзосом для доставки содержащих зкДНК везикул является то, что такие везикулы могут быть нацелены на клетки различных типов путем включения в их мембрану белков, распознаваемых специфическими рецепторами на соответствующих типах клеток. (см. также ЕР 10306226)

[00345] Другой аспект настоящего изобретения относится к способам очистки зкДНК-векторов из линий клеток-хозяев, которые стабильно интегрировали конструкцию зкДНК в их собственный геном. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.

[00346] ФИГ. 5 международной заявки PCT/US18/49996 показывает гель, подтверждающий продуцирование зкДНК из нескольких конструкций зкДНК-плазмид с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4D в Примерах.

VII. Фармацевтические композиции

[00347] Согласно другому аспекту предложены фармацевтические композиции. Фармацевтическая композиция содержит зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, и фармацевтически приемлемый носитель или разбавитель.

[00348] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтические композиции, пригодные для введения субъекту для in vivo доставки в клетки, ткани или органы субъекта. Как правило, фармацевтическая композиция содержит зкДНК-вектор, раскрытый в данном документе, и фармацевтически приемлемый носитель. Например, зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтическую композицию, подходящую для целевого пути терапевтического введения (например, парентерального введения). Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция. Фармацевтические композиции для терапевтических целей могут быть изготовлены в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации, включая зкДНК-вектор, который может быть изготовлен для доставки трансгена в нуклеиновой кислоте в клетки реципиента, что приводит к терапевтической экспрессии в них трансгена или донорной последовательности. Композиция также может включать фармацевтически приемлемый носитель.

[00349] Фармацевтически активные композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, могут быть изготовлены для доставки трансгена для различных целей в клетку, например, в клетки субъекта.

[00350] Фармацевтические композиции для терапевтических целей, как правило, должны быть стерильными и стабильными в условиях изготовления и хранения. Композиция может быть изготовлена в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации.

[00351] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть включен в фармацевтическую композицию, пригодную для местного, системного, внутриамниотического, интратекального, внутричерепного, внутриартериального, внутривенного, внутрилимфатического, внутрибрюшинного, подкожного, трахеального, внутритканевого (например, внутримышечного, внутрисердечного, внутрипеченочного, внутрипочечного, интрацеребрального), интратекального, интравезикального, конъюнктивального (например, экстраорбитального, интраорбитального, ретроорбитального, интраретинального, субретинального, хориоидального, субхориоидального, интрастромального, интракамерального и интравитреального), интракохлеарного и мукозального (например, перорального, ректального, назального) введения. Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция.

[00352] В некоторых аспектах способы, предложенные в данном документе, включают доставку одного или более зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, в клетку-хозяина. В данном документе также предложены клетки, полученные с помощью таких способов, и организмы (такие как животные, растения или грибы), содержащие или полученные из таких клеток. Способы доставки нуклеиновых кислот могут включать липофекцию, нуклеофекцию, микроинъекцию, биолистику, липосомы, иммунолипосомы, конъюгаты поликатион или липид:нуклеиновая кислота, «незащищенную» ДНК и усиленное агентом поглощение ДНК. Липофекция описана, например, в патентах США №№5049386, 4946787 и 4897355, и реагенты для липофекции продаются коммерчески (например, трансфектам (Transfectam™) и липофектин (Lipofectin™)). Доставка может осуществляться в клетки (например, введение in vitro или ex vivo) или в ткани-мишени (например, введение in vivo).

[00353] В данной области техники известны различные методики и способы доставки нуклеиновых кислот в клетки. Например, нуклеиновые кислоты, такие как зкДНК для экспрессии белка FVIII, могут быть изготовлены в виде состава липидных наночастиц (ЛНЧ), липидоидов, липосом, липидных наночастиц, липоплексов или наночастиц типа ядро-оболочка. Как правило, ЛНЧ состоят из молекул нуклеиновой кислоты (например, зкДНК), одного или более ионизируемых или катионных липидов (или их солей), одного или более неионных или нейтральных липидов (например, фосфолипида), молекулы, которая предотвращает агрегацию (например, ПЭГ или конъюгата ПЭГ-липид), и необязательно стерина (например, холестерина).

[00354] Другой способ доставки нуклеиновых кислот, таких как зкДНК для экспрессии белка FVIII, в клетку заключается в конъюгации нуклеиновой кислоты с лигандом, который интернализуется клеткой. Например, лиганд может связывать рецептор на поверхности клетки и интернализоваться за счет эндоцитоза. Лиганд может быть ковалентно связан с нуклеотидом в нуклеиновой кислоте. Примерные конъюгаты для доставки нуклеиновых кислот в клетку описаны, например, в WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 и WO2017/177326.

[00355] Нуклеиновые кислоты, такие как зкДНК-векторы для экспрессии белка FVIII, также могут быть доставлены в клетку путем трансфекции. Подходящие способы трансфекции включают, но не ограничиваются перечисленными, опосредуемую липидами трансфекцию, опосредуемую катионным полимером трансфекцию или осаждение фосфатом кальция. Реагенты для трансфекции хорошо известны в данной области техники и включают, но не ограничиваются перечисленными, реагент для трансфекции TurboFect (Thermo Fisher Scientific), реагент Pro-Ject (Thermo Fisher Scientific), реагент для трансфекции белков TRANSPASS™ Р (New England Biolabs), реагент для доставки белков CHARIOT™ (Active Motif), реагент для трансфекции белков PROTEOJUICE™ (EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTIN™ (Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Базель, Швейцария), FUGENE™ HD (Roche), TRANSFECTAM™ (трансфектам, Promega, Мэдисон, Висконсин), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Геркулес, Калифорния), SILENTFECT™ (Bio-Rad), EfFectene™ (Qiagen, Валенсия, Калифорния), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, Сан-Диего, Калифорния), DHARMAFECT 1™ (Dharmacon, Лафайет, Колорадо), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, Сент-Луис, Миссури) и ESCORT™ IV (Sigma Chemical Co.). Нуклеиновые кислоты, такие как зкДНК, также могут быть доставлены в клетку с помощью микроструйных способов, известных специалистам в данной области техники.

[00356] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, также можно вводить непосредственно в организм для трансдукции клеток in vivo. Введение осуществляют любым из путей, обычно используемых для приведения молекулы в максимальный контакт с клетками крови или тканей, включая, но не ограничиваясь перечисленными, инъекцию, инфузию, местное нанесение и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники, и хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более быструю и более эффективную реакцию по сравнению с другим путем введения.

[00357] Способы введения векторной нуклеиновой кислоты, такой как зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут включать доставку в гемопоэтические стволовые клетки, например, с помощью способов, описанных, например, в патенте США №5928638.

[00358] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды. Примерные липосомы и липосомные составы, включая, но не ограничиваясь перечисленными, соединения, содержащие функциональные группы полиэтиленгликоля (ПЭГ), раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и в международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., например, см. раздел, озаглавленный «Фармацевтические составы».

[00359] Различные способы доставки, известные в данной области техники, или их модификации, могут быть использованы для доставки зкДНК-векторов in vitro или in vivo. Например, согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII доставляют, образуя кратковременное отверстие в клеточной мембране с использованием механической, электрической, ультразвуковой, гидродинамической или лазерной энергии так, чтобы облегчить вход ДНК в целевые клетки. Например, зкДНК-вектор может быть доставлен путем кратковременного разрыва клеточной мембраны путем продавливания клетки через канал ограниченного размера или другими способами, известными в данной области техники. В некоторых случаях зкДНК-вектор по отдельности напрямую вводят в виде незащищенной ДНК путем инъекции в любую из: любой одной или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка, кожи, тимуса, сердечной мышцы или скелетной мышцы. В некоторых случаях зкДНК-вектор доставляют с помощью генной пушки. Сферические частицы золота или вольфрама (диаметром 1-3 мкм), покрытые бескапсидными ААВ-векторами, могут быть разогнаны до высокой скорости с помощью сжатого газа для проникновения в клетки целевой ткани.

[00360] Композиции, содержащие зкДНК-вектор для экспрессии белка FVIII и фармацевтически приемлемый носитель, конкретно предусмотрены в данном документе. Согласно некоторым вариантам реализации зкДНК-вектор изготовлен с липидной системой доставки, например, липосомами, как описано в данном документе. Согласно некоторым вариантам реализации такие композиции вводят любым путем, желательным для квалифицированного специалиста. Композиции могут быть введены субъекту различными путями, включая пероральный, парентеральный, сублингвальный, трансдермальный, ректальный, трансмукозальный, местный, путем ингаляции, путем буккального введения, внутриплевральный, внутривенный, внутриартериальный, внутрибрюшинный, подкожный, внутримышечный, интраназальный, интратекальный и внутрисуставной или их комбинации. Для ветеринарного применения композиция может быть введена в виде достаточно приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринарный врач может легко определить схему дозирования и путь введения, которые наиболее подходят для конкретного животного. Композиции могут быть ведены с помощью обычных шприцев, безыгольных инъекционных устройств, «генных пушек с бомбардировкой микрочастицами» или других физических методов, таких как электропорация («ЭП»), гидродинамические методы или применение ультразвука.

[00361] В некоторых случаях зкДНК-вектор для экспрессии белка FVIII доставляют путем гидродинамической инъекции, которая представляет собой простой и высокоэффективный способ прямой внутриклеточной доставки любых водорастворимых соединений и частиц во внутренние органы и скелетные мышцы во всей конечности.

[00362] В некоторых случаях зкДНК-векторы для экспрессии белка FVIII доставляют с помощью ультразвука, создавая наноскопические поры в мембране для облегчения внутриклеточной доставки частиц ДНК в клетки внутренних органов или опухолей, поэтому размер и концентрация плазмидной ДНК имеют большое значение для эффективности системы. В некоторых случаях зкДНК-векторы доставляют путем магнитофекции с использованием магнитных полей для концентрирования частиц, содержащих нуклеиновую кислоту, в клетках-мишенях.

[00363] В некоторых случаях могут быть использованы химические системы доставки, например, с использованием наномерных комплексов, которые включают уплотнение отрицательно заряженной нуклеиновой кислоты поликатионными наномерными частицами, в составе катионной липосомы/мицеллы или катионных полимеров. Катионные липиды, используемые в указанном способе доставки, включают, но не ограничиваются перечисленными, моновалентные катионные липиды, поливалентные катионные липиды, гуанидин-содержащие соединения, соединения производных холестерина, катионные полимеры (например, полиэтиленимин, поли-L-лизин, протамин, другие катионные полимеры) и гибриды липид-полимер.

А. Экзосомы

[00364] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют упакованным в экзосоме. Экзосомы представляют собой небольшие мембранные везикулы эндоцитарного происхождения, которые высвобождаются во внеклеточную среду после слияния мультивезикулярных телец с плазматической мембраной. Их поверхность состоит из липидного бислоя клеточной мембраны донорной клетки, они содержат цитозоль из клетки, которая продуцировала экзосому, и экспонируют на поверхности мембранные белки родительской клетки. Экзосомы продуцируются различными типами клеток, в том числе эпителиальными клетками, В- и Т-лимфоцитами, тучными клетками (МС), а также дендритными клетками (DC). Согласно некоторым вариантам реализации для применения предусмотрены экзосомы с диаметром от 10 нм до 1 мкм, от 20 нм до 500 нм, от 30 нм до 250 нм, от 50 до 100 нм. Экзосомы могут быть выделены для доставки в целевые клетки либо с использованием их донорных клеток, либо путем введения в них конкретных нуклеиновых кислот. Для получения экзосом, содержащих бескапсидные ААВ-векторы согласно настоящему изобретению, могут быть использованы различные подходы, известные в данной области техники.

В. Микрочастица/наночастицы

[00365] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью липидной наночастицы. Обычно липидные наночастицы содержат ионизируемый аминолипид (например, гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат, DLin-MC3-DMA, фосфатидилхолин(1,2-дистеароил-sn-глицеро-3-фосфохолин, DSPC), холестерин и липид оболочки (полиэтиленгликоль-димиристоилглицерин, ПЭГ-ДМГ), например, как раскрыто Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507.

[00366] Согласно некоторым вариантам реализации липидная наночастица имеет средний диаметр от примерно 10 до примерно 1000 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 10 до примерно 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 200 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 25 до примерно 200 нм. Согласно некоторым вариантам реализации препарат липидных наночастиц (например, композиция, содержащая множество липидных наночастиц) имеет распределение по размерам, при котором средний размер (например, диаметр) составляет от примерно 70 нм до примерно 200 нм, и более типично средний размер составляет примерно 100 нм или менее.

[00367] Для доставки ДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, могут быть использованы различные липидные наночастицы, известные в данной области техники. Например, различные способы доставки с применением липидных наночастиц описаны в патентах США №№9404127, 9006417 и 9518272.

[00368] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью наночастицы золота. Обычно нуклеиновая кислота может быть ковалентно связана с наночастицей золота или нековалентно связана с наночастицей золота (например, связана заряд-зарядным взаимодействием), например, согласно описанию Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. Согласно некоторым вариантам реализации конъюгаты наночастицы золота с нуклеиновой кислотой получают с использованием способов, описанных, например, в патенте США №6812334.

C. Конъюгаты

[00369] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован (например, ковалентно связан) с агентом, который увеличивает клеточное поглощение. «Агент, который увеличивает клеточное поглощение» представляет собой молекулу, которая облегчает транспорт нуклеиновой кислоты через липидную мембрану. Например, нуклеиновая кислота может быть конъюгирована с липофильным соединением (например, холестерином, токоферолом и т.д.), проникающим в клетки пептидом (СРР) (например, пенетратином, TAT, Syn1B и т.д.) и полиаминами (например, спермином). Дополнительные примеры агентов, которые увеличивают поглощение клетками, раскрыты, например, в Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.

[00370] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полимером (например, полимерной молекулой) или молекулой фолата (например, молекулой фолиевой кислоты). В целом, доставка нуклеиновых кислот, конъюгированных с полимерами, известна в данной области техники, например, описана в WO2000/34343 и WO2008/022309. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полиамидным полимером, например, согласно описанию в патенте США №8987377. Согласно некоторым вариантам реализации нуклеиновая кислота, описанная в настоящем раскрытии, конъюгирована с молекулой фолиевой кислоты согласно описанию в патенте США №8507455.

[00371] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с углеводом, например, как описано в патенте США №8450467.

D. Нанокапсула

[00372] В качестве альтернативы, могут применяться нанокапсульные составы зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Обычно нанокапсулы могут захватывать вещества стабильным и воспроизводимым образом. Чтобы избежать побочных эффектов, обусловленных внутриклеточной перегрузкой полимерами, такие ультрадисперсные частицы (размером около 0,1 мкм) необходимо конструировать с использованием полимеров, способных разлагаться in vivo. Предусмотрено применение биоразлагаемых полиалкил-цианоакрилатных наночастиц, которые удовлетворяют таким требованиям.

E. Липосомы

[00373] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.

[00374] Изготовление и применение липосом в целом известно специалистам в данной области техники. Были разработаны липосомы с улучшенной стабильностью в сыворотке и временем полужизни в кровотоке (патент США №5741516). Кроме того, были описаны различные способы получения липосом и липосомоподобных препаратов в качестве потенциальных носителей лекарственных средств (патенты США №№5567434; 5552157; 5565213; 5738868 и 5795587).

F. Примерные композиции липосом и липидных наночастиц (ЛНЧ)

[00375] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку, например, в клетку, нуждающуюся в экспрессии трансгена. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.

[00376] Липидные наночастицы (ЛНЧ), содержащие зкДНК-векторы, раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ, и предусмотрены для применения в способах и композициях зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.

[00377] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который включает одно или более соединений с функциональной группой полиэтиленгликоля (ПЭГ) (так называемых «пегилированных соединений»), которые могут снижать иммуногенность/антигенность, обеспечивать гидрофильность и гидрофобность, а также уменьшать частоту дозирования соединения (соединений). В других случаях, липосомальный состав просто включает полимер полиэтиленгликоль (ПЭГ) в качестве дополнительного компонента. В таких аспектах молекулярная масса ПЭГ или функциональной группы ПЭГ может составлять от 62 Да до примерно 5000 Да.

[00378] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который доставит АФИ с профилем пролонгированного или контролируемого высвобождения на протяжении периода времени от нескольких часов до недель. Согласно некоторым родственным аспектам липосомальный состав может содержать водные камеры, которые ограничены липидными бислоями. Согласно другим родственным аспектам липосомальный состав инкапсулирует АФИ с компонентами, которые претерпевают физический переход при повышенной температуре, который высвобождает АФИ в течение периода от нескольких часов до недель.

[00379] Согласно некоторым аспектам липосомальный состав содержит сфингомиелин и один или более липидов, раскрытых в данном документе. Согласно некоторым аспектам липосомальный состав содержит оптисомы.

[00380] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит один или более липидов, выбранных из: натриевой соли N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина, (дистеароил-sn-глицерофосфоэтаноламина), MPEG (метоксиполиэтиленгликоль)-конъюгированного липида, HSPC (гидрогенизированного соевого фосфатидилхолина); ПЭГ (полиэтиленгликоля); DSPE (дистеароил-sn-глицерофосфоэтаноламина); DSPC (дистеароилфосфатидилхолина); DOPC (диолеоилфосфатидилхолина); DPPG (дипальмитоилфосфатидилглицерина); ЕРС (яичного фосфатидилхолина); DOPS (диолеоилфосфатидилсерина); РОРС (пальмитоилолеоилфосфатидилхолина); SM (сфингомиелина); MPEG (метоксиполиэтиленгликоля); DMPC (димиристоилфосфатидилхолина); DMPG (димиристоилфосфатидилглицерина); DSPG (дистеароилфосфатидилглицерина); DEPC (диэрукоилфосфатидилхолина); DOPE (диолеоил-sn-глицерофосфоэтаноламина); сульфата холестерина (CS); дипальмитоилфосфатидилглицерина (DPPG); DOPC (диолеоил-sn-глицерофосфатидилхолина) или любой их комбинации.

[00381] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий фосфолипид, холестерин и пегилированный липид в молярном соотношении 56:38:5. Согласно некоторым аспектам общее содержание липидов в липосомальном составе составляет 2-16 мг/мл. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид, в молярном соотношении 3:0,015:2, соответственно. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, холестерин и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, и холестерин. Согласно некоторым аспектам пегилированный липид представляет собой ПЭГ-2000-DSPE. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий DPPG, соевый ФХ, липидный конъюгат MPEG-DSPE и холестерин.

[00382] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более липидов, содержащих фосфатидилхолиновую функциональную группу, и один или более липидов, содержащих этаноламиновую функциональную группу. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более из: липидов, содержащих фосфатидилхолиновую функциональную группу, липидов, содержащих этаноламиновую функциональную группу, и стеринов, например, холестерина. Согласно некоторым аспектам липосомальный состав содержит DOPC/DEPC; и DOPE.

[00383] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, дополнительно содержащий одно или более фармацевтических вспомогательных веществ, например, сахарозу и/или глицин.

[00384] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав с униламеллярной или мультиламеллярной структурой. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит мультивезикулярные частицы и/или частицы на основе пены. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, относительный размер которого больше, чем у обычных наночастиц, и составляет примерно от 150 до 250 нм. Согласно некоторым аспектам липосомальный состав представляет собой лиофилизированный порошок.

[00385] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который получают и нагружают зкДНК-векторами, раскрытыми или описанными в данном документе, путем добавления слабого основания к смеси, содержащей выделенную зкДНК вне липосомы. Такое добавление повышает значение рН вне липосом до приблизительно 7,3 и стимулирует вход АФИ в липосому. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, имеющий кислый рН внутри липосомы. В таких случаях значение рН внутри липосом может составлять 4-6,9 и более предпочтительно рН 6,5. Согласно другим аспектам настоящего раскрытия предложен липосомальный состав, полученный с применением технологии внутрилипосомальной стабилизации лекарственных средств. В таких случаях используют полимерные или неполимерные высокозаряженные анионы и внутрилипосомальные захватывающие агенты, например, полифосфат или октасульфат сахарозы.

[00386] Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК, полученной с помощью способа, раскрытого в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая включена в данный документ.Это можно осуществлять путем интенсивного смешивания этанольных растворов липидов с водным раствором зкДНК при низком рН, при котором происходит протонирование ионизируемого липида и обеспечиваются благоприятные энергетические характеристики для ассоциации зкДНК/липида и нуклеации частиц. Частицы могут быть дополнительно стабилизированы путем разбавления водой и удаления органического растворителя. Частицы могут быть сконцентрированы до целевого уровня.

[00387] Обычно липидные частицы получают при соотношении общего количества липида и зкДНК (массовом или весовом) от примерно 10:1 до 30:1. Согласно некоторым вариантам реализации соотношение липида и зкДНК (массовое соотношение; отношение масс/масс.) может находиться в диапазоне значений от примерно 1:1 до примерно 25:1, от примерно 10:1 до примерно 14:1, от примерно 3:1 до примерно 15:1, от примерно 4:1 до примерно 10:1, от примерно 5:1 до примерно 9:1 или от примерно 6:1 до примерно 9:1. Количества липидов и зкДНК могут быть скорректированы, чтобы обеспечить целевое соотношение N/P, например, соотношение N/P, равное 3, 4, 5, 6, 7, 8, 9, 10 или выше. Обычно общее содержание липидов в составе липидных частиц может быть в диапазоне от примерно 5 мг/мл до примерно 30 мг/мл.

[00388] Ионизируемый липид, как правило, применяется для конденсации груза нуклеиновой кислоты, например, зкДНК, при низком рН, и для стимуляции ассоциации мембран и их фузогенности. Обычно ионизируемые липиды представляют собой липиды, содержащие по меньшей мере одну аминогруппу, которая положительно заряжена или становится протонированной в кислых условиях, например, при рН 6,5 или ниже. В данном документе ионизируемые липиды также называют катионными липидами.

[00389] Примерные ионизируемые липиды описаны в международных РСТ публикациях патентов WO 2015/095340, WO 2015/199952, WO 2018/011633, WO 2017/049245, WO 2015/061467, WO 2012/040184, WO 2012/000104, WO 2015/074085, WO 2016/081029, WO 2017/004143, WO 2017/075531, WO 2017/117528, WO 2011/022460, WO 2013/148541, WO 2013/116126, WO 2011/153120, WO 2012/044638, WO 2012/054365, WO 2011/090965, WO 2013/016058, WO 2012/162210, WO 2008/042973, WO 2010/129709, WO 2010/144740, WO 2012/099755, WO 2013/049328, WO 2013/086322, WO 2013/086373, WO 2011/071860, WO 2009/132131, WO 2010/048536, WO 2010/088537, WO 2010/054401, WO 2010/054406, WO 2010/054405, WO 2010/054384, WO 2012/016184, WO 2009/086558, WO 2010/042877, WO 2011/000106, WO 2011/000107, WO 2005/120152, WO 2011/141705, WO 2013/126803, WO 2006/007712, WO 2011/038160, WO 2005/121348, WO 2011/066651, WO 2009/127060, WO 2011/141704, WO 2006/069782, WO 2012/031043, WO 2013/006825, WO 2013/033563, WO 2013/089151, WO 2017/099823, WO 2015/095346 и WO 2013/086354, и публикациях патентов США US 2016/0311759, US 2015/0376115, US 2016/0151284, US 2017/0210697, US 2015/0140070, US 2013/0178541, US 2013/0303587, US 2015/0141678, US 2015/0239926, US 2016/0376224, US 2017/0119904, US 2012/0149894, US 2015/0057373, US 2013/0090372, US 2013/0274523, US 2013/0274504, US 2013/0274504, US 2009/0023673, US 2012/0128760, US 2010/0324120, US 2014/0200257, US 2015/0203446, US 2018/0005363, US 2014/0308304, US 2013/0338210, US 2012/0101148, US 2012/0027796, US 2012/0058144, US 2013/0323269, US 2011/0117125, US 2011/0256175, US 2012/0202871, US 2011/0076335, US 2006/0083780, US 2013/0123338, US 2015/0064242, US 2006/0051405, US 2013/0065939, US 2006/0008910, US 2003/0022649, US 2010/0130588, US 2013/0116307, US 2010/0062967, US 2013/0202684, US 2014/0141070, US 2014/0255472, US 2014/0039032, US 2018/0028664, US 2016/0317458 и US 2013/0195920, содержание которых полностью включено в данный документ посредством ссылки.

[00390] Согласно некоторым вариантам реализации ионизируемый липид представляет собой МС3 (6Z,9Z,28Z,31Z)-гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (DLin-MC3-DMA или МСЗ), имеющий следующую структуру:

[00391] Липид DLin-MC3-DMA описан в Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533, содержание которой полностью включено в данный документ посредством ссылки.

[00392] Согласно некоторым вариантам реализации ионизируемый липид представляет собой липид АТХ-002, описанный в WO 2015/074085, содержание которого полностью включено в данный документ посредством ссылки.

[00393] Согласно некоторым вариантам реализации ионизируемый липид представляет собой (13Z,16Z)-N,N-диметил-3-нонилдокоза-13,16-диен-1-амин (Соединение 32), описанный в WO 2012/040184, содержание которого полностью включено в данный документ посредством ссылки.

[00394] Согласно некоторым вариантам реализации ионизируемый липид представляет собой Соединение 6 или Соединение 22, описанные в WO 2015/199952, содержание которого полностью включено в данный документ посредством ссылки.

[00395] Без ограничений, ионизируемый липид может составлять 20-90% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, молярное содержание ионизируемого липида может составлять 20-70% (мол.), 30-60% (мол.) или 40-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации ионизируемый липид составляет от примерно 50 мол. % до примерно 90 мол. % от общего количества липидов, присутствующих в липидной наночастице.

[00396] Согласно некоторым аспектам липидная наночастица может дополнительно содержать некатионный липид. Неионогенные липиды включают амфипатические липиды, нейтральные липиды и анионные липиды. Соответственно, некатионный липид может представлять собой нейтральный незаряженный, цвиттерионный или анионный липид. Некатионные липиды, как правило, применяют для усиления фузогенности.

[00397] Примерные некатионные липиды, предусмотренные для применения в способах и композициях, раскрытых в данном документе, описаны в международной заявке PCT7US 2018/050042, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ. Примерные некатионные липиды описаны в публикации международной заявки WO 2017/099823 и публикации патента США US 2018/0028664, содержание которых полностью включено в данный документ посредством ссылки.

[00398] Некатионный липид может составлять 0-30% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, содержание некатионного липида составляет 5-20% (мол.) или 10-15% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно различным вариантам реализации молярное соотношение ионизируемого липида и нейтрального липида колеблется от примерно 2:1 до примерно 8:1.

[00399] Согласно некоторым вариантам реализации липидные наночастицы не содержат каких-либо фосфолипидов. Согласно некоторым аспектам липидная наночастица может дополнительно содержать компонент, такой как стерин, для обеспечения целостности мембраны.

[00400] Один примерный стерин, который подходит для применения в липидной наночастице, представляет собой холестерин и его производные. Примерные производные холестерина описаны в международной заявке WO 2009/127060 и публикации патента США US 2010/0130588, содержание которых полностью включено в данный документ посредством ссылки.

[00401] Компонент, обеспечивающий целостность мембраны, такой как стерин, может составлять 0-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации такой компонент составляет 20-50% (мол.) 30-40% (мол.) от общего содержания липидов липидной наночастицы.

[00402] 1200

содержать полиэтиленгликоль (ПЭГ) или молекулу конъюгированного липида. Обычно их используют для ингибирования агрегации липидных наночастиц и/или для обеспечения стерической стабилизации. Примерные конъюгированные липиды включают, но не ограничиваются перечисленными, конъюгаты ПЭГ-липид, конъюгаты полиоксазолин (Р07)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид), конъюгаты катионная группа-полимер-липид (CPL); и их смеси. Согласно некоторым вариантам реализации молекула конъюгированного липида представляет собой конъюгат ПЭГ-липид, например, метоксиполиэтиленгликоль-конъюгированный липид. Примерные конъюгаты ПЭГ-липид включают, но не ограничиваются перечисленными, ПЭГ-диацилглицерин (ДАТ) (такой как 1-(монометоксиполиэтиленгликоль)-2,3-димиристоилглицерин (ПЭГ-ДМГ)), ПЭГ-диалкилоксипропил (ДАА), ПЭГ-фосфолипид, ПЭГ-церамид (Cer), пегилированный фосфатидилэтаноламин (ПЭГ-ФЭ), ПЭГ-сукцинатдиацилглицерин (PEGS-DAG) (такой как 4-O-(2',3'-ди(тетрадеканоилокси)пропил-1-O)-(w-метокси(полиэтокси)этил)бутандиоат (PEG-S-DMG)), ПЭГ-диалкоксипропилкарбам, натриевая соль N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина или их смесь. Дополнительные примерные конъюгаты ПЭГ-липид описаны, например, в US5885613, US6287591, US 2003/0077829, US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2010/0130588, US 2016/0376224 и US 2017/0119904, содержание которых полностью включено в данный документ посредством ссылки.

[00403] Согласно некоторым вариантам реализации ПЭГ-липид представляет собой соединение, раскрытое в US 2018/0028664, содержание которого включено в данный документ посредством ссылки в полном объеме. Согласно некоторым вариантам реализации ПЭГ-липид раскрыт в US 20150376115 или в US 2016/0376224, содержание которых полностью включено в данный документ посредством ссылки.

[00404] Конъюгат ПЭГ-ДАА может представлять собой, например, ПЭГ-дилаурилоксипропил, ПЭГ-димиристилоксипропил, ПЭГ-дипальмитилоксипропил или ПЭГ-дистеарилоксипропил. ПЭГ-липид может представлять собой одно или более из ПЭГ-ДМГ, ПЭГ-дилаурилглицерина, ПЭГ-дипальмитоилглицерина, ПЭГ-дистерилглицерина, ПЭГ-дилаурилгликамида, ПЭГ-димиристилгликамида, ПЭГ-дипальмитоилгликамида, ПЭГ-дистерилгликамида, ПЭГ-холестерина (1-[8'-(холест-5-ен-3β-окси)карбоксамидо-3',6'-диоксаоктанил]карбамоил-[омега]-метилполиэтиленгликоль), ПЭГ-DMB (простой эфир 3,4-дитетрадекоксилбензил-[омега]-метилполиэтиленгликоля) и 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-К-[метоксиполиэтиленгликоля-2000]. В некоторых примерах ПЭГ-липид может быть выбран из группы, состоящей из ПЭГ-ДМГ, 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-N-[метоксиполиэтиленгликоля-2000].

[00405] Липиды, конъюгированные с молекулой, отличной от ПЭГ, также могут быть использованы вместо ПЭГ-липида. Например, конъюгаты полиоксазолин (POZ)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид) и конъюгаты катионная группа-полимер-липид (CPL) могут применяться вместо или вместе с ПЭГ-липидом. Примерные конъюгированные липиды, т.е. ПЭГ-липиды, конъюгаты (POZ)-липид, конъюгаты АТТА-липид и катионный полимер-липиды, описаны в публикациях международных заявок на патент WO1996/010392, WO1998/051278, WO 2002/087541, WO 2005/026372, WO 2008/147438, WO 2009/086558, WO 2012/000104, WO 2017/117528, WO 2017/099823, WO 2015/199952, WO 2017/004143, WO 2015/095346, WO 2012/000104, WO 2012/000104 и WO 2010/006282, публикациях заявок на патент США US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2013/0303587, US 2018/0028664, US 2015/0376115, US 2016/0376224, US 2016/0317458, US 2013/0303587, US 2013/0303587 и US 20110123453, и патентах США US 5885613, US 6287591, US 6320017 и US 6586559, содержание которых полностью включено в данный документ посредством ссылки.

[00406] Согласно некоторым вариантам реализации одно или более дополнительных соединений могут представлять собой терапевтический агент. Терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран в соответствии с терапевтической целью и целевым биологическим действием. Например, если зкДНК в ЛНЧ можно применять для лечения гемофилии А, дополнительное соединение может представлять собой агент, направленный против гемофилии А (например, химиотерапевтический агент или другую терапию гемофилии А (включая, но не ограничиваясь перечисленными, малую молекулу или антитело). Согласно другому примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения инфекции, дополнительное соединение может представлять собой антимикробный агент (например, антибиотик или противовирусное соединение). Согласно еще одному примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения иммунного заболевания или нарушения, дополнительное соединение может представлять собой соединение, которое модулирует иммунный ответ (например, иммуносупрессор, иммуностимулирующее соединение или соединение, модулирующее один или более конкретных иммунных путей). Согласно некоторым вариантам реализации в композициях и способах согласно настоящему изобретению могут применяться другие смеси различных липидных наночастиц, содержащих другие соединения, такие как зкДНК, кодирующая другой белок или другое соединение, такое как терапевтическое средство.

[00407] Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуномодулирующий агент. Например, дополнительное соединение представляет собой иммуносупрессор. Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуностимулирующий агент. В данном документе также предложена фармацевтическая композиция, содержащая инкапсулированный в липидную наночастицу продуцируемый клеткой насекомого или синтетически продуцируемый зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и фармацевтически приемлемый носитель или вспомогательное вещество.

[00408] Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, дополнительно содержащий одно или более фармацевтических вспомогательных веществ. Согласно некоторым вариантам реализации состав липидных наночастиц дополнительно содержит сахарозу, tris, трегалозу и/или глицин.

[00409] ЗкДНК-вектор может образовывать комплексы с липидной частью (portion) частицы или может быть инкапсулирован в липидной части (position) липидной наночастицы. Согласно некоторым вариантам реализации зкДНК может быть полностью инкапсулирована в липидной части липидной наночастицы, что защищает ее от разрушения нуклеазой, например, в водном растворе. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после воздействия на липидную наночастицу нуклеазы при 37°С в течение по меньшей мере примерно 20, 30, 45 или 60 минут. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после инкубации частицы в сыворотке при 37°С в течение по меньшей мере примерно 30, 45 или 60 минут, или по меньшей мере примерно 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 или 36 часов.

[00410] Согласно определенным вариантам реализации липидные наночастицы по существу нетоксичны для субъекта, например, млекопитающего, такого как человек. Согласно некоторым аспектам состав липидных наночастиц представляет собой лиофилизированный порошок.

[00411] Согласно некоторым вариантам реализации липидные наночастицы представляют собой частицы с твердой сердцевиной, которые имеют по меньшей мере один липидный бислой. Согласно другим вариантам реализации липидные наночастицы имеют небислойную структуру, т.е. имеют неламеллярную (т.е. небислойную) морфологию. Без ограничений, небислойная морфология может включать, например, трехмерные трубки, стержни, частицы кубической симметрии и т.д. Например, морфологию липидных наночастиц (ламеллярных в сравнении с неламеллярными) можно легко оценить и охарактеризовать с использованием, например, анализа методом «крио-ТЭМ» (криотрансмиссионная электронная микроскопия), как описано в US 2010/0130588, содержание которого полностью включено в данный документ посредством ссылки.

[00412] Согласно некоторым другим вариантам реализации липидные наночастицы, имеющие неламеллярную морфологию, являются электронно-плотными. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, которая является либо однослойной, либо многослойной по структуре. Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, который содержит мультивезикулярные частицы и/или частицы на основе пены.

[00413] Контролируя композицию и содержание липидных компонентов, можно контролировать скорость, с которой липидный конъюгат высвобождается из липидной частицы, и, в свою очередь, скорость, с которой липидная наночастица становится фузогенной. Кроме того, другие переменные, включая, например, рН, температуру или ионную силу, могут применяться для изменения и/или контроля скорости, с которой липидная наночастица становится фузогенной. Другие способы, которые могут применяться для контроля скорости, с которой указанная липидная наночастица становится фузогенной, будут понятны обычным специалистам в данной области техники после ознакомления с указанным описанием. Также будет понятно, что размер липидных частиц можно контролировать путем контроля композиции и концентрации липидного конъюгата.

[00414] pKa катионных липидов в составах может быть сопоставлена с эффективностью ЛНЧ для доставки нуклеиновых кислот (см. Jayaraman et al., Angewandte Chemie, International Edition (2012), 51(34), 8529-8533; Semple et al, Nature Biotechnology 28, 172-176 (2010), обе работы полностью включены в данный документ посредством ссылки). Предпочтительный диапазон pKa составляет от ~5 до ~7. pKa катионного липида в липидных наночастицах может быть определена с использованием анализа, основанного на флуоресценции 2-(п-толуидино)-6-нафталинсульфоновой кислоты (TNS). VIII. Способы применения

[00415] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также можно применять в способе доставки представляющей интерес нуклеотидной последовательности (например, кодирующей белок FVIII) в клетку-мишень (например, клетку-хозяина). Способ может представлять собой, в частности, способ доставки белка FVIII к клетке субъекта, нуждающегося в этом, и лечения гемофилии А. Настоящее изобретение обеспечивает экспрессию in vivo белка FVIII, закодированного в зкДНК-векторе, в клетке у субъекта так, чтобы возник терапевтический эффект экспрессии белка FVIII. Указанные результаты наблюдаются как в in vivo, так и в in vitro режимах доставки зкДНК-вектора.

[00416] Кроме того, согласно настоящему изобретению предложен способ доставки белка FVIII в клетку субъекта, нуждающегося в этом, включающий многократные введения зкДНК-вектора согласно настоящему изобретению, кодирующего указанный белок FVIII. Поскольку зкДНК-вектор согласно настоящему изобретению не индуцирует иммунный ответ, подобный тому, который обычно наблюдается против инкапсидированных вирусных векторов, такая стратегия многократного введения, вероятно, будет иметь больший успех в системе на основе зкДНК. ЗкДНК-вектор вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса генов и экспрессии белка FVIII без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются перечисленными, введение в сетчатку (например, субретинальную инъекцию, супрахориоидальную инъекцию или интравитреальную инъекцию), внутривенное введение (например, в липосомальном составе), прямую доставку в выбранный орган (например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка), внутримышечный и другие парентеральные пути введения. Пути введения могут быть скомбинированы, если требуется.

[00417] Доставка зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, не ограничивается доставкой экспрессируемого белка FVIII. Например, зкДНК-векторы, полученные с помощью обычного способа (например, с использованием способа продуцирования на основе клеток (например, способов продуцирования в клетках насекомых)) или синтетического способа, как описано в данном документе, можно применять вместе с другими предложенными системами доставки, чтобы обеспечить часть генной терапии. Один неограничивающий пример системы, которую можно комбинировать с зкДНК-векторами в соответствии с настоящим раскрытием, включает системы, которые доставляют по отдельности один или более кофакторов или иммунных супрессоров для эффективной генной экспрессии зкДНК-вектора, экспрессирующего белок FVIII.

[00418] Согласно настоящему изобретению также предложен способ лечения гемофилии А у субъекта, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Выбранный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, который можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую последовательность белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.

[00419] Композиции и векторы, предложенные в данном документе, можно применять для доставки белка FVIII с различными целями. Согласно некоторым вариантам реализации трансген кодирует белок FVIII, который предназначен для применения в исследовательских целях, например, для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции продукта белка FVIII. В другом примере трансген кодирует белок FVIII, который предназначен для применения с целью создания модели гемофилии А на животных. Согласно некоторым вариантам реализации кодируемый белок FVIII можно применять для лечения или предотвращения состояний гемофилии А у млекопитающего-субъекта. Белок FVIII может быть перенесен в организм пациента (например, экспрессирован у пациента) в количестве, достаточном для лечения гемофилии А, ассоциированной с пониженной экспрессией, отсутствием экспрессии или дисфункцией указанного гена.

[00420] В принципе, экспрессионная кассета может включать нуклеиновую кислоту или любой трансген, который кодирует белок FVIII, который либо снижен, либо отсутствует из-за мутации, либо который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего изобретения. Предпочтительно не вставленная бактериальная ДНК не присутствует и предпочтительно бактериальная ДНК не присутствует в композициях зкДНК, предложенных в данном документе.

[00421] ЗкДНК-вектор не ограничивается одной молекулой зкДНК-вектора. Таким образом, в другом аспекте несколько зкДНК-векторов, экспрессирующих разные белки или один и тот же белок FVIII, но функционально связанный с различными промоторами или цис-регуляторными элементами, могут быть доставлены одновременно или последовательно в целевую клетку, ткань, орган или в организм субъекта. Таким образом, эта стратегия может обеспечить одновременную генную терапию несколькими белками или доставку их генов. Также можно разместить разные части белка FVIII в отдельных зкДНК-векторах (например, разные домены и/или кофакторы, необходимые для функциональности белка FVIII), например, которые могут быть введены одновременно или в разные моменты времени, и которые можно регулировать по отдельности, добавляя посредством этого дополнительный уровень контроля экспрессии белка FVIII. Доставку также можно выполнять несколько раз и, что важно для генной терапии в клинических условиях, с последующим увеличением или снижением доз, учитывая отсутствие иммунного ответа хозяина против капсида вследствие отсутствия вирусного капсида. Ожидается, что ответ против капсида не возникнет из-за отсутствия капсида.

[00422] Согласно настоящему изобретению также предложен способ лечения у субъекта гемофилии А, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, представляющую интерес, которую можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую экзогенную последовательность ДНК, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого полипептида, белка или олигонуклеотида, кодируемого указанной экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.

Способы доставки зкДНК-векторов для продукции белка FVIII

[00423] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может быть доставлен в клетку-мишень in vitro или in vivo различными подходящими способами. ЗкДНК-векторы могут быть применены или инъецированы по отдельности. ДНК-векторы могут быть доставлены в клетку без помощи реагента для трансфекции или других физических средств. В качестве альтернативы, зкДНК-векторы для экспрессии белка FVIII могут быть доставлены с использованием любого известного в данной области техники реагента для трансфекции или других известных в данной области техники физических средств, которые облегчают проникновение ДНК в клетку, например, липосом, спиртов, соединений, богатых полилизином, соединений, богатых аргинином, фосфата кальция, микровезикул, микроинъекции, электропорации и т.п.

[00424] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть эффективно нацелены на типы клеток и тканей, которые обычно трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки.

[00425] Один аспект технологии, описанной в данном документе, относится к способу доставки белка FVIII в клетку. Как правило, для способов in vivo и in vitro зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен в клетку с использованием способов, раскрытых в данном документе, а также других способов, известных в данной области техники. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, предпочтительно вводят в клетку в биологически эффективном количестве. Если зкДНК-вектор вводят в клетку in vivo (например, субъекту), биологически эффективное количество зкДНК-вектора представляет собой количество, достаточное для трансдукции и экспрессии белка FVIII в клетке-мишени.

[00426] Примерные способы введения зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают пероральный, ректальный, трансмукозальный, интраназальный, ингаляционный (например, с помощью аэрозоля), буккальный (например, сублингвальный), вагинальный, интратекальный, внутриглазной, трансдермальный, внутриэндотелиальный, in utero (или in ovo), парентеральный (например, внутривенный, подкожный, внутрикожный, внутричерепной, внутримышечный [включая введение в скелетную, диафрагмальную и/или сердечную мышцу], внутриплевральный, внутримозговой и внутрисуставной). Введение может представлять собой системную или прямую доставку в печень или куда-либо еще (например, в любые почки, желчный пузырь, простату, надпочечники, сердце, кишечник, легкое и желудок).

[00427] Введение может быть местным (например, на поверхность кожи и слизистых оболочек, включая поверхности дыхательных путей и трансдермальное введение), внутрилимфатическим и т.п., а также путем прямой инъекции в ткань или орган (например, но не ограничиваясь этим, в печень, а также в глаз, мышцы, включая скелетную мышцу, сердечную мышцу, диафрагмальную мышцу, или головной мозг).

[00428] ЗкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из печени и/или также глаз, головного мозга, скелетной мышцы, гладкой мышцы, сердца, диафрагмы, эпителия дыхательных путей, почки, селезенки, поджелудочной железы, кожи.

[00429] Наиболее подходящий путь в любом конкретном случае будет зависеть от характера и тяжести состояния, подлежащего лечению, облегчению и/или предотвращению, а также от характера конкретного используемого зкДНК-вектора. Кроме того, зкДНК позволяет вводить более одного белка FVIII в одном векторе или в нескольких зкДНК-векторах (например, смесь зкДНК).

А. Внутримышечное введение зкДНК-вектора

[00430] Согласно некоторым вариантам реализации способ лечения заболевания у субъекта включает введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, кодирующего белок FVIII, необязательно с фармацевтически приемлемым носителем. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в мышечную ткань субъекта.

[00431] Согласно некоторым вариантам реализации зкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из скелетной мышцы, гладкой мышцы, сердца, диафрагмы или мышц глаза.

[00432] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в скелетную мышцу в соответствии с настоящим изобретением включает, но не ограничивается этим, введение в скелетную мышцу в конечностях (например, верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. ЗкДНК-вектор, раскрытый в данном документе, может быть доставлен в скелетную мышцу путем внутривенного введения, внутриартериального введения, внутрибрюшинного введения, перфузии конечности (необязательно изолированной перфузии конечности для ноги и/или руки; см., например, Arruda et al., (2005) Blood 105: 3458-3464), и/или путем прямой внутримышечной инъекции. Согласно конкретным вариантам реализации зкДНК-вектор, раскрытый в данном документе, вводят в печень, глаз, конечность (руку и/или ногу) субъекта (например, субъекта с мышечной дистрофией, такой как МДД) путем перфузии конечности, необязательно изолированной перфузии конечности (например, путем внутривенного или внутрисуставного введения). В вариантах реализации зкДНК-вектор, раскрытый в данном документе, можно вводить без применения «гидродинамических» методик.

[00433] Например, доставка в ткань (например, сетчатку) обычных вирусных векторов часто усиливается гидродинамическими методиками (например, внутривенным/внутривенным введением в большом объеме), которые увеличивают давление в сосудистой сети и облегчают способность вирусного вектора пересекать барьер из эндотелиальных клеток. Согласно конкретным вариантам реализации зкДНК-векторы, описанные в данном документе, можно вводить без гидродинамических методик, таких как инфузии большого объема и/или повышенное внутрисосудистое давление (например, выше нормального систолического давления, например, повышение внутрисосудистого давления на величину менее или равную 5%, 10%, 15%, 20%, 25% от нормального систолического давления). Такие методы могут уменьшить или позволяют избежать побочных эффектов, ассоциированных с гидродинамическими методиками, таких как отек, повреждение нервов и/или синдром сдавливания.

[00434] Кроме того, композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, которую вводят в скелетную мышцу, может быть введена в скелетную мышцу в конечностях (например, в верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. Подходящие скелетные мышцы включают, без ограничений, отводящую мышцу мизинца (в кисти), отводящую мышцу мизинца (в стопе), отводящую мышцу большого пальца, отводящую мышцу пятой плюсневой кости, короткую мышцу, отводящую большой палец кисти, длинную мышцу, отводящую большой палец кисти, короткую приводящую мышцу, мышцу, приводящую большой палец стопы, длинную приводящую мышцу, большую приводящую мышцу, мышцу, приводящую большой палец кисти, локтевую мышцу, переднюю лестничную мышцу, суставную мышцу колена, двуглавую мышцу плеча, двуглавую мышцу бедра, плечевую мышцу, плечелучевую мышцу, щечную мышцу, клювовидно-плечевую мышцу, мышцу, сморщивающую бровь, дельтовидную мышцу, мышцу, опускающую угол рта, мышцу, опускающую нижнюю губу, двубрюшную мышцу, тыльные межкостные мышцы (кисти), тыльные межкостные мышцы (стопы), короткий лучевой разгибатель запястья, длинный лучевой разгибатель запястья, локтевой разгибатель запястья, разгибатель мизинца, разгибатель пальцев кисти, короткий разгибатель пальцев кисти, длинный разгибатель пальцев кисти, короткий разгибатель большого пальца стопы, длинный разгибатель большого пальца стопы, разгибатель указательного пальца, короткий разгибатель большого пальца, длинный разгибатель большого пальца, лучевой сгибатель запястья, локтевой сгибатель запястья, короткий сгибатель мизинца (кисти), короткий сгибатель мизинца (стопы), короткий сгибатель пальцев стопы, длинный сгибатель пальцев стопы, глубокий сгибатель пальцев кисти, поверхностный сгибатель пальцев кисти, короткий сгибатель большого пальца стопы, длинный сгибатель большого пальца стопы, короткий сгибатель большого пальца кисти, длинный сгибатель большого пальца кисти, лобную мышцу, икроножную мышцу, подбородочно-подъязычную мышцу, большую ягодичную мышцу, среднюю ягодичную мышцу, малую ягодичную мышцу, тонкую мышцу, подвздошно-реберную мышцу шеи, подвздошно-реберную мышцу поясницы, подвздошно-реберную мышцу груди, подвздошную мышцу, нижнюю близнецовую мышцу, нижнюю косую мышцу, нижнюю прямую мышцу, подостную мышцу, межостистые мышцы, межпоперечные мышцы, латеральную крыловидную мышцу, латеральную прямую мышцу, широчайшую мышцу спины, мышцу, поднимающую угол рта, мышцу, поднимающую верхнюю губу, мышцу, поднимающую верхнюю губу и крыло носа, мышцу, поднимающую верхнее веко, мышцу, поднимающую лопатку, длинные мышцы-вращатели, длиннейшую мышцу головы, длиннейшую мышцу шеи, длиннейшую мышцу груди, длинную мышцу головы, длинную мышцу шеи, червеобразные мышцы (кисти), червеобразные мышцы (стопы), жевательную мышцу, медиальную крыловидную мышцу, медиальную прямую мышцу, среднюю лестничную мышцу, многораздельные мышцы, челюстно-подъязычную мышцу, нижнюю косую мышцу головы, верхнюю косую мышцу головы, наружную запирательную мышцу, внутреннюю запирательную мышцу, затылочную мышцу, лопаточно-подъязычную мышцу, мышцу, противопоставляющую мизинец, мышцу, противопоставляющую большой палец кисти, круговую мышцу глаза, круговую мышцу рта, ладонную межкостную мышцу, короткую ладонную мышцу, длинную ладонную мышцу, гребенчатую мышцу, большую грудную мышцу, малую грудную мышцу, короткую малоберцовую мышцу, длинную малоберцовую мышцу, третью малоберцовую мышцу, грушевидную мышцу, подошвенные межкостные мышцы, подошвенную мышцу, подкожную мышцу шеи, подколенную мышцу, заднюю лестничную мышцу, квадратный пронатор, круглый пронатор, большую поясничную мышцу, квадратную мышцу бедра, квадратную мышцу подошвы, переднюю прямую мышцу головы, латеральную прямую мышцу головы, большую заднюю прямую мышцу головы, малую заднюю прямую мышцу головы, прямую мышцу бедра, большую ромбовидную мышцу, малую ромбовидную мышцу, мышцы смеха, портняжную мышцу, наименьшую лестничную мышцу, полуперепончатую мышцу, полуостистую мышцу головы, полуостистую мышцу шеи, полуостистую мышцу груди, полусухожильную мышцу, переднюю зубчатую мышцу, короткие мышцы-вращатели, камбаловидную мышцу, остистую мышцу головы, остистую мышцу шеи, остистую мышцу груди, ременную мышцу головы, ременную мышцу шеи, грудино-ключично-сосцевидную мышцу, грудино-подъязычную мышцу, грудино-щитовидную мышцу, шило-подъязычную мышцу, подключичную мышцу, подлопаточную мышцу, верхнюю близнецовую мышцу, верхнюю косую мышцу, верхнюю прямую мышцу, супинатор, надостную мышцу, височную мышцу, мышцу, напрягающую широкую фасцию, большую круглую мышцу, малую круглую мышцу, мышцы груди, щито-подъязычную мышцу, переднюю болыпеберцовую мышцу, заднюю болынеберцовую мышцу, трапециевидную мышцу, трехглавую мышцу плеча, промежуточную широкую мышцу бедра, латеральную широкую мышцу бедра, медиальную широкую мышцу бедра, большую скуловую мышцу и малую скуловую мышцу, и любые другие подходящие скелетные мышцы, известные в данной области.

[00435] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в диафрагмальную мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно некоторым вариантам реализации доставка экспрессированного с зкДНК-вектора трансгена в ткань-мишень также может быть достигнута путем доставки синтетического депо, содержащего зкДНК-вектор, причем депо, содержащее зкДНК-вектор, имплантируют в скелетную, гладкомышечную, сердечную и/или диафрагмальную мышечную ткань или мышечная ткань может быть приведена в контакт с пленкой или другим матриксом, содержащим зкДНК-вектор, как описано в данном документе. Такие имплантируемые матриксы или субстраты описаны в патенте США №7201898.

[00436] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в сердечную мышцу включает введение в левое предсердие, правое предсердие, левый желудочек, правый желудочек и/или перегородку. ЗкДНК-вектор, описанный в данном документе, может быть доставлен в сердечную мышцу путем внутривенного введения, внутриартериального введения, такого как внутриаортальное введение, прямой сердечной инъекции (например, в левое предсердие, правое предсердие, левый желудочек, правый желудочек), и/или перфузии коронарной артерии.

[00437] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в гладкую мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно одному варианту реализации введение можно осуществлять в эндотелиальные клетки, присутствующие в гладких мышцах, рядом с ними и/или на них. Неограничивающие примеры гладких мышц включают радужную оболочку глаза, бронхиолы легкого, мышцы гортани (голосовые связки), мышечные слои желудка, пищевода, тонкого и толстого кишечника желудочно-кишечного тракта, мочеточника, детрузора мочевого пузыря, миометрия матки, полового члена или простаты.

[00438] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в скелетную мышцу, диафрагмальную мышцу и/или сердечную мышцу. В типичных вариантах реализации зкДНК-вектор в соответствии с настоящим изобретением применяют для лечения и/или предотвращения нарушений скелетной, сердечной и/или диафрагмальной мышцы.

[00439] В частности, предусмотрено, что композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть доставлена в одну или более мышц глаза (например, боковую прямую мышцу, медиальную прямую мышцу, верхнюю прямую мышцу, нижнюю прямую мышцу, верхнюю косую мышцу, нижнюю косую мышцу), мимические мышцы (такие как затылочно-лобная мышца, височно-теменная мышца, мышца гордецов, носовая мышца, мышца, опускающая перегородку носа, круговая мышца глаза, мышца, сморщивающая бровь, мышца, опускающая бровь, ушные мышцы, круговая мышца рта, опускающая угол рта мышца, мышца смеха, большая скуловая мышца, малая скуловая мышца, поднимающая верхнюю губу мышца, поднимающая верхнюю губу и крыло носа мышца, опускающая нижнюю губу мышца, поднимающая угол рта мышца, щечная мышца, подбородочная мышца) или мышцы языка (например, подбородочно-язычную мышцу, подъязычно-язычную мышцу, хрящеязычную мышцу, шилоязычную мышцу, небно-язычную мышцу, верхнюю продольную мышцу, нижнюю продольную мышцу, вертикальную мышцу и поперечную мышцу).

(i) Внутримышечная инъекция: Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введена путем инъекции в одно или более мест конкретной мышцы, например, скелетной мышцы (например, дельтовидной, латеральной широкой мышцы бедра, вентро-ягодичной мышцы тыльной ягодичной мышцы или переднебоковой мышцы бедра для младенцев), у субъекта с помощью иглы. Композиция, содержащая зкДНК, может быть введена в другие подтипы мышечных клеток. Неограничивающие примеры подтипов мышечных клеток включают клетки скелетных мышц, клетки сердечной мышцы, клетки гладких мышц и/или клетки диафрагмальной мышцы.

[00440] Способы внутримышечной инъекции известны специалистам в данной области техники и поэтому в данном документе подробно не описываются. Однако при выполнении внутримышечной инъекции соответствующий размер иглы следует определять на основании возраста и комплекции пациента, вязкости композиции, а также места инъекции. В Таблице 8 приведены рекомендации по примерным местам инъекции и соответствующему размеру иглы:

[00441] Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в небольшом объеме, например, примерном объеме, представленном в Таблице 8, для конкретного субъекта. Согласно некоторым вариантам реализации перед инъекцией субъекту может быть введен общий или местный анестетик, при необходимости. Это особенно желательно, если требуется несколько инъекций или если инъекцию вводят в более глубокую мышцу, а не в обычные места инъекций, указанные выше.

[00442] Согласно некоторым вариантам реализации внутримышечную инъекцию можно комбинировать с электропорацией, давлением доставки или использованием реагентов для трансфекции для усиления клеточного поглощения зкДНК-вектора.

(ii) Реагенты для трансфекции: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в виде композиций, содержащих один или более реагентов для трансфекции, чтобы облегчить поглощение векторов в мышечные трубочки или мышечную ткань. Таким образом, в одном варианте реализации, нуклеиновые кислоты, описанные в данном документе, вводят в мышечную клетку, мышечную трубочку или мышечную ткань путем трансфекции с использованием способов, описанных в другом месте в данном документе.

(iii) Электропорация: Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят без носителя для облегчения проникновения зкДНК в клетки или в физиологически инертном фармацевтически приемлемом носителе (т.е. в любом носителе, который не улучшает или не усиливает поглощение бескапсидных невирусных векторов в мышечные трубочки). Согласно таким вариантам реализации поглощение бескапсидного невирусного вектора может быть облегчено путем электропорации клетки или ткани.

[00443] Клеточные мембраны естественным образом устойчивы к проникновению внеклеточных объектов в цитоплазму клетки. Одним из методов временного уменьшения этой устойчивости является «электропорация», когда электрические поля используют для создания пор в клетках, не вызывая необратимого повреждения клеток. Эти поры достаточно велики, чтобы позволить ДНК-векторам, фармацевтическим препаратам, ДНК и другим полярным соединениям проникать внутрь клетки. Со временем поры в клеточной мембране закрываются, и клетка снова становится непроницаемой.

[00444] Электропорацию можно использовать в приложениях как in vitro, так и in vivo для введения, например, экзогенной ДНК в живые клетки. Для приложений in vitro, как правило, смешивают образец живых клеток с композицией, содержащей, например, ДНК. Затем клетки помещают между электродами, такими как параллельные пластины, и к смеси клетка/композиция прикладывают электрическое поле.

[00445] Существует ряд методов электропорации in vivo; электроды могут быть обеспечены в различных конфигурациях, таких как, например, штангенциркуль, который захватывает эпидермис, лежащий над областью клеток, подлежащих обработке. В качестве альтернативы, в ткань могут быть введены игольчатые электроды для доступа к клеткам, расположенным глубже. В любом случае, после инъекционного введения композиции, содержащей, например, нуклеиновые кислоты, в область обработки,

электроды прикладывают к области электрическое поле. В некоторых приложениях электропорации электрическое поле представляет собой одиночный прямоугольный импульс порядка 100-500 В/см с длительностью от 10 до 60 мс. Такой импульс может генерироваться, например, в известных приложениях Electro Square Porator Т820, производимых ВТХ Division Genetronics, Inc.

[00446] Как правило, успешное поглощение, например, нуклеиновых кислот происходит только в том случае, если мышцу электрически стимулировать сразу или вскоре после введения композиции, например, путем инъекции в мышцу.

[00447] Согласно определенным вариантам реализации электропорация достигается с использованием импульсов электрических полей или с использованием схем обработки с низким напряжением/длинными импульсами (например, с использованием системы электропорации с прямоугольными импульсами). Примерные генераторы импульсов, способные генерировать импульсное электрическое поле, включают, например, ЕСМ600, который может генерировать экспоненциальную форму волны, и ElectroSquarePorator (Т820), который может генерировать прямоугольную форму волны, оба из которых доступны от ВТХ, подразделения Genetronics, Inc. (Сан-Диего, Калифорния). Системы электропорации с прямоугольной волной доставляют контролируемые электрические импульсы, которые быстро повышаются до заданного напряжения, остаются на этом уровне в течение заданного периода времени (длительность импульса), а затем быстро падают до нуля.

[00448] Согласно некоторым вариантам реализации местный анестетик вводят, например, путем инъекции в место обработки, чтобы уменьшить боль, которая может быть ассоциирована с электропорацией ткани в присутствии композиции, содержащей бескапсидный невирусный вектор, как описано в данном документе. Кроме того, специалист в данной области техники поймет, что следует выбирать дозу композиции, которая сводит к минимуму и/или предотвращает чрезмерное повреждение ткани, приводящее к фиброзу, некрозу или воспалению мышцы.

(iv) Давление доставки: Согласно некоторым вариантам реализации доставку зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечную ткань облегчают с помощью давления доставки, при котором используется комбинация больших объемов и быстрой инъекции в артерию, снабжающую конечность (например, подвздошную артерию). Этот способ введения может быть достигнут с помощью множества способов, которые включают вливание в сосудистую сеть конечности композиции, содержащей зкДНК-вектор, как правило, при изоляции мышцы от большого круга кровообращения с помощью жгута сосудистого зажима. В одном методе композиция циркулирует через сосудистую сеть конечности, чтобы обеспечить возможность экстравазации в клетки. В другом методе внугрисосудистое гидродинамическое давление увеличивается для расширения сосудистых лож и увеличения поглощения зкДНК-вектора в мышечные клетки или ткань. Согласно одному варианту реализации композицию зкДНК вводят в артерию.

(v) Композиции липидпых напочастиц: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, для внутримышечной доставки изготавливают в виде композиции, содержащей липосому, как описано в другом месте в данном документе

(vi) Системное введение зкДНК-вектора, нацеленного на мышечную ткань: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготовлен для нацеливания на мышцу за счет введения путем непрямой доставки, при котором зкДНК транспортируется в мышцу, а не в печень. Соответственно, технология, описанная в данном документе, включает непрямое введение композиций, содержащих зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, в мышечную ткань, например, путем системного введения. Такие композиции можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, подкожно, внутрь полости, и их можно доставлять с помощью перистальтических средств, при необходимости, или с помощью других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно, например, путем внутривенной инфузии.

[00449] Согласно некоторым вариантам реализации поглощение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечные клетки/ткань увеличивается за счет использования нацеливающего агента или фрагмента, который преимущественно направляет вектор в мышечную ткань. Таким образом, в некоторых вариантах реализации бескапсидный зкДНК-вектор может быть сконцентрирован в мышечной ткани по сравнению с количеством бескапсидных зкДНК-векторов, присутствующих в других клетках или тканях организма.

[00450] Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, дополнительно содержит фрагмент, нацеливающий на мышечные клетки. Согласно другим вариантам реализации экспрессированный генный продукт содержит нацеливающий фрагмент, специфический для ткани, в котором его действие является желательным. Нацеливающий фрагмент может включать любую молекулу или комплекс молекул, которые способны нацеливаться, взаимодействовать, соединяться и/или связываться с внутриклеточным, поверхностным или внеклеточным биомаркером клетки или ткани. Биомаркер может включать, например, клеточную протеазу, киназу, белок, рецептор клеточной поверхности, липид и/или алифатическую кислоту. Другие примеры биомаркеров, на которые могут быть нацелены, с которыми могут взаимодействовать, соединяться и/или связываться нацеливающие фрагменты, включают молекулы, ассоциированные с конкретным заболеванием. Например, биомаркеры могут включать рецепторы клеточной поверхности, участвующие в развитии рака, такие как рецептор эпидермального фактора роста и рецептор трансферрина. Нацеливающие фрагменты могут включать, но не ограничиваются перечисленными, синтетические соединения, природные соединения или продукты, макромолекулярные объекты, биосконструированные молекулы (например, полипептиды, липиды, полинуклеотиды, антитела, фрагменты антител) и малые объекты (например, малые молекулы, нейротрансмиттеры, субстраты, лиганды, гормоны и соединения элементов), которые связываются с молекулами, экспрессируемыми в целевой мышечной ткани.

[00451] Согласно определенным вариантам реализации нацеливающий фрагмент может дополнительно содержать рецепторную молекулу, включая, например, рецепторы, которые естественным образом распознают конкретную целевую молекулу клетки-мишени. Такие рецепторные молекулы включают рецепторы, которые были модифицированы для повышения их специфичности взаимодействия с молекулой-мишенью, рецепторы, которые были модифицированы для взаимодействия с целевой молекулой-мишенью, не распознаваемой рецептором в естественных условиях, и фрагменты таких рецепторов (см., например, Skerra, 2000, J. Molecular Recognition, 13:167-187). Предпочтительный рецептор представляет собой рецептор хемокина. Примерные рецепторы хемокинов описаны, например, в Lapidot et al, 2002, Exp Hematol, 30:973-81 и Onuffer et al., 2002, Trends Pharmacol Sci, 23:459-67.

[00452] Согласно другим вариантам реализации дополнительный нацеливающий фрагмент может содержать молекулу лиганда, включая, например, лиганды, которые естественным образом распознают конкретный целевой рецептор клетки-мишени, такой как лиганд трансферрина (Tf). Такие молекулы лигандов включают лиганды, которые были модифицированы для повышения их специфичности взаимодействия с рецептором-мишенью, лиганды, которые были модифицированы для взаимодействия с целевым рецептором, который не распознается лигандом в естественных условиях, и фрагменты таких лигандов.

[00453] Согласно другим вариантам реализации нацеливающий фрагмент может содержать аптамер. Аптамеры представляют собой олигонуклеотиды, выбранные для специфичного связывания с целевой молекулярной структурой клетки-мишени. Аптамеры, как правило, представляют собой продукты способа селекции по аффинности, сходного с селекцией по аффинности при фаговом дисплее (также известной как молекулярная эволюция in vitro). Способ включает выполнение нескольких тандемных итераций разделения по аффинности, например, с использованием твердой подложки, с которой связан патологический иммуноген, с последующей полимеразной цепной реакцией (ПЦР) для амплификации нуклеиновых кислот, которые связались с иммуногенами. Таким образом, каждый раунд аффинного разделения обогащает популяцию нуклеиновых кислот молекулами, которые успешно связывают целевой иммуноген. Таким путем случайный пул нуклеиновых кислот может быть «обучен» с получением аптамеров, которые специфично связывают молекулы-мишени. Аптамеры, как правило, представляют собой РНК, но могут представлять собой ДНК или ее аналоги или производные, такие как, без ограничения, пептидные нуклеиновые кислоты (ПНК) и фосфотиоатные нуклеиновые кислоты.

[00454] Согласно некоторым вариантам реализации нацеливающий фрагмент может содержать фоторазлагаемый лиганд (т.е. «запертый» лиганд), который высвобождается, например, под действием сфокусированного луча света так, что бескапсидные невирусные векторы или генный продукт нацеливаются на конкретную ткань.

[00455] В данном документе также предусмотрено, что композиции доставляют в несколько мест в одной или более мышцах субъекта. Таким образом, инъекции могут быть сделаны в по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 35, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50, по меньшей мере 55, по меньшей мере 60, по меньшей мере 65, по меньшей мере 70, по меньшей мере 75, по меньшей мере 80, по меньшей мере 85, по меньшей мере 90, по меньшей мере 95, по меньшей мере 100 местах инъекций. Такие места могут быть распределены по площади одной мышцы или могут быть распределены между несколькими мышцами.

В. Введение зкДНК-вектора для экспрессии белка FVIII в немышечные места

[00456] Согласно другому варианту реализации зкДНК-вектор для экспрессии белка FVIII вводят в печень. ЗкДНК-вектор также можно вводить в различные области глаза, такие как роговица и/или зрительный нерв. ЗкДНК-вектор также можно вводить в спинной мозг, ствол мозга (продолговатый мозг, мост), средний мозг (гипоталамус, таламус, эпиталамус, гипофиз, черную субстанцию, эпифиз), мозжечок, конечный мозг (полосатое тело, полушария головного мозга, включая затылочную, височную, теменную и лобную доли, кору, базальные ганглии, гиппокамп и амигдалу), лимбическую систему, неокортекс, полосатое тело, полушария головного мозга и нижний холмик четверохолмия. ЗкДНК-вектор может быть доставлен в спинномозговую жидкость (например, с помощью люмбальной пункции). ЗкДНК-вектор для экспрессии белка FVIII можно дополнительно Glu G1 внутрисосудисто в ЦНС в ситуациях, когда нарушен гематоэнцефалический барьер (например, опухоль головного мозга или церебральный инфаркт).

[00457] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII можно вводить в целевую область (области) глаза любым путем, известным в данной области техники, включая, но не ограничиваясь перечисленными, интратекальную, внутриглазную, интрацеребральную, в нутриже луд очковую, внутривенную (например, в присутствии сахара, такого как маннит), интраназальную, внутриушную, внутриглазную (например, интравитреальную, субретинальную, в переднюю камеру) и периокулярную (например, в субтенонову область) доставку, а также внутримышечную доставку с ретроградной доставкой к двигательным нейронам.

[00458] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в жидком составе путем прямой инъекции (например, стереотаксической инъекции) в целевую область или компартмент в ЦНС. Согласно другим вариантам реализации зкДНК-вектор может быть обеспечен путем местного нанесения на целевую область или путем интраназального введения аэрозольного состава. Введение в глаз можно осуществлять путем местного нанесения жидких капель. В качестве дополнительной альтернативы зкДНК-вектор можно вводить в виде твердого состава с медленным высвобождением (см., например, патент США №7201898). Согласно другим дополнительным вариантам реализации зкДНК-вектор можно применять для ретроградного транспорта для лечения, облегчения и/или предотвращения заболеваний и нарушений, затрагивающих двигательные нейроны (например, бокового амиотрофического склероза (БАС); спинальной мышечной атрофии (СМА) и т.д.). Например, зкДНК-вектор может быть доставлен в мышечную ткань, из которой он может мигрировать в нейроны.

С. Лечение ex vivo

[00459] Согласно некоторым вариантам реализации клетки извлекают из организма субъекта, вводят в них зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и затем клетки возвращают в организм субъекта. Способы извлечения клеток из организма субъекта для лечения ex vivo с последующим введением обратно в организм субъекта известны в данной области техники (см., например, патент США №5399346; содержание которого полностью включено в данный документ). В качестве альтернативы, зкДНК-вектор вводят в клетки, полученные от другого субъекта, в культивируемые клетки или в клетки из любого другого подходящего источника, и указанные клетки вводят нуждающемуся в этом субъекту.

[00460] Клетки, трансдуцированные зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе, предпочтительно вводят субъекту в «терапевтически эффективном количестве» в комбинации с фармацевтическим носителем. Специалисты в данной области техники поймут, что терапевтические эффекты не обязательно должны быть полными или обеспечивать исцеление, при условии, что для субъекта они в какой-то мере благоприятны.

[00461] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, описанный в данном документе (иногда называемый трансгеном или гетерологичной нуклеотидной последовательностью), который должен продуцироваться в клетке in vitro, ex vivo или in vivo. Например, в отличие от применения зкДНК-векторов, описанных в данном документе, в способе лечения, который обсуждается в данном документе, в некоторых вариантах реализации зкДНК-вектор для экспрессии белка FVIII может быть введен в культивируемые клетки, и экспрессированный белок FVIII может быть выделен из клеток, например, для получения антител и слитых белков. Согласно некоторым вариантам реализации культивируемые клетки, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для коммерческого получения антител или слитых белков, например, в качестве источника клеток для мелкомасштабного или крупномасштабного биоизготовления антител или слитых белков. В альтернативных вариантах реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в клетки у субъекта-хозяина, не являющегося человеком, для продуцирования антител или слитых белков in vivo, включая мелкомасштабное получение, а также коммерческое крупномасштабное получение белка FVIII.

[00462] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять как в ветеринарных, так и в медицинских приложениях. Подходящие субъекты для способов доставки генов ex vivo, описанных выше, включают как птиц (например, кур, уток, гусей, перепелов, индеек и фазанов), так и млекопитающих (например, человека, бычьих, овечьих, козьих, лошадиных, кошачьих, собачьих и зайцеобразных), при этом предпочтительными являются млекопитающие. Субъекты-люди являются наиболее предпочтительными. Субъекты-люди включают новорожденных, младенцев, детей и подростков, и взрослых людей.

D. Диапазоны доз

[00463] В данном документе предложены способы лечения, включающие введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий белок FVIII, как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к введенному количеству композиции зкДНК, которое приводит к экспрессии белка FVIII в «терапевтически эффективном количестве» для лечения гемофилии А.

[00464] Анализы in vivo и/или in vitro необязательно можно использовать, чтобы облегчить определение оптимальных диапазонов дозировок для применения. Точная доза, которая должна быть использована в составе, также будет зависеть от пути введения и серьезности состояния и должна определяться в соответствии с суждением обычного специалиста в данной области техники и обстоятельствами каждого субъекта. Эффективные дозы можно экстраполировать из кривых доза-ответ, полученных из тест-систем in vitro или в моделях на животных.

[00465] для экс пр есс ии белка FVIII, раскрытые в данном документе, вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса и экспрессии генов без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются ими, те, которые описаны выше в разделе «Введение», такие как прямая доставка в выбранный орган (например, внутрипортальная доставка в печень), пероральный, ингаляционный (включая интраназальную и внутритрахеальную доставку), 1035 внутриопухолевый и другие исходные пути введения. Пути введения могут быть скомбинированы, если требуется.

[00466] Доза количества зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, необходимая для достижения определенного «терапевтического эффекта», будет варьироваться в зависимости от нескольких факторов, включая, но не ограничиваясь перечисленными: путь введения нуклеиновой кислоты, уровень экспрессии гена или РНК, необходимый для достижения терапевтического эффекта, конкретное заболевание или нарушение, которое лечат, и стабильность гена (ов), продукта (ов) РНК или полученного экспрессированного белка (ов). Специалист в данной области техники может легко определить диапазон доз зкДНК-вектора для лечения пациента, страдающего конкретным заболеванием или нарушением, на основании вышеупомянутых факторов, а также других факторов, которые хорошо известны в данной области техники.

[00467] Схему дозирования можно корректировать для обеспечения оптимального терапевтического ответа. Например, олигонуклеотид может быть введен повторно, например, несколько доз могут быть введены ежедневно или дозу можно пропорционально уменьшать в соответствии с требованиями терапевтической ситуации. Обычный специалист в данной области техники легко сможет определить подходящие дозы и схемы введения рассматриваемых олигонуклеотидов, независимо от того, должны быть введены олигонуклеотиды в клетки или субъектам.

[00468] «Терапевтически эффективная доза» будет находиться в относительно широком диапазоне, который может быть определен посредством клинических исследований, и будет зависеть от конкретного применения (нервным клеткам потребуются очень небольшие количества, в то время как системная инъекция потребует больших количеств). Например, для прямой инъекции in vivo в скелетную или сердечную мышцу субъекта-человека терапевтически эффективная доза будет порядка от примерно 1 мкг до 100 г зкДНК-вектора. Если для доставки зкДНК-вектора используются экзосомы или микрочастицы, то терапевтически эффективная доза может быть определена экспериментально, но ожидается, что она доставит от 1 мкг до примерно 100 г вектора. Более того, терапевтически эффективная доза представляет собой количество зкДНК-вектора, которое экспрессирует достаточное количество трансгена, чтобы оказывать влияние на субъекта, которое приводит к уменьшению одного или более симптомов заболевания, но не приводит к значительным нецелевым эффектам или значительным нежелательным побочным эффектам. Согласно одному варианту реализации «терапевтически эффективное количество» представляет собой количество экспрессированного белка FVIII, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера гемофилии А или уменьшения симптома конкретного заболевания. Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК-вектора.

[00469] Изготовление растворов фармацевтически приемлемых вспомогательных веществ и носителей хорошо известно специалистам в данной области техники, как и разработка подходящих схем дозирования и лечения для использования конкретных композиций, описанных в данном документе, в различных схемах лечения.

[00470] Для трансфекции in vitro эффективное количество зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, для доставки в клетки (1×106 клеток) будет порядка от 0,1 до 100 мкг зкДНК-вектора, предпочтительно от 1 до 20 мкг и более предпочтительно от 1 до 15 мкг или от 8 до 10 мкг. Для более крупных зкДНК-векторов потребуются более высокие дозы. При использовании экзосом или микрочастиц, эффективная доза in vitro может быть определена экспериментально, но она будет предназначена для доставки в целом того же количества зкДНК-вектора.

[00471] Для лечения гемофилии А подходящая дозировка зкДНК-вектора, который экспрессирует белок FVIII, раскрытого в данном документе, будет зависеть от конкретного типа заболевания, подлежащего лечению, типа белка FVIII, степени тяжести и течения заболевания гемофилией А, предыдущей терапии, истории болезни пациента и реакции на антитело, а также от решения лечащего врача. ЗкДНК-вектор, кодирующий белок FVIII, подходящим образом вводят пациенту за один раз или в течение ряда обработок. В данном документе предусмотрены различные схемы дозирования, включая, но не ограничиваясь перечисленными, однократное или многократное введение в различные моменты времени, болюсное введение и импульсную инфузию.

[00472] В зависимости от типа и степени тяжести заболевания зкДНК-вектор вводят в количестве, при котором кодируемый белок FVIII экспрессируется в диапазоне от примерно 0,3 мг/кг до 100 мг/кг (например, от 15 мг/кг до 100 мг/кг или любой дозировке в пределах этого диапазона), с помощью одного или более отдельных введений или непрерывной инфузии. Одной типичной суточной дозы зкДНК-вектора достаточно, чтобы привести к экспрессии кодируемого белка FVIII в диапазоне от примерно 15 мг/кг до 100 мг/кг или более, в зависимости от факторов, упомянутых выше. Одна примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII, как раскрыто в данном документе, в диапазоне от примерно 10 мг/кг до примерно 50 мг/кг. Таким образом, пациенту может быть введена одна или более доз зкДНК-вектора в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII при примерно 0,5 мг/кг, 1 мг/кг, 1,5 мг/кг, 2,0 мг/кг, 3 мг/кг, 4,0 мг/кг, 5 мг/кг, 10 мг/кг, 15 мг/кг, 20 мг/кг, 25 мг/кг, 30 мг/кг, 35 мг/кг, 40 мг/кг, 50 мг/кг, 60 мг/кг, 70 мг/кг, 80 мг/кг, 90 мг/кг или 100 мг/кг (или любой их комбинации). Согласно некоторым вариантам реализации зкДНК-вектор представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII для общей дозы в диапазоне от 50 мг до 2500 мг. Примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к общей экспрессии кодируемого белка FVIII примерно 50 мг, примерно 100 мг, 200 мг, 300 мг, 400 мг, примерно 500 мг, примерно 600 мг, примерно 700 мг, примерно 720 мг, примерно 1000 мг, примерно 1050 мг, примерно 1100 мг, примерно 1200 мг, примерно 1300 мг, примерно 1400 мг, примерно 1500 мг, примерно 1600 мг, примерно 1700 мг, примерно 1800 мг, примерно 1900 мг, примерно 2000 мг, примерно 2050 мг, примерно 2100 мг, примерно 2200 мг, примерно 2300 мг, примерно 2400 мг или примерно 2500 мг (или любой их комбинации). Поскольку экспрессию белка FVIII с зкДНК-вектора можно тщательно контролировать с помощью регуляторных переключателей в данном документе или, альтернативно, многократной дозы зкДНК-вектора, вводимой субъекту, экспрессию белка FVIII с зкДНК-вектора можно контролировать так, что дозы экспрессированного белка FVIII можно вводить с перерывами, например, каждую неделю, каждые две недели, каждые три недели, каждые четыре недели, каждый месяц, каждые два месяца, каждые три месяца или каждые шесть месяцев с зкДНК-вектора. Ход этой терапии можно контролировать с помощью обычных методик и анализов.

[00473] Согласно определенным вариантам реализации зкДНК-вектор вводят в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII в дозе 15 мг/кг, 30 мг/кг, 40 мг/кг, 45 мг/кг, 50 мг/кг, 60 мг/кг или в фиксированной дозе, например, 300 мг, 500 мг, 700 мг, 800 мг или выше. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждый день, через день, каждую неделю, каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно определенным вариантам реализации период времени составляет 6 месяцев, один год, восемнадцать месяцев, два года, пять лет, десять лет, 15 лет, 20 лет или продолжительность жизни пациента.

[00474] Лечение может включать введение однократной дозы или многократных доз. Согласно некоторым вариантам реализации субъекту можно вводить более одной дозы; фактически, при необходимости можно вводить многократные дозы, поскольку зкДНК-вектор не вызывает иммунного ответа хозяина против капсида ввиду отсутствия вирусного капсида. Таким образом, специалист в данной области техники может легко определить подходящее количество доз. Количество вводимых доз может составлять, например, порядка 1-100, предпочтительно 2-20 доз.

[00475] Не ограничиваясь какой-либо конкретной теорией, отсутствие типичного противовирусного иммунного ответа, вызванного введением зкДНК-вектора, как описано в настоящем раскрытии (т.е. отсутствие компонентов капсида), позволяет вводить хозяину зкДНК-вектор для экспрессии белка FVIII несколько раз. Согласно некоторым вариантам реализации количество раз доставки гетерологичной нуклеиновой кислоты субъекту находится в диапазоне от 2 до 10 раз (например, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз). Согласно некоторым вариантам реализации зкДНК-вектор доставляют субъекту более 10 раз.

[00476] Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарный день (например, в течение 24-часового периода). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в 2, 3, 4, 5, 6 или 7 календарных дней. Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарную неделю (например, 7 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще, чем один раз в две недели (например, один раз в период в две календарные недели). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный месяц (например, один раз в 30 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в шесть календарных месяцев. Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный год (например, 365 дней или 366 дней в високосный год).

[00477] В конкретных вариантах реализации для достижения целевого уровня экспрессии гена на протяжении различных периодов времени, например, ежедневно, еженедельно, ежемесячно, ежегодно и т.д., можно использовать более одного введения (например, два, три, четыре или более введений) зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе.

[00478] Согласно некоторым вариантам реализации терапевтический белок FVIII, кодируемый зкДНК-вектором, раскрытым в данном документе, можно регулировать с помощью регуляторного переключателя, индуцируемого или репрессируемого промотора так, что он экспрессируется у субъекта в течение по меньшей мере 1 часа, по меньшей мере 2 часов, по меньшей мере 5 часов, по меньшей мере 10 часов, по меньшей мере 12 часов, по меньшей мере 18 часов, по меньшей мере 24 часов, по меньшей мере 36 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Согласно одному варианту реализации экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы. В качестве альтернативы, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может дополнительно содержать компоненты системы редактирования генов (например, CRISPR/Cas, TALEN, эндонуклеазы цинковых пальцев и т.д.), что позволяет вставлять одну или более последовательностей нуклеиновых кислот, кодирующих белок FVIII, для по существу постоянного лечения или «излечения» заболевания. Такие зкДНК-векторы, содержащие компоненты редактирования генов, раскрыты в международной заявке PCT/US18/64242 и могут включать 5' и 3' плечи гомологии (например, SEQ ID NO: 151-154, или последовательности, имеющие по меньшей мере 40%, 50%, 60%, 70% или 80% гомологии с ними) для вставки нуклеиновой кислоты, кодирующей белок FVIII, в области «безопасной гавани», такие как, но не включая их, ген альбумина или ген CCR5. В качестве примера, зкДНК-вектор, экспрессирующий белок FVIII, может содержать по меньшей мере одно плечо гомологии, специфичное в отношении геномной «безопасной гавани» (GSH), для встраивания трансгена FVIII в геномную «безопасную гавань», как раскрыто в международной заявке на патент PCT/US2019/020225, поданной 1 марта 2019 г., которая полностью включена в данный документ посредством ссылки.

[00479] Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Предусмотрено непрерывное введение относительно низких поддерживающих доз после начальной более высокой терапевтической дозы.

Е. Единичные лекарственные формы

[00480] Согласно некоторым вариантам реализации фармацевтические композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут быть удобно представлены в виде единичной лекарственной формы. Единичная лекарственная форма, как правило, адаптирована для одного или более конкретных путей введения фармацевтической композиции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для капель, которые будут введены непосредственно в глаз. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения путем ингаляции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью испарителя. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью небулайзера. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью генератора аэрозоля. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для перорального введения, для буккального введения или для сублингвального введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для внутривенного, внутримышечного или подкожного введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для субретинальной инъекции, супрахориоидальной инъекции или интравитреальной инъекции.

[00481] Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для интратекального или интрацеребровентрикулярного введения. Согласно некоторым вариантам реализации фармацевтическая композиция изготовлена для местного введения. Количество активного ингредиента, которое можно комбинировать с материалом носителя для получения единичной лекарственной формы, обычно будет представлять собой количество соединения, которое вызывает терапевтический эффект.

X. Способы лечения

[00482] Технология, описанная в данном документе, также демонстрирует способы получения, а также способы применения раскрытых зкДНК-векторов для экспрессии белка FVIII различными путями, включая, например, ex vivo, ex situ, in vitro и in vivo приложения, методологии, диагностические процедуры и/или схемы генной терапии.

[00483] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII, экспрессируемый с зкДНК-вектора, раскрытого в данном документе, является функциональным для лечения заболевания. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.

[00484] В данном документе предложен способ лечения гемофилии А у субъекта, включающий введение в клетку-мишень, которая нуждается в этом (например, мышечную клетку или ткань, или другой тип пораженных клеток), указанного субъекта терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, как описано в данном документе, которую можно применять для лечения заболевания. В частности, зкДНК-вектор для экспрессии белка FVIII может содержать целевую последовательность ДНК белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении в организм субъекта. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен любым подходящим путем, как описано выше и в других разделах настоящего документа.

[00485] В данном документе раскрыты композиции и составы зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, которые включают один или более зкДНК-векторов согласно настоящему изобретению вместе с одним или более фармацевтически приемлемыми буферами, разбавителями или вспомогательными веществами. Такие композиции могут быть включены в один или более диагностических или терапевтических наборов для диагностики, предотвращения, лечения или облегчения одного или более симптомов гемофилии А. В одном аспекте заболевание, поражение, нарушение, травма или дисфункция представляет собой заболевание, поражение, нарушение, травму или дисфункцию человека.

[00486] Другой аспект технологии, описанной в данном документе, обеспечивает способ обеспечения субъекту, нуждающемуся в этом, диагностически или терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, причем указанный способ включает обеспечение в клетке, ткани или органе субъекта, нуждающегося в этом, количества зкДНК-вектора, раскрытого в данном документе; и в течение времени, эффективного для обеспечения экспрессии белка FVIII с зкДНК-вектора, что обеспечивает субъекту диагностически или терапевтически эффективное количество белка FVIII, экспрессируемого зкДНК-вектором. Согласно дополнительному аспекту субъект представляет собой человека.

[00487] Другой аспект технологии, описанной в данном документе, обеспечивает способ диагностики, предотвращения, лечения или облегчения по меньшей мере одного или более симптомов гемофилии А, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В целом и в общем смысле, способ включает по меньшей мере этап введения субъекту, нуждающемуся в этом, одного или более из раскрытых зкДНК-векторов для продукции белка FVIII в количестве и в течение времени, достаточных для диагностики, предотвращения, лечения или облегчения одного или более симптомов заболевания, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В таком варианте реализации у субъекта может быть оценена эффективность белка FVIII или, альтернативно, проведено детектирование белка FVIII или тканевого расположения белка FVIII (включая клеточное и субклеточное расположение) у субъекта. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять в качестве диагностического инструмента in vivo, например, для детектирования рака или других показаний. Согласно дополнительному аспекту субъект представляет собой человека.

[00488] Другим аспектом является применение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в качестве инструмента для лечения или уменьшения одного или более симптомов гемофилии А или патологических состояний. Существует ряд наследственных заболеваний, при которых известны дефектные гены, и, как правило, они делятся на два класса: дефицитные состояния, обычно ферментов, которые обычно наследуются рецессивным образом, и несбалансированные состояния, которые могут включать регуляторные или структурные белки и которые, как правило, но не всегда, наследуются доминантным образом. Для несбалансированных патологических состояний зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для создания состояния гемофилии А в модельной системе, которую затем можно использовать в мероприятиях по противодействию патологическому состоянию. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, позволяет лечить генетические заболевания. В данном документе состояние гемофилии А лечат путем частичного или полного излечения дефицита или дисбаланса, который вызывает заболевание или делает его более тяжелым.

А. Клетки-хозяева

[00489] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляет трансген белка FVIII в рассматриваемую клетку-хозяина. Согласно некоторым вариантам реализации клетки представляют собой фоторецепторные клетки. Согласно некоторым вариантам реализации клетки представляют собой клетки RPE. Согласно некоторым вариантам реализации рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека, включая, например, клетки крови, стволовые клетки, гемопоэтические клетки, CD34+ клетки, клетки печени, раковые клетки, сосудистые клетки, мышечные клетки, клетки поджелудочной железы, нервные клетки, клетки глаза или клетки сетчатки, эпителиальные или эндотелиальные клетки, дендритные клетки, фибробласты или любые другие клетки, происходящие от млекопитающего, включая, без ограничения, клетки печени (т.е. печеночные), клетки легких, сердечные клетки, клетки поджелудочной железы, клетки кишечника, диафрагмальные клетки, почечные клетки (т.е. почки), нервные клетки, клетки крови, клетки костного мозга или любой одной или более выбранных тканей субъекта, для которых предусмотрена генная терапия. В одном аспекте рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека.

[00490] Настоящее раскрытие также относится к рекомбинантным клеткам-хозяевам, как упомянуто выше, включая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе. Таким образом, можно использовать несколько клеток-хозяев в зависимости от цели, что очевидно для квалифицированного специалиста. Конструкцию или зкДНК-вектор для экспрессии белка FVIII, раскрытые в данном документе, включая донорную последовательность, вводят в клетку-хозяина так, что донорная последовательность поддерживается в интегрированном в хромосому виде, как описано ранее. Термин «клетка-хозяин» включает любое потомство родительской клетки, которое не идентично родительской клетке из-за мутаций, происходящих во время репликации. Выбор клетки-хозяина будет в значительной степени зависеть от донорной последовательности и ее источника.

[00491] Клетка-хозяин также может представлять собой эукариота, например, клетку млекопитающего, насекомого, растения или гриба. Согласно одному варианту реализации клетка-хозяин представляет собой клетку человека (например, первичную клетку, стволовую клетку или иммортализо ванную линию клеток). Согласно некоторым вариантам реализации в клетку-хозяина можно вводить зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, ex vivo, а затем доставлять субъекту после события генной терапии. Клетка-хозяин может представлять собой любой тип клеток, например, соматическую клетку или стволовую клетку, индуцированную плюрипотентную стволовую клетку или клетку крови, например, Т-клетку или В-клетку, или клетку костного мозга. Согласно определенным вариантам реализации клетка-хозяин представляет собой аллогенную клетку. Например, конструирование Т-клеточного генома можно применять для разных видов иммунотерапии рака, модуляции заболевания, такой как терапия ВИЧ (например, нокаут рецептора, такого как CXCR4 и CCR5), и разных видов терапии иммунодефицита. Мишенями для иммунотерапии могут быть рецепторы ГКГС на В-клетках. Согласно некоторым вариантам реализации клетки-хозяева с модифицированным геномом, например, стволовые клетки костного мозга, например, CD34+ клетки, или индуцированные плюрипотентные стволовые клетки могут быть трансплантированы обратно пациенту для экспрессии терапевтического белка. В. Дополнительные заболевания для генной терапии:

[00492] В целом зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки любого белка FVIII в соответствии с приведенным выше описанием для лечения, предотвращения или облегчения симптомов, ассоциированных с гемофилией А, связанной с нарушенной экспрессией белка или экспрессией гена у субъекта.

[00493] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки белка FVIII в скелетную, сердечную или диафрагмальную мышцу, для продукции белка FVIII для секреции и циркуляции в крови или для системной доставки в другие ткани для лечения, облегчения и/или предотвращения гемофилии А.

[00494] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в легкие субъекта с помощью любых подходящих средств, необязательно путем введения аэрозольной суспензии пригодных для вдыхания частиц, содержащих зкДНК-векторы, которые субъект вдыхает. Пригодные для вдыхания частицы могут быть жидкими или твердыми. Аэрозоли жидких частиц, содержащих зкДНК-векторы, могут быть получены с помощью любых подходящих средств, таких как аэрозольный небулайзер под давлением или ультразвуковой небулайзер, как известно специалистам в данной области техники. См., например, патент США №4501729. Аэрозоли твердых частиц, содержащих зкДНК-векторы, могут быть получены сходным образом с помощью любого генератора аэрозолей лекарственного средства в виде твердых частиц с помощью методик, известных в фармацевтике.

[00495] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в ткани ЦНС (например, головной мозг, глаз).

[00496] Глазные нарушения, которые можно лечить, облегчать или предотвращать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают офтальмологические расстройства, затрагивающие сетчатку, задний тракт и зрительный нерв (например, пигментный ретинит, диабетическую ретинопатию и другие дегенеративные заболевания сетчатки, увеит, возрастную дегенерацию макулы, глаукому). Многие офтальмологические заболевания и нарушения ассоциированы с одним или более из трех типов показаний: (1) ангиогенезом, (2) воспалением и (3) дегенерацией. Согласно некоторым вариантам реализации зкДНК-вектор, раскрытый в данном документе, можно применять для доставки антиангиогенных факторов; противовоспалительных факторов; факторов, которые замедляют дегенерацию клеток, способствуют сохранению клеток или способствуют росту клеток, и комбинаций перечисленных выше. Например, диабетическая ретинопатия характеризуется ангиогенезом. Диабетическую ретинопатию можно лечить путем доставки одного или более антиангиогенных антител или слитых белков интраокулярно (например, в стекловидное тело) или периокулярно (например, в субтеноновую область). Дополнительные глазные заболевания, которые можно лечить, облегчать или предотвращать с помощью зкДНК-векторов согласно настоящему изобретению, включают географическую атрофию, сосудистую или «влажную» дегенерацию макулы, ФКУ, врожденный амавроз Лебера (LCA), синдром Ушера, эластическую псевдоксантому (РХЕ), х-связанный пигментный ретинит (XLRP), х-связанное расслоение сетчатки (XLRS), хороидеремию, наследственную оптическую нейропатию Лебера (LHON), архоматопсию, палочко-колбочковую дистрофию, эндотелиальную дистрофию роговицы Фукса, диабетический макулярный отек и глазной рак или опухоли.

[00497] Согласно некоторым вариантам реализации воспалительные глазные заболевания или нарушения (например, увеит) можно лечить, облегчать или предупреждать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Одно или более противовоспалительных антител или слитых белков могут быть экспрессированы путем внутриглазного (например, стекловидное тело или передняя камера) введения зкДНК-вектора, раскрытого в данном документе.

Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, который ассоциирован с трансгеном, кодирующим репортерный полипептид (например, фермент, такой как зеленый флуоресцентный белок или щелочная фосфатаза). Согласно некоторым вариантам реализации трансген, который кодирует репортерный белок, подходящий для экспериментальных или диагностических целей, выбирают из любого из: р-лактамазы, р-галактозидазы (LacZ), щелочной фосфатазы, тимидинкиназы, зеленого флуоресцентного белка (GFP), хлорамфениколацетилтрансферазы (CAT), люциферазы и других, хорошо известных в данной области техники. В некоторых аспектах зкДНК-векторы, экспрессирующие белок FVIII, связанный с репортерный полипептидом, можно применять для диагностических целей, а также для определения эффективности или в качестве маркеров активности зкДНК-вектора у субъекта, которому их вводят.

С. Тестирование успешной экспрессии гена с использованием зкДНК-вектора

[00498] Для тестирования эффективности доставки гена белка FVIII с помощью зкДНК-вектора можно использовать анализы, хорошо известные в данной области техники, которые можно выполнять как на моделях in vitro, так и на моделях in vivo. Уровни экспрессии белка FVIII с помощью зкДНК могут быть оценены специалистом в данной области техники путем измерения уровней мРНК и белка FVIII (например, ГЩР с обратной транскрипцией, анализ методом Вестерн-блоттинга и иммуноферментный анализ (ИФА)). Согласно одному варианту реализации зкДНК содержит репортерный белок, который можно использовать для оценки экспрессии белка FVIII, например, путем исследования экспрессии репортерного белка с помощью флуоресцентной микроскопии или устройства для считывания люминесценции планшетов. В случае приложений in vivo для тестирования функциональности данного белка FVIII можно использовать анализы функции белков, чтобы определить успешность экспрессии гена. Специалист сможет определить лучший тест для измерения функциональности белка FVIII, экспрессируемого вектором зкДНК, in vitro или in vivo.

[00499] В данном документе предусмотрено, что эффекты экспрессии гена белка FVIII с зкДНК-вектора в клетке или у субъекта могут длиться по меньшей мере 1 месяц, по меньшей мере 2 месяца, по меньшей мере 3 месяца, по меньшей мере четыре месяца, по меньшей мере 5 месяцев, по меньшей мере шесть месяцев, по меньшей мере 10 месяцев, по меньшей мере 12 месяцев, по меньшей мере 18 месяцев, по меньшей мере 2 года, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 20 лет или они могут быть постоянными.

[00500] Согласно некоторым вариантам реализации белок FVIII в экспрессионной кассете, экспрессионной конструкции или зкДНК-векторе, описанных в данном документе, может быть оптимизирован по кодонам для клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека (например, гуманизация), путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc.) или другой общедоступной базы данных.

D. Определение эффективности путем оценки экспрессии белка FVIII с зкДНК-вектора

[00501] По существу любой метод, известный в данной области техники для определения экспрессии белка, может быть использован для анализа экспрессии белка FVIII с зкДНК-вектора. Неограничивающие примеры таких методов/анализов включают иммуноферментный анализ (ИФА), аффинный ИФА, ELISPOT, последовательное разведение, проточную цитометрию, анализ методом поверхностного плазмонного резонанса, анализ кинетического исключения, масс-спектрометрию, Вестерн-блоттинг, иммунопреципитацию и ПЦР.

[00502] Для оценки экспрессии белка FVIII in vivo биологический образец может быть получен от субъекта для анализа. Примеры биологических образцов включают образец биожидкости, образец физиологической жидкости, кровь (включая цельную кровь), сыворотку, плазму, мочу, слюну, биопсию и/или образец ткани и т.д. Биологический образец или образец ткани также может относиться к образцу ткани или жидкости, выделенному у индивидуума, включая, но не ограничиваясь перечисленными, биопсию опухоли, стул, спинномозговую жидкость, плевральную жидкость, аспираты сосков, лимфатическую жидкость, внешние срезы кожи, дыхательного, кишечного и мочеполового путей, слезы, слюну, грудное молоко, клетки (включая, но не ограничиваясь перечисленными, клетки крови), опухоли, органы, а также образцы компонентов культуры клеток in vitro. Термин также включает смесь упомянутых выше образцов. Термин «образец» также включает необработанные или предварительно обработанные (или подвергнутые предварительному процессингу) биологические образцы. Согласно некоторым вариантам реализации образец, используемый для анализов и способов, описанных в данном документе, включает образец сыворотки, собранный у субъекта, подлежащего тестированию.

Е. Определение эффективности экспрессированного белка FVIII по клиническим параметрам

[00503] Эффективность данного белка FVIII, экспрессированного зкДНК-вектором, для лечения гемофилии А (т.е. функциональная экспрессия) может быть определена квалифицированным клиницистом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы гемофилии А изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим терапевтический белок FVIII, как описано в данном документе. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации гемофилии А или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование гемофилии А, например, прекращение или замедление прогрессирования гемофилии А; или (2) облегчение гемофилии А, например, вызывающее регресс симптома гемофилии А; и (3) предотвращение или снижение вероятности развития заболевания гемофилией А, или предотвращение вторичных заболеваний/нарушений, ассоциированных с гемофилией А.

Эффективное количество для лечения заболевания означает такое количество, которое при введении млекопитающему, нуждающемуся в этом, является достаточным, чтобы привести к эффективному лечению этого заболевания, в соответствии с определением этого термина в данном документе. Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для заболевания гемофилией А. Врач может оценить любой один или более клинических симптомов гемофилии А, которые включают: необъяснимое и чрезмерное кровотечение из порезов или повреждений, или после хирургического или стоматологического вмешательства; много больших или глубоких синяков; необычное кровотечение после вакцинаций; боль, отек или стеснение в суставах; кровь в моче или стуле; кровотечение из носа без известной причины; у младенцев - необъяснимую раздражительность.

XI. Различные приложения зкДНК-векторов, экспрессирующих антитела или слитые белки

[00504] Как раскрыто в данном документе, композиции и зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, можно применять для экспрессии белка FVIII для ряда целей. Согласно одному варианту реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции или прогрессирования заболевания гемофилией А. Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для лечения, предотвращения или облегчения состояний гемофилии А или нарушений у субъекта-млекопитающего.

[00505] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения заболевания, ассоциированного с повышенной экспрессией, повышенной активностью продукта гена или нефизиологической положительной регуляцией гена.

[00506] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения гемофилии А со сниженной экспрессией, отсутствием экспрессии или дисфункцией белка.

[00507] Обычный специалист в данной области техники поймет, что трансген может не представлять собой открытую рамку считывания гена, который сам транскрибируется; вместо этого он может представлять собой промоторную область или репрессорную область гена-мишени, и зкДНК-вектор может модифицировать такую область, что в результате модулирует экспрессию гена FVIII.

[00508] Композиции и зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять для доставки белка FVIII для различных целей, как описано выше.

[00509] Согласно некоторым вариантам реализации трансген кодирует один или более белков FVIII, которые можно применять для лечения, облегчения или предотвращения состояний гемофилии А у субъекта-млекопитающего. Белок FVIII, экспрессируемый зкДНК-вектором, вводят пациенту в количестве, достаточном для лечения гемофилии А, ассоциированной с аномальной последовательностью гена, что может привести к любому одному или более из следующего: повышенной экспрессии белка, сверхактивности белка, сниженной экспрессии, отсутствию экспрессии или дисфункции целевого гена или белка.

[00510] 1010 некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, предназначены для применения в методах диагностики и скрининга, посредством которых белок FVIII временно или стабильно экспрессируется в системе на основе культуры клеток или, альтернативно, в модели на трансгенном животном.

[00511] Другой аспект технологии, описанной в данном документе, обеспечивает способ трансдукции популяции клеток млекопитающего зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе. В целом и в общем смысле, способ включает по меньшей мере этап введения в одну или более клеток популяции композиции, которая содержит эффективное количество одного или более из зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.

[00512] Кроме того, согласно настоящему изобретению предложены композиции, а также терапевтические и/или диагностические наборы, которые включают один или более из раскрытых зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, или композиций зкДНК, изготовленных с одним или более дополнительными ингредиентами или приготовленных в соответствии с одной или более инструкциями по их применению.

[00513] Клетка, в которую должен быть введен зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть любого типа, включая, но не ограничиваясь перечисленными, нервные клетки (включая клетки периферической и центральной нервной системы, в частности, клетки головного мозга), клетки легких, клетки сетчатки, эпителиальные клетки (например, кишечные и респираторные эпителиальные клетки), мышечные клетки, дендритные клетки, клетки поджелудочной железы (включая островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки простаты, половые клетки и т.п. В качестве альтернативы, клетка может представлять собой любую клетку-предшественника. В качестве дополнительной альтернативы, клетка может представлять собой стволовую клетку (например, нервную стволовую клетку, стволовую клетку печени). В качестве еще одной альтернативы, клетка может представлять собой раковую или опухолевую клетку. Более того, клетки могут быть любого видового происхождения, как указано выше.

А. Получение и очистка зкДНК-векторов, экспрессирующих FVIII

[00514] ЗкДНК-векторы, раскрытые в данном документе, должны применяться для получения белка FVIII как in vitro, так и in vivo. Белки FVIII, полученные таким образом, могут быть выделены, протестированы в отношении целевой функции и очищены для дальнейшего использования в исследованиях или в качестве терапевтического лечения. Каждая система получения белка имеет свои преимущества/недостатки. В то время как белки, полученные in vitro, можно легко очистить и получить белки за короткое время, белки, полученные in vivo, могут иметь посттрансляционные модификации, такие как гликозилирование.

[00515] Терапевтический белок FVIII, полученный с использованием зкДНК-векторов, может быть очищен с помощью любого метода, известного специалистам в данной области техники, например, ионообменной хроматографии, аффинной хроматографии, осаждения или электрофореза.

[00516] Терапевтический белок FVIII, полученный с помощью способов и композиций, описанных в данном документе, может быть протестирован для оценки связывания с целевым белком-мишенью.

ПРИМЕРЫ

[00517] Примеры ниже представлены в качестве иллюстрации, а не ограничения. Обычные специалисты в данной области техники поймут, что зкДНК-векторы могут быть сконструированы из любых ITR дикого типа или модифицированных ITR, описанных в данном документе, и что примерные методы ниже могут быть использованы для конструирования и оценки активности таких зкДНК-векторов. Несмотря на то, что способы приведены в качестве примера для определенных зкДНК-векторов, они применимы к любому зкДНК-вектору в соответствии с описанием.

ПРИМЕР 1: Конструирование зкДНК-векторов с использованием метода на основе клеток насекомых

[00518] Получение зкДНК-векторов с использованием полинуклеотидной матрицы конструкции описано в Примере 1 заявки PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.

[00519] Примерный способ получения зкДНК-векторов представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от ThermoFisher Scientific.

[00520] Получение зкДНК-бакмид:

[00521] Компетентные клетки DHlOBac (компетентные клетки MAX EFFICIENCY® DH10Bac™, Thermo Fisher) трансформировали либо тестируемой, либо контрольной плазмидами, следуя протоколу в соответствии с инструкциями производителя. Чтобы получить рекомбинантные зкДНК-бакмиды, в клетках DHlOBac индуцировали рекомбинацию между плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного скринингового отбора на основании скрининга по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG с антибиотиками для отбора трансформантов и поддержания бакмиды и плазмид на основе транспозаз. Белые колонии, образующиеся в результате транспозиции, которая разрушает индикаторный ген β-галактозидазы, собирали и культивировали в 10 мл сред.

[00522] Рекомбинантные зкДНК-бакмиды выделяли из E.coli и трансфицировали ими клетки насекомых Sf9 или Sf21 с использованием FugeneHD для получения инфекционного бакуловируса. Адгезивные клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в колбах Т25 при 25°С. Через 4 дня культуральную среду (содержащую вирус Р0) отделяли от клеток, фильтровали через фильтр с размером пор 0,45 мкм, отделяя инфекционные бакуловирусные частицы от клеток или клеточного дебриса.

[00523] Необязательно первое поколение бакуловируса (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 в 50-500 мл сред. Клетки поддерживали в суспензионных культурах в инкубаторе с орбитальным шейкером при 130 об./мин при 25°С, отслеживая диаметр и жизнеспособность клеток до тех пор, пока клетки не достигнут диаметра 18-19 нм (от диаметра наивных клеток, равного 14-15 нм) и плотности ~4,0×106 клеток/мл. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали после центрифугирования для удаления клеток и дебриса с последующей фильтрацией через фильтр с размером пор 0,45 мкм.

[00524] ЗкДНК-бакуловирус, содержащий тестируемые конструкции, собирали и определяли инфекционную активность или титр бакуловируса. В частности, четыре х20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях: 1/1000, 1/10000, 1/50000, 1/100000 и инкубировали при 25-27°С. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.

[00525] «Rep-плазмиду», раскрытую на ФИГ. 8А из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки, получали в экспрессионном векторе pFASTBAC™-Dual (ThermoFisher), содержащем как Rep78 (SEQ ID NO: 131 или 133), так и Rep52 (SEQ ID NO: 132) или Rep68 (SEQ ID NO: 130) и Rep40 (SEQ ID NO: 129). Rep-плазмиду трансформировали в компетентные клетки DH10Bac (компетентные клетки MAX EFFICIENCY® DH10Bac™ (Thermo Fisher)), следуя предоставленному производителем протоколу. Для получения рекомбинантных бакмид («Rep-бакмид») в клетках DH10Bac индуцировали рекомбинацию между Rep-плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного отбора, который включал скрининг по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG. Одиночные белые колонии собирали и инокулировали в 10 мл селективных сред (канамицин, гентамицин, тетрациклин в бульоне LB). Рекомбинантные бакмиды (Rep-бакмиды) выделяли из E.coli, и трансфицировали клетки насекомых Sf9 или Sf21 указанными Rep-бакмидами, чтобы получить инфекционный бакуловирус.

[00526] Клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в течение 4 дней и выделяли из культуры инфекционный рекомбинантный бакуловирус («Rep-бакуловирус»). Необязательно Rep-бакуловирус первого поколения (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 и культивировали в 50-500 мл сред. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали, отделяя клетки путем центрифугирования или фильтрации, или используя другой способ фракционирования. Собирали Rep-бакуловирус и определяли инфекционную активность бакуловируса. В частности, четыре x20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях, 1/1000, 1/10000, 1/50000, 1/100000, и инкубировали. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.

[00527] Получение и характеристика зкДНК-вектора

[00528] На ФИГ. 4В среду для культивирования клеток насекомых Sf9, содержащую (1) образец, содержащий зкДНК-бакмиду или зкДНК-бакуловирус, и (2) Rep-бакуловирус, описанный выше, затем добавляли к свежей культуре клеток Sf9 (2,5×106 клеток/мл, 20 мл) при соотношении 1:1000 и 1:10000, соответственно. Затем клетки культивировали при 130 об./мин при 25°С. Через 4-5 дней после ко инфицирования детектировали диаметр и жизнеспособность клеток. Когда диаметр клеток достигал 18-20 нм при жизнеспособности -70-80%, клеточные культуры центрифугировали, среду удаляли и собирали клеточные осадки. Клеточные осадки сначала ресуспендировали в достаточном объеме водной среды, либо воды, либо буфера. ЗкДНК-вектор выделяли и очищали из клеток с использованием протокола очистки Qiagen MIDI PLUS™ (Qiagen, 0,2 мг массы осадка клеток, обработанной на колонку).

[00529] Значения выхода зкДНК-векторов, полученных и очищенных из клеток насекомых Sf9, первоначально определяли на основании поглощения в УФ-диапазоне при 260 нм.

[00530] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.

[00531] Структуры выделенных зкДНК-векторов анализировали далее путем расщепления ДНК, полученной из коинфицированных клеток Sf9 (как описано в данном документе), рестрикционными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4D и 4Е, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как бескапсидный вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс.п.о.

[00532] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4D).

[00533] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с 1x SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм).

[00534] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.

[00535] Для сравнительных целей в Примере 1 описано получение зкДНК-векторов с использованием метода на основе клеток насекомых и полинуклеотидной матрицы конструкции, а также описано в Примере 1 из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению в соответствии с Примером 1, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.

[00536] Примерный способ получения зкДНК-векторов в способе с использованием клетки насекомого представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от Thermo Fisher Scientific.

ПРИМЕР 2: Синтетическое получение зкДНК путем вырезания из двухцепочечной молекулы ДНК

[00537] Синтетическое получение зкДНК-векторов описано в Примерах 2-6 международной заявки PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки. Один примерный способ получения зкДНК-вектора с применением синтетического способа включает вырезание двухцепочечной молекулы ДНК. В общих чертах, зкДНК-вектор может быть получен с применением конструкции двухцепочечной ДНК, например, см. ФИГ. 7А-8Е из PCT/US19/14122. Согласно некоторым вариантам реализации конструкция двухцепочечной ДНК представляет собой зкДНК-плазмиду, например, см. ФИГ. 6 в международной заявке на патент PCT/US2018/064242, поданной 6 декабря 2018 г.

[00538] Согласно некоторым вариантам реализации конструкция для получения зкДНК-вектора содержит регуляторный переключатель, описанный в данном документе.

[00539] В иллюстративных целях в Примере 2 описано получение зкДНК-векторов в качестве примерных ДНК-векторов с замкнутыми концами, полученных с использованием этого метода. Однако, хотя в этом Примере зкДНК-векторы приведены в качестве примеров для иллюстрации синтетических способов получения in vitro для получения ДНК-вектора с замкнутыми концами путем вырезания двухцепочечного полинуклеотида, содержащего ITR и экспрессионную кассету (например, гетерологичную последовательность нуклеиновой кислоты), с последующим лигированием свободных 3' и 5' концов, как описано в данном документе, обычному специалисту в данной области техники известно, что, как проиллюстрировано выше, полинуклеотидную молекулу двухцепочечной ДНК можно модифицировать так, чтобы получить любой целевой ДНК-вектор с замкнутыми концами, включая, но не ограничиваясь этим, doggybone ДНК, гантелеобразную ДНК и т.п. Примерные зкДНК-векторы для получения антител или слитых белков, которые могут быть получены с помощью синтетического метода получения, описанного в Примере 2, обсуждаются в разделах, озаглавленных «III зкДНК-векторы в целом». Примерные антитела и слитые белки, экспрессируемые зкДНК векторами, описаны в разделе, озаглавленном «ПС Примерные антитела и слитые белки, экспрессируемые зкДНК-векторами».

[00540] Способ включает (i) вырезание последовательности, кодирующей экспрессионную кассету, из конструкции двухцепочечной ДНК, и (ii) образование шпилечных структур на одном или более ITR, и (iii) соединение свободных 5'- и 3'-концов путем лигирования, например, с помощью ДНК-лигазы Т4.

[00541] Конструкция двухцепочечной ДНК содержит, в порядке от 5' к 3': первый сайт рестрикционной эндонуклеазы; левый ITR; экспрессионную кассету; правый ITR; и второй сайт рестрикционной эндонуклеазы. Конструкцию двухцепочечной ДНК затем приводят в контакт с одной или более рестрикционными эндонуклеазами для образования двухцепочечных разрывов в обоих сайтах рестрикционных эндонуклеаз. Одна эндонуклеаза может нацелено действовать на оба сайта, или каждый сайт может быть мишенью разной эндонуклеазы, при условии, что сайты рестрикции не присутствуют в матрице зкДНК-вектора. Это позволяет вырезать последовательность между сайтами рестрикционной эндонуклеазы из остальной части конструкции двухцепочечной ДНК (см. Фиг. 9 PCT/US19/14122). После лигирования образуется ДНК-вектор с замкнутыми концами.

[00542] Один или оба ITR, используемые в способе, могут представлять собой ITR дикого типа. Также могут быть использованы модифицированные ITR, причем указанная модификация может включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С' (см., например, Фиг. 6-8 и 10, ФИГ. 11В из PCT/US19/14122), и может иметь две или более шпилечных петель (см., например, ФИГ. 6-8, ФИГ. 11В из PCT/US 19/14122) или одну шпилечную петлю (см., например, ФИГ. 10А-10В, ФИГ. 11В из PCT/US19/14122). ITR, модифицированный шпилечной петлей, может быть получен путем генетической модификации существующего олиго или путем биологического и/или химического синтеза de novo.

[00543] В неограничивающем примере ITR-6 слева и справа (SEQ ID NO: 111 и 112) включают 40 делеций нуклеотидов в плечах В-В' и С-С' из ITR дикого типа ААВ2. Прогнозируется, что нуклеотиды, оставшиеся в модифицированном ITR, образуют одну шпилечную структуру. Свободная энергия Гиббса разворачивания структуры составляет примерно -54,4 ккал/моль. В ITR также могут быть внесены другие модификации, включая необязательную делецию функционального сайта связывания Rep или сайта TRS. ПРИМЕР 3: получение зкДНК за счет конструирования олигонуклеотидов

[00544] Другой примерный способ получения зкДНК-вектора с использованием синтетического способа, который включает сборку различных олигонуклеотидов, представлен в Примере 3 из PCT/US19/14122, в котором зкДНК-вектор получают путем синтеза 5'-олигонуклеотида и 3'-олигонуклеотида ITR и лигирования указанных олигонуклеотидов ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету. На ФИГ. 11В из PCT/US19/14122 представлен примерный способ лигирования 3'-олигонуклеотида ITR и 3'-олигонуклеотида ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету.

[00545] Как раскрыто в данном документе, олигонуклеотиды ITR могут содержать WT-ITR (например, см. ФИГ. 3А, ФИГ. 3С) или модифицированные ITR (например, см. ФИГ. 3В и ФИГ. 3D). (См. также, например, ФИГ. 6А, 6В, 7А и 7В из PCT/US 19/14122, которая полностью включена в данный документ). Примерные олигонуклеотиды ITR включают, но не ограничиваются перечисленными, SEQ ID NO: 134-145 (например, см. Таблицу 7 в PCT/US19/14122). Модифицированные ITR могут включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С'. Олигонуклеотиды ITR, содержащие WT-ITR или mod-ITR, описанные в данном документе, для использования в бесклеточном синтезе могут быть получены путем генетической модификации или биологического и/или химического синтеза. Как обсуждается в данном документе, олигонуклеотиды ITR в Примерах 2 и 3 могут содержать WT-ITR или модифицированные ITR (mod-ITR) в симметричных или асимметричных конфигурациях, как обсуждается в данном документе. ПРИМЕР 4: получение зкДНК за счет одноцепочечной молекулы ДНК

[00546] В другом примерном способе получения зкДНК-вектора с использованием синтетического способа, представленном в Примере 4 из PCT/US19/14122, используют одноцепочечную линейную ДНК, содержащую два смысловых ITR, которые фланкируют смысловую последовательность экспрессионной кассеты и ковалентно присоединены к двум антисмысловым ITR, которые фланкируют антисмысловую последовательность экспрессионной кассеты, а концы указанной одноцепочечной линейной ДНК затем лигируют с образованием одноцепочечной молекулы с замкнутыми концами. Один неограничивающий пример включает синтез и/или продуцирование молекулы одноцепочечной ДНК, ренатурацию частей указанной молекулы с образованием одной линейной молекулы ДНК, которая содержит одну или более областей вторичной структуры со спаренными основаниями, с последующим лигированием свободных 5'- и 3'-концов между собой с образованием замкнутой одноцепочечной молекулы.

[00547] Примерная одноцепочечная молекула ДНК для получения зкДНК-вектора содержит, от 5' к 3': смысловой первый ITR; смысловую последовательность экспрессионной кассеты; смысловой второй ITR; антисмысловой второй ITR; антисмысловую последовательность экспрессионной кассеты; и антисмысловой первый ITR.

[00548] Молекула одноцепочечной ДНК для использования в примерном способе Примера 4 может быть образована с помощью любой методологии синтеза ДНК, описанной в данном документе, например, путем синтеза ДНК in vitro, или обеспечена путем расщепления конструкции ДНК (например, плазмиды) нуклеазами и плавления полученных фрагментов дцДНК для получения фрагментов оцДНК.

[00549] Ренатурацию можно осуществлять путем понижения температуры ниже расчетных температур плавления пар смысловой и антисмысловой последовательностей. Температура плавления зависит от содержания конкретных нуклеотидных оснований и характеристик используемого раствора, например, от концентрации соли. Температуры плавления для любой конкретной последовательности и комбинации растворов легко рассчитываются обычным специалистом в данной области техники.

[00550] Свободные 5' и 3' концы ренатурированной молекулы могут быть лигированы друг с другом или лигированы со шпилечной молекулой с образованием зкДНК-вектора. Подходящие примерные методологии лигирования и шпилечные молекулы описаны в Примерах 2 и 3.

ПРИМЕР 5: Очистка и/или подтверждение получения зкДНК

[00551] Любой из продуктов ДНК-вектора, полученных с помощью способов, описанных в данном документе, например, включая способы получения на основе клеток насекомых, описанные в Примере 1, или синтетические способы получения, описанные в Примерах 2-4, может быть очищен, например, для удаления примесей, неиспользованных компонентов или побочных продуктов с использованием методов, обычно известных квалифицированному специалисту; и/или может быть проанализирован для подтверждения того, что полученный ДНК-вектор (в данном случае зкДНК-вектор) представляет собой целевую молекулу. Примерным методом очистки ДНК-вектора, например, зкДНК, является использование протокола очистки Qiagen Midi Plus (Qiagen) и/или очистки на геле.

[00552] Ниже приведен примерный метод подтверждения идентичности зкДНК-векторов.

[00553] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.

[00554] Структуры выделенных зкДНК-векторов были дополнительно проанализированы путем расщепления очищенной ДНК рестрикциоиными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4С и 4D, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как зкДНК-вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс. п. о.

[00555] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4Е).

[00556] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с lx SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм). Вышеупомянутый метод на основе геля может быть адаптирован для целей очистки путем выделения зкДНК-вектора из полосы геля и обеспечения его ренатурации.

[00557] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса - например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.

ПРИМЕР 6: Контролируемая экспрессия трансгена с зкДНК: экспрессия трансгена с зкДНК-вектора in vivo может поддерживаться и/или повышаться путем повторного введения дозы.

[00558] ЗкДНК-вектор получали в соответствии со способами, описанными в Примере 1 выше, с использованием зкДНК-плазмиды, содержащей промотор CAG (SEQ ID NO: 72) и трансген люциферазы (SEQ ID NO: 56), в качестве примерного FVIII, фланкированный асимметричными ITR (например, 5'-WT-ITR (SEQ ID NO: 2) и 3' mod-ITR (SEQ ID NO: 3)), и оценивали в различных программах лечения in vivo. Этот зкДНК-вектор использовали во всех последующих экспериментах, описанных в Примерах 6-10. В Примере 6 зкДНК-вектор очищали, изготавливали в виде состава с липидной наночастицей (ЛНЧ-зкДНК) и вводили путем инъекции в хвостовую вену каждой мыши CD-I® IGS. Липосомы изготавливали с использованием подходящей смеси липидов, содержащей четыре компонента для образования липосом на основе липидных наночастиц (ЛНЧ), включая катионные липиды, вспомогательные липиды, холестерин и ПЭГ-липиды.

[00559] Для оценки устойчивой экспрессии трансгена in vivo с зкДНК-вектора на протяжении длительного периода времени ЛНЧ-зкДНК вводили в стерильном ФСБ путем внутривенной инъекции в хвостовую вену мышам CD-I® IGS в возрасте приблизительно 5-7 недель. Была проведена оценка трех групп с разными дозировками: 0,1 мг/кг, 0,5 мг/кг и 1,0 мг/кг, по десять мышей на группу (за исключением группы 1,0 мг/кг, в которой было 15 мышей на группу). Инъекции вводили в день 0. Пять мышей из каждой группы получали инъекцию дополнительной идентичной дозы в день 28. Экспрессию люциферазы измеряли путем визуализации IVIS после внутривенного введения мышам CD-I® IGS (Charles River Laboratories; мыши дикого типа (WT)). Экспрессию люциферазы оценивали с помощью визуализации IVIS после введения путем внутрибрюшинной инъекции 150 мг/кг субстрата люциферина в дни 3, 4, 7, 14, 21, 28, 31, 35 и 42 и регулярно (например, еженедельно, два раза в неделю или через каждые 10 суток, или через каждые 2 недели) в период между днями 42-110. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 132 дней после 3 разных протоколов введения (данные не показаны).

[00560] Расширенное исследование выполняли для изучения эффекта повторной дозы, например, повторного введения ЛНЧ-зкДНК, экспрессирующей люциферазу, субъектам, получавшим ЛНЧ-зкДНК. В частности, оценивали возможность повышения уровней экспрессии путем одного или более дополнительных введений зкДНК-вектора.

[00561] В этом исследовании биораспределение экспрессии люциферазы с зкДНК-вектора оценивали с помощью IVIS у мышей CD-1® IGS после первоначального внутривенного введения 1,0 мг/кг (т.е. праймирующей дозы) в дни 0 и 28 (Группа А). Второе введение зкДНК-вектора осуществляли путем инъекции в хвостовую вену 3 мг/кг (Группа В) или 10 мг/кг (Группа С) в 1,2 мл в хвостовую вену в день 84. В этом исследовании использовали по пять (5) мышей CD-1® в каждой из Групп А, В и С. Визуализацию IVIS экспрессии люциферазы у мышей выполняли перед введением дополнительных доз в дни 49, 56, 63 и 70, как описано выше, а также после введения повторных доз в день 84 и в дни 91, 98, 105, 112 и 132. Экспрессию люциферазы оценивали и детектировали во всех трех Группах А, В и С по меньшей мере до дня 110 (самый продолжительный оцененный период).

[00562] Было показано, что уровень экспрессии люциферазы повышается с помощью повторной дозы (т.е. повторного введения композиции зкДНК) ЛНЧ-зкДНК-Luc, согласно определению путем оценки активности люциферазы в присутствии люциферина. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 110 дней после 3 разных протоколов введения (Группы А, В и С). У мышей, не получавших никакой дополнительной повторной дозы (праймирующая доза 1 мг/кг (т.е. Группа А)), наблюдали стабильную экспрессию люциферазы на протяжении всего исследования. Мыши в группе В, которым вводили повторную дозу 3 мг/кг зкДНК-вектора, демонстрировали приблизительно семикратное увеличение наблюдаемой светимости по сравнению с мышами в Группе С. Неожиданно, мыши, получившие повторную дозу 10 мг/кг зкДНК-вектора, продемонстрировали 17-кратное увеличение наблюдаемой светимости люциферазы по сравнению с мышами, не получавшими никакой повторной дозы (Группа А).

[00563] Группа А мышей CD-1® IGS демонстрирует экспрессию люциферазы после внутривенного введения 1 мг/кг зкДНК-вектора в хвостовую вену в дни 0 и 28. Группы В и С мышей CD-1® IGS демонстрируют экспрессию люциферазы после введения 1 мг/кг зкДНК-вектора в первый момент времени (день 0) и введения повторной дозы зкДНК-вектора во второй момент времени в день 84. Второе введение (т.е. повторная доза) зкДНК-вектора повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз.

[00564] 3-кратное увеличение дозы (т.е. количества) зкДНК-вектора при повторном введении дозы в Группе В (т.е. при повторном введении дозы 3 мг/кг) привело к 7-кратному увеличению экспрессии люциферазы. Также неожиданно 10-кратное увеличение количества зкДНК-вектора при повторном введении дозы (т.е. при повторном введении дозы 10 мг/кг) в Группе С привело к 17-кратному увеличению экспрессии люциферазы. Таким образом, второе введение (т.е. повторная доза) зкДНК повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз. Это показывает, что повышение экспрессии трансгена в результате повторной дозы больше, чем ожидалось, и зависит от дозы или количества зкДНК-вектора при введении повторной дозы и, по-видимому, является синергическим по отношению к начальной экспрессии трансгена после первоначального праймирующего введения в день 0. Таким образом, дозозависимое повышение экспрессии трансгена не является аддитивным, скорее, уровень экспрессии трансгена является дозозависимым и сверхпропорционален суммарному количеству зкДНК-вектора, введенному в каждый момент времени.

[00565] Обе группы В и С показали значительное дозозависимое повышение экспрессии люциферазы по сравнению с контрольными мышами (Группа А), которые не получали повторной дозы зкДНК-вектора во второй момент времени. В совокупности эти данные показывают, что экспрессия трансгена с зкДНК-вектора может быть повышена дозозависимым образом с помощью повторной дозы (т.е. повторного введения) зкДНК-вектора по меньшей мере во второй момент времени.

[00566] В совокупности эти данные демонстрируют, что уровень экспрессии трансгена, например, FVIII, с зкДНК-векторов может поддерживаться на устойчивом уровне на протяжении по меньшей мере 84 дней и может быть повышен in vivo после повторной дозы зкДНК-вектора, введенной по меньшей мере во второй момент времени. ПРИМЕР 7: Устойчивая экспрессия трансгена in vivo зкДНК-векторами, изготовленными в виде составов с ЛНЧ

[00567] Воспроизводимость результатов, полученных в Примере 6, с другой липидной наночастицей оценивали in vivo на мышах. В день 0 мышам вводили дозу либо зкДНК-вектора, содержащего трансген люциферазы, управляемый промотором CAG, который был инкапсулирован в ЛНЧ, отличную от использованной в Примере 6, либо тех же ЛНЧ, содержащих поли(С), но без зкДНК или гена люциферазы. В частности, самцам мышей CD-1® в возрасте приблизительно 4 недель вводили однократную инъекцию 0,5 мг/кг ЛНЧ-зкДНК-люциферазы или контрольных ЛНЧ-поли(С), вводимых внутривенно через латеральную хвостовую вену в день 0. В день 14 животным вводили системно люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг. Приблизительно через 15 минут после введения люциферина каждое животное визуализировали с использованием системы визуализации in vivo («IVIS»).

[00568] Как показано на ФИГ. 7, значительная флуоресценция в печени наблюдалась у всех четырех мышей, получивших зкДНК, при этом за исключением места инъекции у животных наблюдалась очень незначительная флуоресценция, это указывает на то, что ЛНЧ опосредовали специфичную для печени доставку конструкции зкДНК, и что доставленный зкДНК-вектор был способен к контролируемой устойчивой экспрессии своего трансгена в течение по меньшей мере двух недель после введения. ПРИМЕР 8: Устойчивая экспрессия трансгена в печени in vivo после введения зкД НК-вектора

[00569] В отдельном эксперименте оценивали локализацию зкДНК, доставленной с помощью ЛНЧ, в печени экспериментальных животных. ЗкДНК-вектор, содержащий представляющий интерес функциональный трансген, инкапсулировали в те же ЛНЧ, что и использованные в Примере 7, и вводили мышам in vivo при уровне дозы 0,5 мг/кг путем внутривенной инъекции. Через 6 часов мышей умерщвляли и отбирали образцы печени, фиксировали формалином и заливали парафином с использованием стандартных протоколов. Анализы методом гибридизации in situ RNAscope® выполняли для визуализации зкДНК-векторов в ткани с использованием зонда, специфичного для трансгена зкДНК, и детектирования с использованием хромогенной реакции и окрашивания гематоксилином (Advanced Cell Diagnostics). ФИГ. 8 показывает результаты, которые указывают на наличие зкДНК в гепатоцитах. ПРИМЕР 9: Устойчивая экспрессия трансгена зкДНК в глазах in vivo

[00570] Устойчивость экспрессии трансгена зкДНК-вектора в тканях, отличных от печени, оценивали для определения переносимости и экспрессии зкДНК-вектора после введения в глаза in vivo. Несмотря на то, что люциферазу использовали в качестве примерного трансгена в Примере 9, обычный специалист может легко заменить трансген люциферазы последовательностью FVIII из любой из последовательностей, перечисленных в Таблице 1.

[00571] В день 0 самцам крыс Sprague Dawley в возрасте приблизительно 9 недель вводили путем субретинальной инъекции 5 мкл либо зкДНК-вектора, содержащего трансген люциферазы, в виде состава с реагентом для трансфекции jetPEI® (Polyplus), либо плазмидной ДНК, кодирующей люциферазу, в виде состава с jetPEI®, в обоих случаях в концентрации 0,25 мкг/мкл. В каждой группе тестировали по четыре крысы. Животным давали седативное средство и вводили исследуемый препарат в правый глаз путем субретинальной инъекции с помощью иглы калибра 33. Левый глаз каждого животного оставляли интактным. Сразу после инъекции глаза проверяли методом оптической когерентной томографии или визуализации глазного дна, чтобы подтвердить наличие субретинального пузырька. Крысы получали бупренорфин и местную мазь с антибиотиком в соответствии со стандартными процедурами.

[00572] В дни 7, 14, 21, 28 и 35 животным в обеих группах вводили системно свежеприготовленный люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг.Через 5-15 минут после введения люциферина всех животных визуализировали с использованием IVIS под анестезией изофлураном. Полный поток [фотон/с] и средний поток (фотон/с/ср/см2) в представляющей интерес области, включающей глаз, получали при экспозиции 5 минут. Результаты представлены графически в виде средней светимости в обработанном глазу («инъецированный») для каждой группы лечения относительно средней светимости в необработанном глазу («неинъецированный») для каждой группы лечения (ФИГ. 9В). Значительная флуоресценция легко детектировалась в глазах, в которые был введен зкДНК-вектор, но была намного слабее в глазах, в которые была введена плазмида (ФИГ. 9А). Через 35 дней крыс, которым инъецировали плазмиду, умерщвляли, продолжая исследование для крыс, получивших зкДНК, с инъекцией люциферина и визуализацией IVIS в дни 42, 49, 56, 63, 70 и 99. Результаты демонстрируют, что зкДНК-вектор, введенный в глаз крысы путем однократной инъекции, опосредует экспрессию трансгена in vivo и что такая экспрессия поддерживалась на высоком уровне на протяжении по меньшей мере 99 дней после инъекции.

ПРИМЕР 10: Длительное введение доз и введение повторных доз зкДНК-вектора у мышей Rag2.

[00573] В ситуациях, когда один или более трансгенов, кодируемых в экспрессионной генной кассете зкДНК-вектора, экспрессируются в среде хозяина (например, в клетке или в организме субъекта), где экспрессированный белок распознается как чужеродный, существует вероятность того, что у хозяина выработается адаптивный иммунный ответ, который может привести к нежелательному истощению продукта экспрессии, которое может быть ошибочно принято за отсутствие экспрессии. В некоторых случаях это может происходить с репортерной молекулой, которая является гетерологичной для нормальной среды хозяина. Соответственно, экспрессию трансгена зкДНК-вектора оценивали in vivo в модели на мышах Rag2, в которой отсутствуют В- и Т-клетки и, следовательно, не вырабатывается адаптивный иммунный ответ на ненативные для мышей белки, такие как люцифераза. В общих чертах, в день 0 мышам линий c57b1/6 и Rag2 с подавленными генами вводили путем внутривенной инъекции в хвостовую вену 0,5 мг/кг инкапсулированного в ЛНЧ зкДНК-вектора, экспрессирующего люциферазу, или контроля поли(С), а в день 21 некоторым мышам вводили повторную дозу того же самого ЛНЧ-инкапсулированного зкДНК-вектора при том же уровне дозы. Все тестируемые группы состояли из 4 мышей в каждой. Визуализацию IVIS выполняли после инъекции люциферина, как описано в Примере 9, с недельными интервалами.

[00574] При сравнении полного потока, наблюдаемого в анализах IVIS, флуоресценция, наблюдаемая у мышей дикого типа (косвенная мера присутствия экспрессированной люциферазы), которым вводили ЛНЧ-зкДНК-вектор-Luc, постепенно снижалась после дня 21, в то время как мыши Rag2, которым вводили тот же самый препарат, проявили относительно постоянную устойчивую экспрессию люциферазы на протяжении 42 дней эксперимента (ФИГ. 10А). Временная точка приблизительно в день 21, в которой у мышей наблюдали снижение, соответствует временному интервалу, в котором можно ожидать появления адаптивного иммунного ответа. Повторное введение ЛНЧ с зкДНК-вектором мышам Rag2 приводило к заметному увеличению экспрессии, которая была устойчивой в течение по меньшей мере 21 дня, на протяжении которых проводили наблюдения в этом исследовании (ФИГ. 10В). Результаты позволяют предположить, что адаптивный иммунитет может играть определенную роль при экспрессии ненативного белка с зкДНК-вектора у хозяина, и что наблюдаемое снижение экспрессии в период времени 20+ дней с момента первоначального введения может указывать на мешающий адаптивный иммунный ответ на экспрессируемую молекулу, а не на снижение экспрессии (или в дополнение к ней). Следует отметить, что этот ответ, как ожидается, будет низким в случае экспрессии у хозяина нативных белков, когда, предположительно, хозяин будет правильно распознавать экспрессированные молекулы как собственные и не будет вырабатывать такой иммунный ответ.

ПРИМЕР 11: Влияние специфической для печени экспрессии и модуляции CpG на устойчивую экспрессию

[00575] Как описано в Примере 10, нежелательный иммунный ответ хозяина в некоторых случаях может искусственно ослаблять то, что иначе могло бы быть устойчивой экспрессией одного или более целевых трансгенов с введенного зкДНК-вектора. Использовали два подхода, чтобы оценить влияние избегания и/или ослабления потенциального иммунного ответа хозяина на устойчивую экспрессию с зкДНК-вектора.

Во-первых, поскольку вектор зкДНК-Luc, использованный в предшествующих примерах, находился под контролем конститутивного промотора CAG, была получена сходная конструкция с использованием специфического для печени промотора (hAAT) или другого конститутивного промотора (hEF-1), чтобы определить, будет ли избегание длительного воздействия миелоидных клеток или тканей, не относящихся к печени, снижать любые наблюдаемые иммунные эффекты. Во-вторых, некоторые конструкции зкДНК-люцифераза конструировали так, чтобы иметь пониженное содержание CpG, известного триггера иммунной реакции хозяина. Измеряли экспрессию гена люциферазы, кодируемой зкДНК, при введении мышам таких модифицированных зкДНК-векторов с замененным промотором.

[00576] Использовали три разных зкДНК-вектора, каждый из которых кодировал люциферазу в качестве трансгена. Первый зкДНК-вектор имел большое количество неметилированного CpG (~350) и содержал конститутивный промотор С AG («зкДНК CAG»); второй имел умеренное количество неметилированного CpG (~60) и содержал специфический для печени промотор hAAT («зкДНК hAAT с низким содержанием CpG»); и третий представлял собой метилированную форму второго, не содержащую неметилированного CpG, и также содержал промотор hAAT («зкДНК hAAT без CpG»). В остальном зкДНК-векторы были идентичны. Векторы готовили, как описано выше.

[00577] Четыре группы по четыре самца мышей CD-1®, в возрасте приблизительно 4 недель, получали один из зкДНК-векторов, инкапсулированных в ЛНЧ, или контроль поли(С). В день 0 каждой мыши вводили путем однократной внутривенной инъекции в хвостовую вену 0,5 мг/кг зкДНК-вектора в объеме 5 мл/кг. Значения массы тела регистрировали в дни -1, -, 1, 2, 3, 7 и еженедельно после этого, до умерщвления мышей. Образцы цельной крови и сыворотки брали в дни 0, 1 и 35. Прижизненную визуализацию проводили в дни 7, 14, 21, 28 и 35, и затем еженедельно с использованием системы визуализации in vivo (IVIS). Для визуализации каждой мыши вводили люциферин при 150 мг/кг путем внугрибрюшинной инъекции при 2,5 мл/кг. Через 15 минут каждую мышь анестезировали и визуализировали. Мышей умерщвляли в день 93 и собирали терминальные ткани, включая печень и селезенку. Измерения цитокинов проводили через 6 часов после введения дозы в день 0.

[00578] Несмотря на то, что у всех получивших зкДНК мышей наблюдали значительную флуоресценцию в дни 7 и 14, у мышей, получивших зкДНК CAG, флуоресценция быстро снижалась после дня 14 и более постепенно уменьшалась на протяжении оставшейся части исследования. Напротив, у мышей, получивших зкДНК hAAT с низким содержанием CpG и без CpG, полный поток оставался на стабильно высоком уровне (Фиг. 11). Это позволяет предположить, что направление доставки зкДНК-вектора специфически в печень приводило к устойчивой и длительной экспрессии трансгена с вектора в течение по меньшей мере 77 дней после однократной инъекции. Конструкции с минимизированным содержанием CpG или с полным отсутствием CpG имели сходные профили длительной устойчивой экспрессии, в то время как конструкция с конститутивным промотором и высоким содержанием CpG проявила снижение экспрессии с течением времени, это позволяет предположить, что иммунная активация хозяина при введении зкДНК-вектора может играть определенную роль в любом снижении экспрессии, наблюдаемом при введении такого вектора субъекту. Эти результаты обеспечивают альтернативные методы адаптации продолжительности ответа к желаемому уровню путем выбора ограниченного конкретной тканью промотора и/или изменения содержания CpG в зкДНК-векторе в том случае, если наблюдается иммунный ответ хозяина потенциально, специфичный в отношении трансгена ответ.

ПРИМЕР 12: Гидродинамическая доставка зкДНК, экспрессирующей FVIII

[00579] Гидродинамическая инъекция в хвостовую вену является хорошо известным методом введения нуклеиновой кислоты в печень у грызунов. В этой системе инъекция под давлением большого объема неинкапсулированной нуклеиновой кислоты приводит к кратковременному увеличению проницаемости клеток и доставке непосредственно в ткани и клетки. Это обеспечивает экспериментальный механизм обхода многих иммунных систем хозяина, таких как привлечение макрофагов, что обеспечивает возможность наблюдать доставку и экспрессию в отсутствие такой активности.

[00580] Три разных зкДНК-вектора, каждый с левым ITR дикого типа и усеченным мутантным правым ITR и имеющие трансгенную область, кодирующую FVIII, получали и очищали, как описано выше в Примерах 1 и 5. ЗкДНК FVIII-векторы под контролем специфического для печени промотора или только ФСБ вводили самцам мышей C57bl/6J в возрасте приблизительно 6 недель. Незащищенные зкДНК-векторы вводили в дозе 0,005 мг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 1,2 мл, введенной в течение 5 секунд, или в дозе 100 мл/кг, введенной в течение 5-8 секунд. Массу тела измеряли в дни 0, 1, 2, 3 и 7, а затем еженедельно. Образцы крови собирали у каждого обработанного животного в дни 3, 7, 14, 21, а также в последний день 28. Наличие экспрессированного FVIII в образцах плазмы измеряли с помощью набора для ИФА общего фактора VIII человека (ELISA Human Total Factor VIII (Innovative Research)).

[00581] Как показано на ФИГ. 11А, FVIII легко детектировался в образцах плазмы, взятой в день 3 и 7 у мышей, обработанных двумя из трех зкДНК FVIII-векторов, но не наблюдался у мышей, получавших ФСБ. ФИГ. 11В показывает, что экспрессия FVIII зависела от объема дозы в случае двух векторов, для которых наблюдали экспрессию FVIII, и оставалась относительно постоянной на протяжении 28-дневного исследования, за исключением вектора 3, экспрессия которого быстро снижалась после дня 7. Этот эксперимент продемонстрировал, что зкДНК-векторы были способны экспрессировать FVIII из печени после гидродинамической инъекции и что FVIII быстро и легко детектировался в сыворотке после введения зкДНК.

[00582] ПРИМЕР 13: Гидродинамическая доставка зкДНК, экспрессирующей FVIII-тестирование различных зкДНК-векторов, экспрессирующих FVIII

[00583] Систему гидродинамической доставки, описанную в Примере 12, использовали для тестирования эффекта различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор способен экспрессировать FVIII после инъекции.

[00584] зкДНК-векторы получали, как описано в Примере 12. Каждый из зкДНКFVIII-векторов (по отдельности, без какой-либо инкапсуляции в ЛНЧ) и контроль вводили путем гидродинамической внутривенной (в/в) инъекции мышам C57BL/6. ЗкДНК-векторы вводили в дозе 5 мкг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 90-100 мг/мл. Конечной временной точкой был день 7. В качестве контроля использовали носитель по отдельности.

[00585] Следующие зкДНК-векторы тестировали в трех отдельных экспериментах. Последовательности зкДНК-векторов ниже представлены в Таблице 9. В Таблице 9 открытая рамка считывания показана подчеркиванием. Промотор показан жирным шрифтом.

(1) зкДНКFVIII-вектор 4, зкДНКFVIII-вектор 6, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 14, зкДНКFVIII-вектор 16, зкДНКFVIII-вектор 18, зкДНКFVIII-вектор 19, зкДНКFVIII-вектор 21, зкДНКFVIII-вектор 22;

(2) зкДНКFVIII-вектор 1, зкДНКFVIII-вектор 2, зкДНКFVIII-вектор 3, зкДНКFVIII-вектор 5, зкДНКFVIII-вектор 7, зкДНКFVIII-вектор 8, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 13, зкДНКFVIII-вектор 15;

(3) зкДНКFVIII-вектор 9, зкДНКFVIII-вектор 10, зкДНКFVIII-вектор 11, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 17, зкДНКFVIII-вектор 20, зкДНКFVIII-вектор 24, зкДНКFVIII-вектор 25, зкДНКFVIII-вектор 26.

[00586] Исследуемые препараты поставлялись в виде концентрированного исходного раствора и хранились при номинальной температуре 4°С. Составы не перемешивали на вортексе и не центрифугировали. Группы размещали в прозрачных поликарбонатных клетках с контактной подстилкой на вентилируемой стойке в процедурной комнате. Корм и фильтрованную водопроводную воду, подкисленную 1 н. HCl до целевого рН 2,5-3,0, предоставляли животным ad libitum. Кровь собирали в промежуточных и конечных временных точках, как показано ниже:

[00587] Сбор образцов крови выполняли следующим образом:

[00588] Детали исследования описаны далее:

[00589] Вид (количество, пол, возраст): Мыши C57BL/6 (JAX 000664) (Ν=40 и 4 запасные, самцы, в возрасте 6 недель на момент прибытия) из Jackson Laboratories.

[00590] Класс соединения: зкДНК.

[00591] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.

[00592] Клинические наблюдения: Клинические наблюдения выполняли через 1, 5-6 и 24 часа после введения дозы в День 0.

[00593] Масса тела: Массу тела всех животных регистрировали в Дни 0, 3 и 7, в том числе до умерщвления.

[00594] Лекарственная форма: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.

[00595] Введение дозы: Исследуемые материалы вводили в День 0 путем гидродинамического в/в введения в установленном объеме на животное, 90-100 мл/кг (в зависимости от самого легкого животного в группе) через латеральную хвостовую вену (введение дозы в течение 5 секунд).

[00596] Сбор крови: У животных собирали промежуточный образец крови в День 3 в соответствии с таблицей выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. У животных собирали кровь в соответствии с приведенными выше таблицами сбора крови. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Готовили одну (1) аликвоту и отмечали любое свертывание в образце цельной крови или гемолиз в плазме. Все образцы хранили при номинальной температуре -70°С. Все образцы хранили при номинальной температуре -70°С до отправки.

[00597] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.

[00598] Умерщвление и терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения сыворотки в соответствии с СОП учреждения и хранили в двух (2) аликвотах. Для сборов плазмы цельную кровь собирали с помощью шприца, и 600 мкл немедленно помещали в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали четыре (4) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.

[00599] Результаты: Результаты, показанные на ФИГ. 12-15, показывают эффект различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор был способен экспрессировать FVIII после инъекции. ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.

ПРИМЕР 14: Экспрессия FVIII после доставки ЛНЧ:зкДНК в комбинации с ингибитором киназы у самцов мышей CD-1

[00600] ЛНЧ:зкДНК-векторы получали, как описано в Примере 6. Эффект составов зкДНК:липид тестировали на самцах мышей CD-1. Носитель для дозирования и приготовления ингибитора представлял собой 0,5% метилцеллюлозу.

[00601] Исследуемый материал ЛНЧ:зкДНК («зкДНКFVIII-вектор 23») вводили следующим образом:

[00602] Образцы крови (промежуточные и конечные) отбирали, как указано ниже:

[00603] Образцы тканей собирали, как указано ниже:

[00604] Детали исследования описаны далее:

[00605] Вид (количество, пол, возраст): Мыши CD-1 (Ν=10+2 запасные, самцы, в возрасте 4 недель на момент прибытия) из Charles River Laboratories.

[00606] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.

[00607] Клинические наблюдения: Клинические наблюдения выполняли примерно через 1, 5-6 и 24 часа после введения дозы исследуемого материала в День 0.

[00608] Масса тела: Массу тела всех животных регистрировали в Дни 0, 1, 2, 3 и 7, в том числе до умерщвления.

[00609] Лекарственная форма исследуемого материала: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.

[00610] Введение дозы: Исследуемые препараты вводили в дозе 5 мл/кг в День 0 для Групп 1-2 путем внутривенного введения через латеральную хвостовую вену.

[00611] Сбор крови: У всех животных в Группах 1-2 собирали промежуточные образцы крови в День 3 в соответствии с таблицей сбора крови, приведенной выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия с помощью пункции орбитального синуса под анестезией в соответствии с СОП учреждения. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 пл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Была сделана одна (1) аликвота, и будет отмечаться любое свертывание в образце цельной крови или гемолиз в плазме.

[00612] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.

[00613] Терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения плазмы. Для сборов плазмы цельную кровь собирали с помощью шприца и сразу помещали 600 мкл в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали две (2) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.

[00614] Перфузия: После обескровливания всех животных подвергали перфузии сердца физиологическим раствором. В общих чертах, внутрисердечную перфузию всего тела выполняли путем введения иглы калибра 23/21, прикрепленной к 10 мл шприцу, содержащему физиологический раствор, в просвет левого желудочка для перфузии. Правое предсердие было рассечено, чтобы обеспечить дренажный выход для перфузата. После того, как игла была помещена в сердце, к поршню прикладывали легкое и постоянное давление для перфузии животного. Соответствующий поток промывочного раствора обеспечивали до тех пор, пока выходящий перфузат не станет прозрачным (без видимой крови), это указывает на то, что промывочный раствор насытил тело и процедура завершена.

[00615] Сбор ткани: Терминальные ткани собирали у агонирующих животных, которых умерщвляли до запланированной временной точки. При наличии возможности, собирали и сохраняли ткани животных, которые были найдены мертвыми.

[00616] После умерщвления и перфузии забирали печень. Из печени собирали и взвешивали четыре (4) среза по 25-50 мг. Срезы мгновенно замораживали по отдельности и хранили при номинальной температуре -70°С до отправки.

[00617] Результаты: ФИГ. 16 показывает концентрацию FVIII в плазме (МЕ/мл) через 7 дней после введения исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23. Как показано на ФИГ. 16, FVIII легко детектировался в образцах плазмы мышей, получавших исследуемый препарат ЛНЧ:зкДНКFVIII-вектор 23, но не наблюдался у мышей, получавших только носитель.

ССЫЛКИ

[00618] Все публикации и ссылки, включая, но не ограничиваясь перечисленными, патенты и заявки на патенты, указанные в данном описании и в Примерах в данном документе, полностью включены посредством ссылки, как если бы каждая отдельная публикация или ссылка была конкретно и по отдельности указана для включения в данный документ посредством ссылки во всей полноте. Любая заявка на патент, согласно которой настоящая заявка испрашивает приоритет, также включена в данный документ посредством ссылки способом, описанным выше для публикаций и ссылок.

--->

Перечень последовательностей

<110> ДЖЕНЕРЕЙШЕН БИО КО.

<120> НЕВИРУСНЫЕ ДНК-ВЕКТОРЫ И ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ ДЛЯ ЭКСПРЕССИИ

ТЕРАПЕВТИЧЕСКОГО СРЕДСТВА НА ОСНОВЕ ФАКТОРА VIII (FVIII)

<130> 131698-06020

<140> PCT/US2020/022738

<141> 2020-03-13

<150> 62/856,432

<151> 2019-06-03

<150> 62/817,904

<151> 2019-03-13

<160> 398

<170> PatentIn version 3.5

<210> 1

<211> 141

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 1

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc

120

gagcgcgcag ctgcctgcag g

141

<210> 2

<211> 141

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 2

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca

120

actccatcac taggggttcc t

141

<210> 3

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 3

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc

120

tgcctgcagg

130

<210> 4

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 4

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt

60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact

120

aggggttcct

130

<210> 5

<211> 143

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 5

ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc

60

agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt

120

gggcaactcc atcactaggg taa

143

<210> 6

<211> 144

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 6

ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc

60

agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt

120

ggccaactcc atcactagag gtat

144

<210> 7

<211> 127

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 7

ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc

60

agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg

120

gccaact

127

<210> 8

<211> 166

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 8

tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc

60

gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc

120

gacagggggg agagtgccac actctcaagc aagggggttt tgtaag

166

<210> 9

<211> 144

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 9

ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg

60

cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt

120

gggcaactcc atcactaggg gtat

144

<210> 10

<211> 143

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 10

ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc

60

ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga

120

gcgcgcagag agggagtggg caa

143

<210> 11

<211> 144

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 11

atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc

60

ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg

120

agtgcgcata gagggagtgg ccaa

144

<210> 12

<211> 127

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 12

agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct

60

ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag

120

tggccaa

127

<210> 13

<211> 166

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 13

cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc

60

gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt

120

cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga

166

<210> 14

<211> 144

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 14

atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc

60

ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga

120

gcgcgcatta gagggagtgg gcaa

144

<210> 15

<211> 120

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 15

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg

120

<210> 16

<211> 122

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 16

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca

120

gg

122

<210> 17

<211> 129

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 17

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct

120

gcctgcagg

129

<210> 18

<211> 101

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 18

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g

101

<210> 19

<211> 139

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 19

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga

120

gcgcgcagct gcctgcagg

139

<210> 20

<211> 137

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 20

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc

120

gcgcagctgc ctgcagg

137

<210> 21

<211> 135

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 21

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc

120

gcagctgcct gcagg

135

<210> 22

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 22

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc

120

agctgcctgc agg

133

<210> 23

<211> 139

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 23

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga

120

gcgcgcagct gcctgcagg

139

<210> 24

<211> 137

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 24

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc

120

gcgcagctgc ctgcagg

137

<210> 25

<211> 135

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 25

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc

120

gcagctgcct gcagg

135

<210> 26

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 26

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc

120

agctgcctgc agg

133

<210> 27

<211> 131

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 27

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag

120

ctgcctgcag g

131

<210> 28

<211> 129

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 28

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct

120

gcctgcagg

129

<210> 29

<211> 127

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 29

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc

120

ctgcagg

127

<210> 30

<211> 122

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 30

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca

120

gg

122

<210> 31

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 31

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc

120

tgcctgcagg

130

<210> 32

<211> 120

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 32

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg

60

cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct

120

<210> 33

<211> 122

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 33

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc

60

ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc

120

ct

122

<210> 34

<211> 122

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 34

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60

ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc

120

ct

122

<210> 35

<211> 129

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 35

cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg

60

gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta

120

ggggttcct

129

<210> 36

<211> 101

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 36

cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc

60

gcgcagagag ggagtggcca actccatcac taggggttcc t

101

<210> 37

<211> 139

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 37

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60

gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac

120

tccatcacta ggggttcct

139

<210> 38

<211> 137

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 38

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60

gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc

120

catcactagg ggttcct

137

<210> 39

<211> 135

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 39

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60

gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca

120

tcactagggg ttcct

135

<210> 40

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 40

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc

60

gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc

120

actaggggtt cct

133

<210> 41

<211> 139

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 41

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg

60

gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac

120

tccatcacta ggggttcct

139

<210> 42

<211> 137

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 42

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc

60

gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc

120

catcactagg ggttcct

137

<210> 43

<211> 135

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 43

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga

60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca

120

tcactagggg ttcct

135

<210> 44

<211> 133

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 44

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc

60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc

120

actaggggtt cct

133

<210> 45

<211> 131

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 45

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt

60

tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac

120

taggggttcc t

131

<210> 46

<211> 129

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 46

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg

60

gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta

120

ggggttcct

129

<210> 47

<211> 127

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 47

cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt

60

cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg

120

ggttcct

127

<210> 48

<211> 122

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 48

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca

120

gg

122

<210> 49

<211> 12

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 49

cgatcgttcg at

12

<210> 50

<211> 12

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 50

atcgaaccat cg

12

<210> 51

<211> 12

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 51

atcgaacgat cg

12

<210> 52

<211> 165

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 52

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg

60

ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc

120

gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct

165

<210> 53

<211> 140

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 53

cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc

60

cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg

120

cgcagagaga tcactagggg

140

<210> 54

<211> 91

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 54

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg

60

tcgcccggcc tcagtgagcg agcgagcgcg c

91

<210> 55

<211> 91

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 55

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc

60

ccgggcggcc tcagtgagcg agcgagcgcg c

91

<210> 56

<211> 1662

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 56

gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg

60

gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct

120

ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc

180

gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga

240

atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt

300

atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt

360

atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg

420

aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat

480

taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat

540

gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac

600

tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg

660

agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt

720

ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata

780

tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt

840

caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa

900

agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct

960

cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg

1020

caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat

1080

aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat

1140

accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt

1200

atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg

1260

ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc

1320

ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc

1380

ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc

1440

ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag

1500

atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg

1560

tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag

1620

atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa

1662

<210> 57

<211> 453

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<220>

<221> MOD_RES

<222> (1)..(1)

<223> Любая аминокислота

<400> 57

Xaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ala Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 80

Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met Asp

100 105 110

Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys

115 120 125

Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly

130 135 140

Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro

145 150 155 160

Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr

165 170 175

Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val

180 185 190

Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn

195 200 205

Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro

210 215 220

Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu

225 230 235 240

Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp

245 250 255

Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp

260 265 270

Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly

275 280 285

Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn

290 295 300

Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp

305 310 315 320

Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro

325 330 335

Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu

340 345 350

Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn

355 360 365

Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile

370 375 380

Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr

385 390 395 400

Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys

405 410 415

Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys

420 425 430

Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu

435 440 445

Ser Leu Ser Pro Gly

450

<210> 58

<211> 214

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 58

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr

20 25 30

Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

35 40 45

Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 80

Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro Leu

85 90 95

Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205

Phe Asn Arg Gly Glu Cys

210

<210> 59

<211> 1310

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 59

ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga

60

ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc

120

atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg

180

ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct

240

ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt

300

tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg

360

gccgccgagc tggaggtcct gctccgagcg ggccgggccc cgctgtcgtc ggcggggatt

420

agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag

480

cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc

540

cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct

600

gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc

660

cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc

720

cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc

780

ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga

840

tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg

900

gcaccagttg cgtgcgtgga aagatggccg ctcccgggcc ctgttgcaag gagctcaaaa

960

tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc

1020

ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca

1080

cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt

1140

ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg

1200

gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg

1260

tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa

1310

<210> 60

<211> 16

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 60

gcgcgctcgc tcgctc

16

<210> 61

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 61

ggttga

6

<210> 62

<211> 4

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 62

agtt

4

<210> 63

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 63

ggttgg

6

<210> 64

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 64

agttgg

6

<210> 65

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 65

agttga

6

<210> 66

<211> 6

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 66

rrttrr

6

<210> 67

<211> 581

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 67

gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat

60

ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt

120

actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc

180

tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt

240

aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct

300

attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt

360

ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac

420

gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct

480

ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca

540

ggggctaggt tgctgggcac tgataattcc gtggtgttgt c

581

<210> 68

<211> 225

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 68

tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct

60

ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct

120

gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg

180

ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc

225

<210> 69

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 69

actgaggc

8

<210> 70

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 70

gcctcagt

8

<210> 71

<211> 16

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 71

gagcgagcga gcgcgc

16

<210> 72

<211> 1923

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 72

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta

60

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc

120

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg

180

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc

240

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat

300

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc

360

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga

420

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg

480

gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg

540

cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta

600

attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg

660

gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg

720

cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg

780

aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg

840

ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc

900

gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt

960

ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc

1020

ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc

1080

ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg

1140

aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag

1200

gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc

1260

tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg

1320

gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg

1380

ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc

1440

ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg

1500

taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct

1560

gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg

1620

aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc

1680

cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg

1740

ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc

1800

ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg

1860

acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag

1920

cca

1923

<210> 73

<211> 1272

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 73

aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc

60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc

120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc

180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc

240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt

300

ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag

360

taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa

420

gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg

480

ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc

540

tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt

600

gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag

660

cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt

720

ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat

780

cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt

840

ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct

900

gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg

960

cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag

1020

cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc

1080

ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag

1140

cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt

1200

tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac

1260

ctttggaact ga

1272

<210> 74

<211> 1177

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 74

ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc

60

tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac

120

ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac

180

agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca

240

tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc

300

ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag

360

tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa

420

tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt

480

tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga

540

cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca

600

agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt

660

tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta

720

attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt

780

accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca

840

gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca

900

ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg

960

tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg

1020

gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca

1080

gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc

1140

tcctcagctt caggcaccac cactgacctg ggacagt

1177

<210> 75

<211> 547

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 75

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc

60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc

120

cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag

180

gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag

240

gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct

300

gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt

360

gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca

420

ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa

480

gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg

540

gaactga

547

<210> 76

<211> 556

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 76

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc

60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc

120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt

180

agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc

240

aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt

300

ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc

360

ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct

420

tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa

480

aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc

540

caacctttgg aactga

556

<210> 77

<211> 1179

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 77

ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg

60

ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt

120

gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca

180

gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc

240

gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt

300

acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg

360

gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg

420

cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct

480

ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg

540

caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc

600

gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga

660

gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct

720

ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca

780

gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg

840

acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg

900

tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat

960

tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg

1020

gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa

1080

ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca

1140

gtggttcaaa gtttttttct tccatttcag gtgtcgtga

1179

<210> 78

<211> 141

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 78

aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt

60

cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc

120

tgcggcgcgc gcagcacctt t

141

<210> 79

<211> 317

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 79

ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt

60

agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca

120

tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa

180

ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag

240

aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag

300

gcctaggctt ttgcaaa

317

<210> 80

<211> 241

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 80

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag

60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga

120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat

180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga

240

c

241

<210> 81

<211> 215

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 81

gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa

60

cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc

120

tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg

180

gatttgggaa tcgtataaga actgtatgag accac

215

<210> 82

<211> 546

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 82

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc

60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc

120

cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag

180

gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag

240

gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct

300

gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt

360

gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca

420

ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa

480

gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg

540

gaactg

546

<210> 83

<211> 576

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 83

tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa

60

cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata

120

atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag

180

tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc

240

cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta

300

tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg

360

cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt

420

ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca

480

aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag

540

gtctatataa gcagagctgg tttagtgaac cgtcag

576

<210> 84

<211> 150

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 84

ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc

60

gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct

120

gcggcgcgcg cagcaccttt gcggccatct

150

<210> 85

<211> 1313

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 85

ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga

60

ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc

120

atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg

180

gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg

240

tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt

300

agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg

360

gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc

420

gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg

480

ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc

540

tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct

600

gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta

660

aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc

720

gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg

780

aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc

840

tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca

900

ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg

960

gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct

1020

tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc

1080

gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt

1140

tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg

1200

aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt

1260

attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa

1313

<210> 86

<211> 213

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 86

taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta

60

tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag

120

ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt

180

tttaaagcaa gtaaaacctc tacaaatgtg gta

213

<210> 87

<211> 7

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический пептид

<400> 87

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 88

<211> 19

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический пептид

<400> 88

Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly

1 5 10 15

Ala His Ser

<210> 89

<211> 19

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический пептид

<400> 89

Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala

1 5 10 15

Ser Arg Gly

<210> 90

<211> 7

<212> БЕЛОК

<213> Обезьяний вирус 40

<400> 90

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 91

<211> 21

<212> ДНК

<213> Обезьяний вирус 40

<400> 91

cccaagaaga agaggaaggt g

21

<210> 92

<211> 16

<212> БЕЛОК

<213> Неизвестное

<220>

<223> Описание неизвестного: двухкомпонентная последовательность NLS

нуклеоплазмина

<400> 92

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 93

<211> 9

<212> БЕЛОК

<213> Неизвестное

<220>

<223> Описание неизвестного: последовательность NLS C-myc

<400> 93

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 94

<211> 11

<212> БЕЛОК

<213> Неизвестное

<220>

<223> Описание неизвестного: последовательность NLS C-myc

<400> 94

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 95

<211> 38

<212> БЕЛОК

<213> Homo sapiens

<400> 95

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 96

<211> 42

<212> БЕЛОК

<213> Неизвестное

<220>

<223> Описание неизвестного: домен IBB из последовательности

импортина-альфа

<400> 96

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 97

<211> 8

<212> БЕЛОК

<213> Неизвестное

<220>

<223> Описание неизвестного: последовательность белка Т миомы

<400> 97

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 98

<211> 8

<212> БЕЛОК

<213> Неизвестное

<220>

<223> Описание неизвестного: последовательность белка Т миомы

<400> 98

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 99

<211> 8

<212> БЕЛОК

<213> Homo sapiens

<400> 99

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 100

<211> 12

<212> БЕЛОК

<213> Mus musculus

<400> 100

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 101

<211> 70

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 101

gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga

60

gcgagcgcgc

70

<210> 102

<211> 70

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 102

gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga

60

gcgagcgcgc

70

<210> 103

<211> 72

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 103

gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc

60

gagcgagcgc gc

72

<210> 104

<211> 72

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 104

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc

60

gagcgagcgc gc

72

<210> 105

<211> 72

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 105

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc

60

gagcgagcgc gc

72

<210> 106

<211> 72

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 106

gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc

60

gagcgagcgc gc

72

<210> 107

<211> 83

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 107

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg

60

cctcagtgag cgagcgagcg cgc

83

<210> 108

<211> 83

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 108

gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg

60

cctcagtgag cgagcgagcg cgc

83

<210> 109

<211> 77

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 109

gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag

60

tgagcgagcg agcgcgc

77

<210> 110

<211> 77

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 110

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag

60

tgagcgagcg agcgcgc

77

<210> 111

<211> 51

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 111

gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c

51

<210> 112

<211> 51

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 112

gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c

51

<210> 113

<211> 80

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 113

gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct

60

cagtgagcga gcgagcgcgc

80

<210> 114

<211> 80

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 114

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

60

cagtgagcga gcgagcgcgc

80

<210> 115

<211> 79

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 115

gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc

60

agtgagcgag cgagcgcgc

79

<210> 116

<211> 79

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 116

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc

60

agtgagcgag cgagcgcgc

79

<210> 117

<211> 5

<212> БЕЛОК

<213> Вирус гриппа

<400> 117

Asp Arg Leu Arg Arg

1 5

<210> 118

<211> 7

<212> БЕЛОК

<213> Вирус гриппа

<400> 118

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 119

<211> 10

<212> БЕЛОК

<213> Вирус гепатита дельта

<400> 119

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 120

<211> 10

<212> БЕЛОК

<213> Mus musculus

<400> 120

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 121

<211> 20

<212> БЕЛОК

<213> Homo sapiens

<400> 121

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 122

<211> 17

<212> БЕЛОК

<213> Homo sapiens

<400> 122

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 123

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 123

gtttaaac

8

<210> 124

<211> 8

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 124

ttaattaa

8

<210> 125

<211> 141

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 125

aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt

60

cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc

120

tgcggcgcgc gcagcacctt t

141

<210> 126

<211> 317

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 126

ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt

60

agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca

120

tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa

180

ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag

240

aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag

300

gcctaggctt ttgcaaa

317

<210> 127

<211> 72

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 127

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc

60

gagcgagcgc gc

72

<210> 128

<211> 60

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 128

gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac

60

<210> 129

<211> 1260

<212> ДНК

<213> Аденоассоциированный вирус - 2

<400> 129

atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag

60

gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag

120

gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg

180

gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta

240

aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc

300

ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg

360

gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt

420

cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc

480

aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa

540

tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg

600

tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg

660

atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag

720

gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc

780

tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag

840

cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc

900

aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg

960

tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga

1020

cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa

1080

aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc

1140

actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt

1200

taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga

1260

<210> 130

<211> 1932

<212> ДНК

<213> Аденоассоциированный вирус - 2

<400> 130

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc

60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat

120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag

180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg

240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg

300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt

360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc

420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa

480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg

540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag

600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact

660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag

720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg

780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc

840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa

900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc

960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag

1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc

1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg

1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc

1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc

1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg

1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag

1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg

1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca

1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg

1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg

1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc

1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt

1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg

1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa

1860

caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga

1920

cactctctct ga

1932

<210> 131

<211> 1876

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 131

cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg

60

gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt

120

gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga

180

gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct

240

tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac

300

caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat

360

tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac

420

cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt

480

gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag

540

cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc

600

gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag

660

atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac

720

ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc

780

caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac

840

taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg

900

gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct

960

gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac

1020

taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt

1080

aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg

1140

ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag

1200

caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat

1260

cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca

1320

ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga

1380

ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt

1440

ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc

1500

cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac

1560

gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca

1620

cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc

1680

aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc

1740

tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat

1800

gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg

1860

catctttgaa caataa

1876

<210> 132

<211> 1194

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 132

atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag

60

gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag

120

gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg

180

gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta

240

aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc

300

ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg

360

gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt

420

cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc

480

aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa

540

tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg

600

tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg

660

atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag

720

gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc

780

tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag

840

cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc

900

aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg

960

tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga

1020

cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa

1080

aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc

1140

actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa

1194

<210> 133

<211> 1876

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 133

cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg

60

gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt

120

gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga

180

gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct

240

tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac

300

caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat

360

tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac

420

cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt

480

gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag

540

cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc

600

gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag

660

atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac

720

ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc

780

caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac

840

taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg

900

gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct

960

gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac

1020

taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt

1080

aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg

1140

ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag

1200

caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat

1260

cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca

1320

ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga

1380

ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt

1440

ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc

1500

cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac

1560

gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca

1620

cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc

1680

aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc

1740

tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat

1800

gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg

1860

catctttgaa caataa

1876

<210> 134

<211> 51

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 134

ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c

51

<210> 135

<211> 65

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 135

ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct

60

cagtc

65

<210> 136

<211> 67

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 136

ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag

60

tcctgca

67

<210> 137

<211> 41

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 137

gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a

41

<210> 138

<211> 56

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 138

ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca

56

<210> 139

<211> 54

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 139

ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc

54

<210> 140

<211> 48

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 140

ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca

48

<210> 141

<211> 46

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 141

ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc

46

<210> 142

<211> 67

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 142

ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag

60

tcctgca

67

<210> 143

<211> 47

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 143

atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg

47

<210> 144

<211> 29

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 144

atacctaggg gccgcacgcg tgttactag

29

<210> 145

<211> 42

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 145

atacactcag tgcctgcagg cacgtggtcc ggagatccag ac

42

<210> 146

<211> 3754

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 146

cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct

60

tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc

120

catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt

180

gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg

240

gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc

300

atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa

360

cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac

420

tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca

480

agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg

540

gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt

600

agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc

660

ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat

720

gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg

780

cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc

840

ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg

900

agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc

960

cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc

1020

cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa

1080

gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc

1140

gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct

1200

gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg

1260

gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt

1320

gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac

1380

ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt

1440

ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg

1500

gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc

1560

ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg

1620

cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc

1680

ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag

1740

ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg

1800

cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg

1860

accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc

1920

ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat

1980

ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca

2040

ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg

2100

acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct

2160

acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca

2220

ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga

2280

agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct

2340

tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc

2400

tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc

2460

acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga

2520

acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg

2580

ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc

2640

actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg

2700

tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt

2760

aattaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt

2820

gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg

2880

atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg

2940

ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac

3000

tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct

3060

gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt

3120

gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt

3180

gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg

3240

gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg

3300

ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc

3360

tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc

3420

cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg

3480

tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa

3540

tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa

3600

gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg

3660

gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg

3720

tcgcccgacg cccgggcggc ctcagtcctg cagg

3754

<210> 147

<211> 8418

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 147

ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga

60

cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca

120

tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca

180

atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg

240

gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat

300

atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc

360

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc

420

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt

480

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca

540

cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg

600

taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca

660

gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt

720

cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt

780

attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg

840

gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc

900

gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag

960

cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg

1020

cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg

1080

acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc

1140

tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc

1200

tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg

1260

gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg

1320

ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct

1380

gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt

1440

aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg

1500

ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg

1560

gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc

1620

ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa

1680

tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg

1740

aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag

1800

gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag

1860

cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc

1920

ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc

1980

tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca

2040

gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca

2100

gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca

2160

tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg

2220

agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc

2280

ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct

2340

accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc

2400

aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt

2460

tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg

2520

gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg

2580

ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg

2640

gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc

2700

tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga

2760

agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg

2820

acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc

2880

tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca

2940

tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt

3000

taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat

3060

ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc

3120

tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt

3180

gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg

3240

cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg

3300

tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc

3360

cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt

3420

gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt

3480

gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca

3540

ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga

3600

ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca

3660

tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc

3720

ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg

3780

ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag

3840

cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac

3900

ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa

3960

cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct

4020

gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca

4080

ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc

4140

cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg

4200

cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca

4260

gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat

4320

ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg

4380

agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc

4440

ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat

4500

aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca

4560

gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg

4620

actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg

4680

gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag

4740

cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt

4800

aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag

4860

ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg

4920

ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct

4980

ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat

5040

ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc

5100

aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac

5160

gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat

5220

atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg

5280

gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac

5340

gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca

5400

taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat

5460

tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt

5520

tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt

5580

ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa

5640

taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg

5700

ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg

5760

gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag

5820

gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga

5880

cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct

5940

ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc

6000

tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg

6060

gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc

6120

tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca

6180

ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag

6240

ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct

6300

ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc

6360

accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga

6420

tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca

6480

cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat

6540

taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac

6600

caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt

6660

gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt

6720

gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag

6780

ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct

6840

attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt

6900

gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc

6960

tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt

7020

agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg

7080

gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg

7140

actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct

7200

tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc

7260

attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt

7320

tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt

7380

tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg

7440

aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat

7500

tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg

7560

cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc

7620

gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc

7680

ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag

7740

agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc

7800

gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa

7860

gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg

7920

aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt

7980

gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc

8040

gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt

8100

aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat

8160

gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat

8220

gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa

8280

ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat

8340

acgaaaatta aaaatgacaa aatagtttgg aactagattt cacttatctg gttcggatct

8400

cctagtgagc tccctgca

8418

<210> 148

<211> 225

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 148

tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct

60

ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct

120

gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg

180

ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc

225

<210> 149

<211> 1177

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 149

ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc

60

tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac

120

ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac

180

agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca

240

tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc

300

ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag

360

tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa

420

tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt

480

tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga

540

cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca

600

agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt

660

tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta

720

attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt

780

accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca

840

gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca

900

ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg

960

tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg

1020

gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca

1080

gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc

1140

tcctcagctt caggcaccac cactgacctg ggacagt

1177

<210> 150

<211> 1326

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 150

ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca

60

aggggagagc ccagggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc

120

acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct

180

cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg

240

gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tgggggagaa

300

cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga

360

acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc

420

gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga

480

gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc

540

gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg

600

cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg

660

tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg

720

aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg

780

aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc

840

tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga

900

ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt

960

gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcacccac

1020

acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc

1080

ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat

1140

ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg

1200

ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct

1260

cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa

1320

ttcaaa

1326

<210> 151

<211> 573

<212> ДНК

<213> Mus musculus

<400> 151

gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat

60

tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt

120

gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt

180

ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa

240

ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac

300

ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact

360

aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta

420

gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa

480

cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag

540

agaggaacca ttgccacctt cagattttcc tgt

573

<210> 152

<211> 1993

<212> ДНК

<213> Mus musculus

<400> 152

acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag

60

cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc

120

cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat

180

ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt

240

aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag

300

tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga

360

gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa

420

ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg

480

agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg

540

gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag

600

atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg

660

tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta

720

aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca

780

gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa

840

tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat

900

atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg

960

ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa

1020

gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc

1080

ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc

1140

cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag

1200

acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga

1260

ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat

1320

cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccagggt

1380

gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa

1440

aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg

1500

ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac

1560

taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc

1620

aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg

1680

aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt

1740

catggatctg aaagagagca agggggctta catgagaggg tttggaggga ggggttggag

1800

ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca

1860

aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc

1920

aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag

1980

aaaacatgga agg

1993

<210> 153

<211> 1350

<212> ДНК

<213> Homo sapiens

<400> 153

taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca

60

tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag

120

tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct

180

gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct

240

cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta

300

aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt

360

gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga

420

agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta

480

attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca

540

ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc

600

acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat

660

acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg

720

ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg

780

ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct

840

gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac

900

tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga

960

atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt

1020

gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg

1080

gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat

1140

tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca

1200

ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg

1260

ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg

1320

cttatcttca ccatcatgat tgtttatttt

1350

<210> 154

<211> 1223

<212> ДНК

<213> Homo sapiens

<400> 154

tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg

60

gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct

120

gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc

180

gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg

240

acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg

300

tgggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccattt

360

atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa

420

tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta

480

ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga

540

gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg

600

tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct

660

ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat

720

gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag

780

acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca

840

tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta

900

gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga

960

accttgacgg cattgctccg tctaagtcat gagctgagca gggagatcct ggttggtgtt

1020

gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga

1080

gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg

1140

atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg

1200

aggatgcaga gtcagcagaa ctg

1223

<210> 155

<211> 215

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 155

gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa

60

cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc

120

tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg

180

gatttgggaa tcttataagt tctgtatgag accac

215

<210> 156

<211> 141

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 156

cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc

60

gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca

120

actccatcac taggggttcc t

141

<210> 157

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 157

gcgcgctcgc tcgctcacc

19

<210> 158

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 158

ctaggtgagc gagcgagcgc gc

22

<210> 159

<211> 75

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 159

cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg

60

cctcagtcct gcagg

75

<210> 160

<211> 130

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 160

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt

60

gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc

120

tgcctgcagg

130

<210> 161

<211> 142

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 161

cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg

60

acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc

120

aactccatca ctaggggttc ct

142

<210> 162

<211> 80

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 162

gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact

60

cagtgagcga gcgagcgcgc

80

<210> 163

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 163

gcgcgctcgc tcgctcactg a

21

<210> 164

<211> 18

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 164

gtgagcgagc gagcgcgc

18

<210> 165

<211> 89

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 165

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc

60

gcccggcctc agtgagcgag cgagcgcgc

89

<210> 166

<211> 89

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 166

gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc

60

gggcggcctc agtgagcgag cgagcgcgc

89

<210> 167

<211> 87

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 167

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc

60

ccggcctcag tgagcgagcg agcgcgc

87

<210> 168

<211> 87

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 168

gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg

60

gcggcctcag tgagcgagcg agcgcgc

87

<210> 169

<211> 85

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 169

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc

60

ggcctcagtg agcgagcgag cgcgc

85

<210> 170

<211> 85

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 170

gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc

60

ggcctcagtg agcgagcgag cgcgc

85

<210> 171

<211> 89

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 171

gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc

60

gcccggcctc agtgagcgag cgagcgcgc

89

<210> 172

<211> 89

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 172

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc

60

gggcggcctc agtgagcgag cgagcgcgc

89

<210> 173

<211> 87

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 173

gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc

60

ccggcctcag tgagcgagcg agcgcgc

87

<210> 174

<211> 87

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 174

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg

60

gcggcctcag tgagcgagcg agcgcgc

87

<210> 175

<211> 85

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 175

gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc

60

ggcctcagtg agcgagcgag cgcgc

85

<210> 176

<211> 85

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 176

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc

60

ggcctcagtg agcgagcgag cgcgc

85

<210> 177

<211> 83

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 177

gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg

60

cctcagtgag cgagcgagcg cgc

83

<210> 178

<211> 83

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 178

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg

60

cctcagtgag cgagcgagcg cgc

83

<210> 179

<211> 81

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 179

gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc

60

tcagtgagcg agcgagcgcg c

81

<210> 180

<211> 81

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 180

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc

60

tcagtgagcg agcgagcgcg c

81

<210> 181

<211> 79

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 181

gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc

60

agtgagcgag cgagcgcgc

79

<210> 182

<211> 79

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 182

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc

60

agtgagcgag cgagcgcgc

79

<210> 183

<211> 81

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 183

ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc

60

agtgagcgag cgagcgcgca g

81

<210> 184

<211> 81

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 184

ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc

60

agtgagcgag cgagcgcgca g

81

<210> 185

<211> 72

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 185

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc

60

gagcgagcgc gc

72

<210> 186

<211> 80

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 186

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

60

cagtgagcga gcgagcgcgc

80

<210> 187

<211> 79

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 187

gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc

60

agtgagcgag cgagcgcgc

79

<210> 188

<211> 48

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 188

ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc

48

<210> 189

<211> 99

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

олигонуклеотид

<400> 189

attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca

60

gtcatctgtg tttggaagaa agggagcgac tatgaggcc

99

<210> 190

<211> 588

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 190

gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt

60

gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc

120

ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag

180

gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac

240

aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc

300

tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc

360

acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca

420

aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt

480

gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg

540

gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc

588

<210> 191

<211> 399

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 191

cgggggaggc tgctggtgaa tattaaccaa ggtcacccca gttatcggag gagcaaacag

60

gggctaagtc cacacgcgtg gtaccgtctg tctgcacatt tcgtagagcg agtgttccga

120

tactctaatc tccctaggca aggttcatat ttgtgtaggt tacttattct ccttttgttg

180

actaagtcaa taatcagaat cagcaggttt ggagtcagct tggcagggat cagcagcctg

240

ggttggaagg agggggtata aaagcccctt caccaggaga agccgtcaca cagatccaca

300

agctcctgaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt

360

acctggagca cctgcctgaa atcacttttt ttcaggttg

399

<210> 192

<211> 14359

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 192

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct

4380

gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag

4440

tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag

4500

caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga

4560

gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag

4620

aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca

4680

cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc

4740

atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca

4800

tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca

4860

ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca

4920

agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag

4980

acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg

5040

ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc

5100

aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag

5160

tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc

5220

ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta

5280

agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact

5340

cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg

5400

ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg

5460

aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg

5520

gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt

5580

gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga

5640

tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa

5700

gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc

5760

tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg

5820

tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc

5880

ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg

5940

tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt

6000

cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag

6060

aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa

6120

acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc

6180

tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc

6240

tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg

6300

agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct

6360

ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg

6420

gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac

6480

ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg

6540

ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg

6600

gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg

6660

tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg

6720

aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata

6780

acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc

6840

actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg

6900

acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata

6960

agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc

7020

acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca

7080

tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc

7140

ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc

7200

tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga

7260

gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg

7320

ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca

7380

accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt

7440

cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg

7500

aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca

7560

gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg

7620

cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt

7680

acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa

7740

accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag

7800

ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg

7860

aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcccaga agcttcagcc

7920

agaatagcag acacccctcc accagacaga agcagttcaa cgccacaaca atccccgaga

7980

acgacatcga gaaaaccgat ccttggtttg cccacagaac ccctatgcct aagatccaga

8040

acgtgtcctc cagcgatctg ctgatgctcc tgagacagag ccctacacct cacggactga

8100

gcctgtccga tctgcaagag gccaaatacg aaaccttcag cgacgaccct tctcctggcg

8160

ccatcgacag caacaatagc ctgagcgaga tgacccactt cagaccacag ctgcaccaca

8220

gcggcgacat ggtgtttaca cctgagagcg gcctccagct gagactgaat gagaagctgg

8280

gaaccaccgc cgccaccgag ctgaagaaac tggacttcaa ggtgtcctct accagcaaca

8340

acctgatcag cacaatcccc tccgacaacc tggctgccgg caccgacaac acatcttctc

8400

tgggcccacc tagcatgccc gtgcactacg atagccagct ggataccaca ctgttcggca

8460

agaagtctag ccctctgaca gagtctggcg gccctctgtc tctgagcgag gaaaacaacg

8520

acagcaagct gctggaatcc ggcctgatga acagccaaga gtcctcctgg ggcaagaatg

8580

tgtccagcac cgagtccggc agactgttca agggaaagag agcccacgga cctgctctgc

8640

tgaccaagga taacgccctg ttcaaagtgt ccatcagcct gctcaagacc aacaagacct

8700

ccaacaactc cgccaccaac agaaagaccc acatcgacgg ccctagcctg ctgatcgaga

8760

atagccctag cgtctggcag aatatcctgg aaagcgacac cgagttcaag aaagtgaccc

8820

ctctgatcca cgaccggatg ctcatggaca agaacgccac cgctctgcgg ctgaaccaca

8880

tgagcaacaa gacaaccagc agcaagaata tggaaatggt gcagcagaag aaagagggcc

8940

ccattcctcc agacgctcag aaccccgata tgagcttctt caagatgctc tttctgcccg

9000

agagcgcccg gtggattcag agaacacacg gcaagaactc cctgaactcc ggccagggac

9060

cttctccaaa gcagctggtt tccctgggac ctgagaagtc cgtggaagga cagaacttcc

9120

tgagcgaaaa gaacaaagtg gtcgtcggca agggcgagtt caccaaggat gtgggcctga

9180

aagagatggt ctttcccagc agccggaacc tgttcctgac caacctggac aacctgcacg

9240

agaacaacac ccacaatcaa gagaagaaga tccaagagga aatcgaaaag aaagagacac

9300

tcatccaaga gaacgtggtg ctgcctcaga tccacacagt gaccggcacc aagaacttta

9360

tgaagaatct gttcctgctg agtacccggc agaacgtgga aggcagctac gatggcgctt

9420

atgcccctgt gctgcaggac ttcagatccc tgaacgactc caccaatcgg acaaagaagc

9480

acacagccca cttctccaag aagggcgaag aagagaacct ggaaggactg ggcaatcaga

9540

ccaagcagat cgtcgagaag tacgcctgca ccaccagaat cagccccaac acaagccagc

9600

agaacttcgt gacccagcgg agcaaaagag ccctgaagca gtttcggctg cccctggaag

9660

aaaccgagct ggaaaagcgg atcatcgtgg acgacaccag cacacagtgg tccaagaaca

9720

tgaagcactt gacccctagc acactgaccc agatcgacta caacgagaaa gagaagggcg

9780

ctatcacaca gagcccactg agcgactgtc tgaccagaag ccacagcatc cctcaggcca

9840

acagatcccc tctgccaatc gccaaagtgt ctagcttccc cagcatcaga cccatctacc

9900

tgaccagagt gctgttccag gacaacagca gccatctgcc agccgccagc taccggaaga

9960

aagattctgg cgtgcaagag agcagccact ttctgcaggg cgctaagaag aacaatctga

10020

gcctggctat tctgaccctg gaaatgaccg gcgatcagag agaagtcggc tctctgggca

10080

ccagcgccac aaatagcgtg acctacaaaa aggtggaaaa caccgtgctg cctaagcctg

10140

acctgccaaa gacaagcggc aaggtggaac tgctgccaaa ggtgcacatc taccagaagg

10200

acctgtttcc taccgagaca agcaacggct ctcccggcca tctggatctg gtggaaggat

10260

ctctgctgca gggaaccgag ggcgccatca agtggaacga ggccaataga cctggcaagg

10320

tgcccttcct gagagtggcc acagagtcca gcgccaagac accctctaaa ctgctggacc

10380

ctctggcctg ggacaaccac tatggcactc agatccccaa agaggaatgg aagtcccaag

10440

agaagtcccc tgaaaagacc gccttcaaga agaaggacac cattctgtcc ctgaatgcct

10500

gcgagagcaa ccacgccatt gccgccatca atgagggcca gaacaagccc gagatcgaag

10560

tgacctgggc caagcaggga agaaccgaga gactgtgtag ccagaatcct cctgtgctga

10620

agcggcacca gagagaaatc acccggacca cactgcagag cgaccaagaa gagatcgatt

10680

acgacgatac catcagcgtc gagatgaaga aagaagattt cgacatctac gacgaggacg

10740

agaatcagag ccctcggagc ttccagaaga aaaccaggca ctactttatt gccgccgtcg

10800

agcggctgtg ggactacgga atgtctagct ctcctcacgt gctgcggaat agagcccagt

10860

ctggtagcgt gccccagttc aaaaaggtcg tgttccaaga gttcaccgac ggcagcttca

10920

cccagccact gtatagaggc gagctgaacg agcatctggg cctgctgggc ccttatatca

10980

gagccgaagt ggaagataac atcatggtca ccttccggaa tcaggctagc cggccttaca

11040

gcttctacag ctccctgatc tcctacgaag aggaccagag acagggcgca gagccccgga

11100

agaatttcgt gaagcccaac gagactaaga cctacttttg gaaggtgcag caccatatgg

11160

cccctacaaa ggacgagttc gactgcaaag cctgggccta cttctccgat gtggacctcg

11220

aaaaggacgt gcacagcgga ctcatcggcc cactgcttgt gtgccacacc aacacactga

11280

accccgctca cggcagacaa gtgacagtgc aagagttcgc cctgtttttc accatcttcg

11340

acgaaacgaa gtcctggtac ttcaccgaaa acatggaaag aaactgcagg gccccttgca

11400

acattcagat ggaagatccc accttcaaag agaactaccg gttccacgcc atcaacggct

11460

acatcatgga cacactgccc ggcctggtta tggcccagga tcagagaatc cggtggtatc

11520

tgctgtccat gggctccaac gagaatatcc actccatcca cttcagcggc cacgtgttca

11580

ccgtgcggaa aaaagaagag tacaaaatgg ccctgtacaa tctgtaccct ggggtgttcg

11640

aaaccgttga gatgctgcct agcaaggccg gaatttggag agtggaatgt ctgattggag

11700

agcacctcca cgccgggatg agcaccctgt ttctggtgta ctccaacaag tgtcagaccc

11760

ctctcggcat ggcctctggc cacattagag acttccagat caccgccagc ggacagtatg

11820

gacagtgggc ccctaaactg gccagactgc actactccgg cagcatcaat gcctggtcca

11880

ccaaagagcc tttcagctgg atcaaagtgg acctgctggc tcccatgatc atccacggaa

11940

tcaagaccca gggcgccaga caaaagttca gcagcctgta catcagccag ttcatcatca

12000

tgtacagcct ggacggaaag aagtggcaga cctaccgggg caatagcacc ggcacactga

12060

tggtgttctt cggcaacgtg gactccagcg gcattaagca caacatcttc aaccctccaa

12120

tcattgcccg gtacatccgg ctgcacccca cacactacag catcaggtct accctgagaa

12180

tggaactgat gggctgcgac ctgaacagct gctctatgcc cctcggaatg gaaagcaagg

12240

ccatcagcga cgcccagatc acagcctcta gctacttcac caacatgttc gccacttgga

12300

gcccctctaa ggcccggctt catctgcaag gcagaagcaa cgcttggagg ccccaagtga

12360

acaaccccaa agaatggctc caggtggact ttcagaaaac catgaaagtg acaggcgtga

12420

ccacacaggg cgtcaagtcc ctgctgacct ctatgtacgt gaaagagttt ctgatcagct

12480

ccagccagga cggccaccag tggaccctgt tcttccagaa cggcaaagtg aaagtgttcc

12540

agggaaatca ggacagcttc acacccgtgg tcaatagtct ggacccacca ctgctgaccc

12600

gctacctgcg aattcaccct cagtcttggg tgcaccagat tgccctgcgg atggaagtgc

12660

tgggctgtga agctcaggac ctctactagt taattaagag catcttaccg ccatttattc

12720

ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata aaacaaaatg

12780

gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg tattgccaca

12840

agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta atcaacctct

12900

ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc cttttacgct

12960

gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta cggctttcgt

13020

tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt ggcccgttgt

13080

ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg gctggggcat

13140

tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga tcgccacggc

13200

agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc tgggcactga

13260

taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt gcccctcccc

13320

cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga

13380

aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga

13440

cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat

13500

ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta actacacctg

13560

caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact

13620

gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg

13680

cagctgcctg caggggcgcg cctcgaggca tgcggtacca agcttgtcga gaagtactag

13740

aggatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca

13800

cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt

13860

gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt

13920

ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg

13980

atctgatcac tgatatcgcc taggagatcc gaaccagata agtgaaatct agttccaaac

14040

tattttgtca tttttaattt tcgtattagc ttacgacgct acacccagtt cccatctatt

14100

ttgtcactct tccctaaata atccttaaaa actccatttc cacccctccc agttcccaac

14160

tattttgtcc gcccacagcg gggcattttt cttcctgtta tgtttttaat caaacatcct

14220

gccaactcca tgtgacaaac cgtcatcttc ggctactttt tctctgtcac agaatgaaaa

14280

tttttctgtc atctcttcgt tattaatgtt tgtaattgac tgaatatcaa cgcttatttg

14340

cagcctgaat ggcgaatgg

14359

<210> 193

<211> 11677

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 193

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct

4380

gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag

4440

tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag

4500

caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga

4560

gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag

4620

aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca

4680

cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc

4740

atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca

4800

tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca

4860

ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca

4920

agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag

4980

acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg

5040

ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc

5100

aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag

5160

tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc

5220

ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta

5280

agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact

5340

cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg

5400

ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg

5460

aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg

5520

gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt

5580

gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga

5640

tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa

5700

gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc

5760

tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg

5820

tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc

5880

ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg

5940

tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt

6000

cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag

6060

aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa

6120

acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc

6180

tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc

6240

tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg

6300

agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct

6360

ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg

6420

gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac

6480

ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg

6540

ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg

6600

gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg

6660

tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg

6720

aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata

6780

acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc

6840

actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg

6900

acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata

6960

agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc

7020

acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca

7080

tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc

7140

ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc

7200

tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga

7260

gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg

7320

ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca

7380

accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt

7440

cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg

7500

aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca

7560

gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg

7620

cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt

7680

acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa

7740

accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag

7800

ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg

7860

aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg agcttcagcc

7920

agaatcctcc tgtgctgaag cggcaccagc gcgagatcac cagaacaacc ctgcagagcg

7980

accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa gaagatttcg

8040

acatctacga cgaggacgag aatcagagcc ccagaagctt tcagaaaaag acccggcact

8100

acttcattgc cgccgtcgag agactgtggg actacggcat gtctagcagc cctcacgtgc

8160

tgagaaatag agcccagagc ggcagcgtgc cccagttcaa gaaagtggtg ttccaagagt

8220

tcaccgacgg cagcttcacc cagccactgt atagaggcga gctgaacgag catctgggcc

8280

tgctgggccc ttatatcaga gccgaagtgg aagataacat catggtcacc ttccggaatc

8340

aggctagccg gccttacagc ttctacagct ccctgatcag ctacgaagag gaccagagac

8400

agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc tacttttgga

8460

aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaagcc tgggcctact

8520

tctccgatgt ggatctggaa aaggacgtgc acagcgggct catcggacca ctgcttgtgt

8580

gccacaccaa cacactgaac cccgctcacg gcagacaagt gacagtgcaa gagttcgccc

8640

tgttcttcac catcttcgac gaaacaaaga gctggtactt caccgagaat atggaacgga

8700

actgcagagc cccttgcaac atccagatgg aagatcccac cttcaaagag aactaccggt

8760

tccacgccat caacggctac atcatggaca cactgcccgg cctggttatg gcccaggatc

8820

agagaatccg gtggtatctg ctgtccatgg gctccaacga gaatatccac agcatccact

8880

tcagcggcca cgtgttcacc gtgcggaaaa aagaagagta caaaatggcc ctgtacaatc

8940

tgtaccctgg ggtgttcgaa accgtggaaa tgctgccttc caaggccggc atttggagag

9000

tggaatgtct gattggagag cacctccacg ccggaatgag caccctgttt ctggtgtaca

9060

gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac ttccagatca

9120

ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tcggctgcac tacagcggca

9180

gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac ctgctggctc

9240

ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc agcctgtaca

9300

tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc tacagaggca

9360

acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc attaagcaca

9420

acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca cactacagca

9480

tccggtctac cctgagaatg gaactgatgg gctgcgacct gaacagctgc tctatgcccc

9540

tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc tacttcacca

9600

acatgttcgc cacttggagc ccctccaagg ctagactgca tctgcagggc agaagcaacg

9660

cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggttgacttt caaaagacca

9720

tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct atgtacgtga

9780

aagagttcct gatctccagc agccaggacg gccatcagtg gaccctgttt ttccagaacg

9840

gcaaagtgaa agtgttccag ggcaatcagg acagcttcac acccgtggtc aattctctgg

9900

accctccact gctgaccaga tacctgcgga ttcaccctca gtcttgggtg caccagatcg

9960

ctctgcggat ggaagtgctg ggctgtgaag ctcaggacct ctactagtta attaagagca

10020

tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa

10080

tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag

10140

ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt

10200

tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta

10260

tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc

10320

ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga

10380

ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac

10440

ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc

10500

cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc

10560

taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc

10620

tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct

10680

ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg

10740

gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg

10800

ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt

10860

aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg

10920

cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc

10980

agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg cggtaccaag

11040

cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga ggttttactt

11100

gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt

11160

gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat

11220

ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat

11280

gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga accagataag

11340

tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt acgacgctac

11400

acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac tccatttcca

11460

cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct tcctgttatg

11520

tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg ctactttttc

11580

tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg taattgactg

11640

aatatcaacg cttatttgca gcctgaatgg cgaatgg

11677

<210> 194

<211> 13634

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 194

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca

4380

aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct

4440

gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca

4500

gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc

4560

agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat

4620

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat

4680

attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac

4740

agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc

4800

taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc

4860

tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag

4920

ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat

4980

tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc

5040

gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg

5100

tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg

5160

cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc

5220

atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat

5280

tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac

5340

gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc

5400

cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc

5460

aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc

5520

aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc

5580

aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct

5640

agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg

5700

atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag

5760

gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc

5820

ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag

5880

tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag

5940

gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac

6000

tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc

6060

cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat

6120

atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga

6180

agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa

6240

gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag

6300

agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc

6360

aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc

6420

ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct

6480

ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac

6540

cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc

6600

ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag

6660

atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg

6720

tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat

6780

cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg

6840

cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag

6900

accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag

6960

gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc

7020

ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg

7080

ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac

7140

atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat

7200

agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac

7260

atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg

7320

tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg

7380

tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc

7440

gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc

7500

gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc

7560

accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg

7620

atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc

7680

ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag

7740

tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc

7800

aagctgctgg aatccggcct gatgaacagc caagagtcct cctggggcaa gaatgtgtcc

7860

agcaccgagt ccggcagact gttcaaggga aagagagccc acggacctgc tctgctgacc

7920

aaggataacg ccctgttcaa agtgtccatc agcctgctca agaccaacaa gacctccaac

7980

aactccgcca ccaacagaaa gacccacatc gacggcccta gcctgctgat cgagaatagc

8040

cctagcgtct ggcagaatat cctggaaagc gacaccgagt tcaagaaagt gacccctctg

8100

atccacgacc ggatgctcat ggacaagaac gccaccgctc tgcggctgaa ccacatgagc

8160

aacaagacaa ccagcagcaa gaatatggaa atggtgcagc agaagaaaga gggccccatt

8220

cctccagacg ctcagaaccc cgatatgagc ttcttcaaga tgctctttct gcccgagagc

8280

gcccggtgga ttcagagaac acacggcaag aactccctga actccggcca gggaccttct

8340

ccaaagcagc tggtttccct gggacctgag aagtccgtgg aaggacagaa cttcctgagc

8400

gaaaagaaca aagtggtcgt cggcaagggc gagttcacca aggatgtggg cctgaaagag

8460

atggtctttc ccagcagccg gaacctgttc ctgaccaacc tggacaacct gcacgagaac

8520

aacacccaca atcaagagaa gaagatccaa gaggaaatcg aaaagaaaga gacactcatc

8580

caagagaacg tggtgctgcc tcagatccac acagtgaccg gcaccaagaa ctttatgaag

8640

aatctgttcc tgctgagtac ccggcagaac gtggaaggca gctacgatgg cgcttatgcc

8700

cctgtgctgc aggacttcag atccctgaac gactccacca atcggacaaa gaagcacaca

8760

gcccacttct ccaagaaggg cgaagaagag aacctggaag gactgggcaa tcagaccaag

8820

cagatcgtcg agaagtacgc ctgcaccacc agaatcagcc ccaacacaag ccagcagaac

8880

ttcgtgaccc agcggagcaa aagagccctg aagcagtttc ggctgcccct ggaagaaacc

8940

gagctggaaa agcggatcat cgtggacgac accagcacac agtggtccaa gaacatgaag

9000

cacttgaccc ctagcacact gacccagatc gactacaacg agaaagagaa gggcgctatc

9060

acacagagcc cactgagcga ctgtctgacc agaagccaca gcatccctca ggccaacaga

9120

tcccctctgc caatcgccaa agtgtctagc ttccccagca tcagacccat ctacctgacc

9180

agagtgctgt tccaggacaa cagcagccat ctgccagccg ccagctaccg gaagaaagat

9240

tctggcgtgc aagagagcag ccactttctg cagggcgcta agaagaacaa tctgagcctg

9300

gctattctga ccctggaaat gaccggcgat cagagagaag tcggctctct gggcaccagc

9360

gccacaaata gcgtgaccta caaaaaggtg gaaaacaccg tgctgcctaa gcctgacctg

9420

ccaaagacaa gcggcaaggt ggaactgctg ccaaaggtgc acatctacca gaaggacctg

9480

tttcctaccg agacaagcaa cggctctccc ggccatctgg atctggtgga aggatctctg

9540

ctgcagggaa ccgagggcgc catcaagtgg aacgaggcca atagacctgg caaggtgccc

9600

ttcctgagag tggccacaga gtccagcgcc aagacaccct ctaaactgct ggaccctctg

9660

gcctgggaca accactatgg cactcagatc cccaaagagg aatggaagtc ccaagagaag

9720

tcccctgaaa agaccgcctt caagaagaag gacaccattc tgtccctgaa tgcctgcgag

9780

agcaaccacg ccattgccgc catcaatgag ggccagaaca agcccgagat cgaagtgacc

9840

tgggccaagc agggaagaac cgagagactg tgtagccaga atcctcctgt gctgaagcgg

9900

caccagagag aaatcacccg gaccacactg cagagcgacc aagaagagat cgattacgac

9960

gataccatca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat

10020

cagagccctc ggagcttcca gaagaaaacc aggcactact ttattgccgc cgtcgagcgg

10080

ctgtgggact acggaatgtc tagctctcct cacgtgctgc ggaatagagc ccagtctggt

10140

agcgtgcccc agttcaaaaa ggtcgtgttc caagagttca ccgacggcag cttcacccag

10200

ccactgtata gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc

10260

gaagtggaag ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc

10320

tacagctccc tgatctccta cgaagaggac cagagacagg gcgcagagcc ccggaagaat

10380

ttcgtgaagc ccaacgagac taagacctac ttttggaagg tgcagcacca tatggcccct

10440

acaaaggacg agttcgactg caaagcctgg gcctacttct ccgatgtgga cctcgaaaag

10500

gacgtgcaca gcggactcat cggcccactg cttgtgtgcc acaccaacac actgaacccc

10560

gctcacggca gacaagtgac agtgcaagag ttcgccctgt ttttcaccat cttcgacgaa

10620

acgaagtcct ggtacttcac cgaaaacatg gaaagaaact gcagggcccc ttgcaacatt

10680

cagatggaag atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc

10740

atggacacac tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg

10800

tccatgggct ccaacgagaa tatccactcc atccacttca gcggccacgt gttcaccgtg

10860

cggaaaaaag aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc

10920

gttgagatgc tgcctagcaa ggccggaatt tggagagtgg aatgtctgat tggagagcac

10980

ctccacgccg ggatgagcac cctgtttctg gtgtactcca acaagtgtca gacccctctc

11040

ggcatggcct ctggccacat tagagacttc cagatcaccg ccagcggaca gtatggacag

11100

tgggccccta aactggccag actgcactac tccggcagca tcaatgcctg gtccaccaaa

11160

gagcctttca gctggatcaa agtggacctg ctggctccca tgatcatcca cggaatcaag

11220

acccagggcg ccagacaaaa gttcagcagc ctgtacatca gccagttcat catcatgtac

11280

agcctggacg gaaagaagtg gcagacctac cggggcaata gcaccggcac actgatggtg

11340

ttcttcggca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt

11400

gcccggtaca tccggctgca ccccacacac tacagcatca ggtctaccct gagaatggaa

11460

ctgatgggct gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc

11520

agcgacgccc agatcacagc ctctagctac ttcaccaaca tgttcgccac ttggagcccc

11580

tctaaggccc ggcttcatct gcaaggcaga agcaacgctt ggaggcccca agtgaacaac

11640

cccaaagaat ggctccaggt ggactttcag aaaaccatga aagtgacagg cgtgaccaca

11700

cagggcgtca agtccctgct gacctctatg tacgtgaaag agtttctgat cagctccagc

11760

caggacggcc accagtggac cctgttcttc cagaacggca aagtgaaagt gttccaggga

11820

aatcaggaca gcttcacacc cgtggtcaat agtctggacc caccactgct gacccgctac

11880

ctgcgaattc accctcagtc ttgggtgcac cagattgccc tgcggatgga agtgctgggc

11940

tgtgaagctc aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata

12000

tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg

12060

gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca

12120

aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt

12180

acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg

12240

gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct

12300

cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc

12360

aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca

12420

ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac

12480

tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt

12540

ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc

12600

cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg

12660

catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca

12720

agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc

12780

tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga

12840

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc

12900

cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct

12960

gcctgcaggg gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat

13020

cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct

13080

ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc

13140

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc

13200

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg

13260

atcactgata tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt

13320

tgtcattttt aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc

13380

actcttccct aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt

13440

tgtccgccca cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa

13500

ctccatgtga caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt

13560

ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc

13620

tgaatggcga atgg

13634

<210> 195

<211> 10952

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 195

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca

4380

aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct

4440

gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca

4500

gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc

4560

agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat

4620

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat

4680

attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac

4740

agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc

4800

taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc

4860

tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag

4920

ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat

4980

tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc

5040

gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg

5100

tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg

5160

cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc

5220

atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat

5280

tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac

5340

gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc

5400

cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc

5460

aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc

5520

aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc

5580

aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct

5640

agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg

5700

atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag

5760

gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc

5820

ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag

5880

tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag

5940

gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac

6000

tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc

6060

cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat

6120

atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga

6180

agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa

6240

gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag

6300

agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc

6360

aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc

6420

ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct

6480

ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac

6540

cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc

6600

ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag

6660

atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg

6720

tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat

6780

cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg

6840

cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag

6900

accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag

6960

gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc

7020

ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg

7080

ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac

7140

atcagcgcct acctgctgag caagaacaat gccatcgagc ctcggagctt cagccagaat

7200

cctcctgtgc tgaagcggca ccagcgcgag atcaccagaa caaccctgca gagcgaccaa

7260

gaggaaatcg attacgacga caccatcagc gtcgagatga agaaagaaga tttcgacatc

7320

tacgacgagg acgagaatca gagccccaga agctttcaga aaaagacccg gcactacttc

7380

attgccgccg tcgagagact gtgggactac ggcatgtcta gcagccctca cgtgctgaga

7440

aatagagccc agagcggcag cgtgccccag ttcaagaaag tggtgttcca agagttcacc

7500

gacggcagct tcacccagcc actgtataga ggcgagctga acgagcatct gggcctgctg

7560

ggcccttata tcagagccga agtggaagat aacatcatgg tcaccttccg gaatcaggct

7620

agccggcctt acagcttcta cagctccctg atcagctacg aagaggacca gagacagggc

7680

gctgagccca gaaagaactt cgtgaagccc aacgagacta agacctactt ttggaaggtg

7740

cagcaccaca tggcccctac aaaggacgag ttcgactgca aagcctgggc ctacttctcc

7800

gatgtggatc tggaaaagga cgtgcacagc gggctcatcg gaccactgct tgtgtgccac

7860

accaacacac tgaaccccgc tcacggcaga caagtgacag tgcaagagtt cgccctgttc

7920

ttcaccatct tcgacgaaac aaagagctgg tacttcaccg agaatatgga acggaactgc

7980

agagcccctt gcaacatcca gatggaagat cccaccttca aagagaacta ccggttccac

8040

gccatcaacg gctacatcat ggacacactg cccggcctgg ttatggccca ggatcagaga

8100

atccggtggt atctgctgtc catgggctcc aacgagaata tccacagcat ccacttcagc

8160

ggccacgtgt tcaccgtgcg gaaaaaagaa gagtacaaaa tggccctgta caatctgtac

8220

cctggggtgt tcgaaaccgt ggaaatgctg ccttccaagg ccggcatttg gagagtggaa

8280

tgtctgattg gagagcacct ccacgccgga atgagcaccc tgtttctggt gtacagcaac

8340

aagtgtcaga cccctctcgg catggcctct ggacacatca gagacttcca gatcaccgcc

8400

tctggccagt acggacagtg ggctcctaaa ctggctcggc tgcactacag cggcagcatc

8460

aatgcctggt ccaccaaaga gcccttcagc tggatcaagg tggacctgct ggctcccatg

8520

atcatccacg gaatcaagac ccagggcgcc agacagaagt tcagcagcct gtacatcagc

8580

cagttcatca tcatgtacag cctggacggc aagaagtggc agacctacag aggcaacagc

8640

accggcacac tcatggtgtt cttcggcaac gtggactcca gcggcattaa gcacaacatc

8700

ttcaaccctc caatcattgc ccggtacatc cggctgcacc ccacacacta cagcatccgg

8760

tctaccctga gaatggaact gatgggctgc gacctgaaca gctgctctat gcccctcgga

8820

atggaaagca aggccatcag cgacgcccag atcacagcca gcagctactt caccaacatg

8880

ttcgccactt ggagcccctc caaggctaga ctgcatctgc agggcagaag caacgcttgg

8940

aggccccaag tgaacaaccc caaagagtgg ctgcaggttg actttcaaaa gaccatgaaa

9000

gtgaccggcg tgaccacaca gggcgtcaag tctctgctga cctctatgta cgtgaaagag

9060

ttcctgatct ccagcagcca ggacggccat cagtggaccc tgtttttcca gaacggcaaa

9120

gtgaaagtgt tccagggcaa tcaggacagc ttcacacccg tggtcaattc tctggaccct

9180

ccactgctga ccagatacct gcggattcac cctcagtctt gggtgcacca gatcgctctg

9240

cggatggaag tgctgggctg tgaagctcag gacctctact agttaattaa gagcatctta

9300

ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta

9360

ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag

9420

gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg

9480

ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg

9540

ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc

9600

gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt

9660

tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca

9720

ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc

9780

cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt

9840

tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg

9900

tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct

9960

aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg

10020

gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg

10080

cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca

10140

ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc

10200

tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga

10260

gcgagcgagc gcgcagctgc ctgcaggggc gcgcctcgag gcatgcggta ccaagcttgt

10320

cgagaagtac tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt

10380

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt

10440

taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac

10500

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc

10560

ttatcatgtc tggatctgat cactgatatc gcctaggaga tccgaaccag ataagtgaaa

10620

tctagttcca aactattttg tcatttttaa ttttcgtatt agcttacgac gctacaccca

10680

gttcccatct attttgtcac tcttccctaa ataatcctta aaaactccat ttccacccct

10740

cccagttccc aactattttg tccgcccaca gcggggcatt tttcttcctg ttatgttttt

10800

aatcaaacat cctgccaact ccatgtgaca aaccgtcatc ttcggctact ttttctctgt

10860

cacagaatga aaatttttct gtcatctctt cgttattaat gtttgtaatt gactgaatat

10920

caacgcttat ttgcagcctg aatggcgaat gg

10952

<210> 196

<211> 14266

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 196

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc

4380

ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt

4440

ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg

4500

ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg

4560

ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt

4620

atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg

4680

agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc

4740

ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc

4800

accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac

4860

ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca

4920

ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat

4980

gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag

5040

ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg

5100

caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg

5160

ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca

5220

cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc

5280

gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt

5340

ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta

5400

ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt

5460

ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt

5520

gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc

5580

tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg

5640

actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc

5700

ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca

5760

ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta

5820

caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc

5880

ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg

5940

acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca

6000

cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga

6060

catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag

6120

ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt

6180

tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca

6240

gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga

6300

acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact

6360

ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca

6420

ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga

6480

ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc

6540

accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc

6600

tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga

6660

tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg

6720

ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt

6780

acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg

6840

gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga

6900

cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg

6960

gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca

7020

tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg

7080

tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg

7140

tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca

7200

gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct

7260

acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc

7320

tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc

7380

tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc

7440

actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg

7500

cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg

7560

gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg

7620

gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca

7680

gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca

7740

ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca

7800

atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc

7860

agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc

7920

acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga

7980

gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa

8040

ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga

8100

cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc

8160

tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg

8220

acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg

8280

ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata

8340

gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc

8400

ctctgtctct gagcgaggaa aacaacgaca gcaagctgct ggaatccggc ctgatgaaca

8460

gccaagagtc ctcctggggc aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg

8520

gaaagagagc ccacggacct gctctgctga ccaaggataa cgccctgttc aaagtgtcca

8580

tcagcctgct caagaccaac aagacctcca acaactccgc caccaacaga aagacccaca

8640

tcgacggccc tagcctgctg atcgagaata gccctagcgt ctggcagaat atcctggaaa

8700

gcgacaccga gttcaagaaa gtgacccctc tgatccacga ccggatgctc atggacaaga

8760

acgccaccgc tctgcggctg aaccacatga gcaacaagac aaccagcagc aagaatatgg

8820

aaatggtgca gcagaagaaa gagggcccca ttcctccaga cgctcagaac cccgatatga

8880

gcttcttcaa gatgctcttt ctgcccgaga gcgcccggtg gattcagaga acacacggca

8940

agaactccct gaactccggc cagggacctt ctccaaagca gctggtttcc ctgggacctg

9000

agaagtccgt ggaaggacag aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg

9060

gcgagttcac caaggatgtg ggcctgaaag agatggtctt tcccagcagc cggaacctgt

9120

tcctgaccaa cctggacaac ctgcacgaga acaacaccca caatcaagag aagaagatcc

9180

aagaggaaat cgaaaagaaa gagacactca tccaagagaa cgtggtgctg cctcagatcc

9240

acacagtgac cggcaccaag aactttatga agaatctgtt cctgctgagt acccggcaga

9300

acgtggaagg cagctacgat ggcgcttatg cccctgtgct gcaggacttc agatccctga

9360

acgactccac caatcggaca aagaagcaca cagcccactt ctccaagaag ggcgaagaag

9420

agaacctgga aggactgggc aatcagacca agcagatcgt cgagaagtac gcctgcacca

9480

ccagaatcag ccccaacaca agccagcaga acttcgtgac ccagcggagc aaaagagccc

9540

tgaagcagtt tcggctgccc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg

9600

acaccagcac acagtggtcc aagaacatga agcacttgac ccctagcaca ctgacccaga

9660

tcgactacaa cgagaaagag aagggcgcta tcacacagag cccactgagc gactgtctga

9720

ccagaagcca cagcatccct caggccaaca gatcccctct gccaatcgcc aaagtgtcta

9780

gcttccccag catcagaccc atctacctga ccagagtgct gttccaggac aacagcagcc

9840

atctgccagc cgccagctac cggaagaaag attctggcgt gcaagagagc agccactttc

9900

tgcagggcgc taagaagaac aatctgagcc tggctattct gaccctggaa atgaccggcg

9960

atcagagaga agtcggctct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg

10020

tggaaaacac cgtgctgcct aagcctgacc tgccaaagac aagcggcaag gtggaactgc

10080

tgccaaaggt gcacatctac cagaaggacc tgtttcctac cgagacaagc aacggctctc

10140

ccggccatct ggatctggtg gaaggatctc tgctgcaggg aaccgagggc gccatcaagt

10200

ggaacgaggc caatagacct ggcaaggtgc ccttcctgag agtggccaca gagtccagcg

10260

ccaagacacc ctctaaactg ctggaccctc tggcctggga caaccactat ggcactcaga

10320

tccccaaaga ggaatggaag tcccaagaga agtcccctga aaagaccgcc ttcaagaaga

10380

aggacaccat tctgtccctg aatgcctgcg agagcaacca cgccattgcc gccatcaatg

10440

agggccagaa caagcccgag atcgaagtga cctgggccaa gcagggaaga accgagagac

10500

tgtgtagcca gaatcctcct gtgctgaagc ggcaccagag agaaatcacc cggaccacac

10560

tgcagagcga ccaagaagag atcgattacg acgataccat cagcgtcgag atgaagaaag

10620

aagatttcga catctacgac gaggacgaga atcagagccc tcggagcttc cagaagaaaa

10680

ccaggcacta ctttattgcc gccgtcgagc ggctgtggga ctacggaatg tctagctctc

10740

ctcacgtgct gcggaataga gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt

10800

tccaagagtt caccgacggc agcttcaccc agccactgta tagaggcgag ctgaacgagc

10860

atctgggcct gctgggccct tatatcagag ccgaagtgga agataacatc atggtcacct

10920

tccggaatca ggctagccgg ccttacagct tctacagctc cctgatctcc tacgaagagg

10980

accagagaca gggcgcagag ccccggaaga atttcgtgaa gcccaacgag actaagacct

11040

acttttggaa ggtgcagcac catatggccc ctacaaagga cgagttcgac tgcaaagcct

11100

gggcctactt ctccgatgtg gacctcgaaa aggacgtgca cagcggactc atcggcccac

11160

tgcttgtgtg ccacaccaac acactgaacc ccgctcacgg cagacaagtg acagtgcaag

11220

agttcgccct gtttttcacc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca

11280

tggaaagaaa ctgcagggcc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga

11340

actaccggtt ccacgccatc aacggctaca tcatggacac actgcccggc ctggttatgg

11400

cccaggatca gagaatccgg tggtatctgc tgtccatggg ctccaacgag aatatccact

11460

ccatccactt cagcggccac gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc

11520

tgtacaatct gtaccctggg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa

11580

tttggagagt ggaatgtctg attggagagc acctccacgc cgggatgagc accctgtttc

11640

tggtgtactc caacaagtgt cagacccctc tcggcatggc ctctggccac attagagact

11700

tccagatcac cgccagcgga cagtatggac agtgggcccc taaactggcc agactgcact

11760

actccggcag catcaatgcc tggtccacca aagagccttt cagctggatc aaagtggacc

11820

tgctggctcc catgatcatc cacggaatca agacccaggg cgccagacaa aagttcagca

11880

gcctgtacat cagccagttc atcatcatgt acagcctgga cggaaagaag tggcagacct

11940

accggggcaa tagcaccggc acactgatgg tgttcttcgg caacgtggac tccagcggca

12000

ttaagcacaa catcttcaac cctccaatca ttgcccggta catccggctg caccccacac

12060

actacagcat caggtctacc ctgagaatgg aactgatggg ctgcgacctg aacagctgct

12120

ctatgcccct cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gcctctagct

12180

acttcaccaa catgttcgcc acttggagcc cctctaaggc ccggcttcat ctgcaaggca

12240

gaagcaacgc ttggaggccc caagtgaaca accccaaaga atggctccag gtggactttc

12300

agaaaaccat gaaagtgaca ggcgtgacca cacagggcgt caagtccctg ctgacctcta

12360

tgtacgtgaa agagtttctg atcagctcca gccaggacgg ccaccagtgg accctgttct

12420

tccagaacgg caaagtgaaa gtgttccagg gaaatcagga cagcttcaca cccgtggtca

12480

atagtctgga cccaccactg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc

12540

accagattgc cctgcggatg gaagtgctgg gctgtgaagc tcaggacctc tactagttaa

12600

ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat

12660

acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt

12720

aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt

12780

acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat

12840

tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct

12900

agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc

12960

tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc

13020

tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt

13080

cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg

13140

gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg

13200

ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc

13260

cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc

13320

tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag

13380

gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca

13440

tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact

13500

ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg

13560

ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc

13620

ggtaccaagc ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag

13680

gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat

13740

gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc

13800

atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa

13860

ctcatcaatg tatcttatca tgtctggatc tgatcactga tatcgcctag gagatccgaa

13920

ccagataagt gaaatctagt tccaaactat tttgtcattt ttaattttcg tattagctta

13980

cgacgctaca cccagttccc atctattttg tcactcttcc ctaaataatc cttaaaaact

14040

ccatttccac ccctcccagt tcccaactat tttgtccgcc cacagcgggg catttttctt

14100

cctgttatgt ttttaatcaa acatcctgcc aactccatgt gacaaaccgt catcttcggc

14160

tactttttct ctgtcacaga atgaaaattt ttctgtcatc tcttcgttat taatgtttgt

14220

aattgactga atatcaacgc ttatttgcag cctgaatggc gaatgg

14266

<210> 197

<211> 11584

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 197

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc

4380

ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt

4440

ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg

4500

ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg

4560

ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt

4620

atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg

4680

agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc

4740

ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc

4800

accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac

4860

ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca

4920

ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat

4980

gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag

5040

ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg

5100

caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg

5160

ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca

5220

cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc

5280

gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt

5340

ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta

5400

ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt

5460

ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt

5520

gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc

5580

tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg

5640

actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc

5700

ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca

5760

ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta

5820

caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc

5880

ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg

5940

acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca

6000

cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga

6060

catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag

6120

ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt

6180

tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca

6240

gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga

6300

acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact

6360

ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca

6420

ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga

6480

ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc

6540

accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc

6600

tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga

6660

tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg

6720

ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt

6780

acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg

6840

gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga

6900

cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg

6960

gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca

7020

tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg

7080

tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg

7140

tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca

7200

gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct

7260

acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc

7320

tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc

7380

tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc

7440

actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg

7500

cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg

7560

gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg

7620

gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca

7680

gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca

7740

ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca

7800

atgccatcga gcctcggagc ttcagccaga atcctcctgt gctgaagcgg caccagcgcg

7860

agatcaccag aacaaccctg cagagcgacc aagaggaaat cgattacgac gacaccatca

7920

gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat cagagcccca

7980

gaagctttca gaaaaagacc cggcactact tcattgccgc cgtcgagaga ctgtgggact

8040

acggcatgtc tagcagccct cacgtgctga gaaatagagc ccagagcggc agcgtgcccc

8100

agttcaagaa agtggtgttc caagagttca ccgacggcag cttcacccag ccactgtata

8160

gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc gaagtggaag

8220

ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc tacagctccc

8280

tgatcagcta cgaagaggac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc

8340

ccaacgagac taagacctac ttttggaagg tgcagcacca catggcccct acaaaggacg

8400

agttcgactg caaagcctgg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca

8460

gcgggctcat cggaccactg cttgtgtgcc acaccaacac actgaacccc gctcacggca

8520

gacaagtgac agtgcaagag ttcgccctgt tcttcaccat cttcgacgaa acaaagagct

8580

ggtacttcac cgagaatatg gaacggaact gcagagcccc ttgcaacatc cagatggaag

8640

atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc atggacacac

8700

tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg tccatgggct

8760

ccaacgagaa tatccacagc atccacttca gcggccacgt gttcaccgtg cggaaaaaag

8820

aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc gtggaaatgc

8880

tgccttccaa ggccggcatt tggagagtgg aatgtctgat tggagagcac ctccacgccg

8940

gaatgagcac cctgtttctg gtgtacagca acaagtgtca gacccctctc ggcatggcct

9000

ctggacacat cagagacttc cagatcaccg cctctggcca gtacggacag tgggctccta

9060

aactggctcg gctgcactac agcggcagca tcaatgcctg gtccaccaaa gagcccttca

9120

gctggatcaa ggtggacctg ctggctccca tgatcatcca cggaatcaag acccagggcg

9180

ccagacagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg

9240

gcaagaagtg gcagacctac agaggcaaca gcaccggcac actcatggtg ttcttcggca

9300

acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt gcccggtaca

9360

tccggctgca ccccacacac tacagcatcc ggtctaccct gagaatggaa ctgatgggct

9420

gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc agcgacgccc

9480

agatcacagc cagcagctac ttcaccaaca tgttcgccac ttggagcccc tccaaggcta

9540

gactgcatct gcagggcaga agcaacgctt ggaggcccca agtgaacaac cccaaagagt

9600

ggctgcaggt tgactttcaa aagaccatga aagtgaccgg cgtgaccaca cagggcgtca

9660

agtctctgct gacctctatg tacgtgaaag agttcctgat ctccagcagc caggacggcc

9720

atcagtggac cctgtttttc cagaacggca aagtgaaagt gttccagggc aatcaggaca

9780

gcttcacacc cgtggtcaat tctctggacc ctccactgct gaccagatac ctgcggattc

9840

accctcagtc ttgggtgcac cagatcgctc tgcggatgga agtgctgggc tgtgaagctc

9900

aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tttgttctgt

9960

ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt

10020

acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa

10080

gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg

10140

tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc

10200

tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta

10260

taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt

10320

ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca

10380

actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc

10440

ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt

10500

gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac

10560

cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg

10620

tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga

10680

ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc tagagcatgg

10740

ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga ggaaccccta

10800

gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca

10860

aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg

10920

gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat cataatcagc

10980

cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac

11040

ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt

11100

tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct

11160

agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg atcactgata

11220

tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt tgtcattttt

11280

aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc actcttccct

11340

aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt tgtccgccca

11400

cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa ctccatgtga

11460

caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctgtcatctc

11520

ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc tgaatggcga

11580

atgg

11584

<210> 198

<211> 11558

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 198

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca

4380

aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct

4440

gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca

4500

gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc

4560

agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat

4620

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat

4680

attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac

4740

agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc

4800

taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc

4860

tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag

4920

ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat

4980

tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc

5040

gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg

5100

tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg

5160

cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc

5220

atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat

5280

tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac

5340

gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc

5400

cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc

5460

aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc

5520

aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc

5580

aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct

5640

agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg

5700

atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag

5760

gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc

5820

ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag

5880

tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag

5940

gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac

6000

tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc

6060

cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat

6120

atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga

6180

agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa

6240

gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag

6300

agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc

6360

aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc

6420

ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct

6480

ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac

6540

cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc

6600

ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag

6660

atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg

6720

tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat

6780

cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg

6840

cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag

6900

accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag

6960

gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc

7020

ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg

7080

ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac

7140

atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat

7200

agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac

7260

atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg

7320

tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg

7380

tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc

7440

gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc

7500

gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc

7560

accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg

7620

atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc

7680

ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag

7740

tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc

7800

aagctgcctc ctgtgctgaa gcggcaccag cgggaaatca ccagaaccac actgcagagc

7860

gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc

7920

gacatctacg acgaggacga gaatcagagc cccagatcct ttcagaaaaa gacccggcac

7980

tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg

8040

ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag

8100

ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc

8160

ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat

8220

caggctagcc ggccttacag cttctacagc tccctgatct cctacgaaga ggaccagaga

8280

cagggcgctg agccccggaa gaatttcgtg aagcccaacg agactaagac ctacttttgg

8340

aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac

8400

ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg

8460

tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc

8520

ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg

8580

aactgcaggg ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg

8640

ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat

8700

cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac

8760

ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat

8820

ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga

8880

gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac

8940

tccaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc

9000

accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctactccggc

9060

agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct

9120

cccatgatca tccacggaat caagacccag ggcgcaagac agaagttcag cagcctgtac

9180

atcagccagt tcatcatcat gtacagcctg gacggaaaga agtggcagac ctaccggggc

9240

aatagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac

9300

aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc

9360

atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc

9420

ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc

9480

aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac

9540

gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc

9600

atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg

9660

aaagagttcc tgattagcag cagccaggac ggccaccagt ggaccctgtt tttccagaac

9720

ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg

9780

gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc

9840

gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc

9900

atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa

9960

atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta

10020

gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg

10080

ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact

10140

atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg

10200

cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag

10260

aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa

10320

cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc

10380

ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg

10440

ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat

10500

ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc

10560

tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg

10620

ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg

10680

gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag catggcgggt

10740

taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct

10800

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

10860

cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa

10920

gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact

10980

tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt

11040

tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa

11100

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa

11160

tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa

11220

gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta

11280

cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc

11340

acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat

11400

gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt

11460

ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact

11520

gaatatcaac gcttatttgc agcctgaatg gcgaatgg

11558

<210> 199

<211> 12190

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 199

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc

60

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc

120

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt

180

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg

240

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt

300

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta

360

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt

420

aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat

480

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg

540

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa

600

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac

660

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac

720

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt

780

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc

840

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca

900

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc

960

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag

1020

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa

1080

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg

1140

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa

1200

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg

1260

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt

1320

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt

1380

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag

1440

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat

1500

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct

1560

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct

1620

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca

1680

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc

1740

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc

1800

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct

1860

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag

1920

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc

1980

tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg

2040

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag

2100

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt

2160

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac

2220

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg

2280

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc

2340

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg

2400

cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct

2460

ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga

2520

caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag

2580

acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt

2640

tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga

2700

ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac

2760

aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg

2820

tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg

2880

ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca

2940

tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact

3000

gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc

3060

gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta

3120

cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct

3180

ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg

3240

agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg

3300

ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca

3360

tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa

3420

acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa

3480

ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca

3540

ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac

3600

cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc

3660

ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg

3720

cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt

3780

ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt

3840

gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa

3900

tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt

3960

ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca

4020

ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg

4080

attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc

4140

ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt

4200

cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc

4260

aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg

4320

tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc

4380

ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt

4440

ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg

4500

ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg

4560

ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt

4620

atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg

4680

agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc

4740

ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc

4800

accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac

4860

ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca

4920

ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat

4980

gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag

5040

ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg

5100

caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg

5160

ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca

5220

cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc

5280

gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt

5340

ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta

5400

ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt

5460

ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt

5520

gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc

5580

tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg

5640

actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc

5700

ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca

5760

ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta

5820

caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc

5880

ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg

5940

acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca

6000

cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga

6060

catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag

6120

ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt

6180

tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca

6240

gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga

6300

acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact

6360

ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca

6420

ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga

6480

ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc

6540

accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc

6600

tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga

6660

tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg

6720

ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt

6780

acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg

6840

gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga

6900

cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg

6960

gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca

7020

tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg

7080

tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg

7140

tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca

7200

gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct

7260

acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc

7320

tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc

7380

tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc

7440

actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg

7500

cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg

7560

gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg

7620

gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca

7680

gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca

7740

ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca

7800

atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc

7860

agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc

7920

acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga

7980

gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa

8040

ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga

8100

cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc

8160

tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg

8220

acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg

8280

ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata

8340

gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc

8400

ctctgtctct gagcgaggaa aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc

8460

agcgggaaat caccagaacc acactgcaga gcgaccaaga ggaaatcgat tacgacgaca

8520

ccatcagcgt cgagatgaag aaagaagatt tcgacatcta cgacgaggac gagaatcaga

8580

gccccagatc ctttcagaaa aagacccggc actacttcat tgccgccgtc gagagactgt

8640

gggactacgg catgtctagc agccctcacg tgctgagaaa tagagcccag agcggcagcg

8700

tgccccagtt caagaaagtg gtgttccaag agttcaccga cggcagcttc acccagccac

8760

tgtatagagg cgagctgaac gagcatctgg gcctgctggg cccttatatc agagccgaag

8820

tggaagataa catcatggtc accttccgga atcaggctag ccggccttac agcttctaca

8880

gctccctgat ctcctacgaa gaggaccaga gacagggcgc tgagccccgg aagaatttcg

8940

tgaagcccaa cgagactaag acctactttt ggaaggtgca gcaccacatg gcccctacaa

9000

aggacgagtt cgactgcaaa gcctgggcct acttctccga tgtggatctg gaaaaggacg

9060

tgcacagcgg gctcatcgga ccactgcttg tgtgccacac caacacactg aaccccgctc

9120

acggcagaca agtgacagtg caagagttcg ccctgttctt caccatcttc gacgaaacaa

9180

agagctggta cttcaccgag aatatggaac ggaactgcag ggccccttgc aacatccaga

9240

tggaagatcc caccttcaaa gagaactacc ggttccacgc catcaacggc tacatcatgg

9300

acacactgcc cggcctggtt atggcccagg atcagagaat ccggtggtat ctgctgtcca

9360

tgggctccaa cgagaatatc cacagcatcc acttcagcgg ccacgtgttc accgtgcgga

9420

aaaaagaaga gtacaaaatg gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg

9480

aaatgctgcc ttccaaggcc ggcatttgga gagtggaatg tctgattgga gagcacctcc

9540

acgccggaat gagcaccctg tttctggtgt actccaacaa gtgtcagacc cctctcggca

9600

tggcctctgg acacatcaga gacttccaga tcaccgcctc tggccagtac ggacagtggg

9660

ctcctaaact ggctcggctg cactactccg gcagcatcaa tgcctggtcc accaaagagc

9720

ccttcagctg gatcaaggtg gacctgctgg ctcccatgat catccacgga atcaagaccc

9780

agggcgcaag acagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc

9840

tggacggaaa gaagtggcag acctaccggg gcaatagcac cggcacactc atggtgttct

9900

tcggcaacgt ggactccagc ggcattaagc acaacatctt caaccctcca atcattgccc

9960

ggtacatccg gctgcacccc acacactaca gcatccggtc taccctgaga atggaactga

10020

tgggctgcga cctgaacagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg

10080

acgcccagat cacagccagc agctacttca ccaacatgtt cgccacttgg agcccctcca

10140

aggctagact gcatctgcag ggcagaagca acgcttggag gccccaagtg aacaacccca

10200

aagagtggct gcaggttgac tttcaaaaga ccatgaaagt gaccggcgtg accacacagg

10260

gcgtcaagtc tctgctgacc tctatgtacg tgaaagagtt cctgattagc agcagccagg

10320

acggccacca gtggaccctg tttttccaga acggcaaagt gaaagtgttc cagggcaatc

10380

aggacagctt cacacccgtg gtcaattctc tggaccctcc actgctgacc agatacctgc

10440

ggattcaccc tcagtcttgg gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg

10500

aagctcagga cctctactag ttaattaaga gcatcttacc gccatttatt cccatatttg

10560

ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa

10620

tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca

10680

tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa

10740

aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata

10800

tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc

10860

cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg

10920

tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac

10980

ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat

11040

cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt

11100

ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc

11160

cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc

11220

gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg

11280

ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga

11340

gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa

11400

cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg

11460

cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct

11520

gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata

11580

atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc

11640

ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat

11700

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg

11760

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca

11820

ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc

11880

atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc

11940

ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc

12000

cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc

12060

atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt

12120

catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa

12180

tggcgaatgg

12190

<210> 200

<211> 12165

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 200

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240

atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg

300

cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag

360

cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc

420

cgccatgcta cttatcgcgg ccgctcaata ttggccatta gccatattat tcattggtta

480

tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat atcataatat

540

gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat tattgactag

600

ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt

660

tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac

720

gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg

780

ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag

840

tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat

900

gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat

960

ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc

1020

aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg

1080

ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg

1140

tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg

1200

gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc

1260

ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg

1320

cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct

1380

tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg

1440

agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg

1500

agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc

1560

tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg

1620

gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag

1680

ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc ccgagttgct

1740

gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg

1800

ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg

1860

gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg

1920

agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc

1980

caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg

2040

gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg

2100

cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt

2160

tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc

2220

ctctgctaac catgttttag cctttcttct ttttcctaca gctcctgggc aacgtgctgg

2280

ttattgtgct gtctcatcat ttgtcgacag aattcctcga agatccgaag gggttcaagc

2340

ttggcattcc ggtactgttg gtaaagccag tttaaaccgc agccaccatg cagatcgagc

2400

tgtctacctg cttcttcctg tgcctgctgc ggttctgctt cagcgccacc agaagatatt

2460

acctgggcgc cgtggaactg agctgggact acatgcagtc tgacctggga gagctgcccg

2520

tggacgctag atttcctcca agagtgccca agagcttccc cttcaacacc tccgtggtgt

2580

acaagaaaac cctgttcgtg gaattcaccg accacctgtt caatatcgcc aagcctcggc

2640

ctccttggat gggactgctg ggacctacaa ttcaggccga ggtgtacgac accgtggtca

2700

tcaccctgaa gaacatggcc agccatcctg tgtctctgca cgccgtggga gtgtcttatt

2760

ggaaggcttc tgagggcgcc gagtacgacg atcagacaag ccagagagag aaagaggacg

2820

acaaggtttt ccctggcggc agccacacct atgtctggca ggtcctgaaa gaaaacggcc

2880

ctatggcctc cgatcctctg tgcctgacat acagctacct gagccacgtg gacctggtca

2940

aggacctgaa ttctggcctg atcggagccc tgctcgtgtg tagagaaggc agcctggcca

3000

aagagaaaac ccagacactg cacaagttca tcctgctgtt cgccgtgttc gacgagggca

3060

agagctggca cagcgagaca aagaacagcc tgatgcagga cagggatgcc gcctctgcta

3120

gagcttggcc taagatgcac accgtgaacg gctacgtgaa cagaagcctg cctggactga

3180

tcggctgcca cagaaagtcc gtgtactggc acgtgatcgg catgggcaca acacctgagg

3240

tgcacagcat ctttctggaa ggccacacct tcctcgtgcg gaaccacaga caggccagcc

3300

tggaaatcag ccctatcacc ttcctgaccg ctcagaccct gctgatggat ctgggccagt

3360

ttctgctgtt ctgccacatc agctcccacc agcacgatgg catggaagcc tacgtgaagg

3420

tggacagctg ccccgaagaa ccccagctgc ggatgaagaa caacgaggaa gccgaggact

3480

acgacgacga cctgaccgac tctgagatgg acgtcgtcag attcgacgac gataacagcc

3540

ccagcttcat ccagatcaga agcgtggcca agaagcaccc caagacctgg gtgcactata

3600

tcgccgccga ggaagaggac tgggattacg ctcctctggt gctggcccct gacgacagaa

3660

gctacaagag ccagtacctg aacaacggcc ctcagcggat cggccggaag tataagaaag

3720

tgcggttcat ggcctacacc gacgagacat tcaagaccag agaggccatc cagcacgaga

3780

gcggaattct gggccctctg ctgtatggcg aagtgggcga tacactgctg atcatcttca

3840

agaaccaggc cagcagaccc tacaacatct accctcacgg catcaccgat gtgcggcccc

3900

tgtattctag aaggctgccc aagggcgtga agcacctgaa ggacttccct atcctgcctg

3960

gcgagatttt caagtacaag tggaccgtga ccgtggaaga tggccccacc aagagcgacc

4020

ctagatgtct gacacggtac tacagcagct tcgtgaacat ggaacgcgac ctggccagcg

4080

gcctgattgg acctctgctg atctgctaca aagaaagcgt ggaccagcgg ggcaaccaga

4140

tcatgagcga caagcggaac gtgatcctgt ttagcgtgtt cgatgagaac cggtcctggt

4200

atctgaccga gaacatccag cggtttctgc ccaatcctgc cggggtgcaa ctggaagatc

4260

ctgagttcca ggcaagcaac atcatgcact ccatcaatgg ctatgtgttc gacagcctgc

4320

agctgagcgt gtgcctgcac gaagtggcct actggtacat cctgagcatt ggcgcccaga

4380

ccgacttcct gtccgtgttc tttagcggct acaccttcaa gcacaagatg gtgtacgagg

4440

ataccctgac actgttccca ttcagcggcg agacagtgtt catgagcatg gaaaaccccg

4500

gcctgtggat tctgggctgt cacaacagcg acttccggaa cagaggcatg acagccctgc

4560

tgaaggtgtc cagctgcgac aagaacaccg gcgactacta cgaggacagc tatgaggaca

4620

tcagcgccta cctgctgagc aagaacaatg ccatcgagcc tcggagcttc agccagaatc

4680

ctcctgtgct gaagcggcac cagcgcgaga tcaccagaac aaccctgcag agcgaccaag

4740

aggaaatcga ttacgacgac accatcagcg tcgagatgaa gaaagaagat ttcgacatct

4800

acgacgagga cgagaatcag agccccagaa gctttcagaa aaagacccgg cactacttca

4860

ttgccgccgt cgagagactg tgggactacg gcatgtctag cagccctcac gtgctgagaa

4920

atagagccca gagcggcagc gtgccccagt tcaagaaagt ggtgttccaa gagttcaccg

4980

acggcagctt cacccagcca ctgtatagag gcgagctgaa cgagcatctg ggcctgctgg

5040

gcccttatat cagagccgaa gtggaagata acatcatggt caccttccgg aatcaggcta

5100

gccggcctta cagcttctac agctccctga tcagctacga agaggaccag agacagggcg

5160

ctgagcccag aaagaacttc gtgaagccca acgagactaa gacctacttt tggaaggtgc

5220

agcaccacat ggcccctaca aaggacgagt tcgactgcaa agcctgggcc tacttctccg

5280

atgtggatct ggaaaaggac gtgcacagcg ggctcatcgg accactgctt gtgtgccaca

5340

ccaacacact gaaccccgct cacggcagac aagtgacagt gcaagagttc gccctgttct

5400

tcaccatctt cgacgaaaca aagagctggt acttcaccga gaatatggaa cggaactgca

5460

gagccccttg caacatccag atggaagatc ccaccttcaa agagaactac cggttccacg

5520

ccatcaacgg ctacatcatg gacacactgc ccggcctggt tatggcccag gatcagagaa

5580

tccggtggta tctgctgtcc atgggctcca acgagaatat ccacagcatc cacttcagcg

5640

gccacgtgtt caccgtgcgg aaaaaagaag agtacaaaat ggccctgtac aatctgtacc

5700

ctggggtgtt cgaaaccgtg gaaatgctgc cttccaaggc cggcatttgg agagtggaat

5760

gtctgattgg agagcacctc cacgccggaa tgagcaccct gtttctggtg tacagcaaca

5820

agtgtcagac ccctctcggc atggcctctg gacacatcag agacttccag atcaccgcct

5880

ctggccagta cggacagtgg gctcctaaac tggctcggct gcactacagc ggcagcatca

5940

atgcctggtc caccaaagag cccttcagct ggatcaaggt ggacctgctg gctcccatga

6000

tcatccacgg aatcaagacc cagggcgcca gacagaagtt cagcagcctg tacatcagcc

6060

agttcatcat catgtacagc ctggacggca agaagtggca gacctacaga ggcaacagca

6120

ccggcacact catggtgttc ttcggcaacg tggactccag cggcattaag cacaacatct

6180

tcaaccctcc aatcattgcc cggtacatcc ggctgcaccc cacacactac agcatccggt

6240

ctaccctgag aatggaactg atgggctgcg acctgaacag ctgctctatg cccctcggaa

6300

tggaaagcaa ggccatcagc gacgcccaga tcacagccag cagctacttc accaacatgt

6360

tcgccacttg gagcccctcc aaggctagac tgcatctgca gggcagaagc aacgcttgga

6420

ggccccaagt gaacaacccc aaagagtggc tgcaggttga ctttcaaaag accatgaaag

6480

tgaccggcgt gaccacacag ggcgtcaagt ctctgctgac ctctatgtac gtgaaagagt

6540

tcctgatctc cagcagccag gacggccatc agtggaccct gtttttccag aacggcaaag

6600

tgaaagtgtt ccagggcaat caggacagct tcacacccgt ggtcaattct ctggaccctc

6660

cactgctgac cagatacctg cggattcacc ctcagtcttg ggtgcaccag atcgctctgc

6720

ggatggaagt gctgggctgt gaagctcagg acctctacta gttaattaag agcatcttac

6780

cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa

6840

taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg

6900

tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt

6960

taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc

7020

tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg

7080

tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt

7140

gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac

7200

tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc

7260

gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt

7320

gctgggcact gataattccg tggtgttgtc atcgattcca taaagtagga aacactacac

7380

gattccataa agtaggaaac actacatcac tccataaagt aggaaacact acagttaact

7440

gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg

7500

gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg

7560

agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg

7620

gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcggcgcg ccgcatggct

7680

acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt

7740

gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa

7800

ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggtcg

7860

acgctagcag ctgatgcata gcatgcggta ccgggagatg ggggaggcta actgaaacac

7920

ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa

7980

cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct

8040

gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca

8100

ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc

8160

cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg

8220

cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca

8280

gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat

8340

ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg

8400

agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc

8460

ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat

8520

aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca

8580

gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg

8640

actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg

8700

gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag

8760

cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt

8820

aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag

8880

ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg

8940

ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct

9000

ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat

9060

ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc

9120

aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac

9180

gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat

9240

atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg

9300

gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac

9360

gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca

9420

taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat

9480

tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt

9540

tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt

9600

ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa

9660

taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg

9720

ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg

9780

gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag

9840

gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga

9900

cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct

9960

ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc

10020

tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg

10080

gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc

10140

tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca

10200

ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag

10260

ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct

10320

ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc

10380

accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga

10440

tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca

10500

cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat

10560

taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac

10620

caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt

10680

gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt

10740

gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag

10800

ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct

10860

attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt

10920

gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc

10980

tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt

11040

agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg

11100

gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg

11160

actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct

11220

tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc

11280

attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt

11340

tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt

11400

tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg

11460

aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat

11520

tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg

11580

cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc

11640

gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc

11700

ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag

11760

agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc

11820

gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa

11880

gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg

11940

aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt

12000

gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc

12060

gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt

12120

aataacgaag agatgacaga aaaattttca ttctgtgaca gagaa

12165

<210> 201

<211> 11512

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 201

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240

atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg

300

cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag

360

cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc

420

cgccatgcta cttatcgcgg ccgcaggctc agaggcacac aggagtttct gggctcaccc

480

tgcccccttc caacccctca gttcccatcc tccagcagct gtttgtgtgc tgcctctgaa

540

gtccacactg aacaaacttc agcctactca tgtccctaaa atgggcaaac attgcaagca

600

gcaaacagca aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag

660

agacctctct gggcccatgc cacctccaac atccactcga ccccttggaa tttcggtgga

720

gaggagcaga ggttgtcctg gcgtggttta ggtagtgtga gagggtccgg gttcaaaacc

780

acttgctggg tggggagtcg tcagtaagtg gctatgcccc gaccccgaag cctgtttccc

840

catctgtaca atggaaatga taaagacgcc catctgatag ggtttttgtg gcaaataaac

900

atttggtttt tttgttttgt tttgttttgt tttttgagat ggaggtttgc tctgtcgccc

960

aggctggagt gcagtgacac aatctcatct caccacaacc ttcccctgcc tcagcctccc

1020

aagtagctgg gattacaagc atgtgccacc acacctggct aattttctat ttttagtaga

1080

gacgggtttc tccatgttgg tcagcctcag cctcccaagt aactgggatt acaggcctgt

1140

gccaccacac ccggctaatt ttttctattt ttgacaggga cggggtttca ccatgttggt

1200

caggctggtc tagaggtacc ggatcttgct accagtggaa cagccactaa ggattctgca

1260

gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc

1320

cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt

1380

aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac

1440

tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg

1500

gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac

1560

gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatcc

1620

ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat

1680

tgtttctctc ttttagattc caacctttgg aactgagttt aaaccgcagc caccatgcag

1740

atcgagctgt ctacctgctt cttcctgtgc ctgctgcggt tctgcttcag cgccaccaga

1800

agatattacc tgggcgccgt ggaactgagc tgggactaca tgcagtctga cctgggagag

1860

ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga gcttcccctt caacacctcc

1920

gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc acctgttcaa tatcgccaag

1980

cctcggcctc cttggatggg actgctggga cctacaattc aggccgaggt gtacgacacc

2040

gtggtcatca ccctgaagaa catggccagc catcctgtgt ctctgcacgc cgtgggagtg

2100

tcttattgga aggcttctga gggcgccgag tacgacgatc agacaagcca gagagagaaa

2160

gaggacgaca aggttttccc tggcggcagc cacacctatg tctggcaggt cctgaaagaa

2220

aacggcccta tggcctccga tcctctgtgc ctgacataca gctacctgag ccacgtggac

2280

ctggtcaagg acctgaattc tggcctgatc ggagccctgc tcgtgtgtag agaaggcagc

2340

ctggccaaag agaaaaccca gacactgcac aagttcatcc tgctgttcgc cgtgttcgac

2400

gagggcaaga gctggcacag cgagacaaag aacagcctga tgcaggacag ggatgccgcc

2460

tctgctagag cttggcctaa gatgcacacc gtgaacggct acgtgaacag aagcctgcct

2520

ggactgatcg gctgccacag aaagtccgtg tactggcacg tgatcggcat gggcacaaca

2580

cctgaggtgc acagcatctt tctggaaggc cacaccttcc tcgtgcggaa ccacagacag

2640

gccagcctgg aaatcagccc tatcaccttc ctgaccgctc agaccctgct gatggatctg

2700

ggccagtttc tgctgttctg ccacatcagc tcccaccagc acgatggcat ggaagcctac

2760

gtgaaggtgg acagctgccc cgaagaaccc cagctgcgga tgaagaacaa cgaggaagcc

2820

gaggactacg acgacgacct gaccgactct gagatggacg tcgtcagatt cgacgacgat

2880

aacagcccca gcttcatcca gatcagaagc gtggccaaga agcaccccaa gacctgggtg

2940

cactatatcg ccgccgagga agaggactgg gattacgctc ctctggtgct ggcccctgac

3000

gacagaagct acaagagcca gtacctgaac aacggccctc agcggatcgg ccggaagtat

3060

aagaaagtgc ggttcatggc ctacaccgac gagacattca agaccagaga ggccatccag

3120

cacgagagcg gaattctggg ccctctgctg tatggcgaag tgggcgatac actgctgatc

3180

atcttcaaga accaggccag cagaccctac aacatctacc ctcacggcat caccgatgtg

3240

cggcccctgt attctagaag gctgcccaag ggcgtgaagc acctgaagga cttccctatc

3300

ctgcctggcg agattttcaa gtacaagtgg accgtgaccg tggaagatgg ccccaccaag

3360

agcgacccta gatgtctgac acggtactac agcagcttcg tgaacatgga acgcgacctg

3420

gccagcggcc tgattggacc tctgctgatc tgctacaaag aaagcgtgga ccagcggggc

3480

aaccagatca tgagcgacaa gcggaacgtg atcctgttta gcgtgttcga tgagaaccgg

3540

tcctggtatc tgaccgagaa catccagcgg tttctgccca atcctgccgg ggtgcaactg

3600

gaagatcctg agttccaggc aagcaacatc atgcactcca tcaatggcta tgtgttcgac

3660

agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact ggtacatcct gagcattggc

3720

gcccagaccg acttcctgtc cgtgttcttt agcggctaca ccttcaagca caagatggtg

3780

tacgaggata ccctgacact gttcccattc agcggcgaga cagtgttcat gagcatggaa

3840

aaccccggcc tgtggattct gggctgtcac aacagcgact tccggaacag aggcatgaca

3900

gccctgctga aggtgtccag ctgcgacaag aacaccggcg actactacga ggacagctat

3960

gaggacatca gcgcctacct gctgagcaag aacaatgcca tcgagcctcg gagcttcagc

4020

cagaatcctc ctgtgctgaa gcggcaccag cgcgagatca ccagaacaac cctgcagagc

4080

gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc

4140

gacatctacg acgaggacga gaatcagagc cccagaagct ttcagaaaaa gacccggcac

4200

tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg

4260

ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag

4320

ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc

4380

ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat

4440

caggctagcc ggccttacag cttctacagc tccctgatca gctacgaaga ggaccagaga

4500

cagggcgctg agcccagaaa gaacttcgtg aagcccaacg agactaagac ctacttttgg

4560

aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac

4620

ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg

4680

tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc

4740

ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg

4800

aactgcagag ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg

4860

ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat

4920

cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac

4980

ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat

5040

ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga

5100

gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac

5160

agcaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc

5220

accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctacagcggc

5280

agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct

5340

cccatgatca tccacggaat caagacccag ggcgccagac agaagttcag cagcctgtac

5400

atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacagaggc

5460

aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac

5520

aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc

5580

atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc

5640

ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc

5700

aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac

5760

gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc

5820

atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg

5880

aaagagttcc tgatctccag cagccaggac ggccatcagt ggaccctgtt tttccagaac

5940

ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg

6000

gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc

6060

gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc

6120

atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa

6180

atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta

6240

gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg

6300

ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact

6360

atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg

6420

cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag

6480

aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa

6540

cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc

6600

ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg

6660

ctaggttgct gggcactgat aattccgtgg tgttgtcatc gattccataa agtaggaaac

6720

actacacgat tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca

6780

gttaactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt

6840

gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca

6900

ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga

6960

ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cggcgcgccg

7020

catggctacg tagataagta gcatggcggg ttaatcatta actacacctg caggaggaac

7080

ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc

7140

gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg

7200

caggtcgacg ctagcagctg atgcatagca tgcggtaccg ggagatgggg gaggctaact

7260

gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag

7320

aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg

7380

gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg tttcttcctt

7440

ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc

7500

ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact atagctagag

7560

tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac cacttcatcc

7620

ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc ctgaagccag

7680

ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa tgcctgacga

7740

tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc ctcgacttcg

7800

ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc acgaacccag

7860

ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg ctcacgcaac

7920

tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt tttcatggct

7980

tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca agcgcgttac

8040

gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca gcaacgatgt

8100

tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcatcattcg

8160

cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg atcttttcgg

8220

tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg attacctcgg

8280

gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag aagcggttgt

8340

tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg agatctatat

8400

ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg cgctcatcaa

8460

tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc aagcagatta

8520

cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagtgatgca

8580

ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga tcggcttccc

8640

ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt accatgccct

8700

tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga agagtttgct

8760

ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga tttcagttta

8820

caactattct gtctagttta agactttatt gtcatagttt agatctattt tgttcagttt

8880

aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta ctcaaccgta

8940

accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca gatgcgtaag

9000

gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt

9060

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga

9120

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg

9180

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa

9240

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt

9300

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct

9360

gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct

9420

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc

9480

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt

9540

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc

9600

tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat

9660

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa

9720

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa

9780

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga

9840

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct

9900

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga

9960

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc

10020

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg

10080

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat

10140

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat

10200

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg

10260

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc

10320

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa

10380

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc

10440

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt

10500

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag

10560

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt

10620

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag

10680

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac

10740

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc

10800

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca

10860

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg

10920

ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt

10980

aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg

11040

caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg

11100

gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta

11160

tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg

11220

ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa

11280

gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct

11340

ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct

11400

acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc agtcaattac

11460

aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag aa

11512

<210> 202

<211> 10563

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 202

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240

atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg

300

cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag

360

cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc

420

cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac

480

cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca

540

catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt

600

aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc

660

agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag

720

gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg

780

ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg

840

ttggtttaaa ccgcagccac catgcagatc gagctgtcta cctgcttctt cctgtgcctg

900

ctgcggttct gcttcagcgc caccagaaga tattacctgg gcgccgtgga actgagctgg

960

gactacatgc agtctgacct gggagagctg cccgtggacg ctagatttcc tccaagagtg

1020

cccaagagct tccccttcaa cacctccgtg gtgtacaaga aaaccctgtt cgtggaattc

1080

accgaccacc tgttcaatat cgccaagcct cggcctcctt ggatgggact gctgggacct

1140

acaattcagg ccgaggtgta cgacaccgtg gtcatcaccc tgaagaacat ggccagccat

1200

cctgtgtctc tgcacgccgt gggagtgtct tattggaagg cttctgaggg cgccgagtac

1260

gacgatcaga caagccagag agagaaagag gacgacaagg ttttccctgg cggcagccac

1320

acctatgtct ggcaggtcct gaaagaaaac ggccctatgg cctccgatcc tctgtgcctg

1380

acatacagct acctgagcca cgtggacctg gtcaaggacc tgaattctgg cctgatcgga

1440

gccctgctcg tgtgtagaga aggcagcctg gccaaagaga aaacccagac actgcacaag

1500

ttcatcctgc tgttcgccgt gttcgacgag ggcaagagct ggcacagcga gacaaagaac

1560

agcctgatgc aggacaggga tgccgcctct gctagagctt ggcctaagat gcacaccgtg

1620

aacggctacg tgaacagaag cctgcctgga ctgatcggct gccacagaaa gtccgtgtac

1680

tggcacgtga tcggcatggg cacaacacct gaggtgcaca gcatctttct ggaaggccac

1740

accttcctcg tgcggaacca cagacaggcc agcctggaaa tcagccctat caccttcctg

1800

accgctcaga ccctgctgat ggatctgggc cagtttctgc tgttctgcca catcagctcc

1860

caccagcacg atggcatgga agcctacgtg aaggtggaca gctgccccga agaaccccag

1920

ctgcggatga agaacaacga ggaagccgag gactacgacg acgacctgac cgactctgag

1980

atggacgtcg tcagattcga cgacgataac agccccagct tcatccagat cagaagcgtg

2040

gccaagaagc accccaagac ctgggtgcac tatatcgccg ccgaggaaga ggactgggat

2100

tacgctcctc tggtgctggc ccctgacgac agaagctaca agagccagta cctgaacaac

2160

ggccctcagc ggatcggccg gaagtataag aaagtgcggt tcatggccta caccgacgag

2220

acattcaaga ccagagaggc catccagcac gagagcggaa ttctgggccc tctgctgtat

2280

ggcgaagtgg gcgatacact gctgatcatc ttcaagaacc aggccagcag accctacaac

2340

atctaccctc acggcatcac cgatgtgcgg cccctgtatt ctagaaggct gcccaagggc

2400

gtgaagcacc tgaaggactt ccctatcctg cctggcgaga ttttcaagta caagtggacc

2460

gtgaccgtgg aagatggccc caccaagagc gaccctagat gtctgacacg gtactacagc

2520

agcttcgtga acatggaacg cgacctggcc agcggcctga ttggacctct gctgatctgc

2580

tacaaagaaa gcgtggacca gcggggcaac cagatcatga gcgacaagcg gaacgtgatc

2640

ctgtttagcg tgttcgatga gaaccggtcc tggtatctga ccgagaacat ccagcggttt

2700

ctgcccaatc ctgccggggt gcaactggaa gatcctgagt tccaggcaag caacatcatg

2760

cactccatca atggctatgt gttcgacagc ctgcagctga gcgtgtgcct gcacgaagtg

2820

gcctactggt acatcctgag cattggcgcc cagaccgact tcctgtccgt gttctttagc

2880

ggctacacct tcaagcacaa gatggtgtac gaggataccc tgacactgtt cccattcagc

2940

ggcgagacag tgttcatgag catggaaaac cccggcctgt ggattctggg ctgtcacaac

3000

agcgacttcc ggaacagagg catgacagcc ctgctgaagg tgtccagctg cgacaagaac

3060

accggcgact actacgagga cagctatgag gacatcagcg cctacctgct gagcaagaac

3120

aatgccatcg agcctcggag cttcagccag aatcctcctg tgctgaagcg gcaccagcgc

3180

gagatcacca gaacaaccct gcagagcgac caagaggaaa tcgattacga cgacaccatc

3240

agcgtcgaga tgaagaaaga agatttcgac atctacgacg aggacgagaa tcagagcccc

3300

agaagctttc agaaaaagac ccggcactac ttcattgccg ccgtcgagag actgtgggac

3360

tacggcatgt ctagcagccc tcacgtgctg agaaatagag cccagagcgg cagcgtgccc

3420

cagttcaaga aagtggtgtt ccaagagttc accgacggca gcttcaccca gccactgtat

3480

agaggcgagc tgaacgagca tctgggcctg ctgggccctt atatcagagc cgaagtggaa

3540

gataacatca tggtcacctt ccggaatcag gctagccggc cttacagctt ctacagctcc

3600

ctgatcagct acgaagagga ccagagacag ggcgctgagc ccagaaagaa cttcgtgaag

3660

cccaacgaga ctaagaccta cttttggaag gtgcagcacc acatggcccc tacaaaggac

3720

gagttcgact gcaaagcctg ggcctacttc tccgatgtgg atctggaaaa ggacgtgcac

3780

agcgggctca tcggaccact gcttgtgtgc cacaccaaca cactgaaccc cgctcacggc

3840

agacaagtga cagtgcaaga gttcgccctg ttcttcacca tcttcgacga aacaaagagc

3900

tggtacttca ccgagaatat ggaacggaac tgcagagccc cttgcaacat ccagatggaa

3960

gatcccacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacaca

4020

ctgcccggcc tggttatggc ccaggatcag agaatccggt ggtatctgct gtccatgggc

4080

tccaacgaga atatccacag catccacttc agcggccacg tgttcaccgt gcggaaaaaa

4140

gaagagtaca aaatggccct gtacaatctg taccctgggg tgttcgaaac cgtggaaatg

4200

ctgccttcca aggccggcat ttggagagtg gaatgtctga ttggagagca cctccacgcc

4260

ggaatgagca ccctgtttct ggtgtacagc aacaagtgtc agacccctct cggcatggcc

4320

tctggacaca tcagagactt ccagatcacc gcctctggcc agtacggaca gtgggctcct

4380

aaactggctc ggctgcacta cagcggcagc atcaatgcct ggtccaccaa agagcccttc

4440

agctggatca aggtggacct gctggctccc atgatcatcc acggaatcaa gacccagggc

4500

gccagacaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac

4560

ggcaagaagt ggcagaccta cagaggcaac agcaccggca cactcatggt gttcttcggc

4620

aacgtggact ccagcggcat taagcacaac atcttcaacc ctccaatcat tgcccggtac

4680

atccggctgc accccacaca ctacagcatc cggtctaccc tgagaatgga actgatgggc

4740

tgcgacctga acagctgctc tatgcccctc ggaatggaaa gcaaggccat cagcgacgcc

4800

cagatcacag ccagcagcta cttcaccaac atgttcgcca cttggagccc ctccaaggct

4860

agactgcatc tgcagggcag aagcaacgct tggaggcccc aagtgaacaa ccccaaagag

4920

tggctgcagg ttgactttca aaagaccatg aaagtgaccg gcgtgaccac acagggcgtc

4980

aagtctctgc tgacctctat gtacgtgaaa gagttcctga tctccagcag ccaggacggc

5040

catcagtgga ccctgttttt ccagaacggc aaagtgaaag tgttccaggg caatcaggac

5100

agcttcacac ccgtggtcaa ttctctggac cctccactgc tgaccagata cctgcggatt

5160

caccctcagt cttgggtgca ccagatcgct ctgcggatgg aagtgctggg ctgtgaagct

5220

caggacctct actagttaat taagagcatc ttaccgccat ttattcccat atttgttctg

5280

tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt

5340

tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta

5400

agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt

5460

gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg

5520

ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt

5580

ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg

5640

tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc

5700

aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg

5760

cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt

5820

tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga

5880

ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt

5940

gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg

6000

attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg

6060

gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct

6120

agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc

6180

aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg

6240

ggcgcgcctc gagccatggt gctagcagct gatgcatagc atgcggtacc gggagatggg

6300

ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa

6360

taaaaagaca gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg

6420

tcccagggct ggcactctgt cgatacccca ccgagacccc attgggacca atacgcccgc

6480

gtttcttcct tttccccacc ccaaccccca agttcgggtg aaggcccagg gctcgcagcc

6540

aacgtcgggg cggcaagccc tgccatagcc actacgggta cgtaggccaa ccactagaac

6600

tatagctaga gtcctgggcg aacaaacgat gctcgccttc cagaaaaccg aggatgcgaa

6660

ccacttcatc cggggtcagc accaccggca agcgccgcga cggccgaggt ctaccgatct

6720

cctgaagcca gggcagatcc gtgcacagca ccttgccgta gaagaacagc aaggccgcca

6780

atgcctgacg atgcgtggag accgaaacct tgcgctcgtt cgccagccag gacagaaatg

6840

cctcgacttc gctgctgccc aaggttgccg ggtgacgcac accgtggaaa cggatgaagg

6900

cacgaaccca gttgacataa gcctgttcgg ttcgtaaact gtaatgcaag tagcgtatgc

6960

gctcacgcaa ctggtccaga accttgaccg aacgcagcgg tggtaacggc gcagtggcgg

7020

ttttcatggc ttgttatgac tgtttttttg tacagtctat gcctcgggca tccaagcagc

7080

aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc

7140

agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaggtgg ctcaagtatg

7200

ggcatcattc gcacatgtag gctcggccct gaccaagtca aatccatgcg ggctgctctt

7260

gatcttttcg gtcgtgagtt cggagacgta gccacctact cccaacatca gccggactcc

7320

gattacctcg ggaacttgct ccgtagtaag acattcatcg cgcttgctgc cttcgaccaa

7380

gaagcggttg ttggcgctct cgcggcttac gttctgccca ggtttgagca gccgcgtagt

7440

gagatctata tctatgatct cgcagtctcc ggcgagcacc ggaggcaggg cattgccacc

7500

gcgctcatca atctcctcaa gcatgaggcc aacgcgcttg gtgcttatgt gatctacgtg

7560

caagcagatt acggtgacga tcccgcagtg gctctctata caaagttggg catacgggaa

7620

gaagtgatgc actttgatat cgacccaagt accgccacct aacaattcgt tcaagccgag

7680

atcggcttcc cggccgcgga gttgttcggt aaattgtcac aacgccgcga atatagtctt

7740

taccatgccc ttggccacgc ccctctttaa tacgacgggc aatttgcact tcagaaaatg

7800

aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat aactggactg

7860

atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt tagatctatt

7920

ttgttcagtt taagacttta ttgtccgccc acacccgctt acgcagggca tccatttatt

7980

actcaaccgt aaccgatttt gccaggttac gcggctggtc tgcggtgtga aataccgcac

8040

agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg

8100

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg

8160

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag

8220

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac

8280

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga

8340

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt

8400

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc

8460

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc

8520

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta

8580

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat

8640

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca

8700

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct

8760

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt

8820

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct

8880

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc

8940

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa

9000

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta

9060

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc

9120

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat

9180

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta

9240

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt

9300

aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt

9360

ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg

9420

ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc

9480

gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc

9540

gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg

9600

cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga

9660

actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta

9720

ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct

9780

tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag

9840

ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga

9900

agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat

9960

aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt

10020

aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag

10080

gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt

10140

gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga

10200

aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg

10260

gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct

10320

tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc

10380

gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt

10440

aatgcgccgc tacagggcgc gtcccattcg ccattcaggc tgcaaataag cgttgatatt

10500

cagtcaatta caaacattaa taacgaagag atgacagaaa aattttcatt ctgtgacaga

10560

gaa

10563

<210> 203

<211> 9871

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 203

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gagtttgctg cttgcaatgt ttgcccattt tagggtggac

240

acaggacgct gtggtttctg agccaggggg cgactcagat cccagccagt ggacttagcc

300

cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc

360

gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct

420

tcaggcacca ccactgacct gggacagtga atcgccacca tgcagattga gctgagcacc

480

tgcttcttcc tgtgcctgct gaggttctgc ttctctgcca ccaggagata ctacctgggg

540

gctgtggagc tgagctggga ctacatgcag tctgacctgg gggagctgcc tgtggatgcc

600

aggttccccc ccagagtgcc caagagcttc cccttcaaca cctctgtggt gtacaagaag

660

accctgtttg tggagttcac tgaccacctg ttcaacattg ccaagcccag gcccccctgg

720

atgggcctgc tgggccccac catccaggct gaggtgtatg acactgtggt gatcaccctg

780

aagaacatgg ccagccaccc tgtgagcctg catgctgtgg gggtgagcta ctggaaggcc

840

tctgaggggg ctgagtatga tgaccagacc agccagaggg agaaggagga tgacaaggtg

900

ttccctgggg gcagccacac ctatgtgtgg caggtgctga aggagaatgg ccccatggcc

960

tctgaccccc tgtgcctgac ctacagctac ctgagccatg tggacctggt gaaggacctg

1020

aactctggcc tgattggggc cctgctggtg tgcagggagg gcagcctggc caaggagaag

1080

acccagaccc tgcacaagtt catcctgctg tttgctgtgt ttgatgaggg caagagctgg

1140

cactctgaaa ccaagaacag cctgatgcag gacagggatg ctgcctctgc cagggcctgg

1200

cccaagatgc acactgtgaa tggctatgtg aacaggagcc tgcctggcct gattggctgc

1260

cacaggaagt ctgtgtactg gcatgtgatt ggcatgggca ccacccctga ggtgcacagc

1320

atcttcctgg agggccacac cttcctggtc aggaaccaca ggcaggccag cctggagatc

1380

agccccatca ccttcctgac tgcccagacc ctgctgatgg acctgggcca gttcctgctg

1440

ttctgccaca tcagcagcca ccagcatgat ggcatggagg cctatgtgaa ggtggacagc

1500

tgccctgagg agccccagct gaggatgaag aacaatgagg aggctgagga ctatgatgat

1560

gacctgactg actctgagat ggatgtggtg aggtttgatg atgacaacag ccccagcttc

1620

atccagatca ggtctgtggc caagaagcac cccaagacct gggtgcacta cattgctgct

1680

gaggaggagg actgggacta tgcccccctg gtgctggccc ctgatgacag gagctacaag

1740

agccagtacc tgaacaatgg cccccagagg attggcagga agtacaagaa ggtcaggttc

1800

atggcctaca ctgatgaaac cttcaagacc agggaggcca tccagcatga gtctggcatc

1860

ctgggccccc tgctgtatgg ggaggtgggg gacaccctgc tgatcatctt caagaaccag

1920

gccagcaggc cctacaacat ctacccccat ggcatcactg atgtgaggcc cctgtacagc

1980

aggaggctgc ccaagggggt gaagcacctg aaggacttcc ccatcctgcc tggggagatc

2040

ttcaagtaca agtggactgt gactgtggag gatggcccca ccaagtctga ccccaggtgc

2100

ctgaccagat actacagcag ctttgtgaac atggagaggg acctggcctc tggcctgatt

2160

ggccccctgc tgatctgcta caaggagtct gtggaccaga ggggcaacca gatcatgtct

2220

gacaagagga atgtgatcct gttctctgtg tttgatgaga acaggagctg gtacctgact

2280

gagaacatcc agaggttcct gcccaaccct gctggggtgc agctggagga ccctgagttc

2340

caggccagca acatcatgca cagcatcaat ggctatgtgt ttgacagcct gcagctgtct

2400

gtgtgcctgc atgaggtggc ctactggtac atcctgagca ttggggccca gactgacttc

2460

ctgtctgtgt tcttctctgg ctacaccttc aagcacaaga tggtgtatga ggacaccctg

2520

accctgttcc ccttctctgg ggagactgtg ttcatgagca tggagaaccc tggcctgtgg

2580

attctgggct gccacaactc tgacttcagg aacaggggca tgactgccct gctgaaagtc

2640

tccagctgtg acaagaacac tggggactac tatgaggaca gctatgagga catctctgcc

2700

tacctgctga gcaagaacaa tgccattgag cccaggagct tcagccagaa ccccccagtg

2760

ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt

2820

gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag

2880

gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt cattgctgct

2940

gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc

3000

cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc

3060

ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac

3120

atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc

3180

tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc

3240

aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac

3300

atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac

3360

ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc

3420

ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc

3480

tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc

3540

tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat

3600

ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg

3660

tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg

3720

ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg

3780

tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt

3840

ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag

3900

acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag

3960

tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg

4020

agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat

4080

ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc

4140

atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc

4200

ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc

4260

cccatcattg ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg

4320

aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc

4380

aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc

4440

tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag

4500

gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg

4560

gtgaccaccc agggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc

4620

agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg

4680

ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg

4740

accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag

4800

gtgctgggct gtgaggccca ggacctgtac tgaaataaaa gatctttatt ttcattagat

4860

ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt

4920

taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct

4980

gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct

5040

cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa

5100

gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact

5160

tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt

5220

tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa

5280

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa

5340

tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa

5400

gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta

5460

cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc

5520

acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat

5580

gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt

5640

ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact

5700

gaatatcaac gcttatttgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat

5760

taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag

5820

cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc

5880

aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc

5940

ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt

6000

ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa

6060

caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg

6120

cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat

6180

taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt

6240

tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc

6300

ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc

6360

ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa

6420

aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg

6480

gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag

6540

ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc

6600

gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta

6660

cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg

6720

cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca

6780

acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac

6840

caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat

6900

taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg

6960

ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata

7020

aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta

7080

agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa

7140

atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag

7200

tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg

7260

tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact

7320

gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg

7380

taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc

7440

aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata

7500

ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta

7560

catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc

7620

ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg

7680

ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac

7740

agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg

7800

taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt

7860

atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct

7920

cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg

7980

ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata

8040

accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca

8100

gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc

8160

tgtgcggtat ttcacaccgc agaccagccg cgtaacctgg caaaatcggt tacggttgag

8220

taataaatgg atgccctgcg taagcgggtg tgggcggaca ataaagtctt aaactgaaca

8280

aaatagatct aaactatgac aataaagtct taaactagac agaatagttg taaactgaaa

8340

tcagtccagt tatgctgtga aaaagcatac tggacttttg ttatggctaa agcaaactct

8400

tcattttctg aagtgcaaat tgcccgtcgt attaaagagg ggcgtggcca agggcatggt

8460

aaagactata ttcgcggcgt tgtgacaatt taccgaacaa ctccgcggcc gggaagccga

8520

tctcggcttg aacgaattgt taggtggcgg tacttgggtc gatatcaaag tgcatcactt

8580

cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt

8640

gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg

8700

cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct

8760

cactacgcgg ctgctcaaac ctgggcagaa cgtaagccgc gagagcgcca acaaccgctt

8820

cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat

8880

cggagtccgg ctgatgttgg gagtaggtgg ctacgtctcc gaactcacga ccgaaaagat

8940

caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc

9000

ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc

9060

tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct

9120

tgctgcttgg atgcccgagg catagactgt acaaaaaaac agtcataaca agccatgaaa

9180

accgccactg cgccgttacc accgctgcgt tcggtcaagg ttctggacca gttgcgtgag

9240

cgcatacgct acttgcatta cagtttacga accgaacagg cttatgtcaa ctgggttcgt

9300

gccttcatcc gtttccacgg tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag

9360

gcatttctgt cctggctggc gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca

9420

ttggcggcct tgctgttctt ctacggcaag gtgctgtgca cggatctgcc ctggcttcag

9480

gagatcggaa gacctcggcc gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg

9540

gttcgcatcc tcggttttct ggaaggcgag catcgtttgt tcgcccagga ctctagctat

9600

agttctagtg gttggctacg tatactccgg aatattaata gatcatggag ataattaaaa

9660

tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa

9720

aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg gatctcggtc

9780

cgaaaccatg tcgtactacc atcaccatca ccatcacgat tacgatatcc caacgaccga

9840

aaacctgtat tttcagggcg ccatgggatc c

9871

<210> 204

<211> 9969

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 204

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gagtctgtct gcacatttcg tagagcgagt gttccgatac

240

tctaatctcc ctaggcaagg ttcatattga cttaggttac ttattctcct tttgttgact

300

aagtcaataa tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt

360

tggaaggagg gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc

420

tcctgctagc aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat

480

ggcccttgcg tgccttgaat tactgacact gacatccact ttttcttttt ctccacaggt

540

ttaaacgcca ccatgcagat tgagctgagc acctgcttct tcctgtgtct gctgaggttc

600

tgcttctctg ccaccaggag gtattacctg ggggctgtgg agctgagctg ggactatatg

660

cagtctgacc tgggggagct gcctgtggat gctaggttcc cccccagggt gcccaagagc

720

ttccccttta acacttctgt ggtgtacaag aagaccctgt ttgtggagtt cactgaccac

780

ctgttcaaca ttgccaagcc caggcccccc tggatggggc tgctggggcc caccatccag

840

gctgaggtgt atgacactgt ggtgatcacc ctgaagaaca tggccagcca ccctgtgagc

900

ctgcatgctg tgggggtgag ctactggaag gcttctgagg gggctgagta tgatgaccag

960

actagccaga gggagaagga ggatgacaag gtgtttcctg ggggcagcca tacctatgtg

1020

tggcaggtgc tgaaggagaa tggccccatg gcctctgacc ccctgtgcct gacctacagc

1080

tacctgtctc atgtggacct ggtgaaggac ctgaactctg gcctgattgg ggctctgctg

1140

gtgtgtaggg agggcagcct ggctaaggaa aagacccaga ccctgcataa gtttatcctg

1200

ctgtttgctg tgtttgatga gggcaagagc tggcactctg agaccaagaa cagcctgatg

1260

caggataggg atgctgcctc tgccagggct tggcctaaga tgcacactgt gaatgggtat

1320

gtgaatagga gcctgcctgg cctgattggc tgccacagga agtctgtgta ctggcatgtg

1380

attgggatgg gcaccacccc tgaggtccat agcatcttcc tggagggcca cactttcctg

1440

gtgaggaacc acagacaggc ctctctggag atctctccca tcaccttcct gactgctcag

1500

actctgctga tggacctggg ccagttcctg ctgttttgcc atattagcag ccaccagcat

1560

gatgggatgg aggcctatgt gaaggtggat agctgccctg aggagcctca gctgaggatg

1620

aagaacaatg aggaggctga agactatgat gatgacctga ctgattctga gatggatgtg

1680

gtgaggtttg atgatgacaa tagccccagc ttcattcaga tcaggtctgt ggccaagaaa

1740

caccccaaga cctgggtgca ctacattgct gctgaggaag aggactggga ctatgctccc

1800

ctggtgctgg cccctgatga taggtcttat aagagccagt acctgaacaa tgggccccag

1860

aggattggca ggaagtacaa gaaggtgagg ttcatggcct acactgatga aaccttcaaa

1920

accagggagg ccattcagca tgagtctggc atcctgggcc ctctgctgta tggggaggtg

1980

ggggacaccc tgctgatcat cttcaagaac caggccagca ggccctacaa catctatcct

2040

catggcatca ctgatgtgag gcccctgtac agcaggaggc tgcccaaggg ggtgaagcac

2100

ctgaaagact tccccatcct gcctggggag atctttaagt ataagtggac tgtgactgtg

2160

gaggatggcc ctaccaagtc tgaccccagg tgtctgacca ggtactattc tagctttgtg

2220

aacatggaga gggacctggc ctctggcctg attgggcccc tgctgatctg ctacaaggag

2280

tctgtggacc agaggggcaa ccagatcatg tctgacaaga ggaatgtgat cctgttttct

2340

gtgtttgatg agaataggag ctggtacctg actgagaaca tccagaggtt tctgcccaat

2400

cctgctgggg tgcagctgga ggatcctgag ttccaggcca gcaatatcat gcatagcatc

2460

aatggctatg tgtttgacag cctgcagctg tctgtgtgcc tgcatgaggt ggcctactgg

2520

tacatcctga gcattggggc ccagactgac tttctgtctg tgttcttttc tggctatacc

2580

ttcaagcaca agatggtgta tgaggatacc ctgaccctgt tccccttctc tggggagact

2640

gtgttcatga gcatggagaa tcctgggctg tggatcctgg ggtgccacaa ctctgatttt

2700

aggaacaggg ggatgactgc cctgctgaag gtgtctagct gtgataagaa cactggggac

2760

tactatgagg acagctatga ggacatttct gcttatctgc tgtctaagaa taatgccatt

2820

gagcccagaa gcttcagcca gaatccccct gtgctgaaga gacatcagag ggagatcacc

2880

agaactaccc tgcagtctga tcaggaggag attgactatg atgacactat ctctgtggag

2940

atgaagaagg aggactttga catctatgat gaggatgaga atcagtctcc caggagcttt

3000

cagaagaaga ccagacatta cttcattgct gctgtggaga ggctgtggga ctatggcatg

3060

agctctagcc ctcatgtgct gaggaacagg gcccagtctg gctctgtgcc ccagttcaag

3120

aaggtggtgt tccaggaatt cactgatggc agcttcaccc agcccctgta caggggggag

3180

ctgaatgagc acctgggcct gctggggcct tatatcaggg ctgaggtgga ggataatatt

3240

atggtgactt tcaggaacca ggccagcagg ccctactctt tctatagcag cctgatctct

3300

tatgaggagg atcagaggca gggggctgag cctaggaaga actttgtgaa gcccaatgag

3360

actaagacct acttctggaa ggtccagcac cacatggccc ctaccaagga tgagtttgac

3420

tgcaaggcct gggcctattt ctctgatgtg gatctggaga aggatgtcca ttctgggctg

3480

attggccccc tgctggtgtg ccacactaac actctgaatc ctgcccatgg caggcaggtg

3540

actgtccagg agtttgccct gttcttcact atctttgatg agaccaagag ctggtacttt

3600

actgagaaca tggagaggaa ctgcagagct ccttgcaata ttcagatgga ggaccccacc

3660

ttcaaggaga attacaggtt ccatgccatt aatgggtaca tcatggacac cctgcctggc

3720

ctggtgatgg ctcaggacca gaggatcagg tggtacctgc tgagcatggg ctctaatgag

3780

aatatccaca gcatccactt ctctgggcat gtgttcactg tgaggaagaa ggaggagtac

3840

aagatggctc tgtataatct gtaccctggg gtgtttgaaa ctgtggagat gctgccctct

3900

aaggctggca tctggagggt ggagtgcctg attggggagc acctgcatgc tggcatgagc

3960

accctgttcc tggtgtacag caacaagtgc cagacccccc tgggcatggc ctctggccac

4020

atcagggact tccagatcac tgcctctggc cagtatggcc agtgggcccc caagctggcc

4080

aggctgcact attctggcag catcaatgcc tggagcacca aggagccctt cagctggatc

4140

aaggtggacc tgctggcccc catgatcatt catggcatca agacccaggg ggccaggcag

4200

aagttcagct ctctgtacat ctctcagttc atcatcatgt actctctgga tgggaagaag

4260

tggcagacct acaggggcaa cagcactggc accctgatgg tgttctttgg gaatgtggac

4320

tcttctggca tcaagcacaa catcttcaat ccccccatca ttgctaggta tattaggctg

4380

catcccaccc actacagcat caggtctacc ctgaggatgg agctgatggg ctgtgacctg

4440

aactcttgca gcatgcccct gggcatggag tctaaggcca tctctgatgc ccagattact

4500

gccagcagct acttcaccaa catgtttgcc acctggagcc cctctaaggc caggctgcat

4560

ctgcagggga ggagcaatgc ctggaggcct caggtgaaca accccaagga gtggctgcag

4620

gtggatttcc agaagaccat gaaggtgact ggggtgacca cccagggggt caagagcctg

4680

ctgaccagca tgtatgtgaa ggagttcctg atcagcagca gccaggatgg ccaccagtgg

4740

actctgttct ttcagaatgg gaaggtgaag gtgtttcagg gcaatcagga ctctttcacc

4800

cctgtggtga acagcctgga cccccccctg ctgaccagat acctgaggat ccacccccag

4860

tcttgggtgc atcagattgc cctgaggatg gaggtgctgg gctgtgaggc tcaggatctg

4920

tactgagcgg ccgcaataaa agatcagagc tctagagatc tgtgtgttgg ttttttgtgt

4980

tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag

5040

gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag

5100

gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag

5160

ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gtactagagg

5220

atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac

5280

ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca

5340

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt

5400

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc

5460

tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tccaaactat

5520

tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc atctattttg

5580

tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt tcccaactat

5640

tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa acatcctgcc

5700

aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga atgaaaattt

5760

ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc ttatttgcag

5820

cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt

5880

tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt

5940

cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc

6000

tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga

6060

tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc

6120

cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt

6180

ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct

6240

gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa tttcaggtgg

6300

cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa

6360

tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa

6420

gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct

6480

tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg

6540

tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg

6600

ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt

6660

atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga

6720

cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga

6780

attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac

6840

gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg

6900

ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac

6960

gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct

7020

agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct

7080

gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg

7140

gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat

7200

ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg

7260

tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat

7320

tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct

7380

catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa

7440

gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa

7500

aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc

7560

gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta

7620

gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct

7680

gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg

7740

atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag

7800

cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc

7860

cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg

7920

agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt

7980

tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg

8040

gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca

8100

catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg

8160

agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc

8220

ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag

8280

accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat gccctgcgta

8340

agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa actatgacaa

8400

taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta tgctgtgaaa

8460

aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa gtgcaaattg

8520

cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt cgcggcgttg

8580

tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgaattgtta

8640

ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc ccaactttgt

8700

atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca cataagcacc

8760

aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cctgcctccg

8820

gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct gctcaaacct

8880

gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg cagcaagcgc

8940

gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct gatgttggga

9000

gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gcatggattt

9060

gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc cacctaactt

9120

tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca tcgttgctgc

9180

tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat gcccgaggca

9240

tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac

9300

cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca

9360

gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttccacggtg

9420

tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga

9480

acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct

9540

acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt

9600

cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg

9660

aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt tggctacgta

9720

tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa

9780

taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tattccggat

9840

tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc gtactaccat

9900

caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt tcagggcgcc

9960

atgggatcc

9969

<210> 205

<211> 10063

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 205

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gaggaaccat tgccaccttc agggggaggc tgctggtgaa

240

tattaaccaa gatcacccca gttaccggag gagcaaacag ggactaagtt cacacgcgtg

300

gtaccgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tccctaggca

360

aggttcatat ttgtgtaggt tacttattct ccttttgttg actaagtcaa taatcagaat

420

cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg agggggtata

480

aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgaa gaggtaaggg

540

tttaagttat cgttagttcg tgcaccatta atgtttaatt acctggagca cctgcctgaa

600

atcatttttt tttcaggttg gctagtatgc agatcgagct ctccacctgc ttctttctgt

660

gcctgttgag attctgcttc agcgccacca ggagatacta cctgggggct gtggagctga

720

gctgggacta catgcagtct gacctggggg agctgcctgt ggatgccagg ttccccccca

780

gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta caagaagacc ctgtttgtgg

840

agttcactga ccacctgttc aacattgcca agcccaggcc cccctggatg ggcctgctgg

900

gccccaccat ccaggctgag gtgtatgaca ctgtggtgat caccctgaag aacatggcca

960

gccaccctgt gagcctgcat gctgtggggg tgagctactg gaaggcctct gagggggctg

1020

agtatgatga ccagaccagc cagagggaga aggaggatga caaggtgttc cctgggggca

1080

gccacaccta tgtgtggcag gtgctgaagg agaatggccc catggcctct gaccccctgt

1140

gcctgaccta cagctacctg agccatgtgg acctggtgaa ggacctgaac tctggcctga

1200

ttggggccct gctggtgtgc agggagggca gcctggccaa ggagaagacc cagaccctgc

1260

acaagttcat cctgctgttt gctgtgtttg atgagggcaa gagctggcac tctgaaacca

1320

agaacagcct gatgcaggac agggatgctg cctctgccag ggcctggccc aagatgcaca

1380

ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat tggctgccac aggaagtctg

1440

tgtactggca tgtgattggc atgggcacca cccctgaggt gcacagcatc ttcctggagg

1500

gccacacctt cctggtcagg aaccacaggc aggccagcct ggagatcagc cccatcacct

1560

tcctgactgc ccagaccctg ctgatggacc tgggccagtt cctgctgttc tgccacatca

1620

gcagccacca gcatgatggc atggaggcct atgtgaaggt ggacagctgc cctgaggagc

1680

cccagctgag gatgaagaac aatgaggagg ctgaggacta tgatgatgac ctgactgact

1740

ctgagatgga tgtggtgagg tttgatgatg acaacagccc cagcttcatc cagatcaggt

1800

ctgtggccaa gaagcacccc aagacctggg tgcactacat tgctgctgag gaggaggact

1860

gggactatgc ccccctggtg ctggcccctg atgacaggag ctacaagagc cagtacctga

1920

acaatggccc ccagaggatt ggcaggaagt acaagaaggt caggttcatg gcctacactg

1980

atgaaacctt caagaccagg gaggccatcc agcatgagtc tggcatcctg ggccccctgc

2040

tgtatgggga ggtgggggac accctgctga tcatcttcaa gaaccaggcc agcaggccct

2100

acaacatcta cccccatggc atcactgatg tgaggcccct gtacagcagg aggctgccca

2160

agggggtgaa gcacctgaag gacttcccca tcctgcctgg ggagatcttc aagtacaagt

2220

ggactgtgac tgtggaggat ggccccacca agtctgaccc caggtgcctg accagatact

2280

acagcagctt tgtgaacatg gagagggacc tggcctctgg cctgattggc cccctgctga

2340

tctgctacaa ggagtctgtg gaccagaggg gcaaccagat catgtctgac aagaggaatg

2400

tgatcctgtt ctctgtgttt gatgagaaca ggagctggta cctgactgag aacatccaga

2460

ggttcctgcc caaccctgct ggggtgcagc tggaggaccc tgagttccag gccagcaaca

2520

tcatgcacag catcaatggc tatgtgtttg acagcctgca gctgtctgtg tgcctgcatg

2580

aggtggccta ctggtacatc ctgagcattg gggcccagac tgacttcctg tctgtgttct

2640

tctctggcta caccttcaag cacaagatgg tgtatgagga caccctgacc ctgttcccct

2700

tctctgggga gactgtgttc atgagcatgg agaaccctgg cctgtggatt ctgggctgcc

2760

acaactctga cttcaggaac aggggcatga ctgccctgct gaaagtctcc agctgtgaca

2820

agaacactgg ggactactat gaggacagct atgaggacat ctctgcctac ctgctgagca

2880

agaacaatgc cattgagccc aggagcttca gccagaatcc acccgtcctt aagcgccatc

2940

agcgcgagat caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca

3000

ccatctctgt ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga

3060

gccccaggag cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt

3120

gggactatgg catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg

3180

tgccccagtt caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc

3240

tgtacagagg ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg

3300

tggaggacaa catcatggtg accttcagga accaggccag caggccctac agcttctaca

3360

gcagcctgat cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg

3420

tgaagcccaa tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca

3480

aggatgagtt tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg

3540

tgcactctgg cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc

3600

atggcaggca ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca

3660

agagctggta cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga

3720

tggaggaccc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg

3780

acaccctgcc tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca

3840

tgggcagcaa tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga

3900

agaaggagga gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg

3960

agatgctgcc cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc

4020

atgctggcat gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca

4080

tggcctctgg ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg

4140

cccccaagct ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc

4200

ccttcagctg gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc

4260

agggggccag gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc

4320

tggatggcaa gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct

4380

ttggcaatgt ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca

4440

gatacatcag gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga

4500

tgggctgtga cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg

4560

atgcccagat cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca

4620

aggccaggct gcatctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca

4680

aggagtggct gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg

4740

gggtgaagag cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg

4800

atggccacca gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc

4860

aggacagctt cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga

4920

ggattcaccc ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg

4980

aggcccagga cctgtactga ggatccaata aaatatcttt attttcatta catctgtgtg

5040

ttggtttttt gtgtgttttc ctgtaacgat cgggtctaga gcatggctac gtagataagt

5100

agcatggcgg gttaatcatt aactacacct gcaggaggaa cccctagtga tggagttggc

5160

cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg

5220

cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc gcctcgaggc

5280

atgcggtacc aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt

5340

agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat

5400

gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa

5460

tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc

5520

caaactcatc aatgtatctt atcatgtctg gatctgatca ctgatatcgc ctaggagatc

5580

cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag

5640

cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa

5700

aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt

5760

tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt

5820

cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt

5880

ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct

5940

gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg

6000

ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg

6060

gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac

6120

ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct

6180

gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt

6240

tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt

6300

tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt

6360

ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa

6420

cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac

6480

cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg

6540

tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc

6600

tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg

6660

atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga

6720

gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc

6780

aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag

6840

aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga

6900

gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg

6960

cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga

7020

atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt

7080

tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact

7140

ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt

7200

ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg

7260

ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta

7320

tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac

7380

tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta

7440

aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt

7500

tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt

7560

tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt

7620

gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc

7680

agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg

7740

tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg

7800

ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt

7860

cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac

7920

tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg

7980

acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg

8040

gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat

8100

ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt

8160

tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg

8220

attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa

8280

cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc

8340

tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg

8400

gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc

8460

ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt

8520

tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct

8580

aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc

8640

caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg

8700

ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa

8760

agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac

8820

cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga

8880

gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat

8940

agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc

9000

caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt

9060

tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac

9120

gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg

9180

tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg

9240

taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg

9300

gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa

9360

caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac

9420

cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc

9480

aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc

9540

agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg

9600

catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg

9660

ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc

9720

ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag

9780

gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa tagatcatgg

9840

agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag

9900

ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ccatcgggcg

9960

cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg attacgatat

10020

cccaacgacc gaaaacctgt attttcaggg cgccatggga tcc

10063

<210> 206

<211> 11668

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 206

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg

240

cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt

300

ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc

360

aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag

420

acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga

480

ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac

540

ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca

600

tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat

660

ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag

720

gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa

780

gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga

840

cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc

900

caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca

960

ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt

1020

gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc

1080

tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa

1140

gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc

1200

agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt

1260

taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga

1320

ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg

1380

actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg

1440

tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatc

1500

gagctgtcta cctgcttctt cctgtgcctg ctgcggttct gcttcagcgc caccagaaga

1560

tattacctgg gcgccgtgga actgagctgg gactacatgc agtctgacct gggagagctg

1620

cccgtggacg ctagatttcc tccaagagtg cccaagagct tccccttcaa cacctccgtg

1680

gtgtacaaga aaaccctgtt cgtggaattc accgaccacc tgttcaatat cgccaagcct

1740

cggcctcctt ggatgggact gctgggacct acaattcagg ccgaggtgta cgacaccgtg

1800

gtcatcaccc tgaagaacat ggccagccat cctgtgtctc tgcacgccgt gggagtgtct

1860

tattggaagg cttctgaggg cgccgagtac gacgatcaga caagccagag agagaaagag

1920

gacgacaagg ttttccctgg cggcagccac acctatgtct ggcaggtcct gaaagaaaac

1980

ggccctatgg cctccgatcc tctgtgcctg acatacagct acctgagcca cgtggacctg

2040

gtcaaggacc tgaattctgg cctgatcgga gccctgctcg tgtgtagaga aggcagcctg

2100

gccaaagaga aaacccagac actgcacaag ttcatcctgc tgttcgccgt gttcgacgag

2160

ggcaagagct ggcacagcga gacaaagaac agcctgatgc aggacaggga tgccgcctct

2220

gctagagctt ggcctaagat gcacaccgtg aacggctacg tgaacagaag cctgcctgga

2280

ctgatcggct gccacagaaa gtccgtgtac tggcacgtga tcggcatggg cacaacacct

2340

gaggtgcaca gcatctttct ggaaggccac accttcctcg tgcggaacca cagacaggcc

2400

agcctggaaa tcagccctat caccttcctg accgctcaga ccctgctgat ggatctgggc

2460

cagtttctgc tgttctgcca catcagctcc caccagcacg atggcatgga agcctacgtg

2520

aaggtggaca gctgccccga agaaccccag ctgcggatga agaacaacga ggaagccgag

2580

gactacgacg acgacctgac cgactctgag atggacgtcg tcagattcga cgacgataac

2640

agccccagct tcatccagat cagaagcgtg gccaagaagc accccaagac ctgggtgcac

2700

tatatcgccg ccgaggaaga ggactgggat tacgctcctc tggtgctggc ccctgacgac

2760

agaagctaca agagccagta cctgaacaac ggccctcagc ggatcggccg gaagtataag

2820

aaagtgcggt tcatggccta caccgacgag acattcaaga ccagagaggc catccagcac

2880

gagagcggaa ttctgggccc tctgctgtat ggcgaagtgg gcgatacact gctgatcatc

2940

ttcaagaacc aggccagcag accctacaac atctaccctc acggcatcac cgatgtgcgg

3000

cccctgtatt ctagaaggct gcccaagggc gtgaagcacc tgaaggactt ccctatcctg

3060

cctggcgaga ttttcaagta caagtggacc gtgaccgtgg aagatggccc caccaagagc

3120

gaccctagat gtctgacacg gtactacagc agcttcgtga acatggaacg cgacctggcc

3180

agcggcctga ttggacctct gctgatctgc tacaaagaaa gcgtggacca gcggggcaac

3240

cagatcatga gcgacaagcg gaacgtgatc ctgtttagcg tgttcgatga gaaccggtcc

3300

tggtatctga ccgagaacat ccagcggttt ctgcccaatc ctgccggggt gcaactggaa

3360

gatcctgagt tccaggcaag caacatcatg cactccatca atggctatgt gttcgacagc

3420

ctgcagctga gcgtgtgcct gcacgaagtg gcctactggt acatcctgag cattggcgcc

3480

cagaccgact tcctgtccgt gttctttagc ggctacacct tcaagcacaa gatggtgtac

3540

gaggataccc tgacactgtt cccattcagc ggcgagacag tgttcatgag catggaaaac

3600

cccggcctgt ggattctggg ctgtcacaac agcgacttcc ggaacagagg catgacagcc

3660

ctgctgaagg tgtccagctg cgacaagaac accggcgact actacgagga cagctatgag

3720

gacatcagcg cctacctgct gagcaagaac aatgccatcg agcctcggag cttcagccag

3780

aatcctcctg tgctgaagcg gcaccagcgc gagatcacca gaacaaccct gcagagcgac

3840

caagaggaaa tcgattacga cgacaccatc agcgtcgaga tgaagaaaga agatttcgac

3900

atctacgacg aggacgagaa tcagagcccc agaagctttc agaaaaagac ccggcactac

3960

ttcattgccg ccgtcgagag actgtgggac tacggcatgt ctagcagccc tcacgtgctg

4020

agaaatagag cccagagcgg cagcgtgccc cagttcaaga aagtggtgtt ccaagagttc

4080

accgacggca gcttcaccca gccactgtat agaggcgagc tgaacgagca tctgggcctg

4140

ctgggccctt atatcagagc cgaagtggaa gataacatca tggtcacctt ccggaatcag

4200

gctagccggc cttacagctt ctacagctcc ctgatcagct acgaagagga ccagagacag

4260

ggcgctgagc ccagaaagaa cttcgtgaag cccaacgaga ctaagaccta cttttggaag

4320

gtgcagcacc acatggcccc tacaaaggac gagttcgact gcaaagcctg ggcctacttc

4380

tccgatgtgg atctggaaaa ggacgtgcac agcgggctca tcggaccact gcttgtgtgc

4440

cacaccaaca cactgaaccc cgctcacggc agacaagtga cagtgcaaga gttcgccctg

4500

ttcttcacca tcttcgacga aacaaagagc tggtacttca ccgagaatat ggaacggaac

4560

tgcagagccc cttgcaacat ccagatggaa gatcccacct tcaaagagaa ctaccggttc

4620

cacgccatca acggctacat catggacaca ctgcccggcc tggttatggc ccaggatcag

4680

agaatccggt ggtatctgct gtccatgggc tccaacgaga atatccacag catccacttc

4740

agcggccacg tgttcaccgt gcggaaaaaa gaagagtaca aaatggccct gtacaatctg

4800

taccctgggg tgttcgaaac cgtggaaatg ctgccttcca aggccggcat ttggagagtg

4860

gaatgtctga ttggagagca cctccacgcc ggaatgagca ccctgtttct ggtgtacagc

4920

aacaagtgtc agacccctct cggcatggcc tctggacaca tcagagactt ccagatcacc

4980

gcctctggcc agtacggaca gtgggctcct aaactggctc ggctgcacta cagcggcagc

5040

atcaatgcct ggtccaccaa agagcccttc agctggatca aggtggacct gctggctccc

5100

atgatcatcc acggaatcaa gacccagggc gccagacaga agttcagcag cctgtacatc

5160

agccagttca tcatcatgta cagcctggac ggcaagaagt ggcagaccta cagaggcaac

5220

agcaccggca cactcatggt gttcttcggc aacgtggact ccagcggcat taagcacaac

5280

atcttcaacc ctccaatcat tgcccggtac atccggctgc accccacaca ctacagcatc

5340

cggtctaccc tgagaatgga actgatgggc tgcgacctga acagctgctc tatgcccctc

5400

ggaatggaaa gcaaggccat cagcgacgcc cagatcacag ccagcagcta cttcaccaac

5460

atgttcgcca cttggagccc ctccaaggct agactgcatc tgcagggcag aagcaacgct

5520

tggaggcccc aagtgaacaa ccccaaagag tggctgcagg ttgactttca aaagaccatg

5580

aaagtgaccg gcgtgaccac acagggcgtc aagtctctgc tgacctctat gtacgtgaaa

5640

gagttcctga tctccagcag ccaggacggc catcagtgga ccctgttttt ccagaacggc

5700

aaagtgaaag tgttccaggg caatcaggac agcttcacac ccgtggtcaa ttctctggac

5760

cctccactgc tgaccagata cctgcggatt caccctcagt cttgggtgca ccagatcgct

5820

ctgcggatgg aagtgctggg ctgtgaagct caggacctct actagttaat taagagcatc

5880

ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg

5940

ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt

6000

caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc

6060

ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg

6120

ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt

6180

cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg

6240

agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc

6300

ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc

6360

tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta

6420

ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg

6480

ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt

6540

cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg

6600

gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg

6660

atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa

6720

tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg

6780

cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag

6840

tgagcgagcg agcgcgcagc tgcctgcagg ggcgcgcctc gaggcatgcg gtaccaagct

6900

tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc

6960

tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt

7020

tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt

7080

cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt

7140

atcttatcat gtctggatct gatcactgat atcgcctagg agatccgaac cagataagtg

7200

aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac

7260

ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc

7320

cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt

7380

tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc

7440

tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa

7500

tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa

7560

gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc

7620

ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag

7680

ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca

7740

aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc

7800

gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa

7860

cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct

7920

attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa

7980

cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat

8040

ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc

8100

aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct

8160

tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag

8220

atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta

8280

agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc

8340

tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca

8400

tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg

8460

atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg

8520

ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca

8580

tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa

8640

acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa

8700

ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata

8760

aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat

8820

ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc

8880

cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata

8940

gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt

9000

actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga

9060

agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag

9120

cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa

9180

tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag

9240

agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg

9300

tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat

9360

acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta

9420

ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg

9480

gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc

9540

gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa

9600

gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc

9660

tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt

9720

caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct

9780

tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc

9840

gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg

9900

agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt

9960

gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa

10020

taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa

10080

tagatctaaa ctatgacaat aaagtcttaa actagacaga atagttgtaa actgaaatca

10140

gtccagttat gctgtgaaaa agcatactgg acttttgtta tggctaaagc aaactcttca

10200

ttttctgaag tgcaaattgc ccgtcgtatt aaagaggggc gtggccaagg gcatggtaaa

10260

gactatattc gcggcgttgt gacaatttac cgaacaactc cgcggccggg aagccgatct

10320

cggcttgaac gaattgttag gtggcggtac ttgggtcgat atcaaagtgc atcacttctt

10380

cccgtatgcc caactttgta tagagagcca ctgcgggatc gtcaccgtaa tctgcttgca

10440

cgtagatcac ataagcacca agcgcgttgg cctcatgctt gaggagattg atgagcgcgg

10500

tggcaatgcc ctgcctccgg tgctcgccgg agactgcgag atcatagata tagatctcac

10560

tacgcggctg ctcaaacctg ggcagaacgt aagccgcgag agcgccaaca accgcttctt

10620

ggtcgaaggc agcaagcgcg atgaatgtct tactacggag caagttcccg aggtaatcgg

10680

agtccggctg atgttgggag taggtggcta cgtctccgaa ctcacgaccg aaaagatcaa

10740

gagcagcccg catggatttg acttggtcag ggccgagcct acatgtgcga atgatgccca

10800

tacttgagcc acctaacttt gttttagggc gactgccctg ctgcgtaaca tcgttgctgc

10860

tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta acgcgcttgc

10920

tgcttggatg cccgaggcat agactgtaca aaaaaacagt cataacaagc catgaaaacc

10980

gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt gcgtgagcgc

11040

atacgctact tgcattacag tttacgaacc gaacaggctt atgtcaactg ggttcgtgcc

11100

ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga agtcgaggca

11160

tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg tcaggcattg

11220

gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg gcttcaggag

11280

atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga tgaagtggtt

11340

cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccaggactc tagctatagt

11400

tctagtggtt ggctacgtat actccggaat attaatagat catggagata attaaaatga

11460

taaccatctc gcaaataaat aagtatttta ctgttttcgt aacagttttg taataaaaaa

11520

acctataaat attccggatt attcataccg tcccaccatc gggcgcggat ctcggtccga

11580

aaccatgtcg tactaccatc accatcacca tcacgattac gatatcccaa cgaccgaaaa

11640

cctgtatttt cagggcgcca tgggatcc

11668

<210> 207

<211> 11719

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 207

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg

240

cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt

300

ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc

360

aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag

420

acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga

480

ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac

540

ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca

600

tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat

660

ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag

720

gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa

780

gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga

840

cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc

900

caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca

960

ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt

1020

gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc

1080

tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa

1140

gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc

1200

agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt

1260

taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga

1320

ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg

1380

actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg

1440

tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt

1500

gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga

1560

tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg

1620

cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg

1680

gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc

1740

aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg

1800

gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc

1860

tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag

1920

gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat

1980

ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg

2040

gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg

2100

gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag

2160

ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct

2220

gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc

2280

ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct

2340

gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc

2400

agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc

2460

cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg

2520

aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag

2580

gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac

2640

agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac

2700

tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac

2760

aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag

2820

aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat

2880

gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc

2940

ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg

3000

cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg

3060

cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct

3120

gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc

3180

tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac

3240

cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc

3300

tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag

3360

gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc

3420

ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc

3480

cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat

3540

gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac

3600

cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc

3660

ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag

3720

gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag

3780

aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca

3840

gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag

3900

attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac

3960

gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct

4020

gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg

4080

gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc

4140

agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc

4200

tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg

4260

ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag

4320

cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac

4380

cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg

4440

gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac

4500

accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc

4560

atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc

4620

ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc

4680

aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg

4740

tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat

4800

gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg

4860

gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg

4920

attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc

4980

cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc

5040

cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc

5100

tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc

5160

catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc

5220

atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc

5280

accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac

5340

ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc

5400

ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag

5460

agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc

5520

acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc

5580

caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact

5640

ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg

5700

atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag

5760

gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg

5820

ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg

5880

gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca

5940

tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa

6000

caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat

6060

tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc

6120

aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt

6180

ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg

6240

ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc

6300

ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct

6360

ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg

6420

ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg

6480

gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc

6540

cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa

6600

atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg

6660

ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg

6720

gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact

6780

acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc

6840

gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc

6900

gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa

6960

gtactagagg atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa

7020

cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt

7080

gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa

7140

agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca

7200

tgtctggatc tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt

7260

tccaaactat tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc

7320

atctattttg tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt

7380

tcccaactat tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa

7440

acatcctgcc aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga

7500

atgaaaattt ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc

7560

ttatttgcag cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg

7620

gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt

7680

tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc

7740

gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg

7800

attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga

7860

cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc

7920

ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa

7980

aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa

8040

tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa

8100

tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt

8160

gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg

8220

cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag

8280

atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg

8340

agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg

8400

gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt

8460

ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga

8520

cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac

8580

ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc

8640

atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc

8700

gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac

8760

tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag

8820

gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg

8880

gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta

8940

tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg

9000

ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata

9060

tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt

9120

ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc

9180

ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct

9240

tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa

9300

ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag

9360

tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc

9420

tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg

9480

actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca

9540

cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt

9600

gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg

9660

tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc

9720

ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc

9780

ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc

9840

cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg

9900

cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga

9960

gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt

10020

cacaccgcag accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat

10080

gccctgcgta agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa

10140

actatgacaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta

10200

tgctgtgaaa aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa

10260

gtgcaaattg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt

10320

cgcggcgttg tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa

10380

cgaattgtta ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc

10440

ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca

10500

cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc

10560

cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct

10620

gctcaaacct gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg

10680

cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct

10740

gatgttggga gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc

10800

gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc

10860

cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca

10920

tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat

10980

gcccgaggca tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg

11040

ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac

11100

ttgcattaca gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt

11160

ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc

11220

tggctggcga acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg

11280

ctgttcttct acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga

11340

cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc

11400

ggttttctgg aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt

11460

tggctacgta tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct

11520

cgcaaataaa taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa

11580

tattccggat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc

11640

gtactaccat caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt

11700

tcagggcgcc atgggatcc

11719

<210> 208

<211> 11796

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 208

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg

240

cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt

300

ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc

360

aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag

420

acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga

480

ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac

540

ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca

600

tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat

660

ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag

720

gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa

780

gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga

840

cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc

900

caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca

960

ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt

1020

gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc

1080

tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa

1140

gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc

1200

agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt

1260

taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga

1320

ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg

1380

actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg

1440

tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt

1500

gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga

1560

tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg

1620

cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg

1680

gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc

1740

aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg

1800

gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc

1860

tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag

1920

gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat

1980

ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg

2040

gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg

2100

gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag

2160

ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct

2220

gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc

2280

ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct

2340

gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc

2400

agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc

2460

cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg

2520

aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag

2580

gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac

2640

agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac

2700

tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac

2760

aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag

2820

aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat

2880

gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc

2940

ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg

3000

cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg

3060

cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct

3120

gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc

3180

tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac

3240

cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc

3300

tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag

3360

gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc

3420

ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc

3480

cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat

3540

gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac

3600

cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc

3660

ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag

3720

gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag

3780

aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca

3840

gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag

3900

attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac

3960

gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct

4020

gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg

4080

gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc

4140

agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc

4200

tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg

4260

ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag

4320

cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac

4380

cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg

4440

gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac

4500

accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc

4560

atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc

4620

ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc

4680

aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg

4740

tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat

4800

gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg

4860

gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg

4920

attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc

4980

cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc

5040

cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc

5100

tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc

5160

catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc

5220

atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc

5280

accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac

5340

ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc

5400

ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag

5460

agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc

5520

acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc

5580

caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact

5640

ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg

5700

atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag

5760

gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg

5820

ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg

5880

gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca

5940

tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa

6000

caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat

6060

tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc

6120

aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt

6180

ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg

6240

ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc

6300

ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct

6360

ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg

6420

ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg

6480

gcactgataa ttccgtggtg ttgtctccat aaagtaggaa acactacacg attccataaa

6540

gtaggaaaca ctacatcact ccataaagta ggaaacacta catgtgcctt ctagttgcca

6600

gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac

6660

tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat

6720

tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca

6780

tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg

6840

cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc

6900

tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc

6960

ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt

7020

accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt tgtagaggtt

7080

ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca

7140

attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc

7200

acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc

7260

atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag atccgaacca

7320

gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga

7380

cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca

7440

tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat ttttcttcct

7500

gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat cttcggctac

7560

tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa tgtttgtaat

7620

tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg

7680

cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc

7740

cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc

7800

ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct

7860

cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac

7920

ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac

7980

tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat

8040

ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa

8100

aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg gaacccctat

8160

ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata

8220

aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct

8280

tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa

8340

agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa

8400

cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt

8460

taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg

8520

tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca

8580

tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa

8640

cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt

8700

gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc

8760

cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa

8820

actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga

8880

ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc

8940

tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga

9000

tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga

9060

acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga

9120

ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat

9180

ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt

9240

ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct

9300

gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc

9360

ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc

9420

aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc

9480

gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc

9540

gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg

9600

aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata

9660

cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta

9720

tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc

9780

ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg

9840

atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt

9900

cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt

9960

ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga

10020

gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac

10080

gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa tcggttacgg

10140

ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact

10200

gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat agttgtaaac

10260

tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg gctaaagcaa

10320

actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt ggccaagggc

10380

atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg cggccgggaa

10440

gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat caaagtgcat

10500

cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc

10560

tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga ggagattgat

10620

gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat catagatata

10680

gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag cgccaacaac

10740

cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag

10800

gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact cacgaccgaa

10860

aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac atgtgcgaat

10920

gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaacatc

10980

gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac

11040

gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca

11100

tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc

11160

gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gtcaactggg

11220

ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc agcagcgaag

11280

tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc

11340

aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat ctgccctggc

11400

ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg

11460

aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc caggactcta

11520

gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca tggagataat

11580

taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa cagttttgta

11640

ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg gcgcggatct

11700

cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga tatcccaacg

11760

accgaaaacc tgtattttca gggcgccatg ggatcc

11796

<210> 209

<211> 10795

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 209

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600

ggtttaaacg ccgccaccat gcagatcgag ctgtctacct gcttcttcct gtgcctgctg

660

cggttctgct tcagcgccac cagaagatat tacctgggcg ccgtggaact gagctgggac

720

tacatgcagt ctgacctggg agagctgccc gtggacgcta gatttcctcc aagagtgccc

780

aagagcttcc ccttcaacac ctccgtggtg tacaagaaaa ccctgttcgt ggaattcacc

840

gaccacctgt tcaatatcgc caagcctcgg cctccttgga tgggactgct gggacctaca

900

attcaggccg aggtgtacga caccgtggtc atcaccctga agaacatggc cagccatcct

960

gtgtctctgc acgccgtggg agtgtcttat tggaaggctt ctgagggcgc cgagtacgac

1020

gatcagacaa gccagagaga gaaagaggac gacaaggttt tccctggcgg cagccacacc

1080

tatgtctggc aggtcctgaa agaaaacggc cctatggcct ccgatcctct gtgcctgaca

1140

tacagctacc tgagccacgt ggacctggtc aaggacctga attctggcct gatcggagcc

1200

ctgctcgtgt gtagagaagg cagcctggcc aaagagaaaa cccagacact gcacaagttc

1260

atcctgctgt tcgccgtgtt cgacgagggc aagagctggc acagcgagac aaagaacagc

1320

ctgatgcagg acagggatgc cgcctctgct agagcttggc ctaagatgca caccgtgaac

1380

ggctacgtga acagaagcct gcctggactg atcggctgcc acagaaagtc cgtgtactgg

1440

cacgtgatcg gcatgggcac aacacctgag gtgcacagca tctttctgga aggccacacc

1500

ttcctcgtgc ggaaccacag acaggccagc ctggaaatca gccctatcac cttcctgacc

1560

gctcagaccc tgctgatgga tctgggccag tttctgctgt tctgccacat cagctcccac

1620

cagcacgatg gcatggaagc ctacgtgaag gtggacagct gccccgaaga accccagctg

1680

cggatgaaga acaacgagga agccgaggac tacgacgacg acctgaccga ctctgagatg

1740

gacgtcgtca gattcgacga cgataacagc cccagcttca tccagatcag aagcgtggcc

1800

aagaagcacc ccaagacctg ggtgcactat atcgccgccg aggaagagga ctgggattac

1860

gctcctctgg tgctggcccc tgacgacaga agctacaaga gccagtacct gaacaacggc

1920

cctcagcgga tcggccggaa gtataagaaa gtgcggttca tggcctacac cgacgagaca

1980

ttcaagacca gagaggccat ccagcacgag agcggaattc tgggccctct gctgtatggc

2040

gaagtgggcg atacactgct gatcatcttc aagaaccagg ccagcagacc ctacaacatc

2100

taccctcacg gcatcaccga tgtgcggccc ctgtattcta gaaggctgcc caagggcgtg

2160

aagcacctga aggacttccc tatcctgcct ggcgagattt tcaagtacaa gtggaccgtg

2220

accgtggaag atggccccac caagagcgac cctagatgtc tgacacggta ctacagcagc

2280

ttcgtgaaca tggaacgcga cctggccagc ggcctgattg gacctctgct gatctgctac

2340

aaagaaagcg tggaccagcg gggcaaccag atcatgagcg acaagcggaa cgtgatcctg

2400

tttagcgtgt tcgatgagaa ccggtcctgg tatctgaccg agaacatcca gcggtttctg

2460

cccaatcctg ccggggtgca actggaagat cctgagttcc aggcaagcaa catcatgcac

2520

tccatcaatg gctatgtgtt cgacagcctg cagctgagcg tgtgcctgca cgaagtggcc

2580

tactggtaca tcctgagcat tggcgcccag accgacttcc tgtccgtgtt ctttagcggc

2640

tacaccttca agcacaagat ggtgtacgag gataccctga cactgttccc attcagcggc

2700

gagacagtgt tcatgagcat ggaaaacccc ggcctgtgga ttctgggctg tcacaacagc

2760

gacttccgga acagaggcat gacagccctg ctgaaggtgt ccagctgcga caagaacacc

2820

ggcgactact acgaggacag ctatgaggac atcagcgcct acctgctgag caagaacaat

2880

gccatcgagc ctcggagctt cagccagaat cctcctgtgc tgaagcggca ccagcgcgag

2940

atcaccagaa caaccctgca gagcgaccaa gaggaaatcg attacgacga caccatcagc

3000

gtcgagatga agaaagaaga tttcgacatc tacgacgagg acgagaatca gagccccaga

3060

agctttcaga aaaagacccg gcactacttc attgccgccg tcgagagact gtgggactac

3120

ggcatgtcta gcagccctca cgtgctgaga aatagagccc agagcggcag cgtgccccag

3180

ttcaagaaag tggtgttcca agagttcacc gacggcagct tcacccagcc actgtataga

3240

ggcgagctga acgagcatct gggcctgctg ggcccttata tcagagccga agtggaagat

3300

aacatcatgg tcaccttccg gaatcaggct agccggcctt acagcttcta cagctccctg

3360

atcagctacg aagaggacca gagacagggc gctgagccca gaaagaactt cgtgaagccc

3420

aacgagacta agacctactt ttggaaggtg cagcaccaca tggcccctac aaaggacgag

3480

ttcgactgca aagcctgggc ctacttctcc gatgtggatc tggaaaagga cgtgcacagc

3540

gggctcatcg gaccactgct tgtgtgccac accaacacac tgaaccccgc tcacggcaga

3600

caagtgacag tgcaagagtt cgccctgttc ttcaccatct tcgacgaaac aaagagctgg

3660

tacttcaccg agaatatgga acggaactgc agagcccctt gcaacatcca gatggaagat

3720

cccaccttca aagagaacta ccggttccac gccatcaacg gctacatcat ggacacactg

3780

cccggcctgg ttatggccca ggatcagaga atccggtggt atctgctgtc catgggctcc

3840

aacgagaata tccacagcat ccacttcagc ggccacgtgt tcaccgtgcg gaaaaaagaa

3900

gagtacaaaa tggccctgta caatctgtac cctggggtgt tcgaaaccgt ggaaatgctg

3960

ccttccaagg ccggcatttg gagagtggaa tgtctgattg gagagcacct ccacgccgga

4020

atgagcaccc tgtttctggt gtacagcaac aagtgtcaga cccctctcgg catggcctct

4080

ggacacatca gagacttcca gatcaccgcc tctggccagt acggacagtg ggctcctaaa

4140

ctggctcggc tgcactacag cggcagcatc aatgcctggt ccaccaaaga gcccttcagc

4200

tggatcaagg tggacctgct ggctcccatg atcatccacg gaatcaagac ccagggcgcc

4260

agacagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc

4320

aagaagtggc agacctacag aggcaacagc accggcacac tcatggtgtt cttcggcaac

4380

gtggactcca gcggcattaa gcacaacatc ttcaaccctc caatcattgc ccggtacatc

4440

cggctgcacc ccacacacta cagcatccgg tctaccctga gaatggaact gatgggctgc

4500

gacctgaaca gctgctctat gcccctcgga atggaaagca aggccatcag cgacgcccag

4560

atcacagcca gcagctactt caccaacatg ttcgccactt ggagcccctc caaggctaga

4620

ctgcatctgc agggcagaag caacgcttgg aggccccaag tgaacaaccc caaagagtgg

4680

ctgcaggttg actttcaaaa gaccatgaaa gtgaccggcg tgaccacaca gggcgtcaag

4740

tctctgctga cctctatgta cgtgaaagag ttcctgatct ccagcagcca ggacggccat

4800

cagtggaccc tgtttttcca gaacggcaaa gtgaaagtgt tccagggcaa tcaggacagc

4860

ttcacacccg tggtcaattc tctggaccct ccactgctga ccagatacct gcggattcac

4920

cctcagtctt gggtgcacca gatcgctctg cggatggaag tgctgggctg tgaagctcag

4980

gacctctact agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt

5040

ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac

5100

atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga

5160

aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg

5220

aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt

5280

tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata

5340

aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg

5400

tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac

5460

tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct

5520

gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt

5580

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc

5640

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc

5700

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt

5760

gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct

5820

acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt

5880

gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa

5940

ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc

6000

gcgcctcgag gcatgcggta ccaagcttgt cgagaagtac tagaggatca taatcagcca

6060

taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct

6120

gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta

6180

caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag

6240

ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgat cactgatatc

6300

gcctaggaga tccgaaccag ataagtgaaa tctagttcca aactattttg tcatttttaa

6360

ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac tcttccctaa

6420

ataatcctta aaaactccat ttccacccct cccagttccc aactattttg tccgcccaca

6480

gcggggcatt tttcttcctg ttatgttttt aatcaaacat cctgccaact ccatgtgaca

6540

aaccgtcatc ttcggctact ttttctctgt cacagaatga aaatttttct gtcatctctt

6600

cgttattaat gtttgtaatt gactgaatat caacgcttat ttgcagcctg aatggcgaat

6660

gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga

6720

ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg

6780

ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat

6840

ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg

6900

ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata

6960

gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt

7020

tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat

7080

ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa

7140

atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca

7200

tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc

7260

aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc

7320

acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt

7380

acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt

7440

ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg

7500

ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact

7560

caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg

7620

ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga

7680

aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg

7740

aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa

7800

tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac

7860

aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc

7920

cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca

7980

ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga

8040

gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta

8100

agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc

8160

atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc

8220

cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt

8280

cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac

8340

cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct

8400

tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact

8460

tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg

8520

ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata

8580

aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga

8640

cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag

8700

ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg

8760

agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac

8820

ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca

8880

acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg

8940

cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc

9000

gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga

9060

tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcagacca gccgcgtaac

9120

ctggcaaaat cggttacggt tgagtaataa atggatgccc tgcgtaagcg ggtgtgggcg

9180

gacaataaag tcttaaactg aacaaaatag atctaaacta tgacaataaa gtcttaaact

9240

agacagaata gttgtaaact gaaatcagtc cagttatgct gtgaaaaagc atactggact

9300

tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa

9360

gaggggcgtg gccaagggca tggtaaagac tatattcgcg gcgttgtgac aatttaccga

9420

acaactccgc ggccgggaag ccgatctcgg cttgaacgaa ttgttaggtg gcggtacttg

9480

ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg

9540

cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct

9600

catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga

9660

ctgcgagatc atagatatag atctcactac gcggctgctc aaacctgggc agaacgtaag

9720

ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac

9780

tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt

9840

ctccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc

9900

cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac

9960

tgccctgctg cgtaacatcg ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa

10020

catcgaccca cggcgtaacg cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa

10080

aaacagtcat aacaagccat gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc

10140

aaggttctgg accagttgcg tgagcgcata cgctacttgc attacagttt acgaaccgaa

10200

caggcttatg tcaactgggt tcgtgccttc atccgtttcc acggtgtgcg tcacccggca

10260

accttgggca gcagcgaagt cgaggcattt ctgtcctggc tggcgaacga gcgcaaggtt

10320

tcggtctcca cgcatcgtca ggcattggcg gccttgctgt tcttctacgg caaggtgctg

10380

tgcacggatc tgccctggct tcaggagatc ggaagacctc ggccgtcgcg gcgcttgccg

10440

gtggtgctga ccccggatga agtggttcgc atcctcggtt ttctggaagg cgagcatcgt

10500

ttgttcgccc aggactctag ctatagttct agtggttggc tacgtatact ccggaatatt

10560

aatagatcat ggagataatt aaaatgataa ccatctcgca aataaataag tattttactg

10620

ttttcgtaac agttttgtaa taaaaaaacc tataaatatt ccggattatt cataccgtcc

10680

caccatcggg cgcggatctc ggtccgaaac catgtcgtac taccatcacc atcaccatca

10740

cgattacgat atcccaacga ccgaaaacct gtattttcag ggcgccatgg gatcc

10795

<210> 210

<211> 10846

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 210

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600

ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg

660

aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac

720

tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc

780

aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact

840

gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc

900

atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct

960

gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat

1020

gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc

1080

tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc

1140

tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc

1200

ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc

1260

atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc

1320

ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat

1380

ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg

1440

catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc

1500

ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact

1560

gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac

1620

cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg

1680

aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg

1740

gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc

1800

aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat

1860

gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc

1920

ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc

1980

ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg

2040

gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc

2100

tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg

2160

aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg

2220

actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc

2280

tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac

2340

aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg

2400

ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg

2460

cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac

2520

agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc

2580

tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc

2640

tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg

2700

gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct

2760

gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact

2820

ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat

2880

gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc

2940

agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg

3000

accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg

3060

aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag

3120

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc

3180

agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag

3240

gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg

3300

aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg

3360

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat

3420

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc

3480

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc

3540

aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt

3600

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact

3660

gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact

3720

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc

3780

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg

3840

gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac

3900

atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag

3960

atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag

4020

gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc

4080

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc

4140

agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg

4200

ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag

4260

gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag

4320

ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg

4380

cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc

4440

tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac

4500

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac

4560

agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc

4620

agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg

4680

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg

4740

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg

4800

accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc

4860

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct

4920

gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc

4980

tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac

5040

tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt

5100

tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg

5160

gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc

5220

gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga

5280

ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc

5340

tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt

5400

tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg

5460

tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg

5520

ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc

5580

gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt

5640

ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg

5700

ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt

5760

gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca

5820

atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata

5880

agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt

5940

ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg

6000

acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga

6060

ggcatgcggt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt

6120

tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa

6180

aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag

6240

caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt

6300

gtccaaactc atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag

6360

atccgaacca gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat

6420

tagcttacga cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt

6480

aaaaactcca tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat

6540

ttttcttcct gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat

6600

cttcggctac tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa

6660

tgtttgtaat tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc

6720

cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac

6780

ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg

6840

ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt

6900

tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc

6960

cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct

7020

tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga

7080

ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga

7140

attttaacaa aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg

7200

gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat

7260

aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc

7320

gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa

7380

cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac

7440

tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga

7500

tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag

7560

agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca

7620

cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca

7680

tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa

7740

ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc

7800

tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa

7860

cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag

7920

actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct

7980

ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac

8040

tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa

8100

ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt

8160

aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat

8220

ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg

8280

agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc

8340

ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg

8400

tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag

8460

cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact

8520

ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg

8580

gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc

8640

ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg

8700

aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg

8760

cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag

8820

ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc

8880

gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct

8940

ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc

9000

ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc

9060

gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt

9120

ttctccttac gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa

9180

tcggttacgg ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa

9240

gtcttaaact gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat

9300

agttgtaaac tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg

9360

gctaaagcaa actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt

9420

ggccaagggc atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg

9480

cggccgggaa gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat

9540

caaagtgcat cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt

9600

caccgtaatc tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga

9660

ggagattgat gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat

9720

catagatata gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag

9780

cgccaacaac cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca

9840

agttcccgag gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact

9900

cacgaccgaa aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac

9960

atgtgcgaat gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct

10020

gcgtaacatc gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc

10080

acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca

10140

taacaagcca tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg

10200

gaccagttgc gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat

10260

gtcaactggg ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc

10320

agcagcgaag tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc

10380

acgcatcgtc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat

10440

ctgccctggc ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg

10500

accccggatg aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc

10560

caggactcta gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca

10620

tggagataat taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa

10680

cagttttgta ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg

10740

gcgcggatct cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga

10800

tatcccaacg accgaaaacc tgtattttca gggcgccatg ggatcc

10846

<210> 211

<211> 10923

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 211

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600

ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg

660

aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac

720

tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc

780

aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact

840

gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc

900

atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct

960

gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat

1020

gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc

1080

tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc

1140

tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc

1200

ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc

1260

atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc

1320

ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat

1380

ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg

1440

catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc

1500

ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact

1560

gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac

1620

cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg

1680

aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg

1740

gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc

1800

aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat

1860

gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc

1920

ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc

1980

ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg

2040

gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc

2100

tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg

2160

aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg

2220

actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc

2280

tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac

2340

aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg

2400

ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg

2460

cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac

2520

agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc

2580

tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc

2640

tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg

2700

gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct

2760

gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact

2820

ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat

2880

gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc

2940

agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg

3000

accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg

3060

aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag

3120

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc

3180

agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag

3240

gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg

3300

aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg

3360

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat

3420

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc

3480

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc

3540

aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt

3600

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact

3660

gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact

3720

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc

3780

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg

3840

gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac

3900

atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag

3960

atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag

4020

gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc

4080

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc

4140

agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg

4200

ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag

4260

gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag

4320

ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg

4380

cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc

4440

tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac

4500

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac

4560

agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc

4620

agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg

4680

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg

4740

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg

4800

accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc

4860

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct

4920

gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc

4980

tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac

5040

tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt

5100

tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg

5160

gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc

5220

gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga

5280

ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc

5340

tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt

5400

tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg

5460

tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg

5520

ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc

5580

gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctccataaa

5640

gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca taaagtagga

5700

aacactacat gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc

5760

cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc

5820

gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg

5880

ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga

5940

gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa

6000

cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg

6060

cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct

6120

gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata

6180

atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc

6240

ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat

6300

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg

6360

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca

6420

ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc

6480

atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc

6540

ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc

6600

cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc

6660

atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt

6720

catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa

6780

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg

6840

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc

6900

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg

6960

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc

7020

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt

7080

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc

7140

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta

7200

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt

7260

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta

7320

tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat

7380

gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt

7440

ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg

7500

agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga

7560

agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg

7620

tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt

7680

tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg

7740

cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg

7800

aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga

7860

tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc

7920

tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc

7980

ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc

8040

ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg

8100

cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac

8160

gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc

8220

actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt

8280

aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac

8340

caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa

8400

aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc

8460

accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt

8520

aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg

8580

ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc

8640

agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt

8700

accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga

8760

gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct

8820

tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg

8880

cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca

8940

cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa

9000

cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt

9060

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga

9120

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga

9180

gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc

9240

cgcgtaacct ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg

9300

tgtgggcgga caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt

9360

cttaaactag acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat

9420

actggacttt tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc

9480

gtattaaaga ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa

9540

tttaccgaac aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc

9600

ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag

9660

agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc

9720

gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc

9780

gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag

9840

aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa

9900

tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt

9960

ggctacgtct ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg

10020

gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt

10080

agggcgactg ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata

10140

acatcaaaca tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact

10200

gtacaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc

10260

gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac

10320

gaaccgaaca ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc

10380

acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc

10440

gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca

10500

aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc

10560

gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg

10620

agcatcgttt gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc

10680

ggaatattaa tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta

10740

ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca

10800

taccgtccca ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat

10860

caccatcacg attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga

10920

tcc

10923

<210> 212

<211> 12404

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 212

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gagcggccgc tcaatattgg ccattagcca tattattcat

240

tggttatata gcataaatca atattggcta ttggccattg catacgttgt atctatatca

300

taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc attgattatt

360

gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt

420

ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc

480

attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg

540

tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat

600

gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca

660

gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat

720

taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc

780

acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg

840

gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg

900

gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag

960

gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac

1020

gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac

1080

tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt

1140

agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc

1200

tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc

1260

gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg

1320

cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc

1380

ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt

1440

gagcaggggg tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga

1500

gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc

1560

gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg

1620

gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc

1680

gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct

1740

ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg

1800

cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg

1860

tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc

1920

tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcggctct

1980

agagcctctg ctaaccatgt tttagccttc ttctttttcc tacagctcct gggcaacgtg

2040

ctggttattg tgctgtctca tcatttgtcg acagaattcc tcgaagatcc gaaggggttc

2100

aagcttggca ttccggtact gttggtaaag ccagtttaaa cgccgccacc atgcagatcg

2160

agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc accagaagat

2220

attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg ggagagctgc

2280

ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac acctccgtgg

2340

tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc gccaagcctc

2400

ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gacaccgtgg

2460

tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg ggagtgtctt

2520

attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga gagaaagagg

2580

acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg aaagaaaacg

2640

gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac gtggacctgg

2700

tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa ggcagcctgg

2760

ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ttcgacgagg

2820

gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat gccgcctctg

2880

ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc ctgcctggac

2940

tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc acaacacctg

3000

aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac agacaggcca

3060

gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg gatctgggcc

3120

agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gcctacgtga

3180

aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gaagccgagg

3240

actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gacgataaca

3300

gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc tgggtgcact

3360

atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc cctgacgaca

3420

gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg aagtataaga

3480

aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc atccagcacg

3540

agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg ctgatcatct

3600

tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc gatgtgcggc

3660

ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc cctatcctgc

3720

ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc accaagagcg

3780

accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc gacctggcca

3840

gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag cggggcaacc

3900

agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag aaccggtcct

3960

ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg caactggaag

4020

atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg ttcgacagcc

4080

tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc attggcgccc

4140

agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag atggtgtacg

4200

aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggaaaacc

4260

ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atgacagccc

4320

tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac agctatgagg

4380

acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc ttcagccaga

4440

atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg cagagcgacc

4500

aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa gatttcgaca

4560

tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc cggcactact

4620

tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cacgtgctga

4680

gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caagagttca

4740

ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat ctgggcctgc

4800

tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc cggaatcagg

4860

ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cagagacagg

4920

gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac ttttggaagg

4980

tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg gcctacttct

5040

ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg cttgtgtgcc

5100

acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag ttcgccctgt

5160

tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg gaacggaact

5220

gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac taccggttcc

5280

acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc caggatcaga

5340

gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc atccacttca

5400

gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg tacaatctgt

5460

accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tggagagtgg

5520

aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg gtgtacagca

5580

acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc cagatcaccg

5640

cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac agcggcagca

5700

tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggctccca

5760

tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc ctgtacatca

5820

gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac agaggcaaca

5880

gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt aagcacaaca

5940

tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac tacagcatcc

6000

ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct atgcccctcg

6060

gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca

6120

tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga agcaacgctt

6180

ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa aagaccatga

6240

aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg tacgtgaaag

6300

agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc cagaacggca

6360

aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat tctctggacc

6420

ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac cagatcgctc

6480

tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctagttaatt aagagcatct

6540

taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt

6600

taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc

6660

aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc

6720

tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt

6780

tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc

6840

ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga

6900

gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc

6960

cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct

7020

cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag

7080

gttgctgggc actgataatt ccgtggtgtt gtctccataa agtaggaaac actacacgat

7140

tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca tgtgccttct

7200

agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc

7260

actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt

7320

cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat

7380

agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag

7440

tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg

7500

ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac

7560

gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg

7620

catgcggtac caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg

7680

tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa

7740

tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca

7800

atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt

7860

ccaaactcat caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat

7920

ccgaaccaga taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta

7980

gcttacgacg ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa

8040

aaactccatt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt

8100

ttcttcctgt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct

8160

tcggctactt tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg

8220

tttgtaattg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc

8280

tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt

8340

gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc

8400

ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta

8460

cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc

8520

tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg

8580

ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt

8640

ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat

8700

tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga

8760

acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa

8820

ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt

8880

gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg

8940

ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg

9000

gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg

9060

agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag

9120

caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca

9180

gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg

9240

agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc

9300

gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg

9360

aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg

9420

ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac

9480

tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg

9540

tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg

9600

gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact

9660

atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa

9720

ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt

9780

aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag

9840

ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct

9900

ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt

9960

tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg

10020

cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct

10080

gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc

10140

gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg

10200

tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa

10260

ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg

10320

gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg

10380

ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga

10440

tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt

10500

ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct

10560

gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga

10620

acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt

10680

ctccttacgc atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc

10740

ggttacggtt gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt

10800

cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag

10860

ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc

10920

taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg

10980

ccaagggcat ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg

11040

gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca

11100

aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca

11160

ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg

11220

agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca

11280

tagatataga tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg

11340

ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag

11400

ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca

11460

cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat

11520

gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc

11580

gtaacatcgt tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac

11640

ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata

11700

acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga

11760

ccagttgcgt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt

11820

caactgggtt cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag

11880

cagcgaagtc gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac

11940

gcatcgtcag gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct

12000

gccctggctt caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac

12060

cccggatgaa gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca

12120

ggactctagc tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg

12180

gagataatta aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca

12240

gttttgtaat aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc

12300

gcggatctcg gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata

12360

tcccaacgac cgaaaacctg tattttcagg gcgccatggg atcc

12404

<210> 213

<211> 11356

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 213

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gagagtcaat gggaaaaacc cattggagcc aagtacactg

240

actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc

300

aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt

360

tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actgacatgt

420

atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt

480

gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccattg

540

ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg

600

cacatacata aggtcaatag gggtgactag tggagaagag catgcttgag ggctgagtgc

660

ccctcagtgg gcagagagca catggcccac agtccctgag aagttggggg gaggggtggg

720

caattgaact ggtgcctaga gaaggtgggg cttgggtaaa ctgggaaagt gatgtggtgt

780

actggctcca cctttttccc cagggtgggg gagaaccata tataagtgca gtagtctctg

840

tgaacattca agcttctgcc ttctccctcc tgtgagtttg gtaagtcact gactgtctat

900

gcctgggaaa gggtgggcag gagatggggc agtgcaggaa aagtggcact atgaaccctg

960

cagccctaga caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacag

1020

tagcttccgt ttaaacgccg ccaccatgca gattgagctg agcacctgct tcttcctgtg

1080

cctgctgagg ttctgcttct ctgccaccag gagatactac ctgggggctg tggagctgag

1140

ctgggactac atgcagtctg acctggggga gctgcctgtg gatgccaggt tcccccccag

1200

agtgcccaag agcttcccct tcaacacctc tgtggtgtac aagaagaccc tgtttgtgga

1260

gttcactgac cacctgttca acattgccaa gcccaggccc ccctggatgg gcctgctggg

1320

ccccaccatc caggctgagg tgtatgacac tgtggtgatc accctgaaga acatggccag

1380

ccaccctgtg agcctgcatg ctgtgggggt gagctactgg aaggcctctg agggggctga

1440

gtatgatgac cagaccagcc agagggagaa ggaggatgac aaggtgttcc ctgggggcag

1500

ccacacctat gtgtggcagg tgctgaagga gaatggcccc atggcctctg accccctgtg

1560

cctgacctac agctacctga gccatgtgga cctggtgaag gacctgaact ctggcctgat

1620

tggggccctg ctggtgtgca gggagggcag cctggccaag gagaagaccc agaccctgca

1680

caagttcatc ctgctgtttg ctgtgtttga tgagggcaag agctggcact ctgaaaccaa

1740

gaacagcctg atgcaggaca gggatgctgc ctctgccagg gcctggccca agatgcacac

1800

tgtgaatggc tatgtgaaca ggagcctgcc tggcctgatt ggctgccaca ggaagtctgt

1860

gtactggcat gtgattggca tgggcaccac ccctgaggtg cacagcatct tcctggaggg

1920

ccacaccttc ctggtcagga accacaggca ggccagcctg gagatcagcc ccatcacctt

1980

cctgactgcc cagaccctgc tgatggacct gggccagttc ctgctgttct gccacatcag

2040

cagccaccag catgatggca tggaggccta tgtgaaggtg gacagctgcc ctgaggagcc

2100

ccagctgagg atgaagaaca atgaggaggc tgaggactat gatgatgacc tgactgactc

2160

tgagatggat gtggtgaggt ttgatgatga caacagcccc agcttcatcc agatcaggtc

2220

tgtggccaag aagcacccca agacctgggt gcactacatt gctgctgagg aggaggactg

2280

ggactatgcc cccctggtgc tggcccctga tgacaggagc tacaagagcc agtacctgaa

2340

caatggcccc cagaggattg gcaggaagta caagaaggtc aggttcatgg cctacactga

2400

tgaaaccttc aagaccaggg aggccatcca gcatgagtct ggcatcctgg gccccctgct

2460

gtatggggag gtgggggaca ccctgctgat catcttcaag aaccaggcca gcaggcccta

2520

caacatctac ccccatggca tcactgatgt gaggcccctg tacagcagga ggctgcccaa

2580

gggggtgaag cacctgaagg acttccccat cctgcctggg gagatcttca agtacaagtg

2640

gactgtgact gtggaggatg gccccaccaa gtctgacccc aggtgcctga ccagatacta

2700

cagcagcttt gtgaacatgg agagggacct ggcctctggc ctgattggcc ccctgctgat

2760

ctgctacaag gagtctgtgg accagagggg caaccagatc atgtctgaca agaggaatgt

2820

gatcctgttc tctgtgtttg atgagaacag gagctggtac ctgactgaga acatccagag

2880

gttcctgccc aaccctgctg gggtgcagct ggaggaccct gagttccagg ccagcaacat

2940

catgcacagc atcaatggct atgtgtttga cagcctgcag ctgtctgtgt gcctgcatga

3000

ggtggcctac tggtacatcc tgagcattgg ggcccagact gacttcctgt ctgtgttctt

3060

ctctggctac accttcaagc acaagatggt gtatgaggac accctgaccc tgttcccctt

3120

ctctggggag actgtgttca tgagcatgga gaaccctggc ctgtggattc tgggctgcca

3180

caactctgac ttcaggaaca ggggcatgac tgccctgctg aaagtctcca gctgtgacaa

3240

gaacactggg gactactatg aggacagcta tgaggacatc tctgcctacc tgctgagcaa

3300

gaacaatgcc attgagccca ggagcttcag ccagaatgcc actaatgtgt ctaacaacag

3360

caacaccagc aatgacagca atgtgtctcc cccagtgctg aagaggcacc agagggagat

3420

caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca ccatctctgt

3480

ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga gccccaggag

3540

cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gggactatgg

3600

catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg tgccccagtt

3660

caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgtacagagg

3720

ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tggaggacaa

3780

catcatggtg accttcagga accaggccag caggccctac agcttctaca gcagcctgat

3840

cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg tgaagcccaa

3900

tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggatgagtt

3960

tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg tgcactctgg

4020

cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc atggcaggca

4080

ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca agagctggta

4140

cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga tggaggaccc

4200

caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg acaccctgcc

4260

tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca tgggcagcaa

4320

tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga agaaggagga

4380

gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agatgctgcc

4440

cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc atgctggcat

4500

gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggcctctgg

4560

ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg cccccaagct

4620

ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc ccttcagctg

4680

gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc agggggccag

4740

gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc tggatggcaa

4800

gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct ttggcaatgt

4860

ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca gatacatcag

4920

gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga tgggctgtga

4980

cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg atgcccagat

5040

cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca aggccaggct

5100

gcacctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggagtggct

5160

gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg gggtgaagag

5220

cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg atggccacca

5280

gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc aggacagctt

5340

cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga ggattcaccc

5400

ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg aggcccagga

5460

cctgtactga ttaattaaga gcatcttacc gccatttatt cccatatttg ttctgttttt

5520

cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat

5580

ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa

5640

ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa

5700

agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta

5760

tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa

5820

tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg

5880

tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc

5940

ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc

6000

cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtct

6060

ccataaagta ggaaacacta cacgattcca taaagtagga aacactacat cactccataa

6120

agtaggaaac actacatgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg

6180

tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa

6240

ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca

6300

gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg

6360

ctctagatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca

6420

cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct

6480

cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag

6540

cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt accaagcttg tcgagaagta

6600

ctagaggatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct

6660

cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt

6720

tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc

6780

atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt

6840

ctggatctga tcactgatat cgcctaggag atccgaacca gataagtgaa atctagttcc

6900

aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc agttcccatc

6960

tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc tcccagttcc

7020

caactatttt gtccgcccac agcggggcat ttttcttcct gttatgtttt taatcaaaca

7080

tcctgccaac tccatgtgac aaaccgtcat cttcggctac tttttctctg tcacagaatg

7140

aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tgactgaata tcaacgctta

7200

tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg

7260

tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg

7320

ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg

7380

ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt

7440

agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt

7500

tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta

7560

tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa

7620

atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt

7680

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac

7740

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa

7800

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat

7860

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc

7920

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga

7980

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg

8040

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc

8100

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag

8160

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc

8220

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg

8280

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg

8340

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac

8400

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac

8460

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg

8520

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg

8580

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg

8640

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac

8700

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg

8760

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg

8820

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc

8880

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc

8940

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt

9000

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc

9060

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact

9120

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac

9180

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag

9240

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg

9300

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg

9360

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga

9420

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt

9480

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct

9540

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg

9600

aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac

9660

accgcagacc agccgcgtaa cctggcaaaa tcggttacgg ttgagtaata aatggatgcc

9720

ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact gaacaaaata gatctaaact

9780

atgacaataa agtcttaaac tagacagaat agttgtaaac tgaaatcagt ccagttatgc

9840

tgtgaaaaag catactggac ttttgttatg gctaaagcaa actcttcatt ttctgaagtg

9900

caaattgccc gtcgtattaa agaggggcgt ggccaagggc atggtaaaga ctatattcgc

9960

ggcgttgtga caatttaccg aacaactccg cggccgggaa gccgatctcg gcttgaacga

10020

attgttaggt ggcggtactt gggtcgatat caaagtgcat cacttcttcc cgtatgccca

10080

actttgtata gagagccact gcgggatcgt caccgtaatc tgcttgcacg tagatcacat

10140

aagcaccaag cgcgttggcc tcatgcttga ggagattgat gagcgcggtg gcaatgccct

10200

gcctccggtg ctcgccggag actgcgagat catagatata gatctcacta cgcggctgct

10260

caaacctggg cagaacgtaa gccgcgagag cgccaacaac cgcttcttgg tcgaaggcag

10320

caagcgcgat gaatgtctta ctacggagca agttcccgag gtaatcggag tccggctgat

10380

gttgggagta ggtggctacg tctccgaact cacgaccgaa aagatcaaga gcagcccgca

10440

tggatttgac ttggtcaggg ccgagcctac atgtgcgaat gatgcccata cttgagccac

10500

ctaactttgt tttagggcga ctgccctgct gcgtaacatc gttgctgctg cgtaacatcg

10560

ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc

10620

cgaggcatag actgtacaaa aaaacagtca taacaagcca tgaaaaccgc cactgcgccg

10680

ttaccaccgc tgcgttcggt caaggttctg gaccagttgc gtgagcgcat acgctacttg

10740

cattacagtt tacgaaccga acaggcttat gtcaactggg ttcgtgcctt catccgtttc

10800

cacggtgtgc gtcacccggc aaccttgggc agcagcgaag tcgaggcatt tctgtcctgg

10860

ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc aggcattggc ggccttgctg

10920

ttcttctacg gcaaggtgct gtgcacggat ctgccctggc ttcaggagat cggaagacct

10980

cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg aagtggttcg catcctcggt

11040

tttctggaag gcgagcatcg tttgttcgcc caggactcta gctatagttc tagtggttgg

11100

ctacgtatac tccggaatat taatagatca tggagataat taaaatgata accatctcgc

11160

aaataaataa gtattttact gttttcgtaa cagttttgta ataaaaaaac ctataaatat

11220

tccggattat tcataccgtc ccaccatcgg gcgcggatct cggtccgaaa ccatgtcgta

11280

ctaccatcac catcaccatc acgattacga tatcccaacg accgaaaacc tgtattttca

11340

gggcgccatg ggatcc

11356

<210> 214

<211> 11434

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 214

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600

ggtttaaacg ccgccaccat gcaaattgag ttaagtacct gttttttcct gtgcctgttg

660

agattttgct tctctgctac cagaaggtat tacctgggag ctgtggagct gtcatgggac

720

tacatgcagt ctgacctggg agagctccct gttgatgcta ggtttccccc tagggtgcca

780

aagtcctttc cttttaacac ctcagtggtg tacaagaaga cactgtttgt ggagtttact

840

gaccacctct tcaatattgc taagccaaga cccccttgga tgggtctctt gggccctacc

900

atccaggctg aggtttatga tacagtggtg attaccctca agaatatggc ttctcatcct

960

gttagtctgc atgcagtagg ggtcagctat tggaaggcca gtgaaggagc tgagtatgat

1020

gaccagacca gccagagaga gaaagaggat gacaaggtgt tccctggggg atcacacacc

1080

tatgtgtggc aggtgttgaa ggaaaatgga cccatggcct ctgacccact ctgcctgact

1140

tactcctacc tgtctcatgt ggacctggtc aaagatctga actctggcct gattggggca

1200

ctgttggtgt gcagagaagg gtctcttgcc aaggagaaga ctcagaccct gcacaagttc

1260

atcctgctgt ttgctgtgtt tgatgaaggc aagtcttggc attctgagac taagaacagc

1320

ctgatgcaag atagagatgc tgcatctgcc agggcctggc ctaagatgca cactgtgaat

1380

ggatatgtga ataggtcctt gcctggcctg attggatgcc ataggaagtc tgtgtactgg

1440

catgtgattg gcatgggcac cacccctgag gttcactcta tttttctgga gggccatact

1500

ttccttgtga ggaatcatag acaggcctct ctggagatta gccctattac atttctgact

1560

gctcagaccc tcctcatgga cttggggcag tttctgttaa gctgccacat cagcagccat

1620

caacatgatg gtatggaagc ctatgtcaaa gtggatagct gccctgaaga accacagctt

1680

aggatgaaga acaatgagga ggcagaggac tatgatgatg atctgactga ttctgaaatg

1740

gatgtggtga gatttgatga tgataatagc ccttccttta tccagatcag gtcagtggcc

1800

aagaagcacc caaagacctg ggtgcattat attgctgctg aggaggagga ctgggactat

1860

gcccctctgg tgctggcccc tgatgataga agctataagt ctcaatactt gaataatggc

1920

ccacagagga ttgggagaaa gtacaaaaag gtgagattta tggcctacac tgatgagact

1980

ttcaagacca gagaggccat ccagcatgaa tcaggcattt tgggtcccct gctgtatgga

2040

gaggtggggg ataccctgct gatcatcttt aagaaccagg ccagcagacc ttacaacatt

2100

taccctcatg ggatcacaga tgtgaggcca ctctactcta ggagattgcc caagggagtc

2160

aagcatctta aggactttcc aatcctgcct ggggagatct tcaagtacaa atggacagtg

2220

acagttgagg atggacctac taagagtgac cccaggtgtc tgaccagata ttactctagc

2280

tttgtcaata tggaaagaga cctggcttca ggcttgatag gccctcttct catctgctac

2340

aaagagtctg tggaccagag aggaaatcag attatgtctg acaagagaaa tgttattctg

2400

ttttcagtct ttgatgagaa cagaagttgg tacttgacag agaacattca gagatttctg

2460

cctaaccctg caggagtgca gcttgaggac cctgagtttc aggcttccaa tatcatgcat

2520

tctatcaatg gctatgtgtt tgatagcctg cagctgtctg tgtgcctgca tgaggttgcc

2580

tattggtaca tcctgtctat tggggcccaa actgatttct tgtctgtgtt tttcagtgga

2640

tataccttta agcataagat ggtgtatgaa gataccttga cacttttccc tttctcagga

2700

gagactgtct tcatgtctat ggagaaccct ggactgtgga tcctgggatg ccacaactca

2760

gacttcagaa acaggggtat gacagctctg cttaaggtct cctcatgtga caaaaataca

2820

ggagactact atgaagattc ctatgaggac atctctgctt acctgctcag caaaaacaat

2880

gccattgagc ccagaagctt cagccagaat tccagacatc ccagtactag gcagaagcag

2940

tttaatgcca ccaccatccc agaaaatgac attgagaaga cagacccttg gtttgcccat

3000

agaaccccaa tgcccaagat tcagaatgtg agcagctcag acttgctgat gctgctgagg

3060

cagtctccta ctccccatgg cctgtccctc tcagatctgc aggaagccaa gtatgagaca

3120

ttttctgatg acccctcccc aggggctatt gacagtaaca acagcctgtc tgaaatgacc

3180

cacttcagac ctcagctcca ccacagtggg gatatggtgt ttaccccaga gtcaggcctg

3240

cagctgagac tgaatgagaa gctgggaacc acagctgcca cagaactgaa gaagctggat

3300

ttcaaggtga gctctacttc aaataatctg atttccacta tcccatctga caatttggca

3360

gctggcactg acaatacaag ctctctgggc ccacctagca tgccagtgca ttatgacagc

3420

cagttggaca ccactctttt tggaaagaaa tccagtcccc tgacagagtc aggaggaccc

3480

ctttctctgt ctgaggagaa caatgatagt aagcttctgg agtcaggctt gatgaactcc

3540

caggagagtt cttggggcaa gaatgtgagc tctagggaga tcaccagaac cactctgcag

3600

tctgaccaag aagagattga ttatgatgac actatctctg ttgagatgaa gaaggaggac

3660

tttgatatct atgatgagga tgagaaccag tctccaagaa gtttccagaa gaagaccagg

3720

cactacttta ttgctgctgt ggagagactg tgggactatg gaatgtcctc ctcccctcat

3780

gtcctgagaa atagagctca gtcaggatca gtgccccagt tcaagaaggt ggtgttccag

3840

gaattcacag atggaagttt tacccagcca ctgtatagag gtgaactgaa tgaacatctg

3900

ggtctgctgg ggccctatat cagggctgag gtggaggaca atattatggt gacctttaga

3960

aaccaggcct caaggcccta cagcttctac tcttccctca tttcatatga ggaagaccag

4020

agacagggag cagagcctag aaagaacttt gtcaagccca atgaaaccaa aacctatttc

4080

tggaaggtgc agcaccacat ggcacccacc aaagatgagt ttgactgcaa agcctgggcc

4140

tatttctcag atgtggatct ggagaaggat gtccattcag gtctgattgg accactcctg

4200

gtgtgccaca ccaacacact gaatccagct catggcagac aggtgacagt ccaggagttt

4260

gccctgtttt tcactatttt tgatgagacc aagagctggt attttacaga gaatatggaa

4320

agaaactgca gagccccttg taatatccag atggaggacc caacctttaa ggagaactac

4380

aggttccatg ccatcaatgg ctacattatg gataccctgc ctggcctggt tatggcccag

4440

gatcagagga tcaggtggta tctgctgtca atgggctcca atgagaacat tcatagtatt

4500

cacttttcag gacatgtgtt cacagtgaga aagaaggagg agtataagat ggccctctat

4560

aatctctacc caggggtgtt tgagacagtt gagatgctgc catctaaggc aggcatctgg

4620

agagtggaat gcctcattgg agagcacctg catgctggca tgtccaccct gtttctggtg

4680

tactccaaca aatgtcagac ccctcttggt atggcctctg gccacattag ggatttccag

4740

attactgcca gtggtcagta tgggcagtgg gcccctaagc tggccagact gcactattct

4800

gggagcatca atgcctggtc caccaaggaa cctttttctt ggattaaagt ggatctgctg

4860

gccccaatga tcatccatgg gatcaagacc cagggagcta ggcagaagtt cagcagcctg

4920

tacattagtc agttcatcat tatgtacagt ctggatggca aaaagtggca gacatacagg

4980

ggcaattcca ctggaaccct gatggtgttc tttggaaatg tggatagcag tggtatcaag

5040

cacaacattt tcaaccctcc catcattgcc aggtacatca gactgcatcc aacccactac

5100

agcattagga gcacccttag gatggagctc atggggtgtg acctgaactc ttgctctatg

5160

ccacttggaa tggagagcaa ggccatctct gatgcccaga ttactgctag ttcctacttc

5220

accaatatgt ttgccacctg gtcacccagc aaggccaggc tgcacctgca gggaaggtcc

5280

aatgcttgga ggcctcaggt gaacaatcca aaggagtggc tgcaggtgga cttccagaag

5340

actatgaagg tgacaggagt gaccactcag ggagtgaaga gcctgctgac ctccatgtat

5400

gtgaaggagt ttctgatctc cagctcccag gatggccacc agtggaccct gttctttcag

5460

aatggcaagg tgaaggtgtt tcaggggaat caggactcct tcaccccagt ggtgaattcc

5520

ctggatcccc ctctgctgac cagatacctg agaatccacc cccagtcttg ggtgcaccag

5580

attgccctta ggatggaggt gctgggctgt gaggcccagg acctgtactg attaattaag

5640

agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt

5700

taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta

5760

ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct

5820

ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta

5880

actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta

5940

ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt

6000

tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg

6060

caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt

6120

tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag

6180

gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc

6240

catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg

6300

tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc

6360

tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg

6420

ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag tagcatggcg

6480

ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg ccactccctc

6540

tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg

6600

cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg catgcggtac

6660

caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt

6720

acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat

6780

tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac

6840

aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat

6900

caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccgaaccaga

6960

taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg

7020

ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt

7080

tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt ttcttcctgt

7140

tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct tcggctactt

7200

tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tttgtaattg

7260

actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tgtagcggcg

7320

cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc

7380

tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc

7440

gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg

7500

accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg

7560

tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg

7620

gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt

7680

cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa

7740

tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt

7800

gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa

7860

tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta

7920

ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag

7980

taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca

8040

gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta

8100

aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc

8160

gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc

8220

ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca

8280

ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc

8340

acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca

8400

taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac

8460

tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg

8520

cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg

8580

ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg

8640

gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac

8700

gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc

8760

aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct

8820

aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc

8880

actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc

8940

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg

9000

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa

9060

atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc

9120

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt

9180

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa

9240

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc

9300

tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc

9360

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct

9420

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat

9480

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc

9540

tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg

9600

ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc

9660

gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc

9720

atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ggttacggtt

9780

gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt cttaaactga

9840

acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg

9900

aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac

9960

tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ccaagggcat

10020

ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg gccgggaagc

10080

cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca aagtgcatca

10140

cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca ccgtaatctg

10200

cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg agattgatga

10260

gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca tagatataga

10320

tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg ccaacaaccg

10380

cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ttcccgaggt

10440

aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca cgaccgaaaa

10500

gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat gtgcgaatga

10560

tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtaacatcgt

10620

tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac ggcgtaacgc

10680

gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata acaagccatg

10740

aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt

10800

gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt caactgggtt

10860

cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc

10920

gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag

10980

gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt

11040

caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa

11100

gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca ggactctagc

11160

tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg gagataatta

11220

aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gttttgtaat

11280

aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gcggatctcg

11340

gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata tcccaacgac

11400

cgaaaacctg tattttcagg gcgccatggg atcc

11434

<210> 215

<211> 13477

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 215

ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc

60

cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg

120

agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt

180

atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc

240

cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca

300

tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag

360

gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag

420

cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga

480

gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt

540

ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt

600

ggtttaaacg ccgccaccat gcaaatagag ctctccacct gcttctttct gtgccttttg

660

cgattctgct ttagtgccac cagaagatac tacctgggtg cagtggaact gtcatgggac

720

tatatgcaaa gtgatctcgg tgagctgcct gtggacgcaa gatttcctcc tagagtgcca

780

aaatcttttc cattcaacac ctcagtcgtg tacaaaaaga ctctgtttgt agaattcacg

840

gatcaccttt tcaacatcgc taagccaagg ccaccctgga tgggtctgct aggtcctacc

900

atccaggctg aggtttatga tacagtggtc attacactta agaacatggc ttcccatcct

960

gtcagtcttc atgctgttgg tgtatcctac tggaaagctt ctgagggagc tgaatatgat

1020

gatcagacca gtcaaaggga gaaagaagat gataaagtct tccctggtgg aagccataca

1080

tatgtctggc aggtcctgaa agagaatggt ccaatggcct ctgacccact gtgccttacc

1140

tactcatatc tttctcatgt ggacctggta aaagacttga attcaggcct cattggagcc

1200

ctactagtat gtagagaagg gagtctggcc aaggaaaaga cacagacctt gcacaaattt

1260

atactacttt ttgctgtatt tgatgaaggg aaaagttggc actcagaaac aaagaactcc

1320

ttgatgcagg atagggatgc tgcatctgct cgggcctggc ctaaaatgca cacagtcaat

1380

ggttatgtaa acaggtctct gccaggtctg attggatgcc acaggaaatc agtctattgg

1440

catgtgattg gaatgggcac cactcctgaa gtgcactcaa tattcctcga aggtcacaca

1500

tttcttgtga ggaaccatcg ccaggcgtcc ttggaaatct cgccaataac tttccttact

1560

gctcaaacac tcttgatgga ccttggacag tttctactgt tttgtcatat ctcttcccac

1620

caacatgatg gcatggaagc ttatgtcaaa gtagacagct gtccagagga accccaacta

1680

cgaatgaaaa ataatgaaga agcggaagac tatgatgatg atcttactga ttctgaaatg

1740

gatgtggtca ggtttgatga tgacaactct ccttccttta tccaaattcg ctcagttgcc

1800

aagaagcatc ctaaaacttg ggtacattac attgctgctg aagaggagga ctgggactat

1860

gctcccttag tcctcgcccc cgatgacaga agttataaaa gtcaatattt gaacaatggc

1920

cctcagcgga ttggtaggaa gtacaaaaaa gtccgattta tggcatacac agatgaaacc

1980

tttaagactc gtgaagctat tcagcatgaa tcaggaatct tgggaccttt actttatggg

2040

gaagttggag acacactgtt gattatattt aagaatcaag caagcagacc atataacatc

2100

taccctcacg gaatcactga tgtccgtcct ttgtattcaa ggagattacc aaaaggtgta

2160

aaacatttga aggattttcc aattctgcca ggagaaatat tcaaatataa atggacagtg

2220

actgtagaag atgggccaac taaatcagat cctcggtgcc tgacccgcta ttactctagt

2280

ttcgttaata tggagagaga tctagcttca ggactcattg gccctctcct catctgctac

2340

aaagaatctg tagatcaaag aggaaaccag ataatgtcag acaagaggaa tgtcatcctg

2400

ttttctgtat ttgatgagaa ccgaagctgg tacctcacag agaatataca acgctttctc

2460

cccaatccag ctggagtgca gcttgaggat ccagagttcc aagcctccaa catcatgcac

2520

agcatcaatg gctatgtttt tgatagtttg cagttgtcag tttgtttgca tgaggtggca

2580

tactggtaca ttctaagcat tggagcacag actgacttcc tttctgtctt cttctctgga

2640

tataccttca aacacaaaat ggtctatgaa gacacactca ccctattccc attctcagga

2700

gaaactgtct tcatgtcgat ggaaaaccca ggtctatgga ttctggggtg ccacaactca

2760

gactttcgga acagaggcat gaccgcctta ctgaaggttt ctagttgtga caagaacact

2820

ggtgattatt acgaggacag ttatgaagat atttcagcat acttgctgag taaaaacaat

2880

gccattgaac caagaagctt ctcccagaat tcaagacacc ctagcactag gcaaaagcaa

2940

tttaatgcca ccacaattcc agaaaatgac atagagaaga ctgacccttg gtttgcacac

3000

agaacaccta tgcctaaaat acaaaatgtc tcctctagtg atttgttgat gctcttgcga

3060

cagagtccta ctccacatgg gctatcctta tctgatctcc aagaagccaa atatgagact

3120

ttttctgatg atccatcacc tggagcaata gacagtaata acagcctgtc tgaaatgaca

3180

cacttcaggc cacagctcca tcacagtggg gacatggtat ttacccctga gtcaggcctc

3240

caattaagat taaatgagaa actggggaca actgcagcaa cagagttgaa gaaacttgat

3300

ttcaaagttt ctagtacatc aaataatctg atttcaacaa ttccatcaga caatttggca

3360

gcaggtactg ataatacaag ttccttagga cccccaagta tgccagttca ttatgatagt

3420

caattagata ccactctatt tggcaaaaag tcatctcccc ttactgagtc tggtggacct

3480

ctgagcttga gtgaagaaaa taatgattca aagttgttag aatcaggttt aatgaatagc

3540

caagaaagtt catggggaaa aaatgtatcg tcaacagaga gtggtaggtt atttaaaggg

3600

aaaagagctc atggacctgc tttgttgact aaagataatg ccttattcaa agttagcatc

3660

tctttgttaa agacaaacaa aacttccaat aattcagcaa ctaatagaaa gactcacatt

3720

gatggcccat cattattaat tgagaatagt ccatcagtct ggcaaaatat attagaaagt

3780

gacactgagt ttaaaaaagt gacacctttg attcatgaca gaatgcttat ggacaaaaat

3840

gctacagctt tgaggctaaa tcatatgtca aataaaacta cttcatcaaa aaacatggaa

3900

atggtccaac agaaaaaaga gggccccatt ccaccagatg cacaaaatcc agatatgtcg

3960

ttctttaaga tgctattctt gccagaatca gcaaggtgga tacaaaggac tcatggaaag

4020

aactctctga actctgggca aggccccagt ccaaagcaat tagtatcctt aggaccagaa

4080

aaatctgtgg aaggtcagaa tttcttgtct gagaaaaaca aagtggtagt aggaaagggt

4140

gaatttacaa aggacgtagg actcaaagag atggtttttc caagcagcag aaacctattt

4200

cttactaact tggataattt acatgaaaat aatacacaca atcaagaaaa aaaaattcag

4260

gaagaaatag aaaagaagga aacattaatc caagagaatg tagttttgcc tcagatacat

4320

acagtgactg gcactaagaa tttcatgaag aaccttttct tactgagcac taggcaaaat

4380

gtagaaggtt catatgacgg ggcatatgct ccagtacttc aagattttag gtcattaaat

4440

gattcaacaa atagaacaaa gaaacacaca gctcatttct caaaaaaagg ggaggaagaa

4500

aacttggaag gcttgggaaa tcaaaccaag caaattgtag agaaatatgc atgcaccaca

4560

aggatatctc ctaatacaag ccagcagaat tttgtcacgc aacgtagtaa gagagctttg

4620

aaacaattca gactcccact agaagaaaca gaacttgaaa aaaggataat tgtggatgac

4680

acctcaaccc agtggtccaa aaacatgaaa catttgaccc cgagcaccct cacacagata

4740

gactacaatg agaaggagaa aggggccatt actcagtctc ccttatcaga ttgccttacg

4800

aggagtcata gcatccctca agcaaataga tctccattac ccattgcaaa ggtatcatca

4860

tttccatcta ttagacctat atatctgacc agggtcctat tccaagacaa ctcttctcat

4920

cttccagcag catcttatag aaagaaagat tctggggtcc aagaaagcag tcatttctta

4980

caaggagcca aaaaaaataa cctttcttta gccattctaa ccttggagat gactggtgat

5040

caaagagagg ttggctccct ggggacaagt gccacaaatt cagtcacata caagaaagtt

5100

gagaacactg ttctcccgaa accagacttg cccaaaacat ctggcaaagt tgaattgctt

5160

ccaaaagttc acatttatca gaaggaccta ttccctacgg aaactagcaa tgggtctcct

5220

ggccatctgg atctcgtgga agggagcctt cttcagggaa cagagggagc gattaagtgg

5280

aatgaagcaa acagacctgg aaaagttccc tttctgagag tagcaacaga aagctctgca

5340

aagactccct ccaagctatt ggatcctctt gcttgggata accactatgg tactcagata

5400

ccaaaagaag agtggaaatc ccaagagaag tcaccagaaa aaacagcttt taagaaaaag

5460

gataccattt tgtccctgaa cgcttgtgaa agcaatcatg caatagcagc aataaatgag

5520

ggacaaaata agcccgaaat agaagtcacc tgggcaaagc aaggtaggac tgaaaggctg

5580

tgctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt

5640

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa

5700

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca

5760

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca

5820

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc

5880

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat

5940

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc

6000

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat

6060

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac

6120

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg

6180

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt

6240

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa

6300

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg

6360

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat

6420

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct

6480

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct

6540

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg

6600

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt

6660

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg

6720

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt

6780

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat

6840

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg

6900

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc

6960

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat

7020

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata

7080

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat

7140

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc

7200

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac

7260

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg

7320

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag

7380

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg

7440

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt

7500

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac

7560

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac

7620

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctgattaatt

7680

aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac

7740

atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa

7800

ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac

7860

gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc

7920

ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag

7980

ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc

8040

ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg

8100

acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg

8160

ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga

8220

caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc

8280

agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca

8340

ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta

8400

ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc

8460

atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg

8520

gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc

8580

ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg

8640

cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcgcctcg aggcatgcgg

8700

taccaagctt gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt

8760

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc

8820

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat

8880

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact

8940

catcaatgta tcttatcatg tctggatctg atcactgata tcgcctagga gatccgaacc

9000

agataagtga aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg

9060

acgctacacc cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc

9120

atttccaccc ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc

9180

tgttatgttt ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta

9240

ctttttctct gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa

9300

ttgactgaat atcaacgctt atttgcagcc tgaatggcga atgggacgcg ccctgtagcg

9360

gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg

9420

ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc

9480

cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc

9540

tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga

9600

cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa

9660

ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga

9720

tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca

9780

aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta

9840

tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat

9900

aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc

9960

ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga

10020

aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca

10080

acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt

10140

ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg

10200

gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc

10260

atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata

10320

acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt

10380

tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag

10440

ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca

10500

aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg

10560

aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg

10620

ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag

10680

atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg

10740

aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag

10800

accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga

10860

tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt

10920

tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc

10980

tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc

11040

cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac

11100

caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac

11160

cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt

11220

cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct

11280

gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat

11340

acctacagcg tgagcattga gaaagcgcca cgcttcccga agggagaaag gcggacaggt

11400

atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg

11460

cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt

11520

gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt

11580

tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg

11640

tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg

11700

agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta

11760

cgcatctgtg cggtatttca caccgcagac cagccgcgta acctggcaaa atcggttacg

11820

gttgagtaat aaatggatgc cctgcgtaag cgggtgtggg cggacaataa agtcttaaac

11880

tgaacaaaat agatctaaac tatgacaata aagtcttaaa ctagacagaa tagttgtaaa

11940

ctgaaatcag tccagttatg ctgtgaaaaa gcatactgga cttttgttat ggctaaagca

12000

aactcttcat tttctgaagt gcaaattgcc cgtcgtatta aagaggggcg tggccaaggg

12060

catggtaaag actatattcg cggcgttgtg acaatttacc gaacaactcc gcggccggga

12120

agccgatctc ggcttgaacg aattgttagg tggcggtact tgggtcgata tcaaagtgca

12180

tcacttcttc ccgtatgccc aactttgtat agagagccac tgcgggatcg tcaccgtaat

12240

ctgcttgcac gtagatcaca taagcaccaa gcgcgttggc ctcatgcttg aggagattga

12300

tgagcgcggt ggcaatgccc tgcctccggt gctcgccgga gactgcgaga tcatagatat

12360

agatctcact acgcggctgc tcaaacctgg gcagaacgta agccgcgaga gcgccaacaa

12420

ccgcttcttg gtcgaaggca gcaagcgcga tgaatgtctt actacggagc aagttcccga

12480

ggtaatcgga gtccggctga tgttgggagt aggtggctac gtctccgaac tcacgaccga

12540

aaagatcaag agcagcccgc atggatttga cttggtcagg gccgagccta catgtgcgaa

12600

tgatgcccat acttgagcca cctaactttg ttttagggcg actgccctgc tgcgtaacat

12660

cgttgctgct gcgtaacatc gttgctgctc cataacatca aacatcgacc cacggcgtaa

12720

cgcgcttgct gcttggatgc ccgaggcata gactgtacaa aaaaacagtc ataacaagcc

12780

atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg tcaaggttct ggaccagttg

12840

cgtgagcgca tacgctactt gcattacagt ttacgaaccg aacaggctta tgtcaactgg

12900

gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg caaccttggg cagcagcgaa

12960

gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg tttcggtctc cacgcatcgt

13020

caggcattgg cggccttgct gttcttctac ggcaaggtgc tgtgcacgga tctgccctgg

13080

cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc cggtggtgct gaccccggat

13140

gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc gtttgttcgc ccaggactct

13200

agctatagtt ctagtggttg gctacgtata ctccggaata ttaatagatc atggagataa

13260

ttaaaatgat aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt

13320

aataaaaaaa cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc

13380

tcggtccgaa accatgtcgt actaccatca ccatcaccat cacgattacg atatcccaac

13440

gaccgaaaac ctgtattttc agggcgccat gggatcc

13477

<210> 216

<211> 11180

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 216

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240

atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt

300

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt

360

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac

420

aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag

480

taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt

540

gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac

600

tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag

660

cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat

720

gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc

780

cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata

840

aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat

900

agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt

960

ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag

1020

tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag

1080

tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa

1140

tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag

1200

catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag

1260

aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa

1320

ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata

1380

tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg

1440

gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa

1500

aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct

1560

cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaga tagaattatc

1620

tacttgtttt tttctttgtc tgctcaggtt ctgcttctct gctacaagga ggtattactt

1680

aggtgctgta gagttatctt gggactacat gcagtctgat cttggggagc tccctgtgga

1740

tgcaagattt ccccctagag tacctaaaag tttccctttc aacacaagtg tggtgtataa

1800

gaagactctg tttgttgagt tcacagatca ccttttcaat attgccaagc ccagaccccc

1860

ctggatgggt ctactggggc caacaattca agcagaggta tatgatacag tggtgatcac

1920

attaaagaac atggcatccc accctgtaag cctgcatgct gttggtgtgt cctattggaa

1980

agcaagtgaa ggtgctgaat atgatgatca aacatcccaa agagagaagg aagatgacaa

2040

agtcttccca ggtggctctc acacctatgt gtggcaagtg ctcaaggaaa atgggcctat

2100

ggctagtgat ccattgtgcc tcacatatag ctacctgtcc catgtggact tagttaaaga

2160

tctgaactca ggtctgattg gtgccctgct ggtctgtagg gaaggatcac tagctaaaga

2220

aaaaacccag actttacaca agttcatctt attatttgct gtttttgatg agggaaagag

2280

ctggcactca gagactaaga attcactcat gcaggataga gatgcagctt ctgctagagc

2340

atggccaaaa atgcatactg tgaatgggta tgttaacagg agtctgcctg gcctcatagg

2400

ctgccataga aaatcagtgt actggcatgt cataggtatg ggcactactc ctgaggtgca

2460

ttccattttt ttggaggggc atactttcct tgtaagaaac cacaggcagg cttcattgga

2520

aattagtcca ataacctttc tcacagccca gactctgcta atggacttgg ggcagttttt

2580

attattttgt cacattagct ctcatcagca tgatggaatg gaagcctatg ttaaggttga

2640

ttcctgccca gaagagcccc agttgagaat gaagaacaat gaggaagcag aagactatga

2700

tgatgatcta acagactcag aaatggatgt tgtgagattt gatgatgata actccccaag

2760

ttttattcag atcaggtcag tggccaagaa acatccaaaa acatgggttc attatattgc

2820

agcagaagaa gaagactggg attatgcacc cttggtatta gcccctgatg acagaagcta

2880

taagtcacaa tatctcaaca atggacccca gagaattggc agaaagtaca aaaaagtcag

2940

gtttatggct tatactgatg agactttcaa aactagagag gctattcaac atgaatctgg

3000

catcctaggt cctttgttat atggggaagt aggggacacc ttattaatta tatttaaaaa

3060

ccaggccagt aggccttaca acatttaccc ccacggtata acagatgtca gaccactgta

3120

ctcaaggagg ctaccaaaag gggtgaagca cctaaaagac ttccccatcc tacctggtga

3180

gattttcaag tataagtgga cagtgactgt agaagatggt ccaaccaaat cagatcccag

3240

atgcctgaca aggtactaca gtagctttgt aaatatggag agagacctgg cctcagggtt

3300

aatagggccc ctactgatct gctacaagga gagtgtagac caaagaggca accaaattat

3360

gtcagacaag agaaatgtca tcctctttag tgtttttgat gagaataggt cctggtacct

3420

gacagaaaat atccaaagat tccttccaaa tccagcaggg gtacaactgg aggaccctga

3480

gttccaggcc tccaatatca tgcacagcat caatggttat gtgtttgaca gtttgcaact

3540

ttcagtgtgc cttcatgagg ttgcatactg gtatatactt tctatagggg cccagacaga

3600

cttcttgtca gttttctttt caggctatac tttcaagcat aagatggtat atgaagatac

3660

cctgactctt tttcccttta gtggtgagac agttttcatg tcaatggaaa acccagggct

3720

ttggatcttg ggatgccaca actctgactt tagaaacaga ggcatgactg cccttttaaa

3780

ggtgtcctct tgtgataaga atactggaga ctactatgag gacagctatg aggacatttc

3840

agcctatctg ctgtcaaaaa ataatgctat agagccaagg tcattttctc aaaatcctcc

3900

tgtcctgaag aggcaccaaa gagagataac caggactacc ttacagtctg accaggagga

3960

aattgattat gatgacacaa taagtgtgga gatgaaaaag gaggattttg atatttatga

4020

tgaggatgaa aaccaatctc caagatcttt ccagaagaag actagacact atttcattgc

4080

tgcagtggaa agactgtggg actatggaat gtcctccagc cctcatgttc tcaggaatag

4140

ggctcaaagt ggttctgtgc cacagttcaa gaaggtggtg tttcaggaat tcacagatgg

4200

gtcctttact caaccactgt ataggggaga actcaatgaa catctaggat tactaggtcc

4260

ctacattaga gctgaggtgg aggacaatat catggtcact ttcaggaacc aggcatctag

4320

accatactct ttttacagct ccttgatatc ttatgaagag gaccagagac agggtgcaga

4380

acccaggaag aactttgtga aacccaatga gaccaaaaca tacttctgga aggtccagca

4440

tcatatggct cctaccaagg atgaatttga ctgcaaagcc tgggcttact tctcagatgt

4500

ggatttggag aaagatgtgc acagtggctt gattgggcct cttttggtat gtcataccaa

4560

caccttaaac cctgctcatg gaagacaagt aacagtgcaa gagtttgccc tctttttcac

4620

tatatttgat gagacaaaaa gttggtactt tactgagaat atggagagga actgcagggc

4680

tccctgcaat atacagatgg aggatcctac tttcaaggaa aactataggt ttcatgccat

4740

taatggctat atcatggata cattgcctgg cttagttatg gcccaggatc agagaatcag

4800

atggtacctc cttagtatgg gaagcaatga aaacatacat tctattcact tcagtggaca

4860

tgtctttact gtgagaaaaa aggaagagta caagatggca ctgtacaatc tgtaccctgg

4920

agtgtttgag acagttgaga tgctgcccag caaggctggg atctggaggg tagaatgcct

4980

gattggagaa cacttacatg caggtatgtc cactctattc ttggtctatt ccaacaagtg

5040

tcagaccccc ctaggcatgg catctggcca tattagagat ttccagataa ctgcttctgg

5100

tcagtatggc cagtgggccc ccaagcttgc tagacttcac tacagtggtt caataaatgc

5160

ctggtccacc aaggagccct tcagctggat taaagtggac ttgctagccc ccatgatcat

5220

tcatgggata aaaacacagg gtgccagaca gaaattttca tctctgtaca tcagccagtt

5280

tatcatcatg tacagtctgg atggcaaaaa atggcagacc tacagaggta actctacagg

5340

tacactaatg gtattttttg gcaatgtaga ttcatcaggt atcaagcata atatctttaa

5400

tcctcccatt attgccagat acatcaggtt gcacccaact cattacagta taagatccac

5460

tttaaggatg gagcttatgg ggtgtgacct taatagctgc agtatgccct tgggaatgga

5520

aagtaaggcc atatcagatg cccagattac tgcaagcagc tactttacaa acatgtttgc

5580

aacctggtct cctagtaaag ccaggctgca cttgcagggt aggagcaatg catggagacc

5640

ccaggtcaat aacccaaaag agtggcttca agttgacttt caaaagacaa tgaaggtaac

5700

aggggtaacc acccaagggg taaagagtct gctgacatct atgtatgtaa aagaattcct

5760

catctcaagt agtcaagatg ggcaccagtg gacactgttc ttccagaatg gaaaagttaa

5820

ggtgttccaa ggtaatcaag acagcttcac tccagtggtg aacagtctgg atccaccact

5880

cctaaccagg tacctgagga tccaccctca gtcctgggtc caccagatag ctctgagaat

5940

ggaagtgctg ggctgtgaag ctcaggacct atactgatta attaataaaa tacagcatag

6000

caaaacttta acctccaaat caagcctcta cttgaatcct tttctgaggg atgaataagg

6060

cataggcatc aggggctgtt gccaatgtgc attagctgtt tgcagcctca ccttctttca

6120

tggagtttaa gatatagtgt attttcccaa ggtttgaact agctcttcat ttctttatgt

6180

tttaaatgca ctgacctccc acattccctt tttagtaaaa tattcagaaa taatttaaat

6240

acatcattgc aatgaaaata aatgtttttt attaggcaga atccagatgc tcaaggccct

6300

tcataatatc ccccagttta gtagttggac ttagggaaca aaggaacctt taatagaaat

6360

tggacagcaa gaaagcgagc tccataaagt aggaaacact acacgattcc ataaagtagg

6420

aaacactaca tcactccata aagtaggaaa cactacacag acatgataag atacattgat

6480

gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt

6540

gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat

6600

tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa

6660

aacctctaca aatgtggtac ttaagcatgg ctacgtagat aagtagcatg gcgggttaat

6720

cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc

6780

gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt

6840

gagcgagcga gcgcgcagct gcctgcaggg gcgcgccgct agcagctgat gcatagcatg

6900

cggtaccggg agatggggga ggctaactga aacacggaag gagacaatac cggaaggaac

6960

ccgcgctatg acggcaataa aaagacagaa taaaacgcac gggtgttggg tcgtttgttc

7020

ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt

7080

gggaccaata cgcccgcgtt tcttcctttt ccccacccca acccccaagt tcgggtgaag

7140

gcccagggct cgcagccaac gtcggggcgg caagccctgc catagccact acgggtacgt

7200

aggccaacca ctagaactat agctagagtc ctgggcgaac aaacgatgct cgccttccag

7260

aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc gccgcgacgg

7320

ccgaggtcta ccgatctcct gaagccaggg cagatccgtg cacagcacct tgccgtagaa

7380

gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc

7440

cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt gacgcacacc

7500

gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta

7560

atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg

7620

taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc

7680

tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag

7740

caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt

7800

taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat

7860

ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc

7920

aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc

7980

ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt

8040

ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga

8100

ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg

8160

cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa

8220

agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac

8280

aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac

8340

gccgcgaata tagtctttac catgcccttg gccacgcccc tctttaatac gacgggcaat

8400

ttgcacttca gaaaatgaag agtttgcttt agccataaca aaagtccagt atgctttttc

8460

acagcataac tggactgatt tcagtttaca actattctgt ctagtttaag actttattgt

8520

catagtttag atctattttg ttcagtttaa gactttattg tccgcccaca cccgcttacg

8580

cagggcatcc atttattact caaccgtaac cgattttgcc aggttacgcg gctggtctgc

8640

ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt

8700

cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact

8760

caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag

8820

caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata

8880

ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc

8940

cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg

9000

ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc

9060

tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg

9120

gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc

9180

ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga

9240

ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg

9300

gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa

9360

aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg

9420

tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt

9480

ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat

9540

tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct

9600

aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta

9660

tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa

9720

ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac

9780

gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa

9840

gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag

9900

taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg

9960

tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag

10020

ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg

10080

tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc

10140

ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat

10200

tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata

10260

ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa

10320

aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca

10380

actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc

10440

aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc

10500

tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg

10560

aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac

10620

ctgaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct

10680

cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg

10740

agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact

10800

ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac

10860

cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga

10920

gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga

10980

aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca

11040

ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca ttcaggctgc

11100

aaataagcgt tgatattcag tcaattacaa acattaataa cgaagagatg acagaaaaat

11160

tttcattctg tgacagagaa

11180

<210> 217

<211> 13862

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 217

aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat

60

aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg

120

aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta

180

gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt

240

atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt

300

gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt

360

tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac

420

aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag

480

taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt

540

gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac

600

tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag

660

cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat

720

gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc

780

cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata

840

aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat

900

agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt

960

ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag

1020

tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag

1080

tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa

1140

tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag

1200

catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag

1260

aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa

1320

ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata

1380

tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg

1440

gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa

1500

aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct

1560

cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaaa tagagctctc

1620

cacctgcttc tttctgtgcc ttttgcgatt ctgctttagt gccaccagaa gatactacct

1680

gggtgcagtg gaactgtcat gggactatat gcaaagtgat ctcggtgagc tgcctgtgga

1740

cgcaagattt cctcctagag tgccaaaatc ttttccattc aacacctcag tcgtgtacaa

1800

aaagactctg tttgtagaat tcacggatca ccttttcaac atcgctaagc caaggccacc

1860

ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt tatgatacag tggtcattac

1920

acttaagaac atggcttccc atcctgtcag tcttcatgct gttggtgtat cctactggaa

1980

agcttctgag ggagctgaat atgatgatca gaccagtcaa agggagaaag aagatgataa

2040

agtcttccct ggtggaagcc atacatatgt ctggcaggtc ctgaaagaga atggtccaat

2100

ggcctctgac ccactgtgcc ttacctactc atatctttct catgtggacc tggtaaaaga

2160

cttgaattca ggcctcattg gagccctact agtatgtaga gaagggagtc tggccaagga

2220

aaagacacag accttgcaca aatttatact actttttgct gtatttgatg aagggaaaag

2280

ttggcactca gaaacaaaga actccttgat gcaggatagg gatgctgcat ctgctcgggc

2340

ctggcctaaa atgcacacag tcaatggtta tgtaaacagg tctctgccag gtctgattgg

2400

atgccacagg aaatcagtct attggcatgt gattggaatg ggcaccactc ctgaagtgca

2460

ctcaatattc ctcgaaggtc acacatttct tgtgaggaac catcgccagg cgtccttgga

2520

aatctcgcca ataactttcc ttactgctca aacactcttg atggaccttg gacagtttct

2580

actgttttgt catatctctt cccaccaaca tgatggcatg gaagcttatg tcaaagtaga

2640

cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagaagcgg aagactatga

2700

tgatgatctt actgattctg aaatggatgt ggtcaggttt gatgatgaca actctccttc

2760

ctttatccaa attcgctcag ttgccaagaa gcatcctaaa acttgggtac attacattgc

2820

tgctgaagag gaggactggg actatgctcc cttagtcctc gcccccgatg acagaagtta

2880

taaaagtcaa tatttgaaca atggccctca gcggattggt aggaagtaca aaaaagtccg

2940

atttatggca tacacagatg aaacctttaa gactcgtgaa gctattcagc atgaatcagg

3000

aatcttggga cctttacttt atggggaagt tggagacaca ctgttgatta tatttaagaa

3060

tcaagcaagc agaccatata acatctaccc tcacggaatc actgatgtcc gtcctttgta

3120

ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat tttccaattc tgccaggaga

3180

aatattcaaa tataaatgga cagtgactgt agaagatggg ccaactaaat cagatcctcg

3240

gtgcctgacc cgctattact ctagtttcgt taatatggag agagatctag cttcaggact

3300

cattggccct ctcctcatct gctacaaaga atctgtagat caaagaggaa accagataat

3360

gtcagacaag aggaatgtca tcctgttttc tgtatttgat gagaaccgaa gctggtacct

3420

cacagagaat atacaacgct ttctccccaa tccagctgga gtgcagcttg aggatccaga

3480

gttccaagcc tccaacatca tgcacagcat caatggctat gtttttgata gtttgcagtt

3540

gtcagtttgt ttgcatgagg tggcatactg gtacattcta agcattggag cacagactga

3600

cttcctttct gtcttcttct ctggatatac cttcaaacac aaaatggtct atgaagacac

3660

actcacccta ttcccattct caggagaaac tgtcttcatg tcgatggaaa acccaggtct

3720

atggattctg gggtgccaca actcagactt tcggaacaga ggcatgaccg ccttactgaa

3780

ggtttctagt tgtgacaaga acactggtga ttattacgag gacagttatg aagatatttc

3840

agcatacttg ctgagtaaaa acaatgccat tgaaccaaga agcttctccc agaattcaag

3900

acaccctagc actaggcaaa agcaatttaa tgccaccaca attccagaaa atgacataga

3960

gaagactgac ccttggtttg cacacagaac acctatgcct aaaatacaaa atgtctcctc

4020

tagtgatttg ttgatgctct tgcgacagag tcctactcca catgggctat ccttatctga

4080

tctccaagaa gccaaatatg agactttttc tgatgatcca tcacctggag caatagacag

4140

taataacagc ctgtctgaaa tgacacactt caggccacag ctccatcaca gtggggacat

4200

ggtatttacc cctgagtcag gcctccaatt aagattaaat gagaaactgg ggacaactgc

4260

agcaacagag ttgaagaaac ttgatttcaa agtttctagt acatcaaata atctgatttc

4320

aacaattcca tcagacaatt tggcagcagg tactgataat acaagttcct taggaccccc

4380

aagtatgcca gttcattatg atagtcaatt agataccact ctatttggca aaaagtcatc

4440

tccccttact gagtctggtg gacctctgag cttgagtgaa gaaaataatg attcaaagtt

4500

gttagaatca ggtttaatga atagccaaga aagttcatgg ggaaaaaatg tatcgtcaac

4560

agagagtggt aggttattta aagggaaaag agctcatgga cctgctttgt tgactaaaga

4620

taatgcctta ttcaaagtta gcatctcttt gttaaagaca aacaaaactt ccaataattc

4680

agcaactaat agaaagactc acattgatgg cccatcatta ttaattgaga atagtccatc

4740

agtctggcaa aatatattag aaagtgacac tgagtttaaa aaagtgacac ctttgattca

4800

tgacagaatg cttatggaca aaaatgctac agctttgagg ctaaatcata tgtcaaataa

4860

aactacttca tcaaaaaaca tggaaatggt ccaacagaaa aaagagggcc ccattccacc

4920

agatgcacaa aatccagata tgtcgttctt taagatgcta ttcttgccag aatcagcaag

4980

gtggatacaa aggactcatg gaaagaactc tctgaactct gggcaaggcc ccagtccaaa

5040

gcaattagta tccttaggac cagaaaaatc tgtggaaggt cagaatttct tgtctgagaa

5100

aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac gtaggactca aagagatggt

5160

ttttccaagc agcagaaacc tatttcttac taacttggat aatttacatg aaaataatac

5220

acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag aaggaaacat taatccaaga

5280

gaatgtagtt ttgcctcaga tacatacagt gactggcact aagaatttca tgaagaacct

5340

tttcttactg agcactaggc aaaatgtaga aggttcatat gacggggcat atgctccagt

5400

acttcaagat tttaggtcat taaatgattc aacaaataga acaaagaaac acacagctca

5460

tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg ggaaatcaaa ccaagcaaat

5520

tgtagagaaa tatgcatgca ccacaaggat atctcctaat acaagccagc agaattttgt

5580

cacgcaacgt agtaagagag ctttgaaaca attcagactc ccactagaag aaacagaact

5640

tgaaaaaagg ataattgtgg atgacacctc aacccagtgg tccaaaaaca tgaaacattt

5700

gaccccgagc accctcacac agatagacta caatgagaag gagaaagggg ccattactca

5760

gtctccctta tcagattgcc ttacgaggag tcatagcatc cctcaagcaa atagatctcc

5820

attacccatt gcaaaggtat catcatttcc atctattaga cctatatatc tgaccagggt

5880

cctattccaa gacaactctt ctcatcttcc agcagcatct tatagaaaga aagattctgg

5940

ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa aataaccttt ctttagccat

6000

tctaaccttg gagatgactg gtgatcaaag agaggttggc tccctgggga caagtgccac

6060

aaattcagtc acatacaaga aagttgagaa cactgttctc ccgaaaccag acttgcccaa

6120

aacatctggc aaagttgaat tgcttccaaa agttcacatt tatcagaagg acctattccc

6180

tacggaaact agcaatgggt ctcctggcca tctggatctc gtggaaggga gccttcttca

6240

gggaacagag ggagcgatta agtggaatga agcaaacaga cctggaaaag ttccctttct

6300

gagagtagca acagaaagct ctgcaaagac tccctccaag ctattggatc ctcttgcttg

6360

ggataaccac tatggtactc agataccaaa agaagagtgg aaatcccaag agaagtcacc

6420

agaaaaaaca gcttttaaga aaaaggatac cattttgtcc ctgaacgctt gtgaaagcaa

6480

tcatgcaata gcagcaataa atgagggaca aaataagccc gaaatagaag tcacctgggc

6540

aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca ccagtcttga aacgccatca

6600

acgggaaata actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac

6660

catatcagtt gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag

6720

cccccgcagc tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg

6780

ggattatggg atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt

6840

ccctcagttc aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt

6900

ataccgtgga gaactaaatg aacatttggg actcctgggg ccatatataa gagcagaagt

6960

tgaagataat atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc

7020

tagccttatt tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt

7080

caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa

7140

agatgagttt gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt

7200

gcactcaggc ctgattggac cccttctggt ctgccacact aacacactga accctgctca

7260

tgggagacaa gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa

7320

aagctggtac ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat

7380

ggaagatccc acttttaaag agaattatcg cttccatgca atcaatggct acataatgga

7440

tacactacct ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat

7500

gggcagcaat gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa

7560

aaaagaggag tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga

7620

aatgttacca tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca

7680

tgctgggatg agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat

7740

ggcttctgga cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc

7800

cccaaagctg gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc

7860

cttttcttgg atcaaggtgg atctgttggc accaatgatt attcacggca tcaagaccca

7920

gggtgcccgt cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct

7980

tgatgggaag aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt

8040

tggcaatgtg gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg

8100

atacatccgt ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat

8160

gggctgtgat ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga

8220

tgcacagatt actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa

8280

agctcgactt cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa

8340

agagtggctg caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg

8400

agtaaaatct ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga

8460

tggccatcag tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca

8520

agactccttc acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg

8580

aattcacccc cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga

8640

ggcacaggac ctctactgat taattaataa aatacagcat agcaaaactt taacctccaa

8700

atcaagcctc tacttgaatc cttttctgag ggatgaataa ggcataggca tcaggggctg

8760

ttgccaatgt gcattagctg tttgcagcct caccttcttt catggagttt aagatatagt

8820

gtattttccc aaggtttgaa ctagctcttc atttctttat gttttaaatg cactgacctc

8880

ccacattccc tttttagtaa aatattcaga aataatttaa atacatcatt gcaatgaaaa

8940

taaatgtttt ttattaggca gaatccagat gctcaaggcc cttcataata tcccccagtt

9000

tagtagttgg acttagggaa caaaggaacc tttaatagaa attggacagc aagaaagcga

9060

gctccataaa gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca

9120

taaagtagga aacactacac agacatgata agatacattg atgagtttgg acaaaccaca

9180

actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt

9240

gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt

9300

caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt

9360

acttaagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag

9420

gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag

9480

gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag

9540

ctgcctgcag gggcgcgccg ctagcagctg atgcatagca tgcggtaccg ggagatgggg

9600

gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat

9660

aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt

9720

cccagggctg gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg

9780

tttcttcctt ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca

9840

acgtcggggc ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact

9900

atagctagag tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac

9960

cacttcatcc ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc

10020

ctgaagccag ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa

10080

tgcctgacga tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc

10140

ctcgacttcg ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc

10200

acgaacccag ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg

10260

ctcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt

10320

tttcatggct tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca

10380

agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca

10440

gcaacgatgt tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg

10500

gcatcattcg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg

10560

atcttttcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg

10620

attacctcgg gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag

10680

aagcggttgt tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg

10740

agatctatat ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg

10800

cgctcatcaa tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc

10860

aagcagatta cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag

10920

aagtgatgca ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga

10980

tcggcttccc ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt

11040

accatgccct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga

11100

agagtttgct ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga

11160

tttcagttta caactattct gtctagttta agactttatt gtcatagttt agatctattt

11220

tgttcagttt aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta

11280

ctcaaccgta accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca

11340

gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc

11400

tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt

11460

tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg

11520

ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg

11580

agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat

11640

accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta

11700

ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct

11760

gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc

11820

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa

11880

gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg

11940

taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag

12000

tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt

12060

gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta

12120

cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc

12180

agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca

12240

cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa

12300

cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat

12360

ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct

12420

taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt

12480

tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat

12540

ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta

12600

atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg

12660

gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt

12720

tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg

12780

cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg

12840

taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc

12900

ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa

12960

ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac

13020

cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt

13080

ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg

13140

gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa

13200

gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata

13260

aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta

13320

atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg

13380

ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg

13440

ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa

13500

aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg

13560

ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt

13620

gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg

13680

ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta

13740

atgcgccgct acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc

13800

agtcaattac aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag

13860

aa

13862

<210> 218

<211> 2351

<212> БЕЛОК

<213> Homo sapiens

<400> 218

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro

755 760 765

Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp

770 775 780

Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys

785 790 795 800

Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser

805 810 815

Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr

820 825 830

Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn

835 840 845

Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly

850 855 860

Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu

865 870 875 880

Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys

885 890 895

Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn

900 905 910

Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met

915 920 925

Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys

930 935 940

Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu

945 950 955 960

Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu

965 970 975

Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe

980 985 990

Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala

995 1000 1005

Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser

1010 1015 1020

Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser

1025 1030 1035

Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu

1040 1045 1050

Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg

1055 1060 1065

Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met

1070 1075 1080

Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln

1085 1090 1095

Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met

1100 1105 1110

Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile

1115 1120 1125

Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro

1130 1135 1140

Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu

1145 1150 1155

Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys

1160 1165 1170

Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro

1175 1180 1185

Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu

1190 1195 1200

Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu

1205 1210 1215

Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile

1220 1225 1230

His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu

1235 1240 1245

Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr

1250 1255 1260

Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn

1265 1270 1275

Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu

1280 1285 1290

Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu

1295 1300 1305

Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln

1310 1315 1320

Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg

1325 1330 1335

Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp

1340 1345 1350

Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro

1355 1360 1365

Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala

1370 1375 1380

Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser

1385 1390 1395

Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser

1400 1405 1410

Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe

1415 1420 1425

Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys

1430 1435 1440

Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys

1445 1450 1455

Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly

1460 1465 1470

Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser

1475 1480 1485

Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp

1490 1495 1500

Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His

1505 1510 1515

Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser

1520 1525 1530

Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr

1535 1540 1545

Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val

1550 1555 1560

Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser

1565 1570 1575

Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln

1580 1585 1590

Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys

1595 1600 1605

Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys

1610 1615 1620

Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys

1625 1630 1635

Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg

1640 1645 1650

Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu

1655 1660 1665

Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr

1670 1675 1680

Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile

1685 1690 1695

Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys

1700 1705 1710

Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr

1715 1720 1725

Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser

1730 1735 1740

Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr

1745 1750 1755

Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu

1760 1765 1770

His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp

1775 1780 1785

Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser

1790 1795 1800

Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly

1805 1810 1815

Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr

1820 1825 1830

Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu

1835 1840 1845

Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu

1850 1855 1860

Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His

1865 1870 1875

Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln

1880 1885 1890

Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp

1895 1900 1905

Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn

1910 1915 1920

Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His

1925 1930 1935

Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met

1940 1945 1950

Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser

1955 1960 1965

Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr

1970 1975 1980

Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr

1985 1990 1995

Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly

2000 2005 2010

Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly

2015 2020 2025

Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro

2030 2035 2040

Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala

2045 2050 2055

Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His

2060 2065 2070

Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser

2075 2080 2085

Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile

2090 2095 2100

Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser

2105 2110 2115

Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr

2120 2125 2130

Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn

2135 2140 2145

Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile

2150 2155 2160

Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg

2165 2170 2175

Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys

2180 2185 2190

Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln

2195 2200 2205

Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser

2210 2215 2220

Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp

2225 2230 2235

Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe

2240 2245 2250

Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys

2255 2260 2265

Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser

2270 2275 2280

Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys

2285 2290 2295

Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val

2300 2305 2310

Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His

2315 2320 2325

Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu

2330 2335 2340

Gly Cys Glu Ala Gln Asp Leu Tyr

2345 2350

<210> 219

<400> 219

000

<210> 220

<400> 220

000

<210> 221

<400> 221

000

<210> 222

<400> 222

000

<210> 223

<400> 223

000

<210> 224

<400> 224

000

<210> 225

<400> 225

000

<210> 226

<400> 226

000

<210> 227

<400> 227

000

<210> 228

<400> 228

000

<210> 229

<400> 229

000

<210> 230

<400> 230

000

<210> 231

<400> 231

000

<210> 232

<400> 232

000

<210> 233

<400> 233

000

<210> 234

<400> 234

000

<210> 235

<400> 235

000

<210> 236

<400> 236

000

<210> 237

<400> 237

000

<210> 238

<400> 238

000

<210> 239

<400> 239

000

<210> 240

<400> 240

000

<210> 241

<400> 241

000

<210> 242

<400> 242

000

<210> 243

<400> 243

000

<210> 244

<400> 244

000

<210> 245

<400> 245

000

<210> 246

<400> 246

000

<210> 247

<400> 247

000

<210> 248

<400> 248

000

<210> 249

<400> 249

000

<210> 250

<400> 250

000

<210> 251

<400> 251

000

<210> 252

<400> 252

000

<210> 253

<400> 253

000

<210> 254

<400> 254

000

<210> 255

<400> 255

000

<210> 256

<400> 256

000

<210> 257

<400> 257

000

<210> 258

<400> 258

000

<210> 259

<400> 259

000

<210> 260

<400> 260

000

<210> 261

<400> 261

000

<210> 262

<400> 262

000

<210> 263

<400> 263

000

<210> 264

<400> 264

000

<210> 265

<400> 265

000

<210> 266

<400> 266

000

<210> 267

<400> 267

000

<210> 268

<400> 268

000

<210> 269

<400> 269

000

<210> 270

<400> 270

000

<210> 271

<400> 271

000

<210> 272

<400> 272

000

<210> 273

<400> 273

000

<210> 274

<400> 274

000

<210> 275

<400> 275

000

<210> 276

<400> 276

000

<210> 277

<400> 277

000

<210> 278

<400> 278

000

<210> 279

<400> 279

000

<210> 280

<400> 280

000

<210> 281

<400> 281

000

<210> 282

<400> 282

000

<210> 283

<400> 283

000

<210> 284

<400> 284

000

<210> 285

<400> 285

000

<210> 286

<400> 286

000

<210> 287

<400> 287

000

<210> 288

<400> 288

000

<210> 289

<400> 289

000

<210> 290

<400> 290

000

<210> 291

<400> 291

000

<210> 292

<400> 292

000

<210> 293

<400> 293

000

<210> 294

<400> 294

000

<210> 295

<400> 295

000

<210> 296

<400> 296

000

<210> 297

<400> 297

000

<210> 298

<400> 298

000

<210> 299

<400> 299

000

<210> 300

<400> 300

000

<210> 301

<400> 301

000

<210> 302

<400> 302

000

<210> 303

<400> 303

000

<210> 304

<400> 304

000

<210> 305

<400> 305

000

<210> 306

<400> 306

000

<210> 307

<400> 307

000

<210> 308

<400> 308

000

<210> 309

<400> 309

000

<210> 310

<400> 310

000

<210> 311

<400> 311

000

<210> 312

<400> 312

000

<210> 313

<400> 313

000

<210> 314

<400> 314

000

<210> 315

<400> 315

000

<210> 316

<400> 316

000

<210> 317

<400> 317

000

<210> 318

<400> 318

000

<210> 319

<400> 319

000

<210> 320

<400> 320

000

<210> 321

<400> 321

000

<210> 322

<400> 322

000

<210> 323

<400> 323

000

<210> 324

<400> 324

000

<210> 325

<400> 325

000

<210> 326

<400> 326

000

<210> 327

<400> 327

000

<210> 328

<400> 328

000

<210> 329

<400> 329

000

<210> 330

<400> 330

000

<210> 331

<400> 331

000

<210> 332

<400> 332

000

<210> 333

<400> 333

000

<210> 334

<400> 334

000

<210> 335

<400> 335

000

<210> 336

<400> 336

000

<210> 337

<400> 337

000

<210> 338

<400> 338

000

<210> 339

<400> 339

000

<210> 340

<400> 340

000

<210> 341

<400> 341

000

<210> 342

<400> 342

000

<210> 343

<400> 343

000

<210> 344

<400> 344

000

<210> 345

<400> 345

000

<210> 346

<400> 346

000

<210> 347

<400> 347

000

<210> 348

<400> 348

000

<210> 349

<400> 349

000

<210> 350

<400> 350

000

<210> 351

<400> 351

000

<210> 352

<400> 352

000

<210> 353

<400> 353

000

<210> 354

<400> 354

000

<210> 355

<400> 355

000

<210> 356

<400> 356

000

<210> 357

<400> 357

000

<210> 358

<400> 358

000

<210> 359

<400> 359

000

<210> 360

<400> 360

000

<210> 361

<400> 361

000

<210> 362

<400> 362

000

<210> 363

<400> 363

000

<210> 364

<400> 364

000

<210> 365

<400> 365

000

<210> 366

<400> 366

000

<210> 367

<400> 367

000

<210> 368

<400> 368

000

<210> 369

<400> 369

000

<210> 370

<400> 370

000

<210> 371

<400> 371

000

<210> 372

<400> 372

000

<210> 373

<400> 373

000

<210> 374

<400> 374

000

<210> 375

<400> 375

000

<210> 376

<400> 376

000

<210> 377

<400> 377

000

<210> 378

<400> 378

000

<210> 379

<400> 379

000

<210> 380

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 380

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc

60

accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg

120

ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180

acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat

300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360

ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg

420

gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg

480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat

540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg

660

tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat

720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc

780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc

840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900

aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag

1020

gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag

1080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat

1140

gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

1320

aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

1380

atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg

1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact

1500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc

1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc

1620

accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg

1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

1740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag

1800

aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg

1860

cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg

1920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

1980

attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag

2040

atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc

2100

atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc

2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac

2220

agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc

2280

ttcagccaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg

2340

cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag

2400

gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc

2460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc

2520

catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc

2580

caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac

2640

ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc

2700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac

2760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg

2880

gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg

2940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag

3000

tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg

3060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac

3120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc

3180

caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc

3240

atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg

3300

tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc

3360

tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc

3480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac

3540

tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

3600

ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc

3660

ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac

3720

aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc

3780

aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac

3840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac

3960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg

4020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg

4140

tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc

4200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac

4260

agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac

4320

cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga

4374

<210> 381

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 381

atgcagattg agctgagcac ctgcttcttc ctgtgtctgc tgaggttctg cttctctgcc

60

accaggaggt attacctggg ggctgtggag ctgagctggg actatatgca gtctgacctg

120

ggggagctgc ctgtggatgc taggttcccc cccagggtgc ccaagagctt cccctttaac

180

acttctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240

gccaagccca ggcccccctg gatggggctg ctggggccca ccatccaggc tgaggtgtat

300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360

ggggtgagct actggaaggc ttctgagggg gctgagtatg atgaccagac tagccagagg

420

gagaaggagg atgacaaggt gtttcctggg ggcagccata cctatgtgtg gcaggtgctg

480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgtctcat

540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ctctgctggt gtgtagggag

600

ggcagcctgg ctaaggaaaa gacccagacc ctgcataagt ttatcctgct gtttgctgtg

660

tttgatgagg gcaagagctg gcactctgag accaagaaca gcctgatgca ggatagggat

720

gctgcctctg ccagggcttg gcctaagatg cacactgtga atgggtatgt gaataggagc

780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tgggatgggc

840

accacccctg aggtccatag catcttcctg gagggccaca ctttcctggt gaggaaccac

900

agacaggcct ctctggagat ctctcccatc accttcctga ctgctcagac tctgctgatg

960

gacctgggcc agttcctgct gttttgccat attagcagcc accagcatga tgggatggag

1020

gcctatgtga aggtggatag ctgccctgag gagcctcagc tgaggatgaa gaacaatgag

1080

gaggctgaag actatgatga tgacctgact gattctgaga tggatgtggt gaggtttgat

1140

gatgacaata gccccagctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc

1200

tgggtgcact acattgctgc tgaggaagag gactgggact atgctcccct ggtgctggcc

1260

cctgatgata ggtcttataa gagccagtac ctgaacaatg ggccccagag gattggcagg

1320

aagtacaaga aggtgaggtt catggcctac actgatgaaa ccttcaaaac cagggaggcc

1380

attcagcatg agtctggcat cctgggccct ctgctgtatg gggaggtggg ggacaccctg

1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctatcctca tggcatcact

1500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaagacttc

1560

cccatcctgc ctggggagat ctttaagtat aagtggactg tgactgtgga ggatggccct

1620

accaagtctg accccaggtg tctgaccagg tactattcta gctttgtgaa catggagagg

1680

gacctggcct ctggcctgat tgggcccctg ctgatctgct acaaggagtc tgtggaccag

1740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttttctgt gtttgatgag

1800

aataggagct ggtacctgac tgagaacatc cagaggtttc tgcccaatcc tgctggggtg

1860

cagctggagg atcctgagtt ccaggccagc aatatcatgc atagcatcaa tggctatgtg

1920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

1980

attggggccc agactgactt tctgtctgtg ttcttttctg gctatacctt caagcacaag

2040

atggtgtatg aggataccct gaccctgttc cccttctctg gggagactgt gttcatgagc

2100

atggagaatc ctgggctgtg gatcctgggg tgccacaact ctgattttag gaacaggggg

2160

atgactgccc tgctgaaggt gtctagctgt gataagaaca ctggggacta ctatgaggac

2220

agctatgagg acatttctgc ttatctgctg tctaagaata atgccattga gcccagaagc

2280

ttcagccaga atccccctgt gctgaagaga catcagaggg agatcaccag aactaccctg

2340

cagtctgatc aggaggagat tgactatgat gacactatct ctgtggagat gaagaaggag

2400

gactttgaca tctatgatga ggatgagaat cagtctccca ggagctttca gaagaagacc

2460

agacattact tcattgctgc tgtggagagg ctgtgggact atggcatgag ctctagccct

2520

catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc

2580

caggaattca ctgatggcag cttcacccag cccctgtaca ggggggagct gaatgagcac

2640

ctgggcctgc tggggcctta tatcagggct gaggtggagg ataatattat ggtgactttc

2700

aggaaccagg ccagcaggcc ctactctttc tatagcagcc tgatctctta tgaggaggat

2760

cagaggcagg gggctgagcc taggaagaac tttgtgaagc ccaatgagac taagacctac

2820

ttctggaagg tccagcacca catggcccct accaaggatg agtttgactg caaggcctgg

2880

gcctatttct ctgatgtgga tctggagaag gatgtccatt ctgggctgat tggccccctg

2940

ctggtgtgcc acactaacac tctgaatcct gcccatggca ggcaggtgac tgtccaggag

3000

tttgccctgt tcttcactat ctttgatgag accaagagct ggtactttac tgagaacatg

3060

gagaggaact gcagagctcc ttgcaatatt cagatggagg accccacctt caaggagaat

3120

tacaggttcc atgccattaa tgggtacatc atggacaccc tgcctggcct ggtgatggct

3180

caggaccaga ggatcaggtg gtacctgctg agcatgggct ctaatgagaa tatccacagc

3240

atccacttct ctgggcatgt gttcactgtg aggaagaagg aggagtacaa gatggctctg

3300

tataatctgt accctggggt gtttgaaact gtggagatgc tgccctctaa ggctggcatc

3360

tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc

3480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactat

3540

tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

3600

ctggccccca tgatcattca tggcatcaag acccaggggg ccaggcagaa gttcagctct

3660

ctgtacatct ctcagttcat catcatgtac tctctggatg ggaagaagtg gcagacctac

3720

aggggcaaca gcactggcac cctgatggtg ttctttggga atgtggactc ttctggcatc

3780

aagcacaaca tcttcaatcc ccccatcatt gctaggtata ttaggctgca tcccacccac

3840

tacagcatca ggtctaccct gaggatggag ctgatgggct gtgacctgaa ctcttgcagc

3900

atgcccctgg gcatggagtc taaggccatc tctgatgccc agattactgc cagcagctac

3960

ttcaccaaca tgtttgccac ctggagcccc tctaaggcca ggctgcatct gcaggggagg

4020

agcaatgcct ggaggcctca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag

4080

aagaccatga aggtgactgg ggtgaccacc cagggggtca agagcctgct gaccagcatg

4140

tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac tctgttcttt

4200

cagaatggga aggtgaaggt gtttcagggc aatcaggact ctttcacccc tgtggtgaac

4260

agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagtc ttgggtgcat

4320

cagattgccc tgaggatgga ggtgctgggc tgtgaggctc aggatctgta ctga

4374

<210> 382

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 382

atgcagatcg agctctccac ctgcttcttt ctgtgcctgt tgagattctg cttcagcgcc

60

accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg

120

ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180

acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat

300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360

ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg

420

gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg

480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat

540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg

660

tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat

720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc

780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc

840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900

aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag

1020

gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag

1080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat

1140

gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

1320

aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

1380

atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg

1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact

1500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc

1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc

1620

accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg

1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

1740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag

1800

aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg

1860

cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg

1920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

1980

attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag

2040

atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc

2100

atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc

2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac

2220

agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc

2280

ttcagccaga atccacccgt ccttaagcgc catcagcgcg agatcaccag gaccaccctg

2340

cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag

2400

gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc

2460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc

2520

catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc

2580

caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac

2640

ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc

2700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac

2760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg

2880

gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg

2940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag

3000

tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg

3060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac

3120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc

3180

caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc

3240

atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg

3300

tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc

3360

tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc

3480

cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac

3540

tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

3600

ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc

3660

ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac

3720

aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc

3780

aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac

3840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac

3960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcatct gcagggcagg

4020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg

4140

tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc

4200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac

4260

agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac

4320

cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga

4374

<210> 383

<211> 7056

<212> ДНК

<213> Homo sapiens

<400> 383

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt

1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

2280

ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt

2340

ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa

2400

atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat

2460

gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca

2520

cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc

2580

catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag

2640

aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca

2700

tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca

2760

agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta

2820

tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa

2880

aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga

2940

aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct

3000

gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac

3060

aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta

3120

attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa

3180

gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta

3240

aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa

3300

gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc

3360

ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg

3420

caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag

3480

aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta

3540

ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat

3600

ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag

3660

gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag

3720

aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac

3780

ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca

3840

aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga

3900

aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca

3960

agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca

4020

ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc

4080

aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag

4140

aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct

4200

caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct

4260

atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat

4320

agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat

4380

aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc

4440

ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg

4500

aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat

4560

cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg

4620

gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct

4680

ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta

4740

ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa

4800

tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg

4860

aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa

4920

atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca

4980

gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa

5040

attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat

5100

gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct

5160

gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg

5220

gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc

5280

tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca

5340

tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt

5400

ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa

5460

cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat

5520

catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt

5580

gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac

5640

acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc

5700

atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct

5760

ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc

5820

aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga

5880

tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat

5940

gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt

6000

gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt

6060

attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt

6120

cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga

6180

caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc

6240

tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt

6300

cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt

6360

atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga

6420

accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac

6480

cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact

6540

cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag

6600

agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc

6660

acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct

6720

caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca

6780

ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc

6840

atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag

6900

gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta

6960

ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg

7020

gaggttctgg gctgcgaggc acaggacctc tactga

7056

<210> 384

<211> 4425

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 384

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc

60

accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg

120

ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac

180

acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt

240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat

300

gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg

360

ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg

420

gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg

480

aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat

540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg

660

tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat

720

gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc

780

ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc

840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac

900

aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag

1020

gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag

1080

gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat

1140

gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc

1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg

1320

aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc

1380

atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg

1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact

1500

gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc

1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc

1620

accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg

1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag

1740

aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag

1800

aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg

1860

cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg

1920

tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc

1980

attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag

2040

atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc

2100

atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc

2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac

2220

agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc

2280

ttcagccaga atgccactaa tgtgtctaac aacagcaaca ccagcaatga cagcaatgtg

2340

tctcccccag tgctgaagag gcaccagagg gagatcacca ggaccaccct gcagtctgac

2400

caggaggaga ttgactatga tgacaccatc tctgtggaga tgaagaagga ggactttgac

2460

atctacgacg aggacgagaa ccagagcccc aggagcttcc agaagaagac caggcactac

2520

ttcattgctg ctgtggagag gctgtgggac tatggcatga gcagcagccc ccatgtgctg

2580

aggaacaggg cccagtctgg ctctgtgccc cagttcaaga aggtggtgtt ccaggagttc

2640

actgatggca gcttcaccca gcccctgtac agaggggagc tgaatgagca cctgggcctg

2700

ctgggcccct acatcagggc tgaggtggag gacaacatca tggtgacctt caggaaccag

2760

gccagcaggc cctacagctt ctacagcagc ctgatcagct atgaggagga ccagaggcag

2820

ggggctgagc ccaggaagaa ctttgtgaag cccaatgaaa ccaagaccta cttctggaag

2880

gtgcagcacc acatggcccc caccaaggat gagtttgact gcaaggcctg ggcctacttc

2940

tctgatgtgg acctggagaa ggatgtgcac tctggcctga ttggccccct gctggtgtgc

3000

cacaccaaca ccctgaaccc tgcccatggc aggcaggtga ctgtgcagga gtttgccctg

3060

ttcttcacca tctttgatga aaccaagagc tggtacttca ctgagaacat ggagaggaac

3120

tgcagggccc cctgcaacat ccagatggag gaccccacct tcaaggagaa ctacaggttc

3180

catgccatca atggctacat catggacacc ctgcctggcc tggtgatggc ccaggaccag

3240

aggatcaggt ggtacctgct gagcatgggc agcaatgaga acatccacag catccacttc

3300

tctggccatg tgttcactgt gaggaagaag gaggagtaca agatggccct gtacaacctg

3360

taccctgggg tgtttgagac tgtggagatg ctgcccagca aggctggcat ctggagggtg

3420

gagtgcctga ttggggagca cctgcatgct ggcatgagca ccctgttcct ggtgtacagc

3480

aacaagtgcc agacccccct gggcatggcc tctggccaca tcagggactt ccagatcact

3540

gcctctggcc agtatggcca gtgggccccc aagctggcca ggctgcacta ctctggcagc

3600

atcaatgcct ggagcaccaa ggagcccttc agctggatca aggtggacct gctggccccc

3660

atgatcatcc atggcatcaa gacccagggg gccaggcaga agttcagcag cctgtacatc

3720

agccagttca tcatcatgta cagcctggat ggcaagaagt ggcagaccta caggggcaac

3780

agcactggca ccctgatggt gttctttggc aatgtggaca gctctggcat caagcacaac

3840

atcttcaacc cccccatcat tgccagatac atcaggctgc accccaccca ctacagcatc

3900

aggagcaccc tgaggatgga gctgatgggc tgtgacctga acagctgcag catgcccctg

3960

ggcatggaga gcaaggccat ctctgatgcc cagatcactg ccagcagcta cttcaccaac

4020

atgtttgcca cctggagccc cagcaaggcc aggctgcacc tgcagggcag gagcaatgcc

4080

tggaggcccc aggtcaacaa ccccaaggag tggctgcagg tggacttcca gaagaccatg

4140

aaggtgactg gggtgaccac ccagggggtg aagagcctgc tgaccagcat gtatgtgaag

4200

gagttcctga tcagcagcag ccaggatggc caccagtgga ccctgttctt ccagaatggc

4260

aaggtgaagg tgttccaggg caaccaggac agcttcaccc ctgtggtgaa cagcctggac

4320

ccccccctgc tgaccagata cctgaggatt cacccccaga gctgggtgca ccagattgcc

4380

ctgaggatgg aggtgctggg ctgtgaggcc caggacctgt actga

4425

<210> 385

<211> 1474

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 385

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala Thr Asn Val

755 760 765

Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser Pro Pro Val

770 775 780

Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp

785 790 795 800

Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys

805 810 815

Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser

820 825 830

Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu

835 840 845

Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala

850 855 860

Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe

865 870 875 880

Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu

885 890 895

His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn

900 905 910

Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr

915 920 925

Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro

930 935 940

Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys

945 950 955 960

Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala

965 970 975

Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly

980 985 990

Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala

995 1000 1005

His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr

1010 1015 1020

Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu

1025 1030 1035

Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr

1040 1045 1050

Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met

1055 1060 1065

Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg

1070 1075 1080

Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile

1085 1090 1095

His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr

1100 1105 1110

Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val

1115 1120 1125

Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu

1130 1135 1140

Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val

1145 1150 1155

Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His

1160 1165 1170

Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp

1175 1180 1185

Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala

1190 1195 1200

Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu

1205 1210 1215

Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln

1220 1225 1230

Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser

1235 1240 1245

Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly

1250 1255 1260

Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys

1265 1270 1275

His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu

1280 1285 1290

His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu

1295 1300 1305

Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu

1310 1315 1320

Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe

1325 1330 1335

Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His

1340 1345 1350

Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro

1355 1360 1365

Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr

1370 1375 1380

Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr

1385 1390 1395

Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp

1400 1405 1410

Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn

1415 1420 1425

Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu

1430 1435 1440

Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln

1445 1450 1455

Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu

1460 1465 1470

Tyr

<210> 386

<211> 5052

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 386

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc

60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc

120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac

180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc

240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat

300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt

360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg

420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg

480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat

540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa

600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta

660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat

720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct

780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc

840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat

900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg

960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa

1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa

1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat

1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact

1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc

1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg

1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct

1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg

1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact

1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt

1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca

1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga

1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa

1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag

1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg

1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt

1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc

1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa

2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg

2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc

2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac

2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc

2280

ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt

2340

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa

2400

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca

2460

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca

2520

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc

2580

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat

2640

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc

2700

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat

2760

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac

2820

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg

2880

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt

2940

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa

3000

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg

3060

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat

3120

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct

3180

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct

3240

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg

3300

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt

3360

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg

3420

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt

3480

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat

3540

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg

3600

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc

3660

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat

3720

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata

3780

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat

3840

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc

3900

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac

3960

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg

4020

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag

4080

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg

4140

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt

4200

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac

4260

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac

4320

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact

4380

cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc

4440

cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg

4500

gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag

4560

gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc

4620

agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc

4680

tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc

4740

cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc

4800

agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc

4860

aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc

4920

ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc

4980

tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg

5040

tctccgggta aa

5052

<210> 387

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 387

atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc

60

accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg

120

ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac

180

acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc

240

gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300

gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg

360

ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga

420

gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg

480

aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac

540

gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa

600

ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat

720

gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc

780

ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc

840

acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac

900

agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg

960

gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa

1020

gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag

1080

gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac

1140

gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc

1260

cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg

1320

aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc

1380

atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg

1440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc

1500

gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc

1560

cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc

1620

accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc

1680

gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag

1740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag

1800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg

1860

caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc

1980

attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag

2040

atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc

2100

atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc

2160

atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc

2280

ttcagccaga atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg

2340

cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa

2400

gatttcgaca tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc

2460

cggcactact tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct

2520

cacgtgctga gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc

2580

caagagttca ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat

2640

ctgggcctgc tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc

2700

cggaatcagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac

2760

cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac

2820

ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg

2880

gcctacttct ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg

2940

cttgtgtgcc acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag

3000

ttcgccctgt tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg

3060

gaacggaact gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac

3120

taccggttcc acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc

3180

caggatcaga gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc

3240

atccacttca gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg

3300

tacaatctgt accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt

3360

tggagagtgg aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg

3420

gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc

3480

cagatcaccg cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac

3540

agcggcagca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg

3600

ctggctccca tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc

3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

3720

agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt

3780

aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac

3840

tacagcatcc ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct

3900

atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac

3960

ttcaccaaca tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga

4020

agcaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa

4080

aagaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg

4140

tacgtgaaag agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc

4200

cagaacggca aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat

4260

tctctggacc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac

4320

cagatcgctc tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctag

4374

<210> 388

<211> 4980

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 388

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc

60

acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120

ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240

gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc

420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac

720

gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc

780

ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc

840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac

900

cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

1020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag

1080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac

1140

gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

1260

cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc

1320

aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc

1380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg

1440

ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc

1500

gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc

1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

1620

accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc

1680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag

1740

cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag

1800

aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

2100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc

2160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc

2280

ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc

2340

cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag

2400

atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac

2460

ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc

2520

cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg

2580

caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag

2640

aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc

2700

agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc

2760

agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg

2820

ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag

2880

aacaacgaca gcaagctgcc ccccgtgctg aagcgccacc agcgcgagat cacccgcacc

2940

accctgcaga gcgaccagga ggagatcgac tacgacgaca ccatcagcgt ggagatgaag

3000

aaggaggact tcgacatcta cgacgaggac gagaaccaga gcccccgcag cttccagaag

3060

aagacccgcc actacttcat cgccgccgtg gagcgcctgt gggactacgg catgagcagc

3120

agcccccacg tgctgcgcaa ccgcgcccag agcggcagcg tgccccagtt caagaaggtg

3180

gtgttccagg agttcaccga cggcagcttc acccagcccc tgtaccgcgg cgagctgaac

3240

gagcacctgg gcctgctggg cccctacatc cgcgccgagg tggaggacaa catcatggtg

3300

accttccgca accaggccag ccgcccctac agcttctaca gcagcctgat cagctacgag

3360

gaggaccagc gccagggcgc cgagccccgc aagaacttcg tgaagcccaa cgagaccaag

3420

acctacttct ggaaggtgca gcaccacatg gcccccacca aggacgagtt cgactgcaag

3480

gcctgggcct acttcagcga cgtggacctg gagaaggacg tgcacagcgg cctgatcggc

3540

cccctgctgg tgtgccacac caacaccctg aaccccgccc acggccgcca ggtgaccgtg

3600

caggagttcg ccctgttctt caccatcttc gacgagacca agagctggta cttcaccgag

3660

aacatggagc gcaactgccg cgccccctgc aacatccaga tggaggaccc caccttcaag

3720

gagaactacc gcttccacgc catcaacggc tacatcatgg acaccctgcc cggcctggtg

3780

atggcccagg accagcgcat ccgctggtac ctgctgagca tgggcagcaa cgagaacatc

3840

cacagcatcc acttcagcgg ccacgtgttc accgtgcgca agaaggagga gtacaagatg

3900

gccctgtaca acctgtaccc cggcgtgttc gagaccgtgg agatgctgcc cagcaaggcc

3960

ggcatctggc gcgtggagtg cctgatcggc gagcacctgc acgccggcat gagcaccctg

4020

ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggccagcgg ccacatccgc

4080

gacttccaga tcaccgccag cggccagtac ggccagtggg cccccaagct ggcccgcctg

4140

cactacagcg gcagcatcaa cgcctggagc accaaggagc ccttcagctg gatcaaggtg

4200

gacctgctgg cccccatgat catccacggc atcaagaccc agggcgcccg ccagaagttc

4260

agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggcaa gaagtggcag

4320

acctaccgcg gcaacagcac cggcaccctg atggtgttct tcggcaacgt ggacagcagc

4380

ggcatcaagc acaacatctt caaccccccc atcatcgccc gctacatccg cctgcacccc

4440

acccactaca gcatccgcag caccctgcgc atggagctga tgggctgcga cctgaacagc

4500

tgcagcatgc ccctgggcat ggagagcaag gccatcagcg acgcccagat caccgccagc

4560

agctacttca ccaacatgtt cgccacctgg agccccagca aggcccgcct gcacctgcaa

4620

ggccgcagca acgcctggcg cccccaggtg aacaacccca aggagtggct gcaggtggac

4680

ttccagaaga ccatgaaggt gaccggcgtg accacccagg gcgtgaagag cctgctgacc

4740

agcatgtacg tgaaggagtt cctgatcagc agcagccagg acggccacca gtggaccctg

4800

ttcttccaga acggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccccgtg

4860

gtgaacagcc tggacccccc cctgctgacc cgctacctgc gcatccaccc ccagagctgg

4920

gtgcaccaga tcgccctgcg catggaggtg ctgggctgcg aggcccagga cctgtactaa

4980

<210> 389

<211> 7056

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 389

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc

60

acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120

ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240

gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc

420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac

720

gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc

780

ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc

840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac

900

cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

1020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag

1080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac

1140

gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

1260

cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc

1320

aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc

1380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg

1440

ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc

1500

gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc

1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

1620

accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc

1680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag

1740

cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag

1800

aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

2100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc

2160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc

2280

ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc

2340

cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag

2400

atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac

2460

ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc

2520

cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg

2580

caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag

2640

aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc

2700

agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc

2760

agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg

2820

ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag

2880

aacaacgaca gcaagctgct ggagagcggc ctgatgaaca gccaggagag cagctggggc

2940

aagaacgtga gcagcaccga gagcggcagg ctgttcaagg gcaagcgcgc ccacggcccc

3000

gccctgctga ccaaggacaa cgccctgttc aaggtgagca tcagcctgct gaagaccaac

3060

aagaccagca acaacagcgc caccaaccgc aagacccaca tcgacggccc cagcctgctg

3120

atcgagaaca gccccagcgt gtggcagaac atcctggaga gcgacaccga gttcaagaag

3180

gtgacccccc tgatccacga ccgcatgctg atggacaaga acgccaccgc cctgcgcctg

3240

aaccacatga gcaacaagac caccagcagc aagaacatgg agatggtgca gcagaagaag

3300

gagggcccca tcccccccga cgcccagaac cccgacatga gcttcttcaa gatgctgttc

3360

ctgcccgaga gcgcccgctg gatccagcgc acccacggca agaacagcct gaacagcggc

3420

cagggcccca gccccaagca gctggtgagc ctgggccccg agaagagcgt ggagggccag

3480

aacttcctga gcgagaagaa caaggtggtg gtgggcaagg gcgagttcac caaggacgtg

3540

ggcctgaagg agatggtgtt ccccagcagc cgcaacctgt tcctgaccaa cctggacaac

3600

ctgcacgaga acaacaccca caaccaggag aagaagatcc aggaggagat cgagaagaag

3660

gagaccctga tccaggagaa cgtggtgctg ccccagatcc acaccgtgac cggcaccaag

3720

aacttcatga agaacctgtt cctgctgagc acccgccaga acgtggaggg cagctacgac

3780

ggcgcctacg cccccgtgct gcaggacttc cgcagcctga acgacagcac caaccgcacc

3840

aagaagcaca ccgcccactt cagcaagaag ggcgaggagg agaacctgga gggcctgggc

3900

aaccagacca agcagatcgt ggagaagtac gcctgcacca cccgcatcag ccccaacacc

3960

agccagcaga acttcgtgac ccagcgcagc aagcgcgccc tgaagcagtt ccgcctgccc

4020

ctggaggaga ccgagctgga gaagcgcatc atcgtggacg acaccagcac ccagtggagc

4080

aagaacatga agcacctgac ccccagcacc ctgacccaga tcgactacaa cgagaaggag

4140

aagggcgcca tcacccagag ccccctgagc gactgcctga cccgcagcca cagcatcccc

4200

caggccaacc gcagccccct gcccatcgcc aaggtgagca gcttccccag catccgcccc

4260

atctacctga cccgcgtgct gttccaggac aacagcagcc acctgcccgc cgccagctac

4320

cgcaagaagg acagcggcgt gcaggagagc agccacttcc tgcaaggcgc caagaagaac

4380

aacctgagcc tggccatcct gaccctggag atgaccggcg accagcgcga ggtgggcagc

4440

ctgggcacca gcgccaccaa cagcgtgacc tacaagaagg tggagaacac cgtgctgccc

4500

aagcccgacc tgcccaagac cagcggcaag gtggagctgc tgcccaaggt gcacatctac

4560

cagaaggacc tgttccccac cgagaccagc aacggcagcc ccggccacct ggacctggtg

4620

gagggcagcc tgctgcaggg caccgagggc gccatcaagt ggaacgaggc caaccgcccc

4680

ggcaaggtgc ccttcctgcg cgtggccacc gagagcagcg ccaagacccc cagcaagctg

4740

ctggaccccc tggcctggga caaccactac ggcacccaga tccccaagga ggagtggaag

4800

agccaggaga agagccccga gaagaccgcc ttcaagaaga aggacaccat cctgagcctg

4860

aacgcctgcg agagcaacca cgccatcgcc gccatcaacg agggccagaa caagcccgag

4920

atcgaggtga cctgggccaa gcagggccgc accgagcgcc tgtgcagcca gaaccccccc

4980

gtgctgaagc gccaccagcg cgagatcacc cgcaccaccc tgcagagcga ccaggaggag

5040

atcgactacg acgacaccat cagcgtggag atgaagaagg aggacttcga catctacgac

5100

gaggacgaga accagagccc ccgcagcttc cagaagaaga cccgccacta cttcatcgcc

5160

gccgtggagc gcctgtggga ctacggcatg agcagcagcc cccacgtgct gcgcaaccgc

5220

gcccagagcg gcagcgtgcc ccagttcaag aaggtggtgt tccaggagtt caccgacggc

5280

agcttcaccc agcccctgta ccgcggcgag ctgaacgagc acctgggcct gctgggcccc

5340

tacatccgcg ccgaggtgga ggacaacatc atggtgacct tccgcaacca ggccagccgc

5400

ccctacagct tctacagcag cctgatcagc tacgaggagg accagcgcca gggcgccgag

5460

ccccgcaaga acttcgtgaa gcccaacgag accaagacct acttctggaa ggtgcagcac

5520

cacatggccc ccaccaagga cgagttcgac tgcaaggcct gggcctactt cagcgacgtg

5580

gacctggaga aggacgtgca cagcggcctg atcggccccc tgctggtgtg ccacaccaac

5640

accctgaacc ccgcccacgg ccgccaggtg accgtgcagg agttcgccct gttcttcacc

5700

atcttcgacg agaccaagag ctggtacttc accgagaaca tggagcgcaa ctgccgcgcc

5760

ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actaccgctt ccacgccatc

5820

aacggctaca tcatggacac cctgcccggc ctggtgatgg cccaggacca gcgcatccgc

5880

tggtacctgc tgagcatggg cagcaacgag aacatccaca gcatccactt cagcggccac

5940

gtgttcaccg tgcgcaagaa ggaggagtac aagatggccc tgtacaacct gtaccccggc

6000

gtgttcgaga ccgtggagat gctgcccagc aaggccggca tctggcgcgt ggagtgcctg

6060

atcggcgagc acctgcacgc cggcatgagc accctgttcc tggtgtacag caacaagtgc

6120

cagacccccc tgggcatggc cagcggccac atccgcgact tccagatcac cgccagcggc

6180

cagtacggcc agtgggcccc caagctggcc cgcctgcact acagcggcag catcaacgcc

6240

tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc

6300

cacggcatca agacccaggg cgcccgccag aagttcagca gcctgtacat cagccagttc

6360

atcatcatgt acagcctgga cggcaagaag tggcagacct accgcggcaa cagcaccggc

6420

accctgatgg tgttcttcgg caacgtggac agcagcggca tcaagcacaa catcttcaac

6480

ccccccatca tcgcccgcta catccgcctg caccccaccc actacagcat ccgcagcacc

6540

ctgcgcatgg agctgatggg ctgcgacctg aacagctgca gcatgcccct gggcatggag

6600

agcaaggcca tcagcgacgc ccagatcacc gccagcagct acttcaccaa catgttcgcc

6660

acctggagcc ccagcaaggc ccgcctgcac ctgcaaggcc gcagcaacgc ctggcgcccc

6720

caggtgaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgacc

6780

ggcgtgacca cccagggcgt gaagagcctg ctgaccagca tgtacgtgaa ggagttcctg

6840

atcagcagca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaggtgaag

6900

gtgttccagg gcaaccagga cagcttcacc cccgtggtga acagcctgga cccccccctg

6960

ctgacccgct acctgcgcat ccacccccag agctgggtgc accagatcgc cctgcgcatg

7020

gaggtgctgg gctgcgaggc ccaggacctg tactaa

7056

<210> 390

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 390

atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc

60

acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg

120

ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac

180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc

240

gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac

300

gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg

360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc

420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg

480

aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac

540

gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag

600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac

720

gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc

780

ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc

840

accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac

900

cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg

960

gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag

1020

gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag

1080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac

1140

gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc

1260

cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc

1320

aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc

1380

atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg

1440

ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc

1500

gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc

1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc

1620

accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc

1680

gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag

1740

cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag

1800

aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg

1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc

1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag

2040

atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc

2100

atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc

2160

atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc

2280

ttcagccaga acccccccgt gctgaagcgc caccagcgcg agatcacccg caccaccctg

2340

cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag

2400

gacttcgaca tctacgacga ggacgagaac cagagccccc gcagcttcca gaagaagacc

2460

cgccactact tcatcgccgc cgtggagcgc ctgtgggact acggcatgag cagcagcccc

2520

cacgtgctgc gcaaccgcgc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc

2580

caggagttca ccgacggcag cttcacccag cccctgtacc gcggcgagct gaacgagcac

2640

ctgggcctgc tgggccccta catccgcgcc gaggtggagg acaacatcat ggtgaccttc

2700

cgcaaccagg ccagccgccc ctacagcttc tacagcagcc tgatcagcta cgaggaggac

2760

cagcgccagg gcgccgagcc ccgcaagaac ttcgtgaagc ccaacgagac caagacctac

2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg

2880

gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg

2940

ctggtgtgcc acaccaacac cctgaacccc gcccacggcc gccaggtgac cgtgcaggag

3000

ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg

3060

gagcgcaact gccgcgcccc ctgcaacatc cagatggagg accccacctt caaggagaac

3120

taccgcttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc

3180

caggaccagc gcatccgctg gtacctgctg agcatgggca gcaacgagaa catccacagc

3240

atccacttca gcggccacgt gttcaccgtg cgcaagaagg aggagtacaa gatggccctg

3300

tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc

3360

tggcgcgtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg

3420

gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgcgacttc

3480

cagatcaccg ccagcggcca gtacggccag tgggccccca agctggcccg cctgcactac

3540

agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg

3600

ctggccccca tgatcatcca cggcatcaag acccagggcg cccgccagaa gttcagcagc

3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac

3720

cgcggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc

3780

aagcacaaca tcttcaaccc ccccatcatc gcccgctaca tccgcctgca ccccacccac

3840

tacagcatcc gcagcaccct gcgcatggag ctgatgggct gcgacctgaa cagctgcagc

3900

atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac

3960

ttcaccaaca tgttcgccac ctggagcccc agcaaggccc gcctgcacct gcaaggccgc

4020

agcaacgcct ggcgccccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag

4080

aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg

4140

tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc

4200

cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac

4260

agcctggacc cccccctgct gacccgctac ctgcgcatcc acccccagag ctgggtgcac

4320

cagatcgccc tgcgcatgga ggtgctgggc tgcgaggccc aggacctgta ctaa

4374

<210> 391

<211> 7056

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 391

atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc

60

accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg

120

ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac

180

acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc

240

gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300

gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg

360

ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga

420

gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg

480

aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac

540

gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa

600

ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat

720

gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc

780

ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc

840

acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac

900

agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg

960

gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa

1020

gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag

1080

gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac

1140

gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc

1260

cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg

1320

aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc

1380

atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg

1440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc

1500

gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc

1560

cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc

1620

accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc

1680

gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag

1740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag

1800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg

1860

caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc

1980

attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag

2040

atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc

2100

atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc

2160

atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc

2280

ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc

2340

cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag

2400

atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac

2460

ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct

2520

cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg

2580

caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag

2640

aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc

2700

agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca

2760

tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg

2820

ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa

2880

aacaacgaca gcaagctgct ggaatccggc ctgatgaaca gccaagagtc ctcctggggc

2940

aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gaaagagagc ccacggacct

3000

gctctgctga ccaaggataa cgccctgttc aaagtgtcca tcagcctgct caagaccaac

3060

aagacctcca acaactccgc caccaacaga aagacccaca tcgacggccc tagcctgctg

3120

atcgagaata gccctagcgt ctggcagaat atcctggaaa gcgacaccga gttcaagaaa

3180

gtgacccctc tgatccacga ccggatgctc atggacaaga acgccaccgc tctgcggctg

3240

aaccacatga gcaacaagac aaccagcagc aagaatatgg aaatggtgca gcagaagaaa

3300

gagggcccca ttcctccaga cgctcagaac cccgatatga gcttcttcaa gatgctcttt

3360

ctgcccgaga gcgcccggtg gattcagaga acacacggca agaactccct gaactccggc

3420

cagggacctt ctccaaagca gctggtttcc ctgggacctg agaagtccgt ggaaggacag

3480

aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg gcgagttcac caaggatgtg

3540

ggcctgaaag agatggtctt tcccagcagc cggaacctgt tcctgaccaa cctggacaac

3600

ctgcacgaga acaacaccca caatcaagag aagaagatcc aagaggaaat cgaaaagaaa

3660

gagacactca tccaagagaa cgtggtgctg cctcagatcc acacagtgac cggcaccaag

3720

aactttatga agaatctgtt cctgctgagt acccggcaga acgtggaagg cagctacgat

3780

ggcgcttatg cccctgtgct gcaggacttc agatccctga acgactccac caatcggaca

3840

aagaagcaca cagcccactt ctccaagaag ggcgaagaag agaacctgga aggactgggc

3900

aatcagacca agcagatcgt cgagaagtac gcctgcacca ccagaatcag ccccaacaca

3960

agccagcaga acttcgtgac ccagcggagc aaaagagccc tgaagcagtt tcggctgccc

4020

ctggaagaaa ccgagctgga aaagcggatc atcgtggacg acaccagcac acagtggtcc

4080

aagaacatga agcacttgac ccctagcaca ctgacccaga tcgactacaa cgagaaagag

4140

aagggcgcta tcacacagag cccactgagc gactgtctga ccagaagcca cagcatccct

4200

caggccaaca gatcccctct gccaatcgcc aaagtgtcta gcttccccag catcagaccc

4260

atctacctga ccagagtgct gttccaggac aacagcagcc atctgccagc cgccagctac

4320

cggaagaaag attctggcgt gcaagagagc agccactttc tgcagggcgc taagaagaac

4380

aatctgagcc tggctattct gaccctggaa atgaccggcg atcagagaga agtcggctct

4440

ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg tggaaaacac cgtgctgcct

4500

aagcctgacc tgccaaagac aagcggcaag gtggaactgc tgccaaaggt gcacatctac

4560

cagaaggacc tgtttcctac cgagacaagc aacggctctc ccggccatct ggatctggtg

4620

gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ggaacgaggc caatagacct

4680

ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ccaagacacc ctctaaactg

4740

ctggaccctc tggcctggga caaccactat ggcactcaga tccccaaaga ggaatggaag

4800

tcccaagaga agtcccctga aaagaccgcc ttcaagaaga aggacaccat tctgtccctg

4860

aatgcctgcg agagcaacca cgccattgcc gccatcaatg agggccagaa caagcccgag

4920

atcgaagtga cctgggccaa gcagggaaga accgagagac tgtgtagcca gaatcctcct

4980

gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgcagagcga ccaagaagag

5040

atcgattacg acgataccat cagcgtcgag atgaagaaag aagatttcga catctacgac

5100

gaggacgaga atcagagccc tcggagcttc cagaagaaaa ccaggcacta ctttattgcc

5160

gccgtcgagc ggctgtggga ctacggaatg tctagctctc ctcacgtgct gcggaataga

5220

gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt tccaagagtt caccgacggc

5280

agcttcaccc agccactgta tagaggcgag ctgaacgagc atctgggcct gctgggccct

5340

tatatcagag ccgaagtgga agataacatc atggtcacct tccggaatca ggctagccgg

5400

ccttacagct tctacagctc cctgatctcc tacgaagagg accagagaca gggcgcagag

5460

ccccggaaga atttcgtgaa gcccaacgag actaagacct acttttggaa ggtgcagcac

5520

catatggccc ctacaaagga cgagttcgac tgcaaagcct gggcctactt ctccgatgtg

5580

gacctcgaaa aggacgtgca cagcggactc atcggcccac tgcttgtgtg ccacaccaac

5640

acactgaacc ccgctcacgg cagacaagtg acagtgcaag agttcgccct gtttttcacc

5700

atcttcgacg aaacgaagtc ctggtacttc accgaaaaca tggaaagaaa ctgcagggcc

5760

ccttgcaaca ttcagatgga agatcccacc ttcaaagaga actaccggtt ccacgccatc

5820

aacggctaca tcatggacac actgcccggc ctggttatgg cccaggatca gagaatccgg

5880

tggtatctgc tgtccatggg ctccaacgag aatatccact ccatccactt cagcggccac

5940

gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc tgtacaatct gtaccctggg

6000

gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tttggagagt ggaatgtctg

6060

attggagagc acctccacgc cgggatgagc accctgtttc tggtgtactc caacaagtgt

6120

cagacccctc tcggcatggc ctctggccac attagagact tccagatcac cgccagcgga

6180

cagtatggac agtgggcccc taaactggcc agactgcact actccggcag catcaatgcc

6240

tggtccacca aagagccttt cagctggatc aaagtggacc tgctggctcc catgatcatc

6300

cacggaatca agacccaggg cgccagacaa aagttcagca gcctgtacat cagccagttc

6360

atcatcatgt acagcctgga cggaaagaag tggcagacct accggggcaa tagcaccggc

6420

acactgatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa catcttcaac

6480

cctccaatca ttgcccggta catccggctg caccccacac actacagcat caggtctacc

6540

ctgagaatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct cggaatggaa

6600

agcaaggcca tcagcgacgc ccagatcaca gcctctagct acttcaccaa catgttcgcc

6660

acttggagcc cctctaaggc ccggcttcat ctgcaaggca gaagcaacgc ttggaggccc

6720

caagtgaaca accccaaaga atggctccag gtggactttc agaaaaccat gaaagtgaca

6780

ggcgtgacca cacagggcgt caagtccctg ctgacctcta tgtacgtgaa agagtttctg

6840

atcagctcca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaagtgaaa

6900

gtgttccagg gaaatcagga cagcttcaca cccgtggtca atagtctgga cccaccactg

6960

ctgacccgct acctgcgaat tcaccctcag tcttgggtgc accagattgc cctgcggatg

7020

gaagtgctgg gctgtgaagc tcaggacctc tactag

7056

<210> 392

<211> 4980

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 392

atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc

60

accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg

120

ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac

180

acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc

240

gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac

300

gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg

360

ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga

420

gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg

480

aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac

540

gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa

600

ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg

660

ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat

720

gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc

780

ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc

840

acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac

900

agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg

960

gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa

1020

gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag

1080

gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac

1140

gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc

1200

tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc

1260

cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg

1320

aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc

1380

atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg

1440

ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc

1500

gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc

1560

cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc

1620

accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc

1680

gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag

1740

cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag

1800

aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg

1860

caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg

1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc

1980

attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag

2040

atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc

2100

atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc

2160

atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac

2220

agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc

2280

ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc

2340

cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag

2400

atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac

2460

ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct

2520

cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg

2580

caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag

2640

aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc

2700

agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca

2760

tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg

2820

ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa

2880

aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc agcgggaaat caccagaacc

2940

acactgcaga gcgaccaaga ggaaatcgat tacgacgaca ccatcagcgt cgagatgaag

3000

aaagaagatt tcgacatcta cgacgaggac gagaatcaga gccccagatc ctttcagaaa

3060

aagacccggc actacttcat tgccgccgtc gagagactgt gggactacgg catgtctagc

3120

agccctcacg tgctgagaaa tagagcccag agcggcagcg tgccccagtt caagaaagtg

3180

gtgttccaag agttcaccga cggcagcttc acccagccac tgtatagagg cgagctgaac

3240

gagcatctgg gcctgctggg cccttatatc agagccgaag tggaagataa catcatggtc

3300

accttccgga atcaggctag ccggccttac agcttctaca gctccctgat ctcctacgaa

3360

gaggaccaga gacagggcgc tgagccccgg aagaatttcg tgaagcccaa cgagactaag

3420

acctactttt ggaaggtgca gcaccacatg gcccctacaa aggacgagtt cgactgcaaa

3480

gcctgggcct acttctccga tgtggatctg gaaaaggacg tgcacagcgg gctcatcgga

3540

ccactgcttg tgtgccacac caacacactg aaccccgctc acggcagaca agtgacagtg

3600

caagagttcg ccctgttctt caccatcttc gacgaaacaa agagctggta cttcaccgag

3660

aatatggaac ggaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa

3720

gagaactacc ggttccacgc catcaacggc tacatcatgg acacactgcc cggcctggtt

3780

atggcccagg atcagagaat ccggtggtat ctgctgtcca tgggctccaa cgagaatatc

3840

cacagcatcc acttcagcgg ccacgtgttc accgtgcgga aaaaagaaga gtacaaaatg

3900

gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaatgctgcc ttccaaggcc

3960

ggcatttgga gagtggaatg tctgattgga gagcacctcc acgccggaat gagcaccctg

4020

tttctggtgt actccaacaa gtgtcagacc cctctcggca tggcctctgg acacatcaga

4080

gacttccaga tcaccgcctc tggccagtac ggacagtggg ctcctaaact ggctcggctg

4140

cactactccg gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg

4200

gacctgctgg ctcccatgat catccacgga atcaagaccc agggcgcaag acagaagttc

4260

agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggaaa gaagtggcag

4320

acctaccggg gcaatagcac cggcacactc atggtgttct tcggcaacgt ggactccagc

4380

ggcattaagc acaacatctt caaccctcca atcattgccc ggtacatccg gctgcacccc

4440

acacactaca gcatccggtc taccctgaga atggaactga tgggctgcga cctgaacagc

4500

tgctctatgc ccctcggaat ggaaagcaag gccatcagcg acgcccagat cacagccagc

4560

agctacttca ccaacatgtt cgccacttgg agcccctcca aggctagact gcatctgcag

4620

ggcagaagca acgcttggag gccccaagtg aacaacccca aagagtggct gcaggttgac

4680

tttcaaaaga ccatgaaagt gaccggcgtg accacacagg gcgtcaagtc tctgctgacc

4740

tctatgtacg tgaaagagtt cctgattagc agcagccagg acggccacca gtggaccctg

4800

tttttccaga acggcaaagt gaaagtgttc cagggcaatc aggacagctt cacacccgtg

4860

gtcaattctc tggaccctcc actgctgacc agatacctgc ggattcaccc tcagtcttgg

4920

gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg aagctcagga cctctactag

4980

<210> 393

<211> 4374

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 393

atgcagatag aattatctac ttgttttttt ctttgtctgc tcaggttctg cttctctgct

60

acaaggaggt attacttagg tgctgtagag ttatcttggg actacatgca gtctgatctt

120

ggggagctcc ctgtggatgc aagatttccc cctagagtac ctaaaagttt ccctttcaac

180

acaagtgtgg tgtataagaa gactctgttt gttgagttca cagatcacct tttcaatatt

240

gccaagccca gacccccctg gatgggtcta ctggggccaa caattcaagc agaggtatat

300

gatacagtgg tgatcacatt aaagaacatg gcatcccacc ctgtaagcct gcatgctgtt

360

ggtgtgtcct attggaaagc aagtgaaggt gctgaatatg atgatcaaac atcccaaaga

420

gagaaggaag atgacaaagt cttcccaggt ggctctcaca cctatgtgtg gcaagtgctc

480

aaggaaaatg ggcctatggc tagtgatcca ttgtgcctca catatagcta cctgtcccat

540

gtggacttag ttaaagatct gaactcaggt ctgattggtg ccctgctggt ctgtagggaa

600

ggatcactag ctaaagaaaa aacccagact ttacacaagt tcatcttatt atttgctgtt

660

tttgatgagg gaaagagctg gcactcagag actaagaatt cactcatgca ggatagagat

720

gcagcttctg ctagagcatg gccaaaaatg catactgtga atgggtatgt taacaggagt

780

ctgcctggcc tcataggctg ccatagaaaa tcagtgtact ggcatgtcat aggtatgggc

840

actactcctg aggtgcattc catttttttg gaggggcata ctttccttgt aagaaaccac

900

aggcaggctt cattggaaat tagtccaata acctttctca cagcccagac tctgctaatg

960

gacttggggc agtttttatt attttgtcac attagctctc atcagcatga tggaatggaa

1020

gcctatgtta aggttgattc ctgcccagaa gagccccagt tgagaatgaa gaacaatgag

1080

gaagcagaag actatgatga tgatctaaca gactcagaaa tggatgttgt gagatttgat

1140

gatgataact ccccaagttt tattcagatc aggtcagtgg ccaagaaaca tccaaaaaca

1200

tgggttcatt atattgcagc agaagaagaa gactgggatt atgcaccctt ggtattagcc

1260

cctgatgaca gaagctataa gtcacaatat ctcaacaatg gaccccagag aattggcaga

1320

aagtacaaaa aagtcaggtt tatggcttat actgatgaga ctttcaaaac tagagaggct

1380

attcaacatg aatctggcat cctaggtcct ttgttatatg gggaagtagg ggacacctta

1440

ttaattatat ttaaaaacca ggccagtagg ccttacaaca tttaccccca cggtataaca

1500

gatgtcagac cactgtactc aaggaggcta ccaaaagggg tgaagcacct aaaagacttc

1560

cccatcctac ctggtgagat tttcaagtat aagtggacag tgactgtaga agatggtcca

1620

accaaatcag atcccagatg cctgacaagg tactacagta gctttgtaaa tatggagaga

1680

gacctggcct cagggttaat agggccccta ctgatctgct acaaggagag tgtagaccaa

1740

agaggcaacc aaattatgtc agacaagaga aatgtcatcc tctttagtgt ttttgatgag

1800

aataggtcct ggtacctgac agaaaatatc caaagattcc ttccaaatcc agcaggggta

1860

caactggagg accctgagtt ccaggcctcc aatatcatgc acagcatcaa tggttatgtg

1920

tttgacagtt tgcaactttc agtgtgcctt catgaggttg catactggta tatactttct

1980

ataggggccc agacagactt cttgtcagtt ttcttttcag gctatacttt caagcataag

2040

atggtatatg aagataccct gactcttttt ccctttagtg gtgagacagt tttcatgtca

2100

atggaaaacc cagggctttg gatcttggga tgccacaact ctgactttag aaacagaggc

2160

atgactgccc ttttaaaggt gtcctcttgt gataagaata ctggagacta ctatgaggac

2220

agctatgagg acatttcagc ctatctgctg tcaaaaaata atgctataga gccaaggtca

2280

ttttctcaaa atcctcctgt cctgaagagg caccaaagag agataaccag gactacctta

2340

cagtctgacc aggaggaaat tgattatgat gacacaataa gtgtggagat gaaaaaggag

2400

gattttgata tttatgatga ggatgaaaac caatctccaa gatctttcca gaagaagact

2460

agacactatt tcattgctgc agtggaaaga ctgtgggact atggaatgtc ctccagccct

2520

catgttctca ggaatagggc tcaaagtggt tctgtgccac agttcaagaa ggtggtgttt

2580

caggaattca cagatgggtc ctttactcaa ccactgtata ggggagaact caatgaacat

2640

ctaggattac taggtcccta cattagagct gaggtggagg acaatatcat ggtcactttc

2700

aggaaccagg catctagacc atactctttt tacagctcct tgatatctta tgaagaggac

2760

cagagacagg gtgcagaacc caggaagaac tttgtgaaac ccaatgagac caaaacatac

2820

ttctggaagg tccagcatca tatggctcct accaaggatg aatttgactg caaagcctgg

2880

gcttacttct cagatgtgga tttggagaaa gatgtgcaca gtggcttgat tgggcctctt

2940

ttggtatgtc ataccaacac cttaaaccct gctcatggaa gacaagtaac agtgcaagag

3000

tttgccctct ttttcactat atttgatgag acaaaaagtt ggtactttac tgagaatatg

3060

gagaggaact gcagggctcc ctgcaatata cagatggagg atcctacttt caaggaaaac

3120

tataggtttc atgccattaa tggctatatc atggatacat tgcctggctt agttatggcc

3180

caggatcaga gaatcagatg gtacctcctt agtatgggaa gcaatgaaaa catacattct

3240

attcacttca gtggacatgt ctttactgtg agaaaaaagg aagagtacaa gatggcactg

3300

tacaatctgt accctggagt gtttgagaca gttgagatgc tgcccagcaa ggctgggatc

3360

tggagggtag aatgcctgat tggagaacac ttacatgcag gtatgtccac tctattcttg

3420

gtctattcca acaagtgtca gaccccccta ggcatggcat ctggccatat tagagatttc

3480

cagataactg cttctggtca gtatggccag tgggccccca agcttgctag acttcactac

3540

agtggttcaa taaatgcctg gtccaccaag gagcccttca gctggattaa agtggacttg

3600

ctagccccca tgatcattca tgggataaaa acacagggtg ccagacagaa attttcatct

3660

ctgtacatca gccagtttat catcatgtac agtctggatg gcaaaaaatg gcagacctac

3720

agaggtaact ctacaggtac actaatggta ttttttggca atgtagattc atcaggtatc

3780

aagcataata tctttaatcc tcccattatt gccagataca tcaggttgca cccaactcat

3840

tacagtataa gatccacttt aaggatggag cttatggggt gtgaccttaa tagctgcagt

3900

atgcccttgg gaatggaaag taaggccata tcagatgccc agattactgc aagcagctac

3960

tttacaaaca tgtttgcaac ctggtctcct agtaaagcca ggctgcactt gcagggtagg

4020

agcaatgcat ggagacccca ggtcaataac ccaaaagagt ggcttcaagt tgactttcaa

4080

aagacaatga aggtaacagg ggtaaccacc caaggggtaa agagtctgct gacatctatg

4140

tatgtaaaag aattcctcat ctcaagtagt caagatgggc accagtggac actgttcttc

4200

cagaatggaa aagttaaggt gttccaaggt aatcaagaca gcttcactcc agtggtgaac

4260

agtctggatc caccactcct aaccaggtac ctgaggatcc accctcagtc ctgggtccac

4320

cagatagctc tgagaatgga agtgctgggc tgtgaagctc aggacctata ctga

4374

<210> 394

<211> 7056

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 394

atgcaaattg aattgagtac ctgttttttc ctctgtctat taaggttttg tttcagtgca

60

acaagaaggt attatctggg agctgttgag ttatcctggg actacatgca gtctgacctg

120

ggagagctcc cagtggatgc taggtttccc ccaagagtac ccaaaagctt ccctttcaac

180

acttctgttg tctataaaaa gactctgttt gtagaattca cagatcatct gtttaacatt

240

gccaagccta gacctccatg gatggggctg ctgggaccaa ctattcaggc agaggtttat

300

gacactgtgg tgattacact taagaatatg gcatcccacc cagtgagcct gcatgctgtt

360

ggggtttcct actggaaggc aagtgaagga gctgagtatg atgaccagac tagccaaaga

420

gagaaggagg atgacaaggt ctttccaggt ggcagccaca cctatgtctg gcaggtgctg

480

aaggagaatg gccctatggc ctctgatcct ttgtgtctaa cctacagtta tttgtctcat

540

gtggacctgg tgaaggacct taactcaggg ctgatagggg ccttgctggt gtgtagggag

600

ggaagcctgg ctaaggaaaa gacacagact ctgcataagt ttattctctt gtttgcagtg

660

tttgatgagg gtaaaagctg gcactctgaa acaaaaaaca gcttgatgca ggacagggat

720

gctgccagtg ctagggcttg gcctaagatg cacacagtca atggctatgt taacagatca

780

ctgcctggtt tgattggctg ccacagaaag tctgtttact ggcatgtaat tgggatgggg

840

acaaccccag aagttcactc tatcttcctg gaagggcaca ccttcctggt tagaaatcat

900

agacaggcat ccttagagat ttctcctatt acattcctga ctgcccagac cctcctcatg

960

gacctgggtc agttcctgct tttttgccac atttcctccc accagcatga tggcatggag

1020

gcctatgtga aagttgattc ttgccctgag gagcctcagc ttaggatgaa gaacaatgaa

1080

gaggctgagg actatgatga tgacctaaca gacagtgaga tggatgttgt gaggtttgat

1140

gatgacaatt cacctagttt catccagatt aggtctgtgg ctaagaaaca tccaaagacc

1200

tgggttcact acattgcagc agaggaggag gactgggatt atgcccccct ggttctggca

1260

cctgatgaca gaagctataa gtcccagtat ctcaacaatg gcccccagag gattggaaga

1320

aaatacaaaa aagtcagatt tatggcctat acagatgaga cttttaaaac tagggaagct

1380

attcagcatg agtcagggat cctgggacct cttctttatg gagaggtggg ggacactctt

1440

ctgataattt ttaaaaatca ggcaagtaga ccttataaca tctaccccca tgggatcact

1500

gatgtcaggc ctctgtactc aagaaggctg cccaagggtg tcaaacacct caaggatttc

1560

cctattcttc ctggggagat cttcaaatac aagtggacag ttactgtgga ggatggcccc

1620

accaaatctg acccaaggtg cctcaccaga tattacagct cctttgtgaa tatggaaaga

1680

gacctagcta gtggtctcat tggcccactg ctcatctgtt acaaggagtc agtggaccag

1740

agagggaatc aaattatgtc tgacaagaga aatgtgatcc ttttctcagt gtttgatgag

1800

aacagaagct ggtatctgac agagaacatt caaaggtttc tgccaaaccc agctggagtt

1860

cagctggagg accctgaatt ccaggcatct aatattatgc attctatcaa tggatatgtg

1920

tttgatagtc tgcagctgtc tgtgtgcctg catgaagtgg cctactggta tatcctctct

1980

attggtgccc agacagattt cttgtctgtg tttttcagtg gttacacatt taaacataaa

2040

atggtgtatg aggacacact tacattattc ccttttagtg gagagacagt gtttatgtcc

2100

atggagaatc caggcctgtg gatcttgggg tgtcataata gtgactttag gaatagaggt

2160

atgacagctc tgctcaaagt gtcttcctgt gacaagaaca caggggacta ttatgaggac

2220

tcttatgagg acatttcagc ctatttactg tccaagaaca atgccattga accaagatct

2280

ttctctcaga actcaagaca ccccagcacc aggcagaagc agttcaatgc aaccaccatc

2340

ccagagaatg atattgaaaa aactgaccct tggtttgccc acaggactcc catgcctaag

2400

attcagaatg tatcttcatc agacttgctg atgctcctga gacagagccc aactcctcat

2460

ggcctgagct taagtgacct ccaggaggct aagtatgaaa ctttctcaga tgatcccagt

2520

cctggtgcca ttgattctaa taattccctg tctgagatga cacacttcag accccagctc

2580

caccactctg gagatatggt ctttactcct gaatcaggcc tgcagctgag gctgaatgaa

2640

aagcttggca ccacagcagc tactgaactg aaaaagctgg attttaaagt gagctccaca

2700

tccaacaacc tgatttccac tatcccctca gataacttgg cagcagggac tgataacaca

2760

agctcactgg gtcccccttc catgcctgtc cattatgata gtcagctgga tactactctg

2820

tttggtaaga aatcctctcc cctgactgaa agtggaggcc ctctttccct gtcagaggag

2880

aacaatgaca gcaaactgtt agagtctgga ctcatgaact cacaggaaag ttcttggggc

2940

aagaatgtgt ctagcactga gtctgggaga ctgtttaagg gcaagagggc ccatggacca

3000

gccctgctga caaaggataa tgcactgttt aaggtctcaa tcagcctgtt gaagaccaac

3060

aaaaccagta ataattctgc aacaaacagg aagacccaca ttgatggacc ctctcttctc

3120

attgagaatt ccccttctgt ctggcagaac atcttggaat cagatacaga gttcaagaag

3180

gtgactcccc tgatccatga taggatgctc atggataaga atgccacagc actcaggctc

3240

aatcacatga gcaacaagac tacctcctcc aaaaatatgg agatggtgca gcagaagaag

3300

gaaggtccca ttccccctga tgcacagaat ccagatatga gcttctttaa gatgctgttt

3360

ttgcctgagt ctgccaggtg gattcagagg acacatggga agaactcact taactctggc

3420

caaggtccca gtcctaagca gttggtgagc ttggggcctg agaaaagtgt ggagggacag

3480

aatttcctgt ctgaaaagaa caaagtggtt gtgggcaaag gagagttcac taaagatgtg

3540

ggactgaagg agatggtgtt tcctagttca agaaatctct ttcttaccaa tcttgataac

3600

ctgcatgaga acaacaccca caatcaggaa aagaagatcc aggaggaaat tgagaagaag

3660

gaaaccctga tccaggaaaa tgttgtgctg ccacagatcc acactgttac tgggaccaaa

3720

aatttcatga aaaacctgtt tctcctgtct accagacaga atgtagaggg aagctatgat

3780

ggggcctatg cccctgttct ccaggacttc agatccctga atgactccac caacaggact

3840

aagaaacata ctgcacactt tagtaagaag ggggaggagg agaacctgga gggattggga

3900

aaccagacca agcagattgt ggagaaatat gcttgcacca ctagaatctc acctaacaca

3960

agccagcaga actttgtgac ccagaggtct aagagggccc tcaaacagtt tagattgcct

4020

ttggaggaga ctgagctgga aaagaggatt attgtggatg acacctctac ccagtggagc

4080

aagaatatga agcacctgac cccaagcacc cttactcaga ttgattacaa tgaaaaagaa

4140

aagggtgcca tcacccagag ccccttgagt gactgtttga caaggtccca cagtatccca

4200

caggctaaca gatctcctct gcctattgcc aaggtcagct ccttcccttc catcagaccc

4260

atctatctga ccagagtgct gttccaggac aactcctctc atctgccagc tgcctcctat

4320

aggaagaagg atagtggtgt gcaggaatca tctcactttc tgcagggagc caagaagaac

4380

aatctgagcc tggcaattct cacacttgag atgacaggag accagaggga agtgggaagt

4440

ctgggcactt ctgctaccaa ttctgtcacc tacaagaaag tggagaatac agttctgccc

4500

aagccagacc tgcctaaaac atctggaaag gttgagctgc tgcctaaggt gcacatatac

4560

cagaaggacc tattccctac agagacatcc aatggctccc caggccacct ggacttggta

4620

gaggggtctc tcctgcaggg cactgaaggt gctatcaagt ggaatgaggc taatagacct

4680

gggaaggtgc catttctgag ggtggccaca gagagctcag ctaagacacc cagcaagctg

4740

cttgatcccc tggcctggga caatcactat ggaacccaga ttcctaagga ggagtggaag

4800

tcccaggaga agtccccaga gaagactgct ttcaagaaga aggacactat cctctccctg

4860

aatgcctgtg agtctaacca tgctattgct gccatcaatg aaggccagaa caagcctgaa

4920

attgaggtga catgggccaa gcagggcaga acagagaggc tgtgcagcca gaacccacct

4980

gtgctcaaga ggcaccagag agagatcact agaaccactc tgcagtcaga ccaggaagag

5040

attgactatg atgacaccat ctcagttgag atgaaaaagg aggattttga tatttatgat

5100

gaggatgaga atcaatcccc aagatctttt cagaagaaga caagacatta cttcattgct

5160

gcagtggaga gactgtggga ttatggcatg tcctcctcac ctcatgtgct gagaaataga

5220

gcccagtctg gctctgtgcc ccagttcaaa aaagtggtgt ttcaggagtt cacagatggt

5280

tccttcacac agcccctgta caggggtgag ctgaatgagc acctggggtt gctgggcccc

5340

tacatcagag ctgaagttga ggataatatt atggtgacct tcaggaatca ggccagtagg

5400

ccttactctt tctactccag cctgatctca tatgaggagg accagagaca gggggctgaa

5460

cctaggaaga attttgtgaa gcccaatgaa acaaagacat acttctggaa ggtgcagcac

5520

cacatggctc ctaccaagga tgaatttgat tgcaaggctt gggcctattt ttctgatgtg

5580

gacctggaga aggatgtgca ttctggcctc attggccctc tcttggtgtg tcacaccaat

5640

accttgaatc cagcccatgg cagacaggtg actgttcagg agtttgctct gtttttcacc

5700

atctttgatg agacaaagtc ctggtatttt acagagaata tggagaggaa ttgcagggcc

5760

ccctgcaaca tccagatgga agacccaacc ttcaaggaga actacagatt ccatgcaatc

5820

aatggatata tcatggacac cctgcctggc ctggttatgg ctcaggatca gagaatcagg

5880

tggtatctgc tgtctatggg gtcaaatgag aacatccata gtatccactt ctctggccat

5940

gtgtttacag tgagaaagaa ggaagaatat aagatggccc tgtacaacct ctaccctgga

6000

gtgtttgaaa ctgttgaaat gctgccttca aaggctggaa tctggagggt ggaatgcctg

6060

attggagagc accttcatgc tggcatgtcc accctgtttc tggtgtacag caataagtgt

6120

cagactcctc tgggtatggc ttcaggccac atcagggact tccagatcac tgcctcagga

6180

cagtatggac agtgggctcc caaactggca aggctccact actcaggcag cattaatgcc

6240

tggtccacca aagagccttt cagctggatt aaggtggatc tcctggcacc tatgatcatc

6300

catgggatca agactcaggg agctaggcag aagtttagca gcctgtacat ttctcagttt

6360

atcattatgt acagcctgga tggaaaaaag tggcagacct atagaggaaa ctccactgga

6420

acactgatgg tgttttttgg caatgtggac tcaagtggga tcaagcacaa tatcttcaac

6480

ccccctatca ttgccagata catcaggctc caccctacac actactctat cagatctaca

6540

cttaggatgg agctgatggg atgtgatctg aactcttgca gtatgcctct gggtatggag

6600

tccaaggcca tctctgatgc tcagatcaca gccagctctt actttactaa tatgtttgct

6660

acctggtccc caagcaaggc aagactgcac ctgcagggca gatccaatgc ttggagaccc

6720

caggtgaata acccaaaaga gtggcttcag gtggacttcc agaagactat gaaggtgact

6780

ggagtgacca cccagggggt gaagtcactg ctgacctcca tgtatgtgaa ggagttcctg

6840

atctccagct cccaggatgg ccaccagtgg accctgttct tccagaatgg aaaggtgaag

6900

gtgttccagg gaaaccagga ctcctttacc cctgtggtga actccctgga ccccccactg

6960

ctgaccagat acctgagaat ccatccccag agctgggtgc accagattgc ccttaggatg

7020

gaggtgctgg gatgtgaagc ccaggacctg tactaa

7056

<210> 395

<211> 5013

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 395

atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct

60

accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg

120

ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac

180

acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt

240

gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat

300

gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta

360

ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga

420

gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg

480

aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat

540

gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa

600

gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg

660

tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat

720

gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc

780

ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc

840

accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat

900

agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg

960

gacttggggc agtttctgtt attctgccac atcagcagcc atcaacatga tggtatggaa

1020

gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag

1080

gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat

1140

gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc

1200

tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc

1260

cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga

1320

aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc

1380

atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg

1440

ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca

1500

gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt

1560

ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct

1620

actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga

1680

gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag

1740

agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag

1800

aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg

1860

cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg

1920

tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct

1980

attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag

2040

atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct

2100

atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt

2160

atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat

2220

tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc

2280

ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc

2340

ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag

2400

attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat

2460

ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc

2520

ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc

2580

caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag

2640

aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact

2700

tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca

2760

agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt

2820

tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag

2880

aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc

2940

aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt

3000

gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag

3060

gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct

3120

gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct

3180

cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt

3240

tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat

3300

atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc

3360

tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct

3420

agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac

3480

atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat

3540

ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca

3600

ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt

3660

tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct

3720

tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat

3780

ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg

3840

tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg

3900

ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg

3960

tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt

4020

ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag

4080

acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag

4140

tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg

4200

tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat

4260

gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc

4320

attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc

4380

ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct

4440

cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt

4500

aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc

4560

aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc

4620

tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag

4680

gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga

4740

gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc

4800

tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg

4860

tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg

4920

accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag

4980

gtgctgggct gtgaggccca ggacctgtac tga

5013

<210> 396

<211> 5013

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 396

atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct

60

accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg

120

ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac

180

acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt

240

gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat

300

gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta

360

ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga

420

gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg

480

aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat

540

gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa

600

gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg

660

tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat

720

gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc

780

ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc

840

accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat

900

agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg

960

gacttggggc agtttctgtt aagctgccac atcagcagcc atcaacatga tggtatggaa

1020

gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag

1080

gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat

1140

gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc

1200

tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc

1260

cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga

1320

aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc

1380

atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg

1440

ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca

1500

gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt

1560

ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct

1620

actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga

1680

gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag

1740

agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag

1800

aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg

1860

cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg

1920

tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct

1980

attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag

2040

atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct

2100

atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt

2160

atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat

2220

tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc

2280

ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc

2340

ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag

2400

attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat

2460

ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc

2520

ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc

2580

caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag

2640

aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact

2700

tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca

2760

agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt

2820

tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag

2880

aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc

2940

aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt

3000

gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag

3060

gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct

3120

gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct

3180

cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt

3240

tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat

3300

atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc

3360

tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct

3420

agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac

3480

atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat

3540

ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca

3600

ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt

3660

tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct

3720

tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat

3780

ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg

3840

tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg

3900

ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg

3960

tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt

4020

ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag

4080

acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag

4140

tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg

4200

tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat

4260

gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc

4320

attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc

4380

ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct

4440

cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt

4500

aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc

4560

aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc

4620

tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag

4680

gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga

4740

gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc

4800

tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg

4860

tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg

4920

accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag

4980

gtgctgggct gtgaggccca ggacctgtac tga

5013

<210> 397

<211> 1670

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 397

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro

755 760 765

Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp

770 775 780

Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys

785 790 795 800

Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser

805 810 815

Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr

820 825 830

Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn

835 840 845

Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly

850 855 860

Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu

865 870 875 880

Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys

885 890 895

Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn

900 905 910

Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met

915 920 925

Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys

930 935 940

Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu

945 950 955 960

Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu

965 970 975

Ser Ser Trp Gly Lys Asn Val Ser Ser Arg Glu Ile Thr Arg Thr Thr

980 985 990

Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val

995 1000 1005

Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn

1010 1015 1020

Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile

1025 1030 1035

Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro

1040 1045 1050

His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe

1055 1060 1065

Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln

1070 1075 1080

Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly

1085 1090 1095

Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe

1100 1105 1110

Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile

1115 1120 1125

Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn

1130 1135 1140

Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln

1145 1150 1155

His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp

1160 1165 1170

Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly

1175 1180 1185

Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro

1190 1195 1200

Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe

1205 1210 1215

Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met

1220 1225 1230

Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro

1235 1240 1245

Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile

1250 1255 1260

Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile

1265 1270 1275

Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser

1280 1285 1290

Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu

1295 1300 1305

Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr

1310 1315 1320

Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys

1325 1330 1335

Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu

1340 1345 1350

Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly

1355 1360 1365

His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln

1370 1375 1380

Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn

1385 1390 1395

Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu

1400 1405 1410

Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg

1415 1420 1425

Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr

1430 1435 1440

Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr

1445 1450 1455

Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile

1460 1465 1470

Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg

1475 1480 1485

Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu

1490 1495 1500

Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met

1505 1510 1515

Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr

1520 1525 1530

Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu

1535 1540 1545

His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn

1550 1555 1560

Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val

1565 1570 1575

Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met

1580 1585 1590

Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln

1595 1600 1605

Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly

1610 1615 1620

Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro

1625 1630 1635

Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His

1640 1645 1650

Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp

1655 1660 1665

Leu Tyr

1670

<210> 398

<211> 31

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 398

Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser

1 5 10 15

Asn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln Arg

20 25 30

<---

Похожие патенты RU2812852C2

название год авторы номер документа
МОДУЛЯЦИЯ АКТИВНОСТИ REP БЕЛКА ПРИ ПОЛУЧЕНИИ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (ЗКДНК) 2020
  • Котин, Роберт, Майкл
  • Учер, Анна
  • Малакян, Ара, Карл
RU2812850C2
МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ 2018
  • Серегин, Алексей
  • Лю, Туняо
  • Патарройо-Уайт, Сюзанна
  • Драгер, Дуглас
  • Питерс, Роберт Т.
  • Лю, Цзяюнь
RU2819144C2
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A 2017
  • Вонг, Лили
  • Вилсон, Джеймс М.
  • Сидрейн, Дженни Агнес
RU2762257C2
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение 2022
  • Перепелкина Мария Павловна
  • Власова Елена Вениаминовна
  • Фомина Анастасия Владимировна
  • Гершович Павел Михайлович
  • Маркова Виталия Александровна
  • Морозов Дмитрий Валентинович
RU2818229C2
Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови VIII c делетированным B доменом, и ее применение 2022
  • Шугаева Татьяна Евгеньевна
  • Власова Елена Вениаминовна
  • Фомина Анастасия Владимировна
  • Перепелкина Мария Павловна
  • Стрелкова Анна Николаевна
  • Гершович Павел Михайлович
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2808564C2
УЛУЧШЕНИЕ КЛИНИЧЕСКИХ ПАРАМЕТРОВ ПОСРЕДСТВОМ ЭКСПРЕССИИ ФАКТОРА VIII 2019
  • Коннер, Эдвард Р.
  • Райли, Бриджит Е.
  • Руи, Дидье
RU2799048C2
АНТИТЕЛО, КОТОРОЕ ОБЛАДАЕТ СПОСОБНОСТЬЮ НЕЙТРАЛИЗОВАТЬ СУБСТАНЦИЮ, ОБЛАДАЮЩУЮ АКТИВНОСТЬЮ, АЛЬТЕРНАТИВНОЙ ФУНКЦИИ ФАКТОРА СВЕРТЫВАНИЯ VIII (FVIII) 2015
  • Игава Томоюки
  • Муто Атцуси
  • Китадзава Такехиса
  • Судзуки Цукаса
RU2737145C2
СПОСОБ ИЗМЕРЕНИЯ РЕАКТИВНОСТИ FVIII 2015
  • Ногами Кейдзи
  • Шима Мидори
  • Соэда Тецухиро
  • Китадзава Такехиса
RU2752595C2
ВЫСОКОГЛИКОЗИЛИРОВАННЫЙ СЛИТЫЙ БЕЛОК НА ОСНОВЕ ФАКТОРА СВЕРТЫВАНИЯ КРОВИ ЧЕЛОВЕКА VIII, СПОСОБ ЕГО ПОЛУЧЕНИЯ И ЕГО ПРИМЕНЕНИЕ 2016
  • Ли, Цян
  • Чжу, Вэньчэнь
  • Ли, Юаньли
  • Чжу, Чэнгун
  • Гао, Юнцзюань
  • Жэнь, Цзыцзя
  • Чжу, Луянь
  • Сунь, Найчао
  • Ван, Сяошань
  • Лю, Бинь
  • Ли, Чжи
  • Ван, Вэньвэнь
  • Цзян, Мин
  • Ван, Цилэй
  • Ван, Лижуй
  • Ван, Шуя
  • Чжу, Сунлинь
  • Гао, Цзе
  • Су, Хуншэн
RU2722374C1
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 2020
  • Гершович Павел Михайлович
  • Прокофьев Александр Владимирович
  • Стрелкова Анна Николаевна
  • Спирина Наталья Александровна
  • Шугаева Татьяна Евгеньевна
  • Яковлев Павел Андреевич
  • Морозов Дмитрий Валентинович
RU2760301C1

Иллюстрации к изобретению RU 2 812 852 C2

Реферат патента 2024 года НЕВИРУСНЫЕ ДНК-ВЕКТОРЫ И ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ ДЛЯ ЭКСПРЕССИИ ТЕРАПЕВТИЧЕСКОГО СРЕДСТВА НА ОСНОВЕ ФАКТОРА VIII (FVIII)

Изобретение относится к области биотехнологии. Описана группа изобретений, включающая бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК) для экспрессии белка фактора VIII (FVIII), способ экспрессии белка FVIII в клетке, фармацевтическую композицию для генной терапии, способ лечения субъекта, страдающего гемофилией А, клетку для продуцирования белка FVIII, композицию для доставки зкДНК-вектора и набор для доставки зкДНК-вектора. В одном из вариантов реализации бескапсидный вектор содержит по меньшей мере одну последовательность нуклеиновой кислоты, расположенную между фланкирующими инвертированными концевыми повторами (ITR), причем указанная по меньшей мере одна последовательность нуклеиновой кислоты кодирует по меньшей мере один белок фактора VIII (FVIII) и оптимизирована по кодонам для экспрессии в клетке. Изобретение расширяет арсенал средств для экспрессии белка фактора VIII (FVIII). 7 н. и 46 з.п. ф-лы, 16 ил., 15 табл., 14 пр.

Формула изобретения RU 2 812 852 C2

1. Бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК) для экспрессии белка фактора VIII (FVIII), содержащий:

по меньшей мере одну последовательность нуклеиновой кислоты, расположенную между фланкирующими инвертированными концевыми повторами (ITR), причем указанная по меньшей мере одна последовательность нуклеиновой кислоты кодирует по меньшей мере один белок фактора VIII (FVIII), и оптимизирована по кодонам для экспрессии в клетке, при этом указанная по меньшей мере одна последовательность нуклеиновой кислоты, кодирующая указанный по меньшей мере один белок FVIII, имеет по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.

2. ЗкДНК-вектор по п. 1, отличающийся тем, что указанный по меньшей мере один белок FVIII имеет по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из SEQ IS NO: 380, 387 и 393.

3. ЗкДНК-вектор по п. 1, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 192-217.

4. ЗкДНК-вектор по п. 1 или 3, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210.

5. ЗкДНК-вектор по п. 1 или 3, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214.

6. ЗкДНК-вектор по любому из пп. 1-5, отличающийся тем, что указанный зкДНК-вектор содержит промотор, функционально связанный по меньшей мере с указанной одной последовательностью нуклеиновой кислоты, которая кодирует указанный по меньшей мере один белок FVIII.

7. ЗкДНК-вектор по любому из пп. 1-6, отличающийся тем, что указанный зкДНК-вектор содержит энхансер.

8. ЗкДНК-вектор по любому из пп. 1-7, отличающийся тем, что указанный зкДНК-вектор содержит последовательность 5'-UTR и/или интрона.

9. ЗкДНК-вектор по любому из пп. 1-8, отличающийся тем, что указанный зкДНК-вектор содержит последовательность 3'-UTR.

10. ЗкДНК-вектор по любому из пп. 1-9, отличающийся тем, что указанный зкДНК-вектор содержит по меньшей мере одну последовательность поли-(А).

11. ЗкДНК-вектор по любому из пп. 1-10, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой кДНК.

12. ЗкДНК-вектор по любому из пп. 1-11, отличающийся тем, что по меньшей мере один из указанных фланкирующих ITR содержит функциональный сайт концевого разрешения и сайт связывания репликационного белка (Rep).

13. ЗкДНК-вектор по любому из пп. 1-12, отличающийся тем, что один или оба из указанных фланкирующих ITR происходят из вируса, выбранного из группы, состоящей из парвовируса, депендовируса и аденоассоциированного вируса (ААВ).

14. ЗкДНК-вектор по любому из пп. 1-13, отличающийся тем, что указанные фланкирующие ITR являются симметричными или асимметричными.

] 5. ЗкДНК-вектор по п. 14, отличающийся тем, что указанные фланкирующие ITR являются симметричными или по существу симметричными.

16. ЗкДНК-вектор по п. 14, отличающийся тем, что указанные фланкирующие ITR являются асимметричными.

17. ЗкДНК-вектор по любому из пп. 1-16, отличающийся тем, что один из указанных ITR относится к дикому типу, или оба из указанных ITR являются ITR дикого типа.

18. ЗкДНК-вектор по любому из пп. 1-17, отличающийся тем, что указанные фланкирующие ITR происходят из различных вирусных серотипов.

19. ЗкДНК-вектор по любому из пп. 1-18, отличающийся тем, что указанные фланкирующие ITR происходят из пары вирусных серотипов, выбранных из группы, состоящей из пар вирусных серотипов ААВ1, ААВ1; ААВ2, ААВ2; ААВ3, ААВ3; ААВ4, ААВ4; ААВ5, ААВ5; ААВ1, ААВ2; ААВ2, ААВ3; ААВ3, ААВ4; ААВ4, ААВ5; ААВ5, ААВ6; ААВ1, ААВ3; ААВ2, ААВ4; ААВ3, ААВ5; ААВ4, ААВ6; ААВ5, ААВ7; ААВ1, ААВ4; ААВ2, ААВ5; ААВ3, ААВ6; ААВ4, ААВ7; ААВ5, ААВ8; ААВ1, ААВ5; ААВ2, ААВ6; ААВ3, ААВ7; ААВ4, ААВ8; ААВ5, ААВ9; ААВ1, ААВ6; ААВ2, ААВ7; ААВ3, ААВ8; ААВ4, ААВ9; ААВ5, ААВ10; ААВ1, ААВ7; ААВ2, ААВ8; ААВ3, ААВ9; ААВ4, ААВ10; ААВ5, ААВ11; ААВ1, ААВ8; ААВ2, ААВ9; ААВ3, ААВ10; ААВ4, ААВН; ААВ5, ААВ12; ААВ1, ААВ9; ААВ2, ААВ10; ААВ3, ААВ11; ААВ4, ААВ12; ААВ5, AABRH8; ААВ1, ААВ10; ААВ2, ААВ11; ААВ3, ААВ12; ААВ4, AABRH8; ААВ5, AABRH10; ААВ1, ААВ11; ААВ2, ААВ12; ААВ3, AABRH8; ААВ4, AABRH10; ААВ5, ААВ13; ААВ1, ААВ12; ААВ2, AABRH8; ААВ3, AABRH10; ААВ4, ААВ13; ААВ5, AABDJ; ААВ1, AABRH8; ААВ2, AABRH10; ААВ3, ААВ13; ААВ4, AABDJ; ААВ5, AABDJ8; ААВ1, AABRH10; AAB2, AAB13; ААВ3, AABDJ; AAB4, AABDJ8; AAB5, птичий; AAB1, ААВ13; AAB2, AABDJ; ААВ3, AABDJ8; AAB4, птичий; AAB5, бычий; ААВ1, AABDJ; AAB2, AABDJ8; ААВ3, птичий; ААВ4, бычий; ААВ5, собачий; ААВ1, AABDJ8; ААВ2, птичий; ААВ3, бычий; ААВ4, собачий; ААВ5, лошадиный; ААВ1, птичий; ААВ2, бычий; ААВ3, собачий; ААВ4, лошадиный; ААВ5, козий; ААВ1, бычий; ААВ2, собачий; ААВ3, лошадиный; ААВ4, козий; ААВ5, креветки; ААВ1, собачий; ААВ2, лошадиный; ААВ3, козий; ААВ4, креветки; ААВ5, свиной; ААВ1, лошадиный; ААВ2, козий; ААВ3, креветки; ААВ4, свиной; ААВ5, насекомых; ААВ1, козий; ААВ2, креветки; ААВ3, свиной; ААВ4, насекомых; ААВ5, овечий; ААВ1, креветки; ААВ2, свиной; ААВ3, насекомых; ААВ4, овечий; ААВ5, В19; ААВ1, свиной; ААВ2, насекомых; ААВ3, овечий; ААВ4, В19; ААВ5, MVM; ААВ1, насекомых; ААВ2, овечий; ААВ3, В19; ААВ4, MVM; ААВ5, гусиный; ААВ1, овечий; ААВ2, В19; ААВ3, MVM; ААВ4, гусиный; ААВ5, змеиный; ААВ1, В19; ААВ2, MVM; ААВ3, гусиный; ААВ4, змеиный; ААВ1, MVM; ААВ2, гусиный; ААВ3, змеиный; ААВ1, гусиный; ААВ2, змеиный; ААВ1, змеиный; ААВ6, ААВ6; ААВ7, ААВ7; ААВ8, ААВ8; ААВ9, ААВ9; ААВ10, ААВ10; ААВ6, ААВ7; ААВ7, ААВ8; ААВ8, ААВ9; ААВ9, ААВ10; ААВ10, ААВ11; ААВ6, ААВ8; ААВ7, ААВ9; ААВ8, ААВ10; ААВ9, ААВ11; ААВ10, ААВ12; ААВ6, ААВ9; ААВ7, ААВ10; ААВ8, ААВ11; ААВ9, ААВ12; ААВ10, AABRH8; ААВ6, ААВ10; ААВ7, ААВ11; ААВ8, ААВ12; ААВ9, AABRH8; ААВ10, AABRH10; ААВ6, ААВ11; ААВ7, ААВ12; ААВ8, AABRH8; ААВ9, AABRH10; ААВ10, ААВ13; ААВ6, ААВ12; ААВ7, AABRH8; ААВ8, AABRH10; ААВ9, ААВ13; ААВ10, AABDJ; ААВ6, AABRH8; ААВ7, AABRH10; ААВ8, ААВ13; ААВ9, AABDJ; ААВ10, AABDJ8; ААВ6, AABRH10; ААВ7, ААВ13; ААВ8, AABDJ; ААВ9, AABDJ8; ААВ10, птичий; ААВ6, ААВ13; ААВ7, AABDJ; ААВ8, AABDJ8; ААВ9, птичий; ААВ10, бычий; ААВ6, AABDJ;

ААВ7, AABDJ8; ААВ8, птичий; ААВ9, бычий; ААВ10, собачий; ААВ6, AABDJ8; ААВ7, птичий; ААВ8, бычий; ААВ9, собачий; ААВ10, лошадиный; ААВ6, птичий; ААВ7, бычий; ААВ8, собачий; ААВ9, лошадиный; ААВ10, козий; ААВ6, бычий; ААВ7, собачий; ААВ8, лошадиный; ААВ9, козий; ААВ10, креветки; ААВ6, собачий; ААВ7, лошадиный; ААВ8, козий; ААВ9, креветки; ААВ10, свиной; ААВ6, лошадиный; ААВ7, козий; ААВ8, креветки; ААВ9, свиной; ААВ10, насекомых; ААВ6, козий; ААВ7, креветки; ААВ8, свиной; ААВ9, насекомых; ААВ10, овечий; ААВ6, креветки; ААВ7, свиной; ААВ8, насекомых; ААВ9, овечий; ААВ10, В19; ААВ6, свиной; ААВ7, насекомых; ААВ8, овечий; ААВ9, В19; ААВ10, MVM; ААВ6, насекомых; ААВ7, овечий; ААВ8, В19; ААВ9, MVM; ААВ10, гусиный; ААВ6, овечий; ААВ7, В19; ААВ8, MVM; ААВ9, гусиный; ААВ10, змеиный; ААВ6, В19; ААВ7, MVM; ААВ8, гусиный; ААВ9, змеиный; ААВ6, MVM; ААВ7, гусиный; ААВ8, змеиный; ААВ6, гусиный; ААВ7, змеиный; ААВ6, змеиный; ААВ11, ААВ11; ААВ12, ААВ12; AABRH8, AABRH8; AABRH10, AABRH10; ААВ13, ААВ13; ААВ11, ААВ12; ААВ12, AABRH8; AABRH8, AABRH10; AABRH10, ААВ13; ААВ13, AABDJ; ААВ11, AABRH8; ААВ12, AABRH10; AABRH8, ААВ13; AABRH10, AABDJ; ААВ13, AABDJ8; ААВ11, AABRH10; ААВ12, ААВ13; AABRH8, AABDJ; AABRH10, AABDJ8; ААВ13, птичий; ААВ11, ААВ13; ААВ12, AABDJ; AABRH8, AABDJ8; AABRH10, птичий; ААВ13, бычий; ААВ11, AABDJ; ААВ12, AABDJ8; AABRH8, птичий; AABRH10, бычий;ААВ13, собачий; ААВ11, AABDJ8; АВ12, птичий; AABRH8, бычий; AABRH10, собачий; ААВ13, лошадиный; ААВ11, птичий; ААВ12, бычий; AABRH8, собачий; AABRH10, лошадиный; ААВ13, козий; ААВ11, бычий; ААВ12, собачий; AABRH8, лошадиный; AABRH10, козий; ААВ13, креветки; ААВ11, собачий; ААВ12, лошадиный; AABRH8, козий; AABRH10, креветки; ААВ13, свиной; ААВ11, лошадиный; ААВ12, козий; AABRH8, креветки; AABRH10, свиной; ААВ13, насекомых; ААВ11, козий; ААВ12, креветки; AABRH8, свиной; AABRH10, насекомых; ААВ13, овечий; ААВ11, креветки; ААВ12, свиной; AABRH8, насекомых; AABRH10, овечий; ААВ13, В19; ААВ11, свиной; ААВ12, насекомых; AABRH8, овечий; AABRH10, В19; ААВ13, MVM; ААВ11, насекомых; ААВ12, овечий; AABRH8, В19; AABRH10, MVM; ААВ13, гусиный; ААВ11, овечий; ААВ12, В19; AABRH8, MVM; AABRH10, гусиный; ААВ13, змеиный; ААВ11, В19; ААВ12, MVM; AABRH8, гусиный; AABRH10, змеиный; ААВ11, MVM; ААВ12, гусиный; AABRH8, змеиный; ААВ11, гусиный; ААВ12, змеиный; ААВ11, змеиный; AABDJ, AABDJ; AABDJ8, AVVDJ8; птичий, птичий; бычий, бычий; собачий, собачий; AABDJ, AABDJ8; AABDJ8, птичий; птичий, бычий; бычий, собачий; собачий, лошадиный; AABDJ, птичий; AABDJ8, бычий; птичий, собачий; бычий, лошадиный; собачий, козий; AABDJ, бычий; AABDJ8, собачий; птичий, лошадиный; бычий, козий; собачий, креветки; AABDJ, собачий; AABDJ8, лошадиный; птичий, козий; бычий, креветки; собачий, свиной; AABDJ, лошадиный; AABDJ8, козий; птичий, креветки; бычий, свиной; собачий, насекомых; AABDJ, козий; AABDJ8, креветки; птичий, свиной; бычий, насекомых; собачий, овечий; AABDJ, креветки; AABDJ8, свиной; птичий, насекомых; бычий, овечий; собачий, В19; AABDJ, свиной; AABDJ8, насекомых; птичий, овечий; бычий, В19; собачий, MVM; AABDJ, насекомых; AABDJ8, овечий; птичий, В19; бычий, MVM; собачий, гусиный; AABDJ, овечий; AABDJ8, В19; птичий, MVM; бычий, гусиный; собачий, змеиный; AABDJ, В19; AABDJ8, MVM; птичий, гусиный; бычий, змеиный; AABDJ, MVM; AABDJ8, гусиный; птичий, змеиный; AABDJ, гусиный; AABDJ8, змеиный; AABDJ, змеиный; лошадиный, лошадиный; козий, козий; креветки, креветки; свиной, свиной; насекомых, насекомых; лошадиный, козий; козий, креветки; креветки, свиной; свиной, насекомых; насекомых, овечий; лошадиный, креветки; козий, свиной; креветки, насекомых; свиной, овечий; насекомых, В19; лошадиный, свиной; козий, насекомых; креветки, овечий; свиной, В19; насекомых, MVM; лошадиный, насекомых; козий, овечий; креветки, В19; свиной, MVM; насекомых, гусиный; лошадиный, овечий; козий, В19; креветки, MVM; свиной, гусиный; насекомых, змеиный; лошадиный, В19; козий, MVM; креветки, гусиный; свиной, змеиный; лошадиный, MVM; козий, гусиный; креветки, змеиный; лошадиный, гусиный; козий, змеиный; лошадиный, змеиный; овечий, овечий; В19, В19; MVM, MVM; гусиный, гусиный; змеиный, змеиный; овечий, В19; В19, MVM; MVM, гусиный; гусиный, змеиный; овечий, MVM; В19, гусиный; MVM, змеиный; овечий, гусиный; В19, змеиный; овечий, змеиный.

20. ЗкДНК-вектор по любому из пп. 1-19, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-2, 5-48.

21. ЗкДНК-вектор по любому из пп. 1-20, отличающийся тем, что по меньшей мере один из указанных фланкирующих ITR изменен относительно последовательности ITR дикого типа ААВ путем делеции, добавления или замены, которые влияют на общую трехмерную конформацию указанного ITR.

22. ЗкДНК-вектор по любому из пп. 1-21, отличающийся тем, что один или оба из указанных фланкирующих ITR происходят из серотипа ААВ, выбранного из группы, состоящей из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11 и ААВ12.

23. ЗкДНК-вектор по любому из пп. 1-22, отличающийся тем, что один или оба из указанных фланкирующих ITR являются синтетическими.

24. ЗкДНК-вектор по любому из пп. 1-23, отличающийся тем, что один из указанных фланкирующих ITR не является ITR дикого типа, или оба из указанных фланкирующих ITR не являются ITR дикого типа.

25. ЗкДНК-вектор по любому из пп. 1-24, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены по меньшей мере в одной из областей указанных ITR, выбранных из группы, состоящей из А, А', В, В', С, С', D и D'.

26. ЗкДНК-вектор по п. 25, отличающийся тем, что указанная делеция, вставка и/или замена приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями А, А', В, В', С или С'.

27. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями В и В'.

28. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями С и С'.

29. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями В и В', и/или всей или части структуры стебель-петля, образуемой указанными областями С и С'.

30. ЗкДНК-вектор по любому из пп. 1-29, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат одну структуру стебель-петля в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.

31. ЗкДНК-вектор по любому из пп. 1-30, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат один стебель и две петли в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.

32. ЗкДНК-вектор по любому из пп. 1-31, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат один стебель и одну петлю в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.

33. ЗкДНК-вектор по любому из пп. 1-32, отличающийся тем, что оба фланкирующих ITR изменяют таким образом, что это приводит к общей трехмерной симметрии, при которой указанные ITR инвертированы по отношению друг к другу.

34. ЗкДНК-вектор по любому из пп. 1-33, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-2, 5-48.

35. ЗкДНК-вектор по любому из пп. 1-34, отличающийся тем, что указанный зкДНК-вектор включает по меньшей мере один регуляторный переключатель.

36. ЗкДНК-вектор по п. 35, отличающийся тем, что указанный по меньшей мере один регуляторный переключатель выбран из группы, состоящей из бинарного регуляторного переключателя, низкомолекулярного регуляторного переключателя, регуляторного переключателя «с кодом доступа», регуляторного переключателя на основе нуклеиновой кислоты, посттранскрипционного регуляторного переключателя, контролируемого излучением или контролируемого ультразвуком регуляторного переключателя, опосредуемого гипоксией регуляторного переключателя, регуляторного переключателя воспалительного ответа, активируемого сдвигом регуляторного переключателя и аварийного выключателя («kill switch»).

37. Способ экспрессии белка FVIII в клетке, включающий приведение указанной клетки в контакт с зкДНК-вектором по любому из пп. 1-36.

38. Способ по п. 37, отличающийся тем, что указанная клетка представляет собой клетку печени.

39. Способ по п. 37 или 38, отличающийся тем, что указанная клетка находится в условиях in vitro или in vivo.

40. Способ по любому из пп. 37-39, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой последовательность, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.

41. Способ лечения субъекта, страдающего гемофилией А, включающий введение указанному субъекту зкДНК-вектора по любому из пп. 1-36, отличающийся тем, что по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII.

42. Способ по п. 41, отличающийся тем, что уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем.

43. Способ по п. 42, отличающийся тем, что указанное повышение уровней FVIII составляет более примерно 40% по сравнению с контролем.

44. Способ по п. 41, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой последовательность, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.

45. Способ по любому из пп. 41-44, отличающийся тем, что указанный зкДНК-вектор вводят в клетку печени.

46. Способ по любому из пп. 41-45, отличающийся тем, что указанный зкДНК-вектор экспрессирует указанный белок FVIII в клетке печени.

47. Способ по любому из пп. 41-46, отличающийся тем, что указанный зкДНК-вектор вводят с помощью любого одного или более из путей, выбранных из группы, состоящей из: внутривенная инъекция, внутримышечная инъекция и инфузия.

48. Фармацевтическая композиция для генной терапии, содержащая зкДНК-вектор по любому из пп. 1-36.

49. Клетка для продуцирования белка FVIII, содержащая зкДНК-вектор по любому из пп. 1-36.

50. Клетка по п. 49, отличающаяся тем, что указанная клетка представляет собой клетку печени.

51. Композиция для доставки зкДНК-вектора, содержащая зкДНК-вектор по любому из пп. 1-36 и липид.

52. Композиция по п. 51, отличающаяся тем, что указанный липид представляет собой липидную наночастицу (ЛНЧ).

53. Набор для доставки зкДНК-вектора, содержащий зкДНК-вектор по любому из пп. 1-36, фармацевтическую композицию по п. 48, клетку по п. 49 или 50, или композицию по п. 51 или 52 и инструкции по применению.

Документы, цитированные в отчете о поиске Патент 2024 года RU2812852C2

US 20190032083 A1, 31.01.2019
WO 2017075619 A1, 04.05.2017
WO 2019051255 A1, 14.03.2019
WO 2019032898 A1, 14.02.2019
КОМПОЗИЦИИ ВЕКТОРА AAV И СПОСОБЫ ПЕРЕНОСА ГЕНОВ В КЛЕТКИ, ОРГАНЫ И ТКАНИ 2013
  • Хай Катерине А.
  • Мингоззи Федерико
  • Сун Юнвэй
  • Джонсон Филип
RU2653444C2

RU 2 812 852 C2

Авторы

Керр, Дуглас, Антони

Клатте, Дебра

Самайоа, Филлип

Силвер, Натаниел

Даты

2024-02-02Публикация

2020-03-13Подача