РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Настоящая заявка испрашивает приоритет согласно предварительной заявке США №62/817904, поданной 13 марта 2019 г., и предварительной заявке США №62/856432, поданной 3 июня 2019 г., содержание каждой из которых полностью включено в данный документ посредством ссылки.
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[0002] Настоящая заявка включает перечень последовательностей, который был подан в электронном виде в формате ASCII, а также последовательности в Таблицах 1-9 в данном документе, каждая из которых полностью включена в данный документ посредством ссылки. Указанная копия в формате ASCII, созданная 11 марта 2020 г., названа 131698-06020_SL.txt и имеет размер 116781 байтов.
ОБЛАСТЬ ТЕХНИКИ
[0003] Настоящее изобретение относится к области генной терапии, включая невирусные векторы для экспрессии трансгена или выделенных полинуклеотидов у субъекта или в клетке. Настоящее раскрытие также относится к конструкциям нуклеиновых кислот, промоторам, векторам и клеткам-хозяевам, включая полинуклеотиды, а также к способам доставки экзогенных последовательностей ДНК в целевую клетку, ткань, орган или организм. Например, настоящее раскрытие обеспечивает способы применения невирусных зкДНК-векторов для экспрессии фактора VIII (FVIII) из клетки, например, экспрессии терапевтического белка FVIII для лечения субъекта, страдающего гемофилией А. Способы и композиции можно применять, например, для лечения заболевания путем экспрессии FVIII в клетке или ткани субъекта, нуждающегося в этом.
УРОВЕНЬ ТЕХНИКИ
[0004] Целью генной терапии является улучшение клинических исходов у пациентов, страдающих либо генетическими мутациями, либо приобретенными заболеваниями, вызванными аберрацией в профиле экспрессии генов. Генная терапия включает лечение или предотвращение медицинских состояний, вызванных дефектными генами или аномальной регуляцией или экспрессией, например, недостаточной экспрессией или избыточной экспрессией, что может привести к нарушению, заболеванию, злокачественному новообразованию и т.д. Например, заболевание или нарушение, вызванное дефектным геном, можно лечить, предотвращать или облегчать путем доставки пациенту корректирующего генетического материала, или можно лечить, предотвращать или облегчать путем изменения или подавления у пациента дефектного гена, например, с помощью корректирующего генетического материала, приводящего к терапевтической экспрессии генетического материала в организме пациента.
[0005] Основой генной терапии является обеспечение транскрипционной кассеты с активным генным продуктом (иногда называемым трансгеном), например, который может приводить к положительному эффекту усиления функции, отрицательному эффекту потери функции или другому исходу. Такие исходы можно отнести к экспрессии терапевтического белка, такого как антитело, функциональный фермент или слитый белок. Генную терапию также можно применять для лечения заболевания или злокачественного новообразования, вызванного другими факторами. Моногенные нарушения у человека можно лечить путем доставки нормального гена в целевые клетки и его экспрессии в них. Доставку и экспрессию корректирующего гена в клетках-мишенях пациента можно осуществлять с применением многочисленных способов, включая применение сконструированных вирусов и вирусных векторов для доставки генов. Среди многочисленных доступных векторов вирусного происхождения (например, рекомбинантный ретровирус, рекомбинантный лентивирус, рекомбинантный аденовирус и т.п.) рекомбинантный аденоассоциированный вирус (рААВ) приобретает все большую популярность в генной терапии в качестве многоцелевого вектора.
[0006] Аденоассоциированные вирусы (ААВ) принадлежат к семейству Parvoviridae и, более конкретно, составляют род депендопареоеирусое. Векторы, происходящие из ААВ (т.е. рекомбинантные ААВ (рААВ) или ААВ-векторы), являются привлекательным способом доставки генетического материала, поскольку (i) они способны инфицировать (трансдуцировать) широкий спектр типов неделящихся и делящихся клеток, включая миоциты и нейроны; (ii) они лишены вирусных структурных генов, что уменьшает ответы клеток хозяина на вирусную инфекцию, например, опосредуемые интерфероном ответы; (iii) вирусы дикого типа считаются непатологичными у человека; (iv) в отличие от ААВ дикого типа, которые способны интегрироваться в геном клетки хозяина, дефектные по репликации ААВ-векторы лишены гена rep и обычно персистируют в виде эписом, что ограничивает риск инсерционного мутагенеза или генотоксичности; и (ν) по сравнению с другими векторными системами ААВ-векторы обычно считаются относительно слабыми иммуногенами и, следовательно, не вызывают значительного иммунного ответа (см. ii), обеспечивая, таким образом, персистенцию векторной ДНК и, потенциально, долговременную экспрессию терапевтических трансгенов.
[0007] Однако применение частиц ААВ в качестве вектора для доставки генов имеет несколько серьезных недостатков. Одним из основных недостатков, ассоциированных с рААВ, является ограниченная емкость вирусной упаковки, составляющая примерно 4,5 тыс.п.о. гетерологичной ДНК (Dong et al, 1996; Athanasopoulos et al, 2004; Lai et al, 2010), вследствие этого применение ААВ-векторов ограничено их способностью кодировать белки размером менее 150000 Да. Вторым недостатком является то, что в результате распространенности инфекции ААВ дикого типа среди населения кандидаты на генную терапию с использованием рААВ должны проходить скрининг на наличие нейтрализующих антител, устраняющих вектор из организма пациента. Третий недостаток связан с иммуногенностью капсида, которая препятствует повторному введению пациентам, которые не были отстранены от начального лечения. Иммунная система пациента может отвечать на вектор, который фактически выступает в роли «бустерной» прививки, стимулирующей выработку высоких титров антител к ААВ иммунной системой, которые исключают возможность лечения в будущем. В некоторых недавних сообщениях выражены опасения, касающиеся иммуногенности в ситуациях, подразумевающих применение высоких доз. Другой заметный недостаток заключается в относительно медленном начале ААВ-опосредуемой экспрессии генов, учитывая, что одноцепочечная ДНК ААВ должна быть преобразована в двухцепочечную ДНК до экспрессии гетерологичного гена.
[0008] Кроме того, обычные вирионы ААВ с капсидами получают путем введения плазмиды или плазмид, содержащих геном ААВ, гены rep и гены cap (Grimm et al., 1998). Однако было обнаружено, что такие вирусные векторы на основе заключенного в капсид ААВ неэффективно трансдуцируют определенные типы клеток и тканей, а капсиды также индуцируют иммунный ответ.
[0009] Соответственно, применение векторов на основе аденоассоциированного вируса (ААВ) для генной терапии ограничено из-за однократного введения пациентам (вследствие иммунного ответа пациента), ограниченного диапазона трансгенного генетического материала, подходящего для доставки в ААВ-векторах ввиду минимальной емкости вирусной упаковки (около 4,5 тыс.п.о.), и медленной ААВ-опосредуемой экспрессии генов.
[0010] Существует большая неудовлетворенная потребность в модифицирующих заболевание видах терапии при гемофилии А. Современные виды терапии обременительны и требуют внутривенных (в/в) введений. Во-первых, эти инъекционные препараты фактора VIII не обеспечивают непрерывную доставку факторов, при этом минимальные уровни допускают эпизоды кровотечения. Во-вторых, отсутствуют одобренные виды генной терапии гемофилии А, а виды терапии на основе ААВ не могут применяться у 25%-40% пациентов из-за уже существующих антител. ААВ может быть введен только один раз, и полученные уровни фактора VIII могут быть недостаточно высокими, чтобы быть эффективными, или могут превышать нормальные, уровни доз не поддаются титрованию. В-третьих, многие пациенты, страдающие гемофилией А, не могут использовать эти виды терапии из-за выработки нейтрализующих антител к этим экзогенным, искусственным факторам свертывания крови.
[0011] Соответственно, в данной области существует потребность в технологии, которая обеспечивает экспрессию терапевтического белка FVIII в клетке, ткани или организме субъекта для лечения гемофилии А.
КРАТКОЕ ОПИСАНИЕ
[0012] Технология, описанная в данном документе, относится к способам и композициям для лечения гемофилии А путем экспрессии белка фактора VIII (FVIII) с бескапсидного (например, невирусного) ДНК-вектора с ковалентно замкнутыми концами (называемого в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), причем указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты FVIII или ее варианты, оптимизированные по кодонам. Этот зкДНК-вектор можно применять для получения белков FVIII для лечения, мониторинга и диагностики. Применение зкДНК-векторов, экспрессирующих FVIII, у субъекта для лечения гемофилии А подходит для: (i) обеспечения модифицирующих заболевание уровней фермента FVIII, (ii) минимально инвазивной доставки, (iii) повторяемости и дозирования до достижения эффекта, (iv) быстрого начала терапевтического эффекта, (v) устойчивой экспрессии корректирующего фермента FVIII в печени, (vi) восстановления функции цикла мочевины, и/или (vii) титрования для достижения соответствующих фармакологических уровней дефектного фермента.
[0013] Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий FVIII, необязательно присутствует в составе липосомных наночастиц (ЛНЧ) для лечения гемофилии А. ЗкДНК-векторы, описанные в данном документе, могут обеспечивать одно или более преимуществ, включая, но не ограничиваясь перечисленными, обеспечение модифицирующих заболевание уровней фактора VIII, минимальную инвазивность при доставке, повторяемость и дозирование до достижения эффекта, обеспечение быстрого начала терапевтического эффекта в течение нескольких дней после терапевтического вмешательства, устойчивую экспрессию корректирующих уровней фактора VIII в кровотоке, возможность титрования для достижения соответствующих фармакологических уровней дефектного фактора коагуляции и/или обеспечение способов лечения другого типа гемофилии, включая, но не ограничиваясь этим, дефицит фактора VIII.
[0014] Соответственно, настоящее изобретение, описанное в данном документе, относится к бескапсидному (например, невирусному) ДНК-вектору с ковалентно замкнутыми концами (называемому в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), содержащему гетерогенный ген, кодирующий FVIII, чтобы обеспечить экспрессию терапевтического белка FVIII в клетке. В соответствии с одним аспектом в настоящем раскрытии предложен бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетер о логичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из любой из последовательностей в Таблице 1. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из любой из последовательностей в Таблице 9. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из группы, состоящей из SEQ ID NO: 207, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 199, SEQ ID NO: 208, SEQ ID NO: 211 и SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 214.
[0015] Согласно одному варианту реализации в данном документе раскрыт бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1.
[0016] Согласно одному варианту реализации последовательность в Таблице 1 выбрана из группы, состоящей из SEQ ID NO: 380, SEQ ID NO: 381, SEQ ID NO: 382, SEQ ID NO: 383, SEQ ID NO: 384, SEQ ID NO: 385, SEQ ID NO: 386, SEQ ID NO: 387, SEQ ID NO: 388, SEQ ID NO: 389, SEQ ID NO: 390, SEQ ID NO: 391, SEQ ID NO: 392, SEQ ID NO: 393, SEQ ID NO: 394, SEQ ID NO: 395, SEQ ID NO: 396 и SEQ ID NO: 397. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 380. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 381. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 382. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 383. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 384. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 385. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 386. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 387. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 388. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 389. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 390. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 391. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 392. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 393. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 394. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 395. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 396. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 397.
[0017] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую последовательность в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из последовательности в Таблице 9.
[0018] Согласно одному варианту реализации последовательность в Таблице 9 выбрана из группы, состоящей из SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 204, SEQ ID NO: 205, SEQ ID NO: 206, SEQ ID NO: 207, SEQ ID NO: 208, SEQ ID NO: 209, SEQ ID NO: 210, SEQ ID NO: 211, SEQ ID NO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ ID NO: 216 и SEQ ID NO: 217. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 197. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 198. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 199. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 200. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 201. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 202. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 203. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 204. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 205. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 206. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 207. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 208. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 209. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 210. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 211. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 212. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 213. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 214. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 215. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 216. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 217.
[0019] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 210.
[0020] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 214.
[0021] ЗкДНК-векторы для экспрессии продукции белка FVIII, описанные в данном документе, представляют собой бескапсидные линейные дуплексные молекулы ДНК, образованные из непрерывной цепи комплементарной ДНК с ковалентно замкнутыми концами (линейная, непрерывная и неинкапсидированная структура), которые содержат последовательность 5' инвертированного концевого повтора (ITR) и последовательность 3'-ITR, причем указанные 5-ITR и 3'-ITR могут иметь одинаковую симметричную трехмерную организацию по отношению друг к другу (т.е. симметричную или по существу симметричную) или, альтернативно, 5'-ITR и 3'-ITR могут иметь различную трехмерную организацию по отношению друг к другу (т.е. асимметричные ITR). Кроме того, ITR могут происходить из одного и того же или разных серотипов. Согласно некоторым вариантам реализации зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и В-В' в трехмерном пространстве (т.е. они одинаковы или являются зеркальными отображениями по отношению друг к другу). Согласно некоторым вариантам реализации один ITR может происходить из одного серотипа ААВ, а другой ITR может происходить из другого серотипа ААВ.
[0022] Соответственно, некоторые аспекты технологии, описанной в данном документе, относятся к зкДНК-вектору для улучшенной экспрессии и/или продукции белка описанного выше белка FVIII, который содержит последовательности ITR, фланкирующие гетерологичную последовательность нуклеиновой кислоты, содержащую любую последовательность нуклеиновой кислоты FVIII, раскрытую в Таблицах 5, при этом указанные последовательности ITR выбраны из любых из: (i) по меньшей мере одного ITR дикого типа (WT) и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию. ЗкДНК-векторы, раскрытые в данном документе, могут быть получены в эукариотических клетках и поэтому лишены прокариотических модификаций ДНК и загрязнения бактериальными эндотоксинами в клетках насекомых.
[0023] Способы и композиции, описанные в данном документе, частично относятся к открытию невирусного бескапсидного ДНК-вектора с ковалентно замкнутыми концами (зкДНК-векторы), который можно применять для экспрессии по меньшей мере одного белка FVIII или более чем одного белка FVIII из клетки, включая, но не ограничиваясь ими, клетки печени.
[0024] Соответственно, в данном документе в одном аспекте предложены ДНК-векторы (например, зкДНК-векторы), содержащие по меньшей мере одну гетерологичную последовательность нуклеиновой кислоты, кодирующую по меньшей мере один трансген, кодирующий белки FVIII, функционально связанный с промотором, расположенную между двумя различными последовательностями инвертированных концевых повторов (ITR) ААВ, причем один из ITR содержит функциональный сайт концевого разрешения ААВ и сайт связывания Rep, и один из ITR содержит делецию, вставку или замену относительно другого ITR; при этом указанный трансген кодирует белок FVIII; и при этом указанная ДНК при расщеплении рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, отличается наличием характерных полос линейной и непрерывной ДНК по сравнению с контрольными линейными и прерывистыми ДНК при анализе на неденатурирующем геле. Другие аспекты включают доставку белка FVIII путем его экспрессии in vivo с зкДНК-вектора, описанного в данном документе, и, кроме того, лечение гемофилии А с применением зкДНК-векторов, кодирующих FVIII. В данном документе также предусмотрены клетки, содержащие зкДНК-вектор, кодирующий FVIII, описанный в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.
[0025] Аспекты настоящего изобретения относятся к способам получения зкДНК-векторов, которые можно применять для экспрессии белка FVIII в клетке, как описано в данном документе. Другие варианты реализации относятся к зкДНК-вектору, полученному с помощью способа, предложенного в данном документе. Согласно одному варианту реализации бескапсидный (например, невирусный) ДНК-вектор (зкДНК-вектор) для продукции белка FVIII получают из плазмиды (называемой в данном документе «зкДНК-плазмидой»), содержащей полинуклеотидную матрицу экспрессионной конструкции, содержащую, в указанном порядке: первый 5'-инвертированный концевой повтор (например, ITR ААВ); гетерологичную последовательность нуклеиновой кислоты; и 3'-ITR (например, ITR ААВ), причем указанные 5'-ITR и 3'-ITR могут быть асимметричными по отношению друг к другу или симметричными (например, WT-ITR или модифицированные симметричные ITR), как определено в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.
[0026] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с помощью ряда средств, которые будут известны обычному квалифицированному специалисту после прочтения этого раскрытия. Например, полинуклеотидная матрица экспрессионной конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус. Согласно одному варианту реализации зкДНК-плазмида содержит сайт рестрикционного клонирования (например, SEQ ID NO: 123 и/или 124), функционально расположенный между ITR, в который может быть вставлена экспрессионная кассета, содержащая, например, промотор, функционально связанный с трансгеном, например, нуклеиновой кислотой, кодирующей FVIII. Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII получают из полинуклеотидной матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса), содержащей симметричные или асимметричные ITR (модифицированные ITR или WT ITR).
[0027] В пермиссивной клетке-хозяине, в присутствии, например, Rep, полинуклеотидная матрица, имеющая по меньшей мере два ITR, реплицируется с получением зкДНК-векторов, экспрессирующих белок FVIII. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.д.) посредством белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора. Белки Rep и сайты связывания Rep различных серотипов ААВ хорошо известны обычным специалистам в данной области техники. Обычный специалист в данной области техники понимает необходимость выбора белка Rep из серотипа, который связывается с последовательностью нуклеиновой кислоты и реплицирует ее, на основе по меньшей мере одного функционального ITR. Например, если компетентный по репликации ITR происходит из серотипа 2 ААВ, соответствующий Rep будет из серотипа ААВ, который работает с этим серотипом, такого как ITR ААВ2 с Rep ААВ2 или ААВ4, но не Rep ААВ5, который не работает. После репликации зкДНК-вектор с ковалентно замкнутыми концами продолжает накапливаться в пермиссивных клетках, и зкДНК-вектор предпочтительно является достаточно стабильным с течением времени в присутствии белка Rep в стандартных условиях репликации, например, для накопления в количестве, составляющем по меньшей мере 1 пг/клетку, предпочтительно по меньшей мере 2 пг/клетку, предпочтительно по меньшей мере 3 пг/клетку, более предпочтительно по меньшей мере 4 пг/клетку, еще более предпочтительно по меньшей мере 5 пг/клетку.
[0028] Соответственно, один аспект настоящего изобретения относится к способу получения зкДНК-вектора для экспрессии таких белков FVIII, включающему этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в клетках-хозяевах и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR с получением зкДНК-вектора для экспрессии белка FVIII в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, налагаемое вирионами. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.
[0029] Наличие пригодного для экспрессии белка FVIII зкДНК-вектора, выделенного из клеток-хозяев, можно подтвердить путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на денатурирующем и неденатурирующем гелях для подтверждения наличия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.
[0030] В данном документе также предложены способы экспрессии белка FVIII, который имеет терапевтическое применение, с применением зкДНК-вектора в клетке или у субъекта. Такие белки FVIII можно применять для лечения гемофилии А. Соответственно, в данном документе предложены способы лечения гемофилии А, включающие введение зкДНК-вектора, кодирующего терапевтический белок FVIII, субъекту, нуждающемуся в этом. В соответствии с некоторыми вариантами реализации зкДНК-вектор, кодирующий терапевтический белок FVIII, выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-векгора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23. В соответствии с некоторыми вариантами реализации уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40% по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40%, примерно 45%, примерно 50%, примерно 55%, примерно 60%, примерно 65%, примерно 70%, примерно 75% по сравнению с контролем.
[0031] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к невирусному бескапсидному ДНК-вектору с ковалентно замкнутыми концами (зкДНК-вектору), причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, функционально расположенную между двумя последовательностями инвертированных концевых повторов, при этом указанные последовательности ITR могут быть асимметричными или симметричными, или по существу симметричными, в соответствии с определением этих терминов в данном документе, при этом по меньшей мере один из ITR содержит функциональный сайт концевого разрешения и сайт связывания Rep, и необязательно указанная гетер о логичная последовательность нуклеиновой кислоты кодирует трансген (например, белок FVIII), и при этом указанный вектор не находится в вирусном капсиде.
[0032] Эти и другие аспекты настоящего изобретения более подробно описаны ниже.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0033] Варианты реализации настоящего раскрытия, кратко обобщенные выше и более подробно обсуждаемые ниже, будут понятны со ссылкой на иллюстративные варианты реализации раскрытия, представленные на прилагаемых чертежах. Однако прилагаемые чертежи иллюстрируют только типичные варианты реализации настоящего раскрытия и поэтому не должны рассматриваться, как ограничивающие объем, поскольку раскрытие может допускать другие не менее эффективные варианты реализации.
[0034] ФИГ. 1А иллюстрирует примерную структуру зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, содержащего асимметричные ITR. Согласно этому варианту реализации примерный зкДНК-вектор содержит экспрессионную кассету, содержащую промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования (R3/R4) между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - ITR дикого типа ААВ2 слева (на 5'-конце) и модифицированным ITR справа (на 3'-конце) от экспрессионной кассеты, поэтому два ITR, фланкирующие экспрессионную кассету, асимметричны по отношению друг к другу.
[0035] ФИГ. 1 В иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - модифицированным ITR слева (на 5'-конце) и ITR дикого типа справа (на 3'-конце) от экспрессионной кассеты.
[0036] ФИГ. 1С иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR, с экспрессионной кассетой, содержащей энхансер/промотор, трансген FVIII, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет встраивать трансген FVIII в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR), которые асимметричны по отношению друг к другу; модифицированным ITR слева (на 5'-конце) и модифицированным ITR справа (на 3-конце) от экспрессионной кассеты, причем указанные 5'-ITR и 3'-ITR оба представляют собой модифицированные ITR, но имеют разные модификации (т.е. они не имеют одинаковых модификаций).
[0037] ФИГ. 1D иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем 849849949 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.
[0038] ФИГ. 1Е иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем указанные 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.
[0039] ФИГ. 1F иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные WT-ITR или по существу симметричные WT-ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген (например, FVIII), вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.
[0040] ФИГ. 1G иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген (например, FVIII), посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.
[0041] ФИГ. 2А представляет Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 (SEQ ID NO: 52) с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE'), а также показывает сайт концевого разрешения (TRS). RBE содержит группу из 4 дуплексных тетрамеров, которые, как полагают, взаимодействуют либо с Rep 78, либо с Rep 68. Кроме того, также полагают, что RBE' взаимодействует с комплексом Rep, собранным на ITR дикого типа или мутированном ITR в конструкции. Области D и D' содержат сайты связывания факторов транскрипции и другую консервативную структуру. ФИГ. 2 В показывает предполагаемую Rep-катализируемую никирующую и лигирующую активность в левом ITR дикого типа (SEQ ID NO: 53), включая Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE), а также показывает сайт концевого разрешения (TRS) и область D и D', содержащую несколько сайтов связывания факторов транскрипции и другую консервативную структуру.
[0042] ФИГ. 3А представляет первичную структуру (полинуклеотидную последовательность) (слева) и вторичную структуру (справа) RBE-содержащих частей плеча А-А', а также плеча С-С' и В-В' левого ITR дикого типа ААВ2 (SEQ ID NO: 54). ФИГ. 3В показывает примерную последовательность мутированного ITR (также называемого модифицированным ITR) для левого ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) части RBE плеча А-А', плеча С и плеча В-В' примерного мутированного левого ITR (ITR-1, слева) (SEQ ID NO: 113). ФИГ. 3С показывает первичную структуру (слева) и вторичную структуру (справа) RBE-содержащей части петли А-А' и плеч В-В' и С-С' правого ITR дикого типа ААВ2 (SEQ ID NO: 55). ФИГ. 3D показывает примерный правый модифицированный ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) RBE-содержащей части плеча А-А', В-В' и плеча С примерного мутантного правого ITR (ITR-1, справа) (SEQ ID NO: 114). Любая комбинация левого и правого ITR (например, ITR ААВ2 или другого вирусного серотипа или синтетических ITR) может использоваться, как описано в данном документе. Каждая из полинуклеотидных последовательностей на ФИГ. 3A-3D относится к последовательности, используемой в геноме плазмиды или бакмиды/бакуловируса, применяемых для получения зкДНК, как описано в данном документе. Также на каждой из ФИГ. 3A-3D приведены соответствующие вторичные структуры зкДНК, выведенные на основании конфигураций зкДНК-вектора в геноме плазмиды или бакмиды/бакуловируса и предсказанных значений свободной энергии Гиббса.
[0043] ФИГ. 4А представляет собой схему, иллюстрирующую подготовительный способ получения инфицированных бакуловирусом клеток насекомых (ВИС), которые можно применять для получения зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, в способе, описанном на схеме на ФИГ. 4В. ФИГ. 4В представляет собой схему примерного способа получения зкДНК, и ФИГ. 4С иллюстрирует биохимический метод и способ подтверждения получения зкДНК-вектора. ФИГ. 4D и ФИГ. 4Е представляют собой схематические иллюстрации, описывающие способ идентификации наличия зкДНК в ДНК, собранной из осадков клеток, полученных во время способов продуцирования зкДНК на ФИГ. 4В. ФИГ. 4D схематически показывает ожидаемые полосы примерной зкДНК, оставленной неразрезанной или расщепленной рестрикционной эндонуклеазой, а затем подвергнутой электрофорезу либо на нативном геле, либо на денатурирующем геле. Самая левая схема представляет собой нативный гель и показывает несколько полос, свидетельствующих о том, что в дуплексной и неразрезанной форме зкДНК существует по меньшей мере в мономерном и димерном состояниях, наблюдаемых как быстрее мигрирующий мономер меньшего размера и медленнее мигрирующий димер, размер которого в два раза превышает размер мономера. На второй слева схеме показано, что при разрезании зкДНК рестрикционной эндонуклеазой исходные полосы исчезают и появляются быстрее мигрирующие (например, меньшие по размеру) полосы, соответствующие ожидаемым размерам фрагментов, оставшихся после расщепления. В денатурирующих условиях исходная дуплексная ДНК является одноцепочечной и мигрирует как молекула, размер которой в два раза превышает размер, наблюдаемый на нативном геле, поскольку комплементарные цепи ковалентно связаны. Таким образом, на второй схеме справа расщепленная зкДНК показывает распределение полос, сходное с наблюдаемым на нативном геле, но полосы мигрируют как фрагменты, размер которых в два раза превышает размер их аналогов на нативном геле. На самой правой схеме показано, что неразрезанная зкДНК в денатурирующих условиях мигрирует в виде одноцепочечного раскрытого кольца, поэтому размер наблюдаемых полос в два раза превышает размер полос, наблюдаемых в нативных условиях, в которых кольцо не раскрыто. На этой фигуре «тыс.п.о.» используется для обозначения относительного размера нуклеотидных молекул на основании, в зависимости от контекста, либо длины нуклеотидной цепи (например, для одноцепочечных молекул, наблюдаемых в денатурирующих условиях), либо числа пар оснований (например, для двухцепочечных молекул, наблюдаемых в нативных условиях). ФИГ. 4Е показывает ДНК, имеющую прерывистую структуру. ЗкДНК может быть разрезана рестрикционной эндонуклеазой, имеющей один сайт распознавания в зкДНК-векторе, с получением двух фрагментов ДНК с разными размерами (1 тыс.п.о. и 2 тыс.п.о.) как в нейтральных, так и в денатурирующих условиях. ФИГ. 4Е также показывает зкДНК, имеющую линейную и непрерывную структуру. ЗкДНК-вектор может быть разрезан рестрикционной эндонуклеазой с получением двух фрагментов ДНК, которые мигрируют как 1 тыс. п. о. и 2 тыс. п. о. в нейтральных условиях, но в денатурирующих условиях цепи остаются соединенными и образуют одиночные цепи, которые мигрируют как 2 тыс. п. о. и 4 тыс. п. о.
[0044] ФИГ. 5 представляет собой примерное изображение анализа на денатурирующем геле примеров зкДНК-векторов с (+) или без (-) расщепления эндонуклеазами (EcoRI для зкДНК-конструкций 1 и 2; BamH1 для зкДНК-конструкций 3 и 4; SpeI для зкДНК-конструкций 5 и 6; и XhoI для зкДНК-конструкций 7 и 8). Конструкции 1-8 описаны в Примере 1 международной заявки РСТ PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Размеры выделенных звездочкой полос были определены и указаны внизу рисунка.
[0045] ФИГ. 6 отображает результаты экспериментов, описанных в Примере 7, и конкретно показывает изображения IVIS, полученные у мышей, получавших контроль ЛНЧ-поли(С) (крайняя слева мышь), и четырех мышей, получавших ЛНЧ-зкДНК-люциферазу (все, кроме крайней слева мыши). У четырех мышей, обработанных зкДНК, наблюдается значительная флуоресценция в области печени мыши.
[0046] ФИГ. 7 отображает результаты эксперимента, описанного в Примере 8. Темные точки указывают на наличие белка, полученного в результате экспрессии трансгена с зкДНК, и демонстрируют ассоциацию введенной ЛНЧ-зкДНК с гепатоцитами.
[0047] ФИГ. 8А и 8В отображают результаты исследований на глазах, описанных в Примере 9. ФИГ. 8А показывает типичные изображения IVIS из глаз крысы, в которые инъецировали JetPEI®-зкДНК-люциферазу (вверху слева), по сравнению с неинъецированным глазом той же крысы (вверху справа) или глазом крысы, в который инъецировали плазмиду-ДНК люциферазы (внизу слева), и неинъецированным глазом той же крысы (внизу справа). ФИГ. 8В показывает график средней светимости, наблюдаемой в обработанных глазах или соответствующих необработанных глазах в каждой из групп обработки. Крысы, обработанные зкДНК, демонстрировали длительную значительную флуоресценцию (и, следовательно, экспрессию трансгена люциферазы) в течение 99 дней, что существенно разнилось с крысами, получавшими плазмиду-люциферазу, у которых наблюдалась минимальная относительная флуоресценция (и, следовательно, экспрессия трансгена люциферазы).
[0048] ФИГ. 9А и 9В отображают результаты исследования устойчивости зкДНК и повторного введения дозы у мышей Rag2, описанного в Примере 10. ФИГ. 9А показывает график зависимости полного потока от времени, наблюдаемой у получавших ЛНЧ-зкДНК-Luc мышей c57bl/6 дикого типа или мышей Rag2. ФИГ. 9В представляет график, показывающий влияние повторной дозы на уровни экспрессии трансгена люциферазы у мышей Rag2, при этом после введения повторной дозы наблюдали повышенную стабильную экспрессию (стрелка указывает время введения повторной дозы).
[0049] ФИГ. 10 представляет данные исследования экспрессии люциферазы с зкДНК у обработанных мышей, описанного в Примере 11, показывающие полный поток в каждой группе мышей на протяжении исследования. Высокие уровни неметилированного CpG коррелировали с более низким полным потоком, наблюдаемым у мышей с течением времени, в то время как использование специфического для печени промотора коррелировало с продолжительной стабильной экспрессией трансгена с зкДНК-вектора на протяжении по меньшей мере 77 дней.
[0050] ФИГ. 11А и 11В показывают гидродинамическую доставку зкДНК-вектора, экспрессирующего FVIII. ФИГ. 11А показывает уровни экспрессии FVIII в образцах сыворотки на день 3 и 7 от мышей после гидродинамической инъекции трех различных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или контрольного зкДНК-вектора (только зкДНК, экспрессирующая люциферазу) (показано как Носитель). Два из трех зкДНК-векторов, экспрессирующих FVIII, показали экспрессию FVIII. ФИГ. 11В представляет собой график зависимости ответа от дозы для уровней экспрессии FVIII в образцах сыворотки в течение 30-дневного периода от мышей после гидродинамической инъекции небольшого или большого количества трех разных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или небольших количеств зкДНК-вектора в качестве контроля носителя (экспрессирующего только люциферазу).
[0051] ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.
[0052] ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.
[0053] ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.
[0054] ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005 мкг-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.
[0055] ФИГ. 16 представляет собой график, который отображает концентрацию FVIII в плазме (MP/мл) через 7 дней после гидродинамической доставки исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0056] В данном документе предложен способ лечения гемофилии А с применением зкДНК-вектора, содержащего одну или более нуклеиновых кислот, которые кодируют терапевтический белок FVIII или его фрагмент. В данном документе также предложены зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие одну или более гетер о логичных нуклеиновых кислот, которые кодируют белок FVIII. Согласно некоторым вариантам реализации экспрессия белка FVIII может включать секрецию терапевтического белка из клетки, в которой он экспрессируется. В качестве альтернативы, в некоторых вариантах реализации экспрессированный белок FVIII может действовать или функционировать (например, оказывать свой эффект) внутри клетки, в которой он экспрессируется. Согласно некоторым вариантам реализации зкДНК-вектор экспрессирует белок FVIII в печени, мышце (например, скелетной мышце) субъекта или в другой части тела, которая может функционировать как депо для продукции и секреции терапевтического белка FVIII во многие системные компартменты.
I. Определения
[0057] Если в данном документе не указано иное, научные и технические термины, используемые применительно к настоящей заявке, должны иметь значения, обычно известные обычным специалистам в области техники, к которой относится данное раскрытие. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения. Определения обычных терминов в иммунологии и молекулярной биологии можно найти в The Merck Manual of Diagnosis and Therapy, 19 изд., опубликовано Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ред.), Fields Virology, 6 изд., опубликовано Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ред.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, опубликовано Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); и Robert A. Meyers (ред.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, опубликовано VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, опубликовано Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (ред.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, опубликовано Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4 изд., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ред.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ред.), John Wiley and Sons, Inc., 2005; и Current Protocols in Immunology (CPI) (John E. Coligan, ADA Μ Kruisbeek, David Η Margulies, Ethan Μ Shevach, Warren Strobe, (ред.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), содержание которых полностью включено в данный документ посредством ссылки).
[0058] В данном документе термины «введение», «введенный» и их варианты относятся к введению субъекту композиции или агента (например, терапевтической нуклеиновой кислоты или иммуносупрессора, описанных в данном документе) и включают одновременное и последовательное введение одной или более композиций или агентов. «Введение» может относиться, например, к терапевтическим, фармакокинетическим, диагностическим, исследовательским методам, к плацебо и к экспериментальным методам. «Введение» также включает способы лечения in vitro и ex vivo. Введение композиции или агента субъекту осуществляют любым подходящим путем, включая перорально, через легкие, интраназально, парентерально (внутривенно, внутримышечно, внутрибрюшинно или подкожно), ректально, введение в лимфатическую систему, внутрь опухоли или местно. Введение субъекту композиции или агента осуществляют с помощью электропорации. Введение включает самостоятельное введение и введение другим лицом. Введение может быть осуществлено любым подходящим путем. Подходящий путь введения позволяет композиции или агенту выполнять их предусмотренную функцию. Например, если подходящим путем является внутривенный, композицию вводят путем введения указанной композиции или агента в вену субъекта.
[0059] В данном документе выражения «терапевтическое средство на основе нуклеиновой кислоты», «терапевтическая нуклеиновая кислота» и «ТНК» используются взаимозаменяемо и относятся к любому варианту терапевтического средства с использованием нуклеиновых кислот в качестве активного компонента терапевтического агента для лечения заболевания или нарушения. В данном документе указанные выражения относятся к терапевтическим средствам на основе РНК и терапевтическим средствам на основе ДНК. Неограничивающие примеры терапевтических средств на основе РНК включают мРНК, антисмысловую РНК и олигонуклеотиды, рибозимы, аптамеры, интерферирующие РНК (РНКи), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК). Неограничивающие примеры терапевтических средств на основе ДНК включают миникольцо ДНК, миниген, вирусную ДНК (например, геном лентивируса или ААВ) или невирусные синтетические ДНК-векторы, линейную дуплексную ДНК с замкнутыми концами (зкДНК/CELiD), плазмиды, бакмиды, ДНК-векторы doggybone (dbDNA™), минималистичный вектор для иммунологически определенной экспрессии гена (MIDGE), невирусный ДНК-вектор с минимальной цепью (линейный ковалентно замкнутый ДНК-вектор) или гантелеобразный минимальный ДНК-вектор («гантелеобразную ДНК»).
[0060] В данном документе «эффективное количество» или «терапевтически эффективное количество» терапевтического агента, такого как терапевтический белок FVIII или его фрагмент, представляет собой количество, достаточное для получения целевого эффекта, например, лечения или предотвращения гемофилии А. Подходящие анализы для измерения экспрессии целевого гена или целевой последовательности включают, например, исследование уровней белка или РНК с применением методик, известных специалистам в данной области техники, таких как дот-блоттинг, Нозерн-блоттинг, гибридизация in situ, ИФА, иммунопреципитация, функциональный ферментный анализ, а также фенотипические анализы, известные специалистам в данной области техники. Однако уровни дозировки основаны на различных факторах, включая тип повреждения, возраст, массу тела, пол, медицинское состояние пациента, тяжесть состояния, путь введения и конкретный применяемый активный агент. Соответственно, схема дозирования может значительно изменяться, однако может быть определена обычным путем лечащим врачом с применением стандартных способов. Кроме того, термины «терапевтическое количество», «терапевтически эффективные количества» и «фармацевтически эффективные количества» включают профилактические или превентивные количества композиций согласно описанному изобретению. В профилактических или превентивных приложениях описанного изобретения фармацевтические композиции или лекарственные средства вводят пациенту, подверженному или по иным причинам имеющему риск развития заболевания, нарушения или состояния, в количестве, достаточном для того чтобы устранить или уменьшить риск, уменьшить степень тяжести или отсрочить начало указанного заболевания, нарушения или состояния, включая биохимические, гистологические и/или поведенческие симптомы указанного заболевания, нарушения или состояния, его осложнения, и промежуточные патологические фенотипы, возникающие в ходе развития указанного заболевания, нарушения или состояния. Обычно предпочтительным является применение максимальной дозы, т.е. самой высокой безопасной дозы в соответствии с некоторым медицинским заключением. В соответствии с некоторыми вариантами реализации заболевание, нарушение или состояние представляет собой гемофилию А. Термины «доза» и «дозировка» используются в данном документе взаимозаменяемо.
[0061] В данном документе термин «терапевтический эффект» относится к последствиям лечения, результаты которого оценивают как целевые и благоприятные. Терапевтический эффект может включать, прямо или опосредованно, остановку, уменьшение или устранение проявления заболевания. Терапевтический эффект также может включать, прямо или опосредованно, остановку, уменьшение или устранение прогрессирования проявления заболевания.
[0062] Для любого терапевтического агента, описанного в данном документе, терапевтически эффективное количество может быть изначально определено на основании предварительных исследований in vitro и/или в моделях на животных. Терапевтически эффективная доза также может быть определена на основании данных у человека. Применяемая доза может быть скорректирована на основании относительных биодоступности и эффективности вводимого соединения. Коррекция дозы для достижения максимальной эффективности на основе описанных выше способов и других хорошо известных способов находится в пределах возможностей обычного специалиста в данной области техники. Общие принципы определения терапевтической эффективности, с которыми можно ознакомиться в главе 1 руководства Goodman and Oilman, The Pharmacological Basis of Therapeutics, 10 изд., McGraw-Hill (New York) (2001), включенного в данный документ посредством ссылки, обобщены ниже.
[0063] Фармакокинетические принципы обеспечивают основу для модификации схемы дозирования для получения целевой степени терапевтической эффективности с минимумом неприемлемых нежелательных явлений. Дополнительные рекомендации по модификации дозировки могут быть получены в ситуациях, когда концентрация лекарственного средства в плазме может быть измерена и соотнесена с терапевтическим окном.
[0064] В данном документе термины «гетерологичная нуклеотидная последовательность» и «трансген» используются взаимозаменяемо и относятся к представляющей интерес нуклеиновой кислоте (отличной от нуклеиновой кислоты, кодирующей полипептид капсида), которая встроена в зкДНК-вектор и может быть доставлена и экспрессирована зкДНК-вектором, раскрытым в данном документе.
[0065] В данном документе термины «экспрессионная кассета» и «транскрипционная кассета» используются взаимозаменяемо и относятся к линейному участку нуклеиновых кислот, который включает трансген, функционально связанный с одним или более промоторами или другими регуляторными последовательностями, достаточными для направления транскрипции трансгена, но который не содержит кодирующих капсид последовательностей, других векторных последовательностей или областей инвертированных концевых повторов. Экспрессионная кассета может дополнительно содержать одну или более цис-действующих последовательностей (например, промоторов, энхансеров или репрессоров), один или более интронов и один или более посттранскрипционных регуляторных элементов.
[0066] Термины «полинуклеотид» и «нуклеиновая кислота», используемые в данном документе взаимозаменяемо, относятся к полимерной форме нуклеотидов любой длины, будь то рибонуклеотиды или дезоксирибонуклеотиды. Таким образом, этот термин включает одно-, двух- или многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, включающий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания. «Олигонуклеотид» обычно относится к полинуклеотидам, содержащим от примерно 5 до примерно 100 нуклеотидов одно- или двухцепочечной ДНК. Однако для целей настоящего раскрытия верхнего предела длины олигонуклеотида не существует. Олигонуклеотиды также известны как «олигомеры» или «олиго» (oligos) и могут быть выделены из генов или химически синтезированы с помощью способов, известных в данной области техники. Термины «полинуклеотид» и «нуклеиновая кислота» следует понимать как включающие, применительно к описываемым вариантам реализации, одноцепочечные (такие как смысловые или антисмысловые) и двухцепочечные полинуклеотиды. ДНК может быть в форме, например, антисмысловых молекул, плазмидной ДНК, дуплексов ДНК-ДНК, предварительно конденсированной ДНК, продуктов ПЦР, векторов (Р1, РАС, ВАС, ΥАС, искусственные хромосомы), экспрессионных кассет, химерных последовательностей, хромосомной ДНК или производных и комбинаций указанных групп. ДНК может быть в форме миникольца, плазмиды, бакмиды, минигена, ДНК с минимальной цепью (линейного ковалентно замкнутого ДНК-вектора), линейной дуплексной ДНК с замкнутыми концами (CELiD или зкДНК), ДНК doggybone (dbDNA™), гантелеобразной ДНК, минималистичного вектора для иммунологически определенной экспрессии гена (MIDGE), вирусного вектора или невирусных векторов. РНК может быть в форме короткой интерферирующей РНК (киРНК), дцРНК-субстрата Dicer, короткой шпилечной РНК (кшРНК), асимметричной интерферирующей РНК (аиРНК), микроРНК (миРНК), мРНК, рРНК, тРНК, вирусной РНК (вРНК) и их комбинаций. Нуклеиновые кислоты включают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки или связи остова, которые являются синтетическими, природными и неприродными, и которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Примеры таких аналогов и/или модифицированных остатков включают, без ограничения, фосфотиоаты, фосфодиамидат-морфолиновый олигомер (морфолино), фосфоамидаты, метилфосфонаты, хиральные метилфосфонаты, 2'-О-метилрибонуклеотиды, замкнутую нуклеиновую кислоту (LNA™) и пептидные нуклеиновые кислоты (ПНК). За исключением конкретно указанных ограничений термин включает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Если не указано иное, подразумевается также, что конкретная последовательность нуклеиновой кислоты также включает ее консервативно модифицированные варианты (например, вырожденные замены кодонов), аллели, ортологи, однонуклеотидные полиморфизмы (SNP) и комплементарные последовательности, а также последовательность, указанную явным образом.
[0067] «Нуклеотиды» содержат сахар дезоксирибозу (ДНК) или рибозу (РНК), основание и фосфатную группу. Нуклеотиды соединены между собой посредством фосфатных групп.
[0068] «Основания» включают пурины и пиримидины, которые, в частности, включают природные соединения аденин, тимин, гуанин, цитозин, урацил, инозин и природные аналоги, а также синтетические производные пуринов и пиримидинов, которые включают, но не ограничиваются перечисленными, модификации, которые вводят новые реакционноспособные группы, такие как, но не ограничиваясь перечисленными, амины, спирты, тиолы, карбоксилаты и алкилгалогениды.
[0069] В данном документе термин «интерферирующая РНК» или «РНКи», или «последовательность интерферирующей РНК» включает одноцепочечную РНК (например, зрелую миРНК, олигонуклеотиды оцРНКи, олигонуклеотиды оцДНКи), двухцепочечную РНК (т.е. дуплексную РНК, такую как киРНК, дцРНК-субстрат Dicer, кшРНК, аиРНК или пре-миРНК), гибрид ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941) или гибрид ДНК-ДНК (см., например, публикацию РСТ № WO 2004/104199), который способен уменьшать или ингибировать экспрессию целевого гена или последовательности (например, опосредуя разрушение или ингибируя трансляцию мРНК, которые комплементарны последовательности интерферирующей РНК), когда интерферирующая РНК находится в той же клетке, что и целевой ген или последовательность. Таким образом, интерферирующая РНК относится к одноцепочечной РНК, которая комплементарна последовательности мРНК-мишени, или к двухцепочечной РНК, образованной двумя комплементарными цепями или одной самокомплементарной цепью. Интерферирующая РНК может иметь существенную или полную идентичность с целевым геном или последовательностью или может содержать область несовпадения (т.е. мотив несовпадения). Последовательность интерферирующей РНК может соответствовать полноразмерному целевому гену или его подпоследовательности. Предпочтительно молекулы интерферирующих РНК синтезируют химическим путем. Раскрытия каждого из упомянутых выше патентных документов полностью включены в данный документ посредством ссылки для всех целей.
[0070] Интерферирующая РНК включает «короткую интерферирующую РНК» или «киРНК», например, интерферирующую РНК из примерно 15-60, 15-50 или 15-40 (дуплекс) нуклеотидов в длину, более типично примерно 15-30, 15-25 или 19-25 (дуплекс) нуклеотидов в длину и предпочтительно составляет примерно 20-24, 21-22 или 21-23 (дуплекс) нуклеотида в длину (например, каждая комплементарная последовательность двухцепочечной киРНК составляет 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 нуклеотидов в длину, предпочтительно примерно 20-24, 21-22 или 21-23 нуклеотида в длину, и двухцепочечная киРНК составляет примерно 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 пар оснований в длину, предпочтительно примерно 18-22, 19-20 или 19-21 пару оснований в длину). Дуплексы киРНК могут содержать 3'-липкие концы, имеющие от примерно 1 до примерно 4 нуклеотидов или от примерно 2 до примерно 3 нуклеотидов, и 5-фосфатные концы. Примеры киРНК включают, без ограничения, двухцепочечную полинуклеотидную молекулу, собранную из двух одноцепочечных молекул, причем одна цепь является смысловой цепью, а другая представляет собой комплементарную антисмысловую цепь; двухцепочечную полинуклеотидную молекулу, собранную из одноцепочечной молекулы, в которой смысловая и антисмысловая области соединены линкером на основе нуклеиновой кислоты или на основе, отличной от нуклеиновой кислоты; двухцепочечную полинуклеотидную молекулу со шпилечной вторичной структурой, имеющей самокомплементарные смысловые и антисмысловые области; и кольцевую одноцепочечную полинуклеотидную молекулу с двумя или более петлевыми структурами и стеблем, имеющим самокомплементарные смысловые и антисмысловые области, причем кольцевой полинуклеотид может подвергаться процессингу in vivo или in vitro с получением активной двухцепочечной молекулы киРНК. В данном документе термин «киРНК» включает дуплексы РНК-РНК, а также гибриды ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941).
[0071] В данном документе термин «конструкция нуклеиновой кислоты» относится к молекуле нуклеиновой кислоты, будь то одноцепочечная или двухцепочечная, которая выделена из природного гена или которая модифицирована так, чтобы она содержала сегменты нуклеиновых кислот, с помощью способа, который в прочих случаях не существовал бы в природе, или является синтетической. Термин «конструкция нуклеиновой кислоты» является синонимом термина «экспрессионная кассета», когда конструкция нуклеиновой кислоты содержит контрольные последовательности, необходимые для экспрессии кодирующей последовательности согласно настоящему раскрытию. «Экспрессионная кассета» включает кодирующую последовательность ДНК, функционально связанную с промотором.
[0072] Под «гибридизуемая» или «комплементарная» или «по существу комплементарная» подразумевается, что нуклеиновая кислота (например, РНК) включает последовательность нуклеотидов, которая позволяет ей нековалентно связываться, т.е. формировать пары оснований по Уотсону-Крику и/или пары оснований G/U, «ренатурировать» или «гибридизироваться» с другой нуклеиновой кислотой специфичным для последовательности, антипараллельным образом (т.е. нуклеиновая кислота специфично связывается с комплементарной нуклеиновой кислотой) в соответствующих условиях температуры и ионной силы раствора in vitro и/или in vivo. Как известно в данной области техники, стандартное спаривание оснований по Уотсону-Крику включает: спаривание аденина (А) с тимидином (Т), спаривание аденина (А) с урацилом (U) и спаривание гуанина (G) с цитозином (С). Кроме того, в данной области техники также известно, что при гибридизации двух молекул РНК (например, дцРНК) гуаниновое (G) основание спаривается с урацилом (U). Например, спаривание оснований G/U частично отвечает за вырожденность (т.е. избыточность) генетического кода в случае спаривания оснований анти-кодонов тРНК с кодонами в мРНК. Применительно к настоящему раскрытию гуанин (G) связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению считается комплементарным урацилу (U), и наоборот. Таким образом, когда пара оснований G/U может быть получена в определенном нуклеотидном положении связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению, это положение не рассматривается как некомплементарное, а вместо этого считается комплементарным.
[0073] Термины «пептид», «полипептид» и «белок» используются в данном документе взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты, и полипептиды, имеющие модифицированные пептидные остовы.
[0074] Последовательность ДНК, которая «кодирует» конкретный белок FVIII, представляет собой последовательность нуклеиновой кислоты ДНК, которая транскрибируется в конкретную РНК и/или белок. Полинуклеотид ДНК может кодировать РНК (мРНК), которая транслируется в белок, или полинуклеотид ДНК может кодировать РНК, которая не транслируется в белок (например, тРНК, рРНК или нацеливающую на ДНК РНК; также называемые «некодирующими» РНК или «нкРНК»).
[0001] В данном документе термин «слитый белок», в используемом в данном документе значении, относится к полипептиду, который содержит белковые домены по меньшей мере из двух разных белков. Например, слитый белок может содержать (i) FVIII или его фрагмент и (ii) по меньшей мере один белок, не относящийся к GOI. Слитые белки, охватываемые данным документом, включают, но не ограничиваются перечисленными, антитело или Fc или антигенсвязывающий фрагмент антитела, слитый с белком FVIII, например, внеклеточным доменом рецептора, лигандом, ферментом или пептидом. Белок FVIII или его фрагмент, который является частью слитого белка, может представлять собой моноспецифичное антитело или биспецифичное или мультиспецифичное антитело.
[0075] В данном документе термин «ген безопасной гавани генома» или «ген безопасной гавани» относится к гену или локусам, в которые последовательность нуклеиновой кислоты может быть вставлена так, чтобы последовательность могла интегрироваться и функционировать предсказуемым образом (например, экспрессировать белок, представляющий интерес) без существенных отрицательных последствий для активности эндогенного гена или стимуляции рака. Согласно некоторым вариантам реализации ген безопасной гавани также представляет собой локусы или ген, в которых вставленная последовательность нуклеиновой кислоты может экспрессироваться эффективнее и на более высоких уровнях, чем в сайте, не являющемся «безопасной гаванью».
[0076] В данном документе термин «доставка гена» означает способ, с помощью которого чужеродную ДНК переносят в клетки-хозяева для приложений генной терапии.
[0077] В данном документе термин «концевой повтор» или «TR» включает любой вирусный концевой повтор или синтетическую последовательность, которая содержит по меньшей мере одну минимальную требуемую точку начала репликации и область, содержащую палиндромную шпилечную структуру. Связывающая Rep последовательность («RBS») (также называемая RBE (связывающий Rep элемент)) и сайт концевого разрешения («TRS») вместе составляют «минимальную требуемую точку начала репликации» и, соответственно, TR содержит по меньшей мере одну RBS и по меньшей мере один TRS. Каждый из TR, обратно комплементарных по отношению друг к другу в пределах определенного участка полинуклеотидной последовательности, как правило, называют «инвертированным концевым повтором» или «ITR». Применительно к вирусу ITR опосредуют репликацию, упаковку вируса, интеграцию и освобождение провируса. Как было неожиданно обнаружено, согласно настоящему изобретению TR, которые не являются обратно комплементарными по всей их длине, все еще могут выполнять обычные функции ITR и, таким образом, в данном документе термин ITR относится к TR в геноме зкДНК или зкДНК-векторе, который способен опосредовать репликацию зкДНК-вектора. Обычный специалист в данной области техники поймет, что в зкДНК-векторах сложной конфигурации может присутствовать более двух пар ITR или асимметричных ITR. ITR может представлять собой ITR ААВ или ITR, не принадлежащий ААВ, или может быть получен из ITR ААВ или ITR, не принадлежащего ААВ. Например, ITR может происходить из семейства Parvoviridae, которое включает парвовирусы и депендовирусы (например, собачий парвовирус, бычий парвовирус, мышиный парвовирус, свиной парвовирус, парвовирус человека В-19), или шпилька SV40, которая служит точкой начала репликации SV40, может применяться в качестве ITR, который может быть дополнительно модифицирован путем усечения, замены, делеции, вставки и/или добавления. Вирусы семейства Parvoviridae состоят из двух подсемейств: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих беспозвоночных. Депендопарвовирусы включают вирусное семейство аденоассоциированных вирусов (ААВ), которые способны к репликации у позвоночных животных-хозяев, включая, но не ограничиваясь перечисленными, человека, виды приматов, бычьих, собачьих, лошадиных и овечьих. Для удобства в данном документе ITR, расположенный в 5-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».
[0078] «ITR дикого типа» или «WT-ITR» относится к последовательности природной последовательности ITR в ААВ или другом депендовирусе, которая сохраняет, например, активность связывания Rep и никирующую способность Rep. Нуклеотидная последовательность WT-ITR из любого серотипа ААВ может незначительно отличаться от канонической природной последовательности из-за вырожденности генетического кода или дрейфа, и, таким образом, последовательности WT-ITR, предусмотренные для применения в данном документе, включают последовательности WT-ITR, образующиеся в результате природных изменений, происходящих в процессе продуцирования (например, ошибки репликации).
[0079] В данном документе термин «по существу симметричные WT-ITR» или «пара по существу симметричных WT-ITR» относится к паре WT-ITR в одном геноме зкДНК или зкДНК-векторе, которые оба представляют собой ITR дикого типа, которые имеют обратно комплементарные последовательности по всей их длине. Например, ITR может считаться последовательностью дикого типа, даже если он содержит один или более нуклеотидов, отличающихся от канонической природной последовательности, при условии, что указанные изменения не влияют на свойства и общую трехмерную структуру последовательности. Согласно некоторым аспектам отличающиеся нуклеотиды представляют собой консервативные изменения последовательности. В качестве одного неограничивающего примера, последовательность, имеющая по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной, например, с использованием BLAST при настройках по умолчанию), также имеет симметричную трехмерную пространственную организацию с другой последовательностью WT-ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. По существу симметричный WT-ITR содержит одинаковые петли А, С-С' и В-В' в трехмерном пространстве. То, что по существу симметричный WT-ITR представляет собой WT, может быть функционально подтверждено путем определения наличия в нем функционального сайта связывания Rep (RBE или RBE') и сайта концевого разрешения (TRS), который спаривается с соответствующим белком Rep. Могут быть протестированы другие функции, включая экспрессию трансгена в пермиссивных условиях, но необязательно.
[0080] В данном документе выражения «модифицированный ITR» или «mod-ITR», или «мутантный ITR» используются в данном документе взаимозаменяемо и относятся к ITR, который содержит мутацию по меньшей мере в одном или более нуклеотидах по сравнению с WT-ITR из того же серотипа. Указанная мутация может приводить к изменению в одной или более из областей А, С, С', В, В' в ITR и может приводить к изменению трехмерной пространственной организации (т.е. его трехмерной структуры в геометрическом пространстве) по сравнению с трехмерной пространственной организацией WT-ITR из того же серотипа.
[0081] В данном документе термин «асимметричные ITR», также называемые «парами асимметричных ITR», относится к паре ITR в одном геноме зкДНК или зкДНК-векторе, которые не являются обратно комплементарными по их полной длине. В качестве одного неограничивающего примера, асимметричный ITR в паре не имеет симметричной трехмерной пространственной организации со своим когнатным ITR так, что их трехмерные структуры имеют разные формы в геометрическом пространстве. Другими словами, асимметричные ITR в паре имеют разные общие геометрические структуры, т.е. они имеют разную организацию их петель А, С-С' и В-В' в трехмерном пространстве (например, один ITR может иметь короткое плечо С-С' и/или короткое плечо В-В' по сравнению с когнатным ITR). Различие по последовательности между двумя ITR может быть обусловлено добавлением, делецией, усечением или точечной мутацией одного или более нуклеотидов. Согласно одному варианту реализации один ITR из пары асимметричных ITR может представлять собой последовательность ITR дикого типа ААВ, а другой ITR представляет собой модифицированный ITR, как определено в данном документе (например, последовательность ITR, не относящуюся к дикому типу, или синтетическую последовательность). Согласно другому варианту реализации ни один ITR из пары асимметричных ITR не является последовательностью ААВ дикого типа, и указанные два ITR представляют собой модифицированные ITR, которые имеют разные формы в геометрическом пространстве (т.е. разную общую геометрическую структуру). Согласно некоторым вариантам реализации один mod-ITR из пары асимметричных ITR может иметь короткое плечо С-С', а другой ITR может иметь другую модификацию (например, одно плечо или короткое плечо В-В' и т.д.) так, что они имеют различную трехмерную пространственную организацию по сравнению с когнатным асимметричным mod-ITR.
[0082] В данном документе термин «симметричные ITR» относится к паре ITR в одном зкДНК-геноме или зкДНК-векторе, которые представляют собой последовательности дикого типа или мутированные (например, модифицированные относительно дикого типа) депендовирусные последовательности ITR и обратно комплементарны по всей их длине. В одном неограничивающем примере оба ITR представляют собой последовательности ITR дикого типа из ААВ2. В другом примере ни один из ITR не является последовательностью ITR дикого типа ААВ2 (т.е. они представляют собой модифицированные ITR, также называемые мутантными ITR) и может отличаться по последовательности от ITR дикого типа вследствие добавления, делеции, замены, усечения или точечной мутации нуклеотида. Для удобства в данном документе ITR, расположенный в 5'-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3'-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».
[0083] В данном документе термин «по существу симметричные модифицированные ITR» или «пара по существу симметричных mod-ITR» относится к паре модифицированных ITR в одном геноме зкДНК или зкДНК-векторе, которые оба имеют обратно комплементарные последовательности по всей их длине. Например, модифицированный ITR может считаться по существу симметричным, даже если он имеет некоторые нуклеотидные последовательности, отличающиеся от обратно комплементарной последовательности, при условии, что указанные изменения не влияют на свойства и общую форму. В качестве одного неограничивающего примера представлена последовательность, которая имеет по меньшей мере 85%, 90%, 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной с помощью BLAST при настойках по умолчанию), а также имеет симметричную трехмерную пространственную организацию в отношении ее когнатного модифицированного ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. Иными словами, пара по существу симметричных модифицированных ITR имеет одинаково организованные в трехмерном пространстве петли А, С-С' и В-В'. Согласно некоторым вариантам реализации ITR из пары mod-ITR могут иметь разные обратно комплементарные нуклеотидные последовательности, но все же иметь одинаковую симметричную трехмерную пространственную организацию, т.е. оба ITR содержат мутации, которые приводят к одинаковой общей трехмерной форме. Например, один ITR (например, 5'-ITR) в паре mod-ITR может происходить из одного серотипа, а другой ITR (например, 3'-ITR) может происходить из другого серотипа, однако оба могут иметь одинаковую соответствующую мутацию (например, если 5'-ITR имеет делецию в области С, то когнатный модифицированный 3'-ITR из другого серотипа имеет делецию в соответствующем положении в области С') так, что пара модифицированных ITR имеет одинаковую симметричную трехмерную пространственную организацию. Согласно таким вариантам реализации каждый ITR в паре модифицированных ITR может происходить из разных серотипов (например, ААВ1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12), таких как комбинация ААВ2 и ААВ6, при этом модификация в одном ITR отображается в соответствующем положении в когнатном ITR из другого серотипа. Согласно одному варианту реализации пара по существу симметричных модифицированных ITR относится к паре модифицированных ITR (mod-ITR) при условии, что различие в нуклеотидных последовательностях между указанными ITR не влияет на свойства или общую форму, и они имеют по существу одинаковую форму в трехмерном пространстве. В качестве неограничивающего примера представлен mod-ITR, который имеет по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с каноническим mod-ITR, как определено с помощью стандартных способов, хорошо известных в данной области техники, таких как BLAST (Basic Local Alignment Search Tool) или BLASTN, при настройках по умолчанию, а также имеет симметричную трехмерную пространственную организацию так, что их трехмерная структура имеет одинаковую форму в геометрическом пространстве. Пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR.
[0084] Термин «фланкирование» относится к относительному положению одной последовательности нуклеиновой кислоты по отношению к другой последовательности нуклеиновой кислоты. Обычно в последовательности ABC А и С фланкируют В. То же самое верно для расположения АхВхС. Соответственно, фланкирующая последовательность предшествует фланкируемой последовательности или следует за ней, но не обязательно должна быть смежной с фланкируемой последовательностью или непосредственно прилегать к ней. Согласно одному варианту реализации термин «фланкирование» относится к концевым повторам на каждом конце линейного дуплексного зкДНК-вектора.
[0085] В данном документе термины «лечить», «осуществлять лечение» и/или «лечение» включают подавление, по существу ингибирование, замедление или обращение прогрессирования состояния, по существу облегчение клинических симптомов состояния или по существу предотвращение появления клинических симптомов состояния, получение благоприятных или целевых клинических результатов. В соответствии с некоторыми вариантами реализации состояние представляет собой гемофилию А. Лечение также относится к достижению одного или более из следующих: (а) уменьшения степени тяжести нарушения; (b) ограничения развития симптомов, характерных для нарушения (ий), которое лечат; (с) ограничения ухудшения симптомов, характерных для нарушения (ий), которое лечат; (d) ограничения рецидивирования нарушения (ий) у пациентов, ранее имевших указанное нарушение (ия); и (е) ограничения рецидивирования симптомов у пациентов, ранее не имевших симптомов указанного нарушения (ий). Благоприятные или целевые клинические результаты, такие как фармакологические и/или физиологические эффекты, включают, но не ограничиваются перечисленными, предотвращение наступления заболевания, нарушения или состояния у субъекта, который может быть предрасположен к указанному заболеванию, нарушению или состоянию, но еще не испытывает симптомов или у него еще не проявляются симптомы указанного заболевания (профилактическое лечение), облегчение симптомов указанного заболевания, нарушения или состояния, уменьшение интенсивности заболевания, нарушения или состояния, стабилизацию (т.е., отсутствие ухудшения) указанного заболевания, нарушения или состояния, предотвращение распространения указанного заболевания, нарушения или состояния, задержку или замедление прогрессирования указанного заболевания, нарушения или состояния, облегчение или временное облегчение указанного заболевания, нарушения или состояния, и комбинации перечисленных, а также увеличение продолжительности выживания по сравнению с ожидаемым выживанием без лечения.
[0086] В данном документе термин «увеличение», «усиление», «повышение» (и подобные термины) обычно относится к акту увеличения, прямо или опосредовано, концентрации, уровня, функции, активности или поведения относительно природного, ожидаемого или среднего, или относительно контрольного состояния.
[0087] В данном документе термин «минимизировать», «уменьшать», «снижать» и/или «ингибировать» (и подобные термины) обычно относится к акту уменьшения, прямо или опосредовано, концентрации, уровня, функции, активности, поведения относительно природного, ожидаемого, среднего, или относительно контрольного состояния.
[0088] В данном документе термин «зкДНК-геном» относится к экспрессионной кассете, которая дополнительно включает по меньшей мере одну область инвертированного концевого повтора. ЗкДНК-геном может дополнительно содержать одну или более спейсерных областей. Согласно некоторым вариантам реализации зкДНК-геном включен в виде межмолекулярного дуплексного полинуклеотида ДНК в плазмиду или вирусный геном.
[0089] В данном документе термин «спейсерная область зкДНК» относится к промежуточной последовательности, которая разделяет функциональные элементы в зкДНК-векторе или геноме зкДНК. Согласно некоторым вариантам реализации спейсерные области зкДНК удерживают два функциональных элемента на целевом расстоянии для оптимальной функциональности. Согласно некоторым вариантам реализации спейсерные области зкДНК обеспечивают или увеличивают генетическую стабильность зкДНК-генома, например, в плазмиде или бакуловирусе. Согласно некоторым вариантам реализации спейсерные области зкДНК облегчают подготовленные генетические манипуляции с зкДНК-геномом, обеспечивая удобное расположение для сайтов клонирования и т.п. Например, согласно определенным аспектам олигонуклеотидный «полилинкер», содержащий несколько сайтов рестрикционных эндонуклеаз, или последовательность не из открытой рамки считывания, сконструированная так, чтобы в ней отсутствовали известные сайты связывания белка (например, транскрипционного фактора), могут быть размещены в зкДНК-геноме для разделения цис-действующих факторов, например, с помощью 6-членной, 12-членной, 18-членной, 24-членной, 48-членной, 86-членной, 176-членной вставки и т.д. между сайтом концевого разрешения и расположенным в 5-направлении транскрипционным регуляторным элементом. Аналогичным образом, спейсер может быть встроен между последовательностью сигнала полиаденилирования и 3'-сайтом концевого разрешения.
[0090] В данном документе термины «сайт связывания Rep», «элемент связывания Rep», «RBE» и «RBS» используются взаимозаменяемо и относятся к сайту связывания белка Rep (например, Rep 78 ААВ или Rep 68 ААВ), который после связывания белком Rep позволяет белку Rep выполнять его сайт-специфичную эндонуклеазную активность в отношении последовательности, включающей RBS. Последовательность RBS и ее обратно комплементарная последовательность вместе образуют один RBS. Последовательности RBS известны в данной области техники и включают, например, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), представляющую собой последовательность RBS, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность RBS, включая другие известные последовательности RBS ААВ и другие известные природные или синтетические последовательности RBS. Не ограничиваясь какой-либо теорией, считается, что нуклеазный домен белка Rep связывается с дуплексной нуклеотидной последовательностью GCTC и, соответственно, происходит прямое связывание и стабильная сборка двух известных белков Rep ААВ на дуплексном олигонуклеотиде 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3' (SEQ ID NO: 60). Кроме того, растворимые агрегированные конформеры (т.е. неопределенное число взаимосвязанных белков Rep) диссоциируют и связываются с олигонуклеотидами, которые содержат сайты связывания Rep. Каждый белок Rep взаимодействует как с азотистыми основаниями, так и с фосфодиэфирным остовом на каждой цепи. Взаимодействия с азотистыми основаниями обеспечивают специфичность в отношении последовательности, в то время как взаимодействия с фосфодиэфирным остовом неспецифичны или менее специфичны в отношении последовательности и стабилизируют комплекс белка с ДНК.
[0091] В данном документе термины «сайт концевого разрешения» и «TRS» используются в данном документе взаимозаменяемо и относятся к области, в которой Rep образует тирозин-фосфодиэфирную связь с 5'-тимидином с образованием 3'-ОН, который служит субстратом для удлинения ДНК с помощью клеточной ДНК-полимеразы, например, ДНК-полимеразы дельта или ДНК-полимеразы эпсилон. В качестве альтернативы, комплекс Rep-тимидин может принимать участие в скоординированной реакции лигирования. Согласно некоторым вариантам реализации TRS включает, как минимум, неспаренный тимидин. Согласно некоторым вариантам реализации никирующую эффективность TRS по меньшей мере отчасти можно контролировать за счет расстояния между ним и RBS в пределах одной молекулы. Если акцепторный субстрат представляет собой комплементарный ITR, тогда полученный продукт представляет собой внутримолекулярный дуплекс. Последовательности TRS известны в данной области техники и включают, например, 5'-GGTTGA-3' (SEQ ID NO: 61), представляющую собой гексануклеотидную последовательность, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность TRS, включая другие известные последовательности TRS ААВ и другие известные природные или синтетические последовательности TRS, такие как AGTT (SEQ ID NO: 62), GGTTGG (SEQ ID NO: 63), AGTTGG (SEQ ID NO: 64), AGTTGA (SEQ ID NO: 65), и другие мотивы, такие как RRTTRR (SEQ ID NO: 66).
[0092] В данном документе термин «зкДНК-плазмида» относится к плазмиде, которая содержит зкДНК-геном в виде межмолекулярного дуплекса.
[0093] В данном документе термин «зкДНК-бакмида» относится к геному инфекционного бакуловируса, содержащему зкДНК-геном в виде межмолекулярного дуплекса, который способен размножаться в Е. coli в виде плазмиды и, соответственно, может выполнять роль челночного вектора для бакуловируса.
[0094] В данном документе термин «зкДНК-бакуловирус» относится к бакуловирусу, который содержит зкДНК-геном в виде межмолекулярного дуплекса в геноме бакуловируса.
[0095] В данном документе термины «инфицированная зкДНК-бакуловирусом клетка насекомого» и «зкДНК-ВПС» используются взаимозаменяемо и относятся к клетке беспозвоночного животного-хозяина (включая, но не ограничиваясь этим, клетку насекомого (например, клетку Sf9)), инфицированной зкДНК-бакуловирусом.
[0096] В данном документе термин «зкДНК» относится к бескапсидной линейной двухцепочечной (дц) дуплексной ДНК с замкнутыми концами для невирусного переноса генов, синтетической или другой. Подробное описание зкДНК приведено в международной заявке PCT/US 2017/020828, поданной 3 марта 2017 г., содержание которой полностью явным образом включено в данный документ посредством ссылки. Некоторые способы получения зкДНК, содержащей различные последовательности и конфигурации инвертированных концевых повторов (ITR), с использованием клеточных методов описаны в Примере 1 международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., каждая из которых полностью включена в данный документ посредством ссылки. Некоторые способы получения синтетических зкДНК-векторов, содержащих различные последовательности и конфигурации ITR, описаны, например, в международной заявке PCT/US 2019/14122, поданной 18 января 2019 г., содержание которой полностью включено в данный документ посредством ссылки.
[0097] В данном документе термин «ДНК-вектор с замкнутыми концами» относится к бескапсидному ДНК-вектору по меньшей мере с одним ковалентно замкнутым концом, причем по меньшей мере часть вектора имеет структуру внутримолекулярного дуплекса.
[0098] В данном документе термины «зкДНК-вектор» и «зкДНК» используются взаимозаменяемо и относятся к ДНК-вектору с замкнутыми концами, содержащему по меньшей мере один концевой палиндром. Согласно некоторым вариантам реализации зкДНК содержит два ковалентно замкнутых конца.
[0099] В данном документе термин «нзДНК» или «никированная зкДНК» относится к ДНК с замкнутыми концами, содержащей одноцепочечный разрыв или пропуск размером 1-100 пар оснований в области «стебля» или спейсерной области, расположенной в 5'-направлении относительно открытой рамки считывания (например, промотора и трансгена, подлежащего экспрессии).
[00100] В данном документе термины «пропуск» и «одноцепочечный разрыв» используются взаимозаменяемо и относятся к прерванной части синтетического ДНК-вектора согласно настоящему изобретению, создавая участок части одноцепочечной ДНК в двухцепочечной в других местах зкДНК. Пропуск может иметь от 1 пары оснований до 100 пар оснований в длину в одной цепи дуплексной ДНК. Типичные пропуски, разработанные и созданные с применением способов, описанных в данном документе, и синтетические векторы, полученные с применением указанных способов, могут иметь, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 или 60 пар оснований в длину. Примерные пропуски в настоящем раскрытии могут иметь от 1 пары оснований до 10 пар оснований в длину, от 1 до 20 пар оснований в длину, от 1 до 30 пар оснований в длину.
[00101] Как определено в данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.
[00102] В данном документе термины «смысловой» и «антисмысловой» относятся к ориентации структурного элемента на полинуклеотиде. Смысловой и антисмысловой варианты элемента обратно комплементарны друг другу.
[00103] В данном документе термин «синтетический ААВ-вектор» и «получение ААВ-вектора синтетическим путем» относится к ААВ-вектору и синтетическим способам его получения в полностью бесклеточной среде.
[00104] В данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.
[00105] В данном документе термин «эффекторный белок» относится к полипептиду, который обеспечивает детектируемый показатель, либо, например, как репортерный полипептид, либо, более предпочтительно, как полипептид, уничтожающий клетку, например, токсин, или агент, придающий клетке чувствительность к уничтожению выбранным агентом или при его отсутствии. Эффекторные белки включают любой белок или пептид, который непосредственно нацелен на ДНК и/или РНК клетки-хозяина или повреждает их. Например, эффекторные белки могут включать, но не ограничиваются перечисленными, рестрикционную эндонуклеазу, которая нацелена на последовательность ДНК клетки-хозяина (будь то геномный или внехромосомный элемент), протеазу, которая расщепляет полипептид-мишень, необходимый для выживания клетки, ингибитор ДНК-гиразы и токсин рибонуклеазного типа. Согласно некоторым вариантам реализации экспрессия эффекторного белка, контролируемая синтетическим биологическим контуром, описанным в данном документе, может принимать участие в качестве фактора в другом синтетическом биологическом контуре, что расширяет диапазон и сложность восприимчивости системы биологического контура.
[00106] Транскрипционные регуляторы относятся к транскрипционным активаторам и репрессорам, которые либо активируют, либо репрессируют транскрипцию представляющего интерес гена, такого как FVIII. Промоторы представляют собой области нуклеиновой кислоты, которые инициируют транскрипцию конкретного гена. Транскрипционные активаторы, как правило, связываются поблизости от транскрипционных промоторов и привлекают РНК-полимеразу для непосредственной инициации транскрипции. Репрессоры связываются с транскрипционными промоторами и стерически затрудняют инициацию транскрипции РНК-полимеразой. Другие транскрипционные регуляторы могут служить либо активаторами, либо репрессорами в зависимости от места их связывания и условий в клетке и в окружающей среде. Неограничивающие примеры классов транскрипционных регуляторов включают, но не ограничиваются перечисленными, белки гомеодомена, белки с цинковыми пальцами, белки с мотивом «крылатая спираль» (белки Forkhead) и белки с лейциновой молнией.
[00107] В данном документе «репрессорный белок» или «индукторный белок» представляет собой белок, который связывается с элементом регуляторной последовательности и репрессирует или активирует, соответственно, транскрипцию последовательностей, функционально связанных с указанным элементом регуляторной последовательности. Предпочтительные репрессорные и индукторные белки, описанные в данном документе, чувствительны к присутствию или отсутствию по меньшей мере одного вносимого агента или фактора внешней среды. Предпочтительные белки, описанные в данном документе, являются модульными по форме и содержат, например, отделяемые ДНК-связывающие и связывающие вводимые агенты, или реагирующие на них, элементы или домены.
[00108] В данном документе термин «носитель» включает любые и все возможные растворители, дисперсионные среды, основы, покрытия, разбавители, антибактериальные и противогрибковые агенты, изотонические и замедляющие абсорбцию агенты, буферы, растворы-носители, суспензии, коллоиды и т.п. Применение таких сред и агентов для фармацевтически активных веществ хорошо известно в данной области техники. В композиции также могут быть включены вспомогательные активные ингредиенты. Выражение «фармацевтически приемлемый» относится к молекулярным частицам и композициям, которые не приводят к токсической, аллергической или схожей нежелательной реакции при введении хозяину.
[00109] В данном документе термин «домен, реагирующий на вводимый агент» представляет собой домен транскрипционного фактора, который связывает или иначе отвечает на условие или вводимый агент таким способом, который придает восприимчивость присоединенного к нему ДНК-связывающего слитого домена к наличию указанного условия или вводимого агента. Согласно одному варианту реализации наличие указанного условия или вводимого агента приводит к конформационному изменению в отвечающем на вводимый агент домене, или в белке, с которым он слит, которое модифицирует модулирующую транскрипцию активность транскрипционного фактора.
[00110] Термин «in vivo» относится к анализам или способам, которые реализуют на организме или в организме, таком как многоклеточное животное. Согласно некоторым аспектам, описанным в данном документе, считается, что способ или применение реализуют «in vivo», если используется одноклеточный организм, такой как бактерия. Термин «ех vivo» относится к способам и вариантам применения, которые выполняют с использованием живой клетки с интактной мембраной, находящейся вне организма многоклеточного животного или растения, например, эксплантатов, культивируемых клеток, включая первичные клетки и линии клеток, трансформированных линий клеток, а также экстрагированных тканей или клеток, включая клетки крови, помимо прочего. Термин «in vitro» относится к анализам и способам, которые не требуют присутствия клетки с интактной мембраной, например, клеточных экстрактов, и могут относиться к введению программируемого синтетического биологического контура в бесклеточной системе, такой как среда, не содержащая клеток или клеточных систем, таких как клеточные экстракты.
[00111] В данном документе термин «промотор» относится к любой последовательности нуклеиновой кислоты, которая регулирует экспрессию другой последовательности нуклеиновой кислоты за счет управления транскрипцией указанной последовательности нуклеиновой кислоты, которая может представлять собой гетерологичный целевой ген, кодирующий белок или РНК. Промоторы могут быть конститутивными, индуцируемыми, репрессируемыми, тканеспецифическими или могут представлять собой любую комбинацию перечисленных. Промотор представляет собой контрольную область последовательности нуклеиновой кислоты, в которой осуществляется контроль инициации и скорости транскрипции остальной части последовательности нуклеиновой кислоты. Промотор также может содержать генетические элементы, с которыми могут связываться регуляторные белки и молекулы, такие как РНК-полимераза и другие транскрипционные факторы. Согласно некоторым вариантам реализации аспектов, описанных в данном документе, промотор может управлять экспрессией транскрипционного фактора, который регулирует экспрессию самого промотора. В последовательности промотора может быть расположен сайт инициации транскрипции, а также связывающие белки домены, отвечающие за связывание РНК-полимеразы. Эукариотические промоторы часто, однако не всегда, будут содержать «ТАТА»-боксы и «САТ»-боксы. Различные промоторы, включая индуцируемые промоторы, могут применяться для управления экспрессией трансгенов в зкДНК-векторах, раскрытых в данном документе. Последовательность промотора может быть ограничена на ее 3'-конце сайтом инициации транскрипции и простирается в восходящем направлении (в 5'-направлении), включая минимальное количество оснований или элементов, необходимых для инициации транскрипции на уровнях, детектируемых выше фона.
[00112] В данном документе термин «энхансер» относится к цис-действующей регуляторной последовательности (например, 50-1500 пар оснований), которая связывает один или более белков (например, белки-активаторы или транскрипционный фактор) для повышения транскрипционной активации последовательности нуклеиновой кислоты. Энхансеры могут быть расположены на расстоянии до 1000000 пар оснований выше сайта начала гена или ниже сайта начала гена, который они регулируют. Энхансер может быть расположен в пределах интронной области или в экзонной области неродственного гена.
[00113] Можно сказать, что промотор управляет экспрессией или управляет транскрипцией последовательности нуклеиновой кислоты, которую он регулирует.Выражения «функционально связанный», «функционально расположенный», «с функциональной связью», «под контролем» и «под транскрипционным контролем» указывают, что промотор находится в корректном функциональном положении и/или ориентации относительно последовательности нуклеиновой кислоты, которую он регулирует, для контроля инициации транскрипции и/или экспрессии указанной последовательности. В данном документе «инвертированный промотор» относится к промотору, в котором последовательность нуклеиновой кислоты располагается в обратной ориентации так, что цепь, которая была смысловой, становится некодирующей цепью, и наоборот. Последовательности инвертированных промоторов могут применяться в различных вариантах реализации для регуляции состояния переключателя. Кроме того, согласно различным вариантам реализации промотор может применяться в сочетании с энхансером.
[00114] Промотор может представлять собой промотор, который в естественных условиях ассоциирован с геном или последовательностью, а также может быть получен путем выделения некодирующих 5'-последовательностей, расположенных в 5'-направлении относительно кодирующего сегмента и/или экзона определенного гена или последовательности. Такой промотор может быть назван «эндогенным». Аналогичным образом, согласно некоторым вариантам реализации, энхансер может быть представлен энхансером, который в естественных условиях ассоциирован с последовательностью нуклеиновой кислоты и расположен либо в 3', либо в 5'-направлении от указанной последовательности.
[00115] Согласно некоторым вариантам реализации кодирующий сегмент нуклеиновой кислоты расположен под контролем «рекомбинантного промотора» или «гетерологичного промотора», оба указанных термина относятся к промотору, который обычно не ассоциирован с кодируемой последовательностью нуклеиновой кислоты, с которой промотор функционально связан, в ее естественной среде. Рекомбинантный или гетерологичный энхансер относится к энхансеру, обычно не ассоциированному с конкретной последовательностью нуклеиновой кислоты в ее естественной среде. Такие промоторы или энхансеры могут включать промоторы или энхансеры других генов; промоторы или энхансеры, выделенные из любой другой прокариотической, вирусной или эукариотической клетки; и синтетические промоторы или энхансеры, которые не являются «природными», т.е. содержат различные элементы разных транскрипционных регуляторных областей и/или изменяющие экспрессию мутации, введенные с применением способов генетического конструирования, известных в данной области техники. Наряду с получением последовательностей нуклеиновых кислот промоторов и энхансеров синтетическим путем, последовательности промоторов могут быть получены с использованием рекомбинантного клонирования и/или технологии амплификации нуклеиновых кислот, включая ПЦР, применительно к синтетическим биологическим контурам и модулям, раскрытым в данном документе (см., например, патент США №4683202, патент США №5928906, каждый из которых включен в данный документ посредством ссылки). Кроме того, также предусмотрена возможность применения контрольных последовательностей, которые управляют транскрипцией и/или экспрессией последовательностей в неядерных органеллах, таких как митохондрии, хлоропласты и т.п.
[00116] Как описано в данном документе, «индуцируемый промотор» представляет собой промотор, который характеризуется инициацией или усилением транскрипционной активности в присутствии, под влиянием или при контакте с индуктором или индуцирующим агентом. «Индуктор» или «индуцирующий агент», как определено в данном документе, может быть эндогенным или обычно является экзогенным соединением или белком, которые вводят таким образом, чтобы обеспечить их активность по индукции транскрипционной активности индуцируемого промотора. Согласно некоторым вариантам реализации индуктор или индуцирующий агент, т.е. химическое вещество, соединение или белок, сам может быть получен в результате транскрипции или экспрессии последовательности нуклеиновой кислоты (т.е. индуктор может представлять собой индукторный белок, экспрессируемый другим компонентом или модулем), который сам может находиться под контролем индуцируемого промотора. Согласно некоторым вариантам реализации индуцируемый промотор индуцируется в отсутствие определенных агентов, таких как репрессор. Примеры индуцируемых промоторов включают, но не ограничиваются перечисленными, чувствительные к тетрациклину, металлотионину, экдизону промоторы, промоторы вирусов млекопитающих (например, поздний промотор аденовируса; и промотор длинного концевого повтора вируса опухоли молочной железы мышей (MMTV-LTR)) и другие чувствительные к стероидам промоторы, чувствительные к рапамицину промоторы и т.п.
[00117] Термины «регуляторные последовательности ДНК», «контрольные элементы» и «регуляторные элементы», используемые в данном документе взаимозаменяемо, относятся к транскрипционным и трансляционным контрольным последовательностям, таким как промоторы, энхансеры, сигналы полиаденилирования, терминаторы, сигналы разрушения белка и т.п., которые обеспечивают и/или регулируют транскрипцию некодирующей последовательности (например, нацеливающей на ДНК РНК) или кодирующей последовательности (например, сайт-направленного модифицирующего полипептида или полипептида Cas9/Csn1) и/или регулируют трансляцию кодируемого полипептида.
[00118] «Функционально связанный» относится к размещению в непосредственной близости, при котором описываемые так компоненты находятся во взаимосвязи, позволяющей им функционировать предусмотренным для них образом. Например, промотор функционально связан с кодирующей последовательностью, если указанный промотор влияет на ее транскрипцию или экспрессию. «Экспрессионная кассета» включает гетер о логичную последовательность ДНК, которая функционально связана с промотором или другой регуляторной последовательностью, достаточными для управления транскрипцией трансгена в зкДНК-векторе. Подходящие промоторы включают, например, тканеспецифические промоторы. Промоторы также могут происходить из ААВ.
[00119] В данном документе термин «субъект» относится к человеку или животному, которому предоставляют лечение, включая профилактическое лечение, с применением зкДНК-вектора в соответствии с настоящим изобретением. Обычно животное представляет собой позвоночное животное, такое как, но не ограничиваясь перечисленными, примат, грызун, домашнее животное или промысловое животное. Приматы включают, но не ограничиваются перечисленными, шимпанзе, яванских макак, коат и макак, например, макак-резусов. Грызуны включают мышей, крыс, сурков, хорьков, кроликов и хомяков. Домашние и промысловые животные включают, но не ограничиваются перечисленными, коров, лошадей, свиней, оленей, бизона, буйвола, виды кошачьих, например, домашнюю кошку, виды собачьих, например, собаку, лису, волка, виды птиц, например, курицу, эму, страуса, и рыб, например, форель, сома и лосося. В определенных вариантах реализации аспектов, описанных в данном документе, субъект представляет собой млекопитающее, например, примата или человека. Субъект может быть мужского или женского пола. Кроме того, субъект может быть младенцем или ребенком. Согласно некоторым вариантам реализации субъект может представлять собой новорожденного или нерожденного субъекта, например, субъекта in utero. Предпочтительно субъект представляет собой млекопитающее. Млекопитающее может представлять собой человека, не являющегося человеком примата, мышь, крысу, собаку, кошку, лошадь или корову, однако указанные примеры не являются ограничивающими. Млекопитающие, отличные от человека, могут быть предпочтительно использованы в качестве субъектов в моделях заболеваний и нарушений на животных. Кроме того, способы и композиции, описанные в данном документе, могут быть использованы для одомашненных животных и/или домашних животных. Человек-субъект может быть любого возраста, пола, расы или этнической группы, например, может быть европеоидом (белым), азиатом, африканцем, черным, афроамериканцем, афроевропейцем, испаноамериканцем, представителем ближневосточного этноса и т.д. Согласно некоторым вариантам реализации субъект может представлять собой пациента или другого субъекта в клинических условиях. Согласно некоторым вариантам реализации субъект уже проходит курс лечения. Согласно некоторым вариантам реализации субъект представляет собой эмбрион, плод, новорожденного, младенца, ребенка, подростка или взрослую особь. Согласно некоторым вариантам реализации субъект представляет собой плод человека, новорожденного человека, младенца-человека, ребенка-человека, подростка-человека или взрослого человека. Согласно некоторым вариантам реализации субъект представляет собой эмбрион животного или эмбрион, не принадлежащий человеку, или эмбрион примата, не являющегося человеком. Согласно некоторым вариантам реализации субъект представляет собой эмбрион человека.
[00120] В данном документе термин «клетка-хозяин» включает любой тип клеток, которые являются восприимчивыми к трансформации, трансфекции, трансдукции и т.п. с использованием конструкции нуклеиновой кислоты или зкДНК-вектора для экспрессии согласно настоящему изобретению. В качестве неограничивающих примеров, клетка-хозяин может представлять собой выделенную первичную клетку, плюрипотентные стволовые клетки, CD34+ клетки, индуцированные плюрипотентные стволовые клетки или любую из ряда иммортализованных клеточных линий (например, клетки HepG2). В качестве альтернативы, клетка-хозяин может представлять собой клетку in situ или in vivo в ткани, органе или организме.
[00121] Термин «экзогенный» относится к веществу, присутствующему в клетке, отличной от его природного источника. В данном документе термин «экзогенный» может относиться к нуклеиновой кислоте (например, нуклеиновой кислоте, кодирующей полипептид) или к полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обычно не обнаруживаются, и введение нуклеиновой кислоты или полипептида в такую клетку или организм является желательным. В качестве альтернативы, «экзогенный» может относиться к нуклеиновой кислоте или полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обнаруживаются в относительно низких количествах, и увеличение количества нуклеиновой кислоты или полипептида в клетке или организме является желательным, например, для получения эктопической экспрессии или уровней. В отличие от этого термин «эндогенный» относится к веществу, которое является нативным для биологической системы или клетки.
[00122] Термин «идентичность последовательности» относится к сродству между двумя нуклеотидными последовательностями. Для целей настоящего раскрытия степень идентичности последовательностей между двумя дезоксирибонуклеотидными последовательностями определяется с использованием алгоритма Нидлмана-Вунша (Needleman and Wunsch, 1970, выше), реализованного в программе Needle пакета EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et at, 2000, выше), предпочтительно, версии 3.0.0 или более поздней. Используемые необязательные параметры представляют собой штраф за открытие пропуска 10, штраф за продление пропуска 0,5 и матрицу замены EDNAFULL (версия EMBOSS NCBI NUC4.4). Выходной показатель Needle, называемый «наибольшей длиной идентичного фрагмента» (полученный с применением опции «-nobrief») используют в качестве процента идентичности и вычисляют следующим образом: (Идентичные дезоксирибонуклеотиды×100)/(Длина выравнивания - Общее число пропусков в выравнивании). Длина выравнивания составляет предпочтительно по меньшей мере 10 нуклеотидов, предпочтительно по меньшей мере 25 нуклеотидов, более предпочтительно по меньшей мере 50 нуклеотидов и наиболее предпочтительно по меньшей мере 100 нуклеотидов.
[00123] В данном документе термин «гомология» или «гомологичный» определяется как процент нуклеотидных остатков, которые идентичны нуклеотидным остаткам в соответствующей последовательности на хромосоме-мишени после выравнивания последовательностей и введения пробелов, при необходимости, для достижения максимального процента идентичности последовательностей. Выравнивание с целью определения процента гомологии нуклеотидной последовательности может быть достигнуто различными путями, известными в данной области техники, например, с применением общедоступного компьютерного программного обеспечения, такого как программное обеспечение BLAST, BLAST-2, ALIGN, ClustalW2 или Megalign (DNASTAR). Специалисты в данной области техники могут определить соответствующие параметры для выравнивания последовательностей, включая любые алгоритмы, необходимые для достижения максимального выравнивания по всей длине сравниваемых последовательностей. Согласно некоторым вариантам реализации последовательность нуклеиновой кислоты (например, последовательность ДНК), например, гомологичное плечо, считается «гомологичной», когда последовательность по меньшей мере на 70%, по меньшей мере на 75%, по меньшей мере на 80%, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98%, по меньшей мере на 99% или более идентична соответствующей нативной или неотредактированной последовательности нуклеиновой кислоты (например, геномной последовательности) клетки-хозяина.
[00124] В данном документе термин «гетерологичный» означает нуклеотидную или полипептидную последовательность, которая не обнаружена в нативной нуклеиновой кислоте или белке, соответственно. Гетерологичная последовательность нуклеиновой кислоты может быть связана с природной последовательностью нуклеиновой кислоты (или ее вариантом) (например, путем генетического конструирования) с получением химерной нуклеотидной последовательности, кодирующей химерный полипептид. Гетерологичная последовательность нуклеиновой кислоты может быть соединена с вариантом полипептида (например, путем генетического конструирования) с получением нуклеотидной последовательности, кодирующей слитый вариант полипептида.
[00125] «Вектор» или «экспрессионный вектор» представляет собой репликон, такой как плазмида, бакмида, фаг, вирус, вирион или космида, к которому может быть присоединен другой сегмент ДНК, т.е. «вставка», чтобы вызвать репликацию присоединенного сегмента в клетке. Вектор может представлять собой конструкцию нуклеиновой кислоты, разработанную для доставки в клетку-хозяина или для переноса между разными клетками-хозяевами. В данном документе вектор может быть вирусным или невирусным по происхождению и/или в конечной форме, однако для цели настоящего раскрытия «вектор» обычно относится к зкДНК-вектору в соответствии с использованием этого термина в данном документе. Термин «вектор» включает любой генетический элемент, который способен к репликации, когда он ассоциирован с надлежащими контрольными элементами, и который может переносить генные последовательности в клетки. Согласно некоторым вариантам реализации вектор может представлять собой экспрессионный вектор или рекомбинантный вектор.
[00126] В данном документе термин «экспрессионный вектор» относится к вектору, который управляет экспрессией РНК или полипептида с последовательностей, связанных с транскрипционными регуляторными последовательностями на векторе. Экспрессируемые последовательности часто, но не обязательно, будут гетер о логичными по отношению к клетке. Экспрессионный вектор может содержать дополнительные элементы, например, экспрессионный вектор может иметь две системы репликации, что позволяет поддерживать его в двух организмах, например, в клетках человека для экспрессии и в прокариотическом хозяине для клонирования и амплификации. Термин «экспрессия» относится к клеточным процессам, участвующим в продуцировании РНК и белков и, в соответствующих случаях, в секретировании белков, включая, где это применимо, но не ограничиваясь перечисленными, например, транскрипцию, процессинг транскрипта, трансляцию и укладку, модификацию и процессинг белка. «Продукты экспрессии» включают РНК, транскрибированную с гена, и полипептиды, полученные путем трансляции мРНК, транскрибированной с гена. Термин «ген» означает последовательность нуклеиновой кислоты, которая транскрибируется (ДНК) в РНК in vitro или in vivo, когда она функционально связана с соответствующими регуляторными последовательностями. Ген может включать, но не обязательно, области, предшествующие кодирующей области и следующие за ней, например, 5'-нетранслируемые (5'-UTR) или «лидерные» последовательности и 3'-UTR или «трейлерные» последовательности, а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).
[00127] Под «рекомбинантным вектором» подразумевается вектор, который включает гетерологичную последовательность нуклеиновой кислоты или «трансген», который способен к экспрессии in vivo. Следует понимать, что векторы, описанные в данном документе, в некоторых вариантах реализации, можно комбинировать с другими подходящими композициями и видами терапии. Согласно некоторым вариантам реализации вектор является эписомальным. Применение подходящего эписомального вектора обеспечивает средство поддержания представляющего интерес нуклеотида у субъекта в многокопийной внехромосомной ДНК, что устраняет потенциальные эффекты интеграции в хромосому.
[00128] В данном документе выражение «генетическое заболевание» относится к заболеванию, частично или полностью, прямо или опосредованно, вызванному одной или более аномалиями в геноме, в частности, к состоянию, присутствующему с момента рождения. Аномалия может представлять собой мутацию, вставку или делецию. Аномалия может влиять на кодирующую последовательность гена или его регуляторную последовательность. Генетическое заболевание может представлять собой, но не ограничивается перечисленными, мышечную дистрофию Дюшенна (МДД), гемофилию, муковисцидоз, хорею Хантингтона, семейную гиперхолестеринемию (дефект рецептора ЛПНП), гепатобластому, болезнь Вильсона, врожденную печеночную порфирию, наследственные нарушения метаболизма печени, синдром Леша-Нихана, серповидноклеточную анемию, талассемию, пигментную ксеродерму, анемию Фанкони, пигментный ретинит, атаксию-телеангиэктазию, синдром Блума, ретинобластому и болезнь Тея-Сакса.
[00129] В данном документе термин «ингибирующий полинуклеотид» относится к молекуле ДНК или РНК, которая уменьшает или предотвращает экспрессию (транскрипцию или трансляцию) второго (целевого) полинуклеотида. Ингибирующие полинуклеотиды включают антисмысловые полинуклеотиды, рибозимы и внешние направляющие последовательности. Термин «ингибирующий полинуклеотид» дополнительно включает молекулы ДНК и РНК, например, РНКи, которые кодируют существующие ингибирующие молекулы, такие как молекулы ДНК, которые кодируют рибозимы.
[00130] В данном документе «подавление гена» или «подавленный ген» в отношении активности молекулы РНКи, например, киРНК или миРНК, относится к снижению в клетке уровня мРНК гена-мишени.
[00131] В данном документе термин «РНКи» относится к любому типу интерферирующей РНК, включая, но не ограничиваясь перечисленными, киРНК, кшРНКи, эндогенную микроРНК и искусственную микроРНК. Например, он включает последовательности, ранее идентифицированные как киРНК, независимо от механизма последующего процессинга РНК (т.е., несмотря на то, что киРНК, как полагают, имеют специфичный способ процессинга in vivo, приводящий к расщеплению мРНК, такие последовательности могут быть включены в векторы между фланкирующими последовательностями, описанными в данном документе). Термин «РНКи» может включать как молекулы РНКи, подавляющие ген, так и эффекторные молекулы РНКи, которые активируют экспрессию гена.
[00132] В данном документе термин «содержащий» или «содержит» используется в отношении композиций, способов и их соответствующего компонента (компонентов), существенных для указанного способа или композиции, но допускающих включение не указанных элементов, будь то существенных или нет.
[00133] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие элементов, которые не влияют существенным образом на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации. Использование термина «содержащий» указывает на включение, а не на ограничение.
[00134] Термин «состоящий из» относится к композициям, способам и их соответствующим компонентам, описанным в данном документе, которые не включают никаких элементов, не перечисленных в указанном описании варианта реализации.
[00135] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие дополнительных элементов, которые не оказывают существенного влияния на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации настоящего изобретения.
[00136] В настоящем описании и прилагаемой формуле изобретения термины в единственном числе (соотв. «а», «an» и «the» в исходном тексте на английском языке) включают их эквиваленты во множественном числе, если иное явным образом не следует из контекста. Соответственно, например, ссылка на «способ» включает один или более способов и/или этапов типа, описанного в данном документе, и/или таких, которые будут понятны специалистам в данной области техники после прочтения настоящего раскрытия, и т.п. Аналогичным образом, предусмотрено, что термин «или» включает «и», если из контекста явным образом не следует иное. Несмотря на то, что при практической реализации или тестировании настоящего раскрытия могут применяться способы и материалы, сходные или эквивалентные тем, которые описаны в данном документе, ниже описаны подходящие способы и материалы. В данном документе «например» (сокращение «e.g.» в исходном тексте на английском языке, произошедшее от латинского выражения «exempli gratia») указывает на неограничивающий пример. Соответственно, «например» синонимично термину «к примеру».
[00137] Группы альтернативных элементов или вариантов реализации настоящего изобретения, раскрытых в данном документе, не должны рассматриваться как ограничения. На каждый член группы можно ссылаться и заявлять его индивидуально или в любой комбинации с другими членами группы или другими элементами, представленными в данном документе. Один или более членов группы могут быть включены или исключены из группы по соображениям удобства и/или патентоспособности. При любом таком включении или исключении в данном документе считается, что описание изобретения содержит группу, измененную таким образом, чтобы она удовлетворяла условию письменного описания всех групп Маркуша, используемых в прилагаемой формуле изобретения.
[00138] Согласно некоторым вариантам реализации любого из аспектов раскрытие, описанное в данном документе, не касается способа клонирования людей, способов модификации генетической идентичности зародышевой линии человека, вариантов применения эмбрионов человека в промышленных или коммерческих целях, или способов модификации генетической идентичности животных, которые могут причинить им страдания без какой-либо существенной медицинской пользы для человека или животного, а также животных, полученных с помощью таких способов.
[00139] Определения других терминов приведены в данном документе в описании различных аспектов настоящего изобретения.
[00140] Все патенты и другие публикации; включая литературные ссылки, выданные патенты, опубликованные заявки на патент и заявки на патент, находящиеся на рассмотрении одновременно с настоящей заявкой; упомянутые в настоящем описании, явным образом включены в данный документ посредством ссылки с целью описания и раскрытия, например, методологий, описанных в таких публикациях, которые могут быть использованы в связи с технологией, описанной в данном документе. Эти публикации представлены исключительно по причине их раскрытия до даты подачи настоящей заявки. Ничто в этом отношении не должно истолковываться как признание того, что авторы изобретения не обладают правами на более раннее изобретение по отношению к такому раскрытию в силу предшествующего изобретения или по любой другой причине. Все утверждения, касающиеся дат, или представления относительно содержания этих документов основаны на информации, доступной заявителям, и не являются допущением каким-либо образом признания правильности дат или содержания этих документов.
[00141] Описание вариантов реализации настоящего раскрытия не должно рассматриваться как исчерпывающее или ограничивающее настоящее изобретение точной раскрытой формой. Несмотря на то, что в данном документе в иллюстративных целях описаны конкретные варианты реализации и примеры раскрытия, возможны различные эквивалентные модификации в пределах объема раскрытия, как будет понятно специалистам в соответствующей области техники. Например, хотя этапы или функции способа представлены в указанном порядке, согласно альтернативным вариантам реализации функции могут выполняться в другом порядке, или функции могут выполняться по существу одновременно. Принципиальные положения настоящего раскрытия, предоставленные в данном документе, могут быть применены к другим процедурам или способам в зависимости от ситуации. Различные варианты реализации, описанные в данном документе, могут быть объединены для обеспечения дополнительных вариантов реализации. Аспекты настоящего раскрытия могут быть модифицированы, при необходимости, для применения композиций, функций и концепций вышеупомянутых ссылок и приложения для обеспечения дополнительных вариантов реализации настоящего раскрытия. Кроме того, из соображений биологической функциональной эквивалентности могут быть сделаны некоторые изменения в структуре белка, не влияющие на биологическое или химическое действие в качественном или количественном отношении. Эти и другие изменения могут быть выполнены в раскрытии в свете подробного описания. Все такие модификации предусмотрены, как включенные в объем прилагаемой формулы изобретения.
[00142] Конкретные элементы любого из вышеприведенных вариантов реализации могут быть объединены или заменены элементами других вариантов реализации. Кроме того, хотя преимущества, ассоциированные с некоторыми вариантами реализации настоящего раскрытия, были описаны в контексте этих вариантов реализации, другие варианты реализации также могут демонстрировать такие преимущества, и не все варианты реализации должны обязательно демонстрировать такие преимущества, чтобы попадать в объем раскрытия.
[00143] Описанная в данном документе технология дополнительно иллюстрируется следующими примерами, которые никоим образом не следует истолковывать как дополнительные ограничения. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения.
II. Экспрессия белка FVIII с зкДНК-вектора
[00144] Технология, описанная в данном документе, в целом направлена на экспрессию и/или продукцию белка FVIII в клетке с невирусного ДНК-вектора, например, зкДНК-вектора, описанного в данном документе. ЗкДНК-векторы для экспрессии белка FVIII описаны в данном документе в разделе, озаглавленном «зкДНК-векторы в целом». В частности, зкДНК-векторы для экспрессии белка FVIII содержат пару ITR (например, симметричных или асимметричных, как описано в данном документе), а между парой ITR нуклеиновую кислоту, кодирующую белок FVIII, как описано в данном документе, функционально связанную с промотором или регуляторной последовательностью. Отличительным преимуществом зкДНК-векторов для экспрессии белка FVIII по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже полноразмерный белок FVIII размером 6,8 тыс. п.о. может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы, описанные в данном документе, можно применять для экспрессии терапевтического белка FVIII у субъекта, нуждающегося в этом, например, субъекта, страдающего гемофилией А.
[00145] Как будет понятно, технологии зкДНК-векторов, описанные в данном документе, могут быть адаптированы к любому уровню сложности или могут применяться модульно, причем экспрессия различных компонентов белка FVIII может контролироваться независимо. Например, конкретно предусмотрено, что технологии зкДНК-векторов, разработанные в данном документе, могут быть простыми, как применение одного зкДНК-вектора для экспрессии одной гетерологичной генной последовательности (например, белка FVIII), или могут быть сложными, как применение нескольких зкДНК-векторов, когда каждый вектор экспрессирует несколько белков FVIII или ассоциированных кофакторов, или вспомогательных белков, каждый из которых независимо контролируется разными промоторами. Варианты реализации ниже конкретно предусмотрены в данном документе и могут быть адаптированы специалистом в данной области техники при необходимости.
[00146] Согласно одному варианту реализации один зкДНК-вектор можно применять для экспрессии одного компонента белка FVIII. В качестве альтернативы, один зкДНК-вектор можно применять для экспрессии нескольких компонентов (например, по меньшей мере 2) белка FVIII под контролем одного промотора (например, сильного промотора), необязательно с использованием последовательности (ей) IRES, чтобы обеспечить надлежащую экспрессию каждого из компонентов, например, кофакторов или вспомогательных белков.
[00147] В данном документе также предусмотрен, в другом варианте реализации, один зкДНК-вектор, содержащий по меньшей мере две вставки (например, экспрессирующие тяжелую цепь или легкую цепь), причем экспрессия каждой вставки находится под контролем ее собственного промотора. Промоторы могут включать несколько копий одного и того же промотора, несколько разных промоторов или любую их комбинацию. Специалист в данной области техники поймет, что желательной часто является экспрессия компонентов белка FVIII на разных уровнях экспрессии, что позволяет контролировать стехиометрию отдельных экспрессируемых компонентов для обеспечения эффективного укладывания и комбинирования белка FVIII в клетке.
[00148] Специалист в данной области техники может предусмотреть дополнительные варианты технологий зкДНК-векторов или адаптировать их из методов получения белка с использованием стандартных векторов.
А. Нуклеиновые кислоты
[00149] В данном документе предложена характеристика и разработка молекул нуклеиновых кислот для потенциального терапевтического применения. В соответствии с некоторыми вариантами реализации нуклеиновые кислоты для терапевтического применения кодируют белок FVIII. Согласно некоторым вариантам реализации в соответствующих случаях описана химическая модификация олигонуклеотидов с целью изменения и улучшения свойств in vivo (доставки, стабильности, времени жизни, укладки, специфичности в отношении мишени), а также их биологической функции и механизма, которые напрямую коррелируют с терапевтическим приложением.
[00150] Иллюстративные терапевтические нуклеиновые кислоты согласно настоящему раскрытию, которые могут быть иммуностимулирующими и требуют применения иммуносупрессоров, раскрытых в данном документе, могут включать, но не ограничиваются перечисленными, минигены, плазмиды, миникольца, короткую интерферирующую РНК (киРНК), микроРНК (миРНК), антисмысловые олигонуклеотиды (ASO), рибозимы, двухцепочечную ДНК с замкнутыми концами (например, зкДНК, CELiD, линейную ковалентно замкнутую ДНК («с минимальной цепью»), doggybone (dbDNA™), протеломерную ДНК с замкнутыми концами или гантелеобразную линейную ДНК), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК), мРНК, тРНК, рРНК и вирусные ДНК-векторы, вирусный РНК-вектор; и любую их комбинацию.
[00151] киРНК или миРНК, которые могут отрицательно регулировать внутриклеточные уровни конкретных белков посредством процесса, называемого РНК-интерференцией (РНКи), также предусмотрены настоящим изобретением в качестве терапевтических средств на основе нуклеиновых кислот. После введения киРНК или миРНК в цитоплазму клетки-хозяина указанные конструкции двухцепочечной РНК связываются с белком, называемым RISC. Комплекс RISC удаляет смысловую цепь киРНК или миРНК. Комплекс RISC в комбинации с комплементарной мРНК расщепляет мРНК и высвобождает разрезанные цепи. РНКи осуществляется путем индукции специфичного разрушения мРНК, что приводит к отрицательной регуляции соответствующего белка.
[00152] Антисмысловые олигонуклеотиды (ASO) и рибозимы, которые ингибируют трансляцию мРНК в белок, могут представлять собой терапевтические средства на основе нуклеиновых кислот. В случае антисмысловых конструкций указанные одноцепочечные дезоксинуклеиновые кислоты имеют последовательность, комплементарную последовательности мРНК целевого белка, и способны связываться с мРНК посредством спаривания оснований по Уотсону-Крику. Такое связывание предотвращает трансляцию целевой мРНК и/или запускает разрушение транскрипта мРНК РНКазой Н. В результате антисмысловой олигонуклеотид имеет повышенную специфичность действия (т.е. отрицательную регуляцию специфического белка, связанного с заболеванием).
[00153] Согласно любому из способов, предложенных в данном документе, терапевтическая нуклеиновая кислота может представлять собой терапевтическую РНК. Терапевтическая РНК может представлять собой ингибитор трансляции мРНК, агент РНК-интерференции (РНКи), каталитически активную молекулу РНК (рибозим), транспортную РНК (тРНК) или РНК, которая связывает транскрипт мРНК (ASO), белок или другой молекулярный лиганд (аптамер). Согласно любому из способов, предложенных в данном документе, агент РНКи может представлять собой двухцепочечную РНК, одноцепочечную РНК, микроРНК, короткую интерферирующую РНК, короткую шпилечную РНК или образующий триплекс олигонуклеотид.
[00154] В соответствии с некоторыми вариантами реализации терапевтическая нуклеиновая кислота представляет собой двухцепочечную ДНК с замкнутыми концами, например, зкДНК. В соответствии с некоторыми вариантами реализации экспрессия и/или продукция терапевтического белка в клетке происходит с невирусного ДНК-вектора, например, зкДНК-вектора. Отличительным преимуществом зкДНК-векторов для экспрессии терапевтического белка по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже большой терапевтический белок может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы можно применять для экспрессии терапевтического белка у субъекта, нуждающегося в этом.
[00155] В общем случае зкДНК-вектор для экспрессии терапевтического белка, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.
[00156] Согласно некоторым вариантам реализации трансген, кодирующий белок FVIII, также может кодировать секреторную последовательность так, что белок FVIII направляется в аппарат Гольджи и эндоплазматический ретикулум (ЭР), где будет происходить укладка белка FVIII в правильную конформацию молекулами-шаперонами при его прохождении через ЭР и высвобождении из клетки. Примерные секреторные последовательности включают, но не ограничиваются перечисленными, VH-02 (SEQ ID NO: 88) и VK-A26 (SEQ ID NO: 89) и сигнальную последовательность IgK (SEQ ID NO: 126), а также секреторный сигнал Glue, обеспечивающий секрецию меченого белка из цитозоля (SEQ ID NO: 188), секреторную последовательность TMD-ST, которая направляет меченый белок в аппарат Гольджи (SEQ ID NO: 189).
[00157] Регуляторные переключатели также можно использовать для точной настройки экспрессии белка FVIII так, что белок FVIII экспрессируется предусмотренным образом, включая, но не ограничиваясь этим, экспрессию белка FVIII на целевом уровне экспрессии или в целевом количестве, или, в качестве альтернативы, в присутствии или в отсутствие конкретного сигнала, включая событие клеточной передачи сигнала. Например, как описано в данном документе, экспрессия белка FVIII с зкДНК-вектора может быть включена или выключена при возникновении конкретного состояния, как описано в разделе данного документа, озаглавленном «Регуляторные переключатели».
[00158] Например, и только в целях иллюстрации, белки FVIII можно применять для выключения нежелательной реакции, такой как слишком высокий уровень продукции белка FVIII. Ген FVIII может содержать сигнальный пептидный маркер для доставки белка FVIII в целевую клетку. Однако в любой ситуации может быть желательно регулировать экспрессию белка FVIII. ЗкДНК-векторы легко приспосабливаются к использованию регуляторных переключателей.
[00159] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих белок FVIII. Таким образом, даже полноразмерный FVIII, а также необязательно любые кофакторы или вспомогательные белки могут быть экспрессированы с одного зкДНК-вектора. Кроме того, в зависимости от необходимой стехиометрии можно экспрессировать несколько сегментов одного и того же белка FVIII и можно использовать один и тот же или разные промоторы, а также можно использовать регуляторные переключатели для точной настройки экспрессии каждой области. Например, как показано в Примерах, можно применять зкДНК-вектор, который содержит двойную промоторную систему, так, что для каждого домена белка FVIII используется разный промотор. Применение зкДНК-плазмиды для получения белка FVIII может включать уникальную комбинацию промоторов для экспрессии доменов белка FVIII, что приводит к правильным соотношениям каждого домена для образования функционального белка FVIII. Соответственно, в некоторых вариантах реализации, зкДНК-вектор можно применять для экспрессии различных областей белка FVIII по отдельности (например, под контролем другого промотора).
[00160] Согласно другому варианту реализации белок FVIII, экспрессируемый с зкДНК-векторов, дополнительно содержит дополнительную функциональную возможность, такую как флуоресценция, ферментативная активность, сигнал секреции или активатор иммунных клеток.
[00161] Согласно некоторым вариантам реализации зкДНК, кодирующая белок FVIII, может дополнительно содержать линкерный домен, например. В данном документе «линкерный домен» относится к олиго- или полипептидной области от примерно 2 до 100 аминокислот в длину, которая связывает любые домены/области белка FVIII, описанного в данном документе. Согласно некоторым вариантам реализации линкеры могут включать или могут состоять из гибких остатков, таких как глицин и серии, так, что смежные белковые домены могут свободно перемещаться относительно друг друга. Более длинные линкеры могут использоваться, когда желательно гарантировать, что два смежных домена не будут стерически мешать друг другу. Линкеры могут быть расщепляемыми или нерасщепляемыми. Примеры расщепляемых линкеров включают линкеры 2А (например, Т2А), 2А-подобные линкеры или их функциональные эквиваленты и их комбинации. Линкер может представлять собой линкерную область Т2А, происходящую из вируса Thosea asigna.
[00162] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, FVIII и т.д., и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.
В. зкДНК-векторы, экспрессирующие белок FVIII
[00163] ЗкДНК-вектор для экспрессии белка FVIII, имеющий одну или более последовательностей, кодирующих целевой FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих белок FVIII.
[00164] Для достижения высокоэффективной и точной сборки белка FVIII в некоторых вариантах реализации конкретно предусмотрено, что белок FVIII содержит лидерную последовательность для эндоплазматического ретикулума (ЭР) для направления его в ЭР, где происходит укладка белка. Например, последовательность, которая направляет экспрессированный белок (белки) в ЭР для укладки.
[00165] Согласно некоторым вариантам реализации сигнал клеточной или внеклеточной локализации (например, секреторный сигнал, сигнал ядерной локализации, сигнал митохондриальной локализации и т.д.) содержится в зкДНК-векторе, чтобы направлять секрецию или целевую субклеточную локализацию FVIII так, что белок FVIII может связываться с внутриклеточной мишенью (мишенями) (например, внутри тела) или внеклеточной мишенью (мишенями).
[00166] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, обеспечивает сборку и экспрессию любого целевого белка FVIII модульным способом. В данном документе термин «модульный» относится к элементам в зкДНК-экспрессирующей плазмиде, которые можно легко удалить из конструкции. Например, модульные элементы в зкДНК-генерирующей плазмиде, содержат уникальные пары сайтов рестрикции, фланкирующие каждый элемент в конструкции, что обеспечивает исключительное манипулирование отдельными элементами (см., например, ФИГ. 1A-1G). Таким образом, платформа зкДНК-вектора может обеспечивать экспрессию и сборку любой целевой конфигурации белка FVIII. В данном документе в различных вариантах реализации предложены плазмидные зкДНК-векторы, которые могут уменьшить и/или минимизировать количество манипуляций, необходимых для сборки целевого зкДНК-вектора, кодирующего белок FVIII.
С. Примерные белки FVIII, экспрессируемые зкДНК-векторами
[00167] В частности, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать, например, но не ограничиваясь перечисленными, белки FVIII, а также их варианты и/или активные фрагменты для применения в лечении, профилактике и/или облегчении одного или более симптомов гемофилии А. В одном аспекте гемофилия А представляет собой гемофилию А человека.
(i) Терапевтические белки FVIII и их фрагменты
[00168] По существу любой вариант терапевтического белка FVIII или его фрагмента (например, функциональный фрагмент) может кодироваться и экспрессироваться с зкДНК-вектора, как описано в данном документе. Специалист в данной области техники поймет, что терапевтический белок FVIII включает все варианты сплайсинга и ортологи белка FVIII. Терапевтический белок FVIII включает интактные молекулы, а также их фрагменты (например, функциональные).
[00169] Фактор VIII
[00170] Фактор VIII представляет собой неферментный кофактор активированного фактора свертывания крови IX (FIXa), который при протеолитической активации взаимодействует с FLXa с образованием прочного нековалентного комплекса, который связывается с фактором X (FX) и активирует его.
[00171] Ген или белок фактора VIII также может называться F8, фактор коагуляции VIII, прокоагулянтный компонент, антигемофильный фактор, F8C, AHF, DXS1253E, FVIII, НЕМА или F8B. Экспрессия гена фактора VIII тканеспецифична и в основном наблюдается в клетках печени. Самый высокий уровень мРНК и белков фактора VIII детектировался в синусоидных клетках печени; значительные количества фактора VIII также присутствуют в гепатоцитах и клетках Купфера (резидентные макрофаги синусоидов печени). Умеренные уровни белка фактора VIII детектируются в сыворотке и плазме. Белок фактора VIII экспрессируется на низких и умеренных уровнях в фетальном головном мозге, сетчатке, почке и семеннике.
[00172] мРНК фактора VIII экспрессируется во многих тканях организма, включая костный мозг, цельную кровь, лейкоциты, лимфатические узлы, тимус, головной мозг, кору головного мозга, мозжечок, сетчатку, спинной мозг, большеберцовый нерв, сердце, артерию, гладкую мышцу, скелетную мышцу, тонкий кишечник, толстую кишку, адипоциты, почку, печень, легкое, селезенку, желудок, пищевод, мочевой пузырь, поджелудочную железу, щитовидную железу, слюнную железу, надпочечник, гипофиз, молочную железу, кожу, яичник, матку, плаценту, простату и семенник. Ген FVIII, локализованный на длинном плече Х-хромосомы, занимает область длиной приблизительно 186 тыс. п.о. и состоит из 26 экзонов (69-3106 п.о.) и интронов (от 207 п.о. до 32,4 тыс. п.о.). Общая длина кодирующей последовательности этого гена составляет 9 тыс. п.о.
[00173] Зрелый полипептид фактора VIII содержит структурные домены А1-А2-В-А3-С1-С2. Три кислых субдомена, которые обозначаются a1-a3-A1(a1)-A2(a2)-B-(a3)A3-C1-C2, локализуются на границах доменов А и играют важную роль во взаимодействии между FVIII и другими белками (в частности, с тромбином). Мутации в этих субдоменах снижают уровень активации фактора VIII тромбином.
[00174] Белок фактора VIII (изоформа фактора коагуляции VIII) представляет собой препробелок [Homo sapiens]; номер доступа: NP_000123.1 (2351 амк.) и имеет следующую последовательность:
[00176] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, несколько полноразмерных терапевтических белков FVIII могут быть экспрессированы с одного зкДНК-вектора.
[00177] Экспрессия терапевтического белка FVIII или его фрагмента с зкДНК-вектора может быть достигнута как в пространстве, так и во времени с использованием одного или более индуцируемых или репрессируемых промоторов, известных в данной области техники или описанных в данном документе, включая регуляторные переключатели, описанные в данном документе.
[00178] Согласно одному варианту реализации терапевтический белок FVIII представляет собой «вариант терапевтического белка», который относится к терапевтическому белку FVIII, имеющему измененную аминокислотную последовательность, композицию или структуру по сравнению с соответствующим нативным терапевтическим белком FVIII. Согласно одному варианту реализации FVIII представляет собой функциональный вариант (например, дикий тип). Подходящей также может быть экспрессия мутантного варианта белка FVIII, такого как точечная мутация или делеционная мутация, которая приводит к гемофилии А, например, для создания модели заболевания на животных и/или для оценки лекарственных средств для лечения гемофилии А. Доставка мутантных или модифицированных белков FVIII в модельную систему на основе клеток или на животных может быть выполнена для создания модели заболевания. Такую модель на основе клеток или на животных можно использовать для исследований и/или скрининга лекарственных средств. Терапевтический белок FVIII, экспрессируемый с зкДНК-векторов, может дополнительно содержать последовательность/фрагмент, который придает дополнительную функциональность, такую как флуоресценция, ферментативная активность или сигнал секреции. Согласно одному варианту реализации вариант терапевтического белка FVIII содержит ненативную последовательность метки для идентификации (например, иммунную метку), которая позволяет отличить его от эндогенного терапевтического белка FVIII в реципиентной клетке-хозяине.
[00179] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, терапевтического белка FVIII, и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.
[00180] Согласно одному варианту реализации последовательность, кодирующая терапевтический белок FVIII, может быть получена из существующей клетки-хозяина или линии клеток, например, путем обратной транскрипции мРНК, полученной от хозяина, и амплификации последовательности с использованием ПЦР.
(ii) ЗкДНК-векторы, экспрессирующие терапевтический белок FVIII
[00181] ЗкДНК-вектор, имеющий одну или более последовательностей, кодирующих целевой терапевтический белок FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих терапевтический белок FVIII или его функциональный фрагмент.Примерные кассетные вставки для получения зкДНК-векторов, кодирующих терапевтические белки FVIII, отображены на Фигурах 1A-1G. Согласно одному варианту реализации зкДНК-вектор содержит последовательность FVIII, перечисленную в Таблице 1 в данном документе.
(iii) Терапевтические белки FVIII и варианты их применения для лечения гемофилии А
[00182] ЗкДНК-векторы, описанные в данном документе, можно применять для доставки терапевтических белков FVIII для лечения гемофилии А, ассоциированной с нефизиологической экспрессией белка FVIII и/или мутациями в белках FVIII.
[00183] ЗкДНК-векторы, описанные в данном документе, можно применять для экспрессии любого целевого терапевтического белка FVIII. Примерные терапевтические белки FVIII включают, но не ограничиваются им, любой белок FVIII, экспрессируемый последовательностями, педставленными в Таблице 1 в данном документе.
[00184] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII является функциональным для лечения гемофилии А. Согласно некоторым вариантам реализации терапевтический белок FVIII не вызывает реакции иммунной системы.
[00185] Согласно другому варианту реализации зкДНК-векторы, кодирующие терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), можно применять для получения химерного белка. Таким образом, в данном документе конкретно предусмотрено, что зкДНК-вектор, экспрессирующий химерный белок, можно вводить, например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников. Согласно некоторым вариантам реализации, когда зкДНК-вектор, экспрессирующий FVIII, вводят младенцу или вводят субъекту in utero, зкДНК-вектор, экспрессирующий FVIII, можно вводить в любую одну или более тканей, выбранных из: печени, надпочечников, сердца, кишечника, легкого и желудка, или в стволовую клетку-предшественника клеток печени для лечения гемофилии A in vivo или ex vivo.
[00186] Гемофилия:
[00187] Гемофилия А представляет собой генетический дефицит фактора свертывания крови VIII, который вызывает повышенное кровотечение и обычно поражает мужчин. В большинстве случаев он наследуется как Х-сцепленный рецессивный признак, хотя имеются случаи, которые возникают в результате спонтанных мутаций. В отношении симптомов гемофилии А различают эпизоды внутреннего или внешнего кровотечения. Индивидуумы с более тяжелой формой гемофилии страдают более тяжелыми и более частыми кровотечениями, в то время как другие с легкой формой гемофилии, как правило, имеют более незначительные симптомы, за исключением случаев хирургического вмешательства или серьезной травмы. Больные с гемофилией умеренной степени тяжести имеют различные симптомы, которые проявляются в диапазоне от тяжелой до легкой форм.
[00188] Современные способы лечения для предотвращения кровотечений у людей, страдающих гемофилией А, включают лекарственный препарат фактора VIII. Большинство индивидуумов с тяжелой формой гемофилии нуждаются в регулярном введении внутривенного рекомбинантного фактора VIII или его плазматического концентрата. Рекомбинантный фактор свертывания крови VIII является одним из наиболее сложных белков для промышленного изготовления из-за низкой эффективности транскрипции его гена, значительной внутриклеточной потери его пробелка во время посттрансляционного процессинга и нестабильности секретируемого белка. Больные с легкой формой гемофилии могут контролировать свое состояние с помощью десмопрессина, лекарственного средства, которое высвобождает из стенок кровеносных сосудов фактор VIII, хранящийся в них.
[00189] Существует много осложнений, связанных с лечением гемофилии А. У детей можно ввести легкодоступный внутривенный порт, чтобы свести к минимуму частую травматическую внутривенную канюляцию. Однако эти порты ассоциированы с высокой частотой инфицирования и риском образования сгустков на кончике катетера, что делает его бесполезным. Вирусные инфекции могут быть распространены у больных гемофилией из-за частых переливаний крови, которые подвергают пациентов риску заражения инфекциями, передаваемыми через кровь, такими как ВИЧ, гепатит В и гепатит С.Прионные инфекции также могут передаваться при переливаниях крови. Еще одно терапевтическое осложнение гемофилии А представляет собой выработку ингибирующих антител к фактору VIII из-за частых инфузий. Они вырабатываются, когда организм распознает введенный путем инфузий фактор VIII как чужеродный, поскольку организм не продуцирует свою собственную копию. У таких индивидуумов активированный фактор VII, предшественник фактора VIII в коагуляционном каскаде, может быть введен путем инфузий для лечения кровоизлияния у индивидуумов с гемофилией и антителами к замещающему фактору VIII.
[00190] Коагуляционный каскад
[00191] Коагуляция, также известная как свертывание, представляет собой процесс, при котором кровь превращается из жидкости в гель, образуя сгусток крови. Это потенциально приводит к гемостазу, прекращению кровопотери из поврежденного сосуда с последующим восстановлением. Механизм коагуляции включает активацию, адгезию и агрегацию тромбоцитов наряду с отложением и созреванием фибрина. Нарушения коагуляции представляют собой патологические состояния, которые могут привести к кровотечению (кровоизлиянию или синяку) или обструктивному свертыванию (тромбозу).
[00192] Коагуляция начинается почти мгновенно после того, как повреждение кровеносного сосуда повредило эндотелий, выстилающий кровеносный сосуд. Воздействие крови на субэндотелиальное пространство инициирует два процесса: изменения в тромбоцитах и воздействие субэндотелиального тканевого фактора на плазматический фактор VII, что в конечном итоге приводит к образованию фибрина. Тромбоциты немедленно образуют пробку в месте повреждения; это называется первичным гемостазом. Одновременно происходит вторичный гемостаз: дополнительные факторы коагуляции или факторы свертывания, помимо фактора VII (включая фактор VIII), отвечают сложным каскадом с образованием нитей фибрина, которые укрепляют тромбоцитарную пробку.
[00193] Коагуляционный каскад вторичного гемостаза имеет два исходных пути, которые приводят к образованию фибрина. Они включают путь контактной активации (также известный как внутренний путь) и путь тканевого фактора (также известный как внешний путь), которые оба приводят к одним и тем же фундаментальным реакциям, которые продуцируют фибрин. Первичный путь инициации коагуляции крови представляет собой путь тканевого фактора (внешний). Пути представляют собой ряд реакций, в которых зимоген (неактивный предшественник фермента) сериновой протеазы и ее гликопротеиновый кофактор активируются, чтобы стать активными компонентами, которые затем катализируют следующую реакцию в каскаде, что в конечном итоге приводит к образованию перекрестно-сшитого фибрина. Факторы коагуляции обычно обозначаются римскими цифрами с добавленной строчной буквой «а», указывающей на активную форму.
[00194] Факторы коагуляции обычно представляют собой сериновые протеазы (ферменты), которые действуют путем расщепления нисходящих белков. Исключение составляют тканевой фактор, FV, FVIII, FXIII. Тканевый фактор, FV и FVIII представляют собой гликопротеины, а фактор XIII представляет собой трансглутаминазу. Факторы коагуляции циркулируют в виде неактивных зимогенов. Таким образом, коагуляционный каскад классически делится на три пути. Путь тканевого фактора и путь контактной активации оба активируют «конечный общий путь» фактора X, тромбина и фибрина.
[00195] Основная роль пути тканевого фактора (внешнего) заключается в создании «тромбинового взрыва», процесса, с помощью которого происходит быстрое высвобождение тромбина, наиболее важного компонента коагуляционного каскада с точки зрения его функций активации обратной связи. FVIIa циркулирует в большем количестве, чем любой другой активированный фактор коагуляции. Процесс включает следующие этапы:
[00196] Этап 1: После повреждения кровеносного сосуда FVII покидает кровоток и вступает в контакт с тканевым фактором (TF), экспрессируемым на клетках, несущих тканевой фактор (стромальные фибробласты и лейкоциты), с образованием активированного комплекса (TF-FVIIa).
[00197] Этап 2: TF-FVIIa активирует FIX и FX.
[00198] Этап 3: Сам FVII активируется тромбином, FXIa, FXII и FXa.
[00199] Этап 4: Активация FX (с образованием FXa) TF-FVIIa почти сразу ингибируется ингибитором пути тканевого фактора (TFPI).
[00200] Этап 5: FXa и его кофактор FVa образуют протромбиназный комплекс, который активирует протромбин в тромбин.
[00201] Этап 6: Затем тромбин активирует другие компоненты коагуляционного каскада, включая FV и FVIII (который образует комплекс с FIX), а также активирует и высвобождает FVIII из комплекса с фактором фон Виллебранда (vWF).
[00202] Этап 7: FVIIIa представляет собой кофактор FIXa, и вместе они образуют «теназный» комплекс, который активирует FX; и таким образом цикл продолжается.
[00203] Путь контактной активации (внутренний) начинается с образования первичного комплекса высокомолекулярного кининогена (HMWK), прекалликреина и FXII (фактора Хагемана) на коллагене. Прекалликреин превращается в калликреин, a FXII становится FXIIa. FXIIa превращает FXI в FXIa. Фактор Х1а активирует FIX, который со своим кофактором FVIIIa образует теназный комплекс, который активирует FX в FXa. Незначительную роль, которую играет путь контактной активации в инициировании образования сгустка, можно проиллюстрировать тем фактом, что пациенты с тяжелым дефицитом FXII, HMWK и прекалликреина не имеют нарушения гемостаза. Вместо этого система контактной активации в большей степени вовлечена в воспаление и врожденный иммунитет.
[00204] Конечный общий путь, который является общим для внутреннего и внешнего путей коагуляции, включает превращение протромбина в тромбин и фибриногена в фибрин. Тромбин выполняет множество функций, помимо превращения фибриногена в фибрин, строительный блок гемостатической пробки. Кроме того, он является наиболее важным активатором тромбоцитов, и помимо этого он активирует факторы VIII и V и их ингибитор, белок С (в присутствии тромбомодулина), а также активирует фактор XIII, который образует ковалентные связи, которые перекрестно сшивают полимеры фибрина, которые образуются из активированных мономеров.
[00205] После активации посредством путей контактного фактора или тканевого фактора коагуляционный каскад поддерживается в протромботическом состоянии за счет продолжающейся активации FVIII и FIX с образованием теназного комплекса, пока он не будет подавлен антикоагулянтными путями. Способы включают введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к количеству введенной композиции зкДНК, которое приводит к экспрессии белка в «терапевтически эффективном количестве» для лечения заболевания или нарушения.
[00206] Диапазоны дозировок для композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), зависят от эффективности (например, эффективности промотора) и включают количества, достаточно большие для получения целевого эффекта, например, экспрессии целевого терапевтического белка FVIII для лечения фенилкетонурии (гемофилии А). Дозировка не должна быть настолько большой, чтобы вызывать неприемлемые нежелательные побочные эффекты. Обычно дозировка будет варьироваться в зависимости от конкретных характеристик зкДНК-вектора, эффективности экспрессии, а также в зависимости от возраста, состояния и пола пациента. Дозировка может быть определена специалистом в данной области техники и, в отличие от обычных ААВ-векторов, также может быть скорректирована индивидуальным врачом в случае любого осложнения, поскольку зкДНК-векторы не содержат активирующие иммунную систему капсидные белки, которые препятствуют повторному дозированию.
[00207] Введение композиций зкДНК, описанных в данном документе, можно повторять в течение ограниченного периода времени. Согласно некоторым вариантам реализации дозы вводят периодически или с помощью импульсного введения. Согласно предпочтительному варианту реализации указанные выше дозы вводят в течение нескольких месяцев. Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Также предусмотрены «бустерные» обработки с течением времени. Кроме того, уровень экспрессии можно титровать по мере роста субъекта.
[00208] Терапевтический белок FVIII может быть экспрессирован у субъекта в течение по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Долговременная экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы.
[00209] В данном документе термин «терапевтически эффективное количество» представляет собой количество экспрессированного терапевтического белка FVIII или его функционального фрагмента, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера заболевания или уменьшения конкретного симптома заболевания (см. «Измерение эффективности» ниже). Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК.
[00210] Точные количества зкДНК-вектора, необходимые для введения, зависят от суждения практикующего врача и являются индивидуальными для каждого индивидуума. Подходящие схемы введения также являются вариабельными, но типичным является начальное введение с последующими повторными дозами с одним или более интервалами с последующей инъекцией или другим введением. В качестве альтернативы, предусмотрена непрерывная внутривенная инфузия, достаточная для поддержания концентраций в крови в диапазонах, указанных для видов терапии in vivo, в частности, для лечения острых заболеваний/нарушений.
[00211] Агенты, которые можно применять в способах и композициях, описанных в данном документе, можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, внутримышечно, подкожно, внутрь полости, а также они могут быть доставлены с помощью перистальтических средств, при необходимости, или других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно. Он также может быть введен in utero.
[00212] Эффективность данного лечения гемофилии А может быть определена квалифицированным врачом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы заболевания или нарушения изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим FVIII или его функциональный фрагмент. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации заболевания или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование заболевания, например, прекращение или замедление прогрессирования заболевания или нарушения; или (2) облегчение заболевания, например, вызывающее регресс симптомов; и (3) предотвращение или снижение вероятности развития заболевания, или предотвращение вторичных заболеваний/нарушений, ассоциированных с указанным заболеванием, таких как печеночная или почечная недостаточность. Эффективное количество для лечения заболевания означает такое количество, которое, при введении нуждающемуся в этом млекопитающему, является достаточным для обеспечения эффективного лечения, в соответствии с определением этого термина в данном документе, этого заболевания.
[00213] Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для гемофилии А. Стандартные методы анализа показателей гемофилии А известны в данной области техники.
[00214] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также может кодировать кофакторы или другие полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, киРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)), которые можно применять в сочетании с белком FVIII, экспрессируемым с зкДНК. Кроме того, экспрессионные кассеты, содержащие последовательность, кодирующую белок FVIII, также могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как р-лактамаза, р-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.
[00215] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты для экспрессии белка FVIII, который является функциональным для лечения гемофилии А. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.
III. ЗкДНК-вектор в целом для применения в получении терапевтических белков FVIII
[00216] Варианты реализации настоящего изобретения основаны на способах и композициях, содержащих линейные дуплексные векторы с замкнутыми концами (зкДНК), которые могут экспрессировать трансген FVIII. Согласно некоторым вариантам реализации трансген представляет собой последовательность, кодирующую белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, не ограничены размером, что обеспечивает, например, экспрессию всех компонентов, необходимых для экспрессии трансгена, с одного вектора. ЗкДНК-вектор для экспрессии белка FVIII предпочтительно является дуплексным, например, самокомплементарным, по меньшей мере в части молекулы, такой как экспрессионная кассета (например, зкДНК не является двухцепочечной кольцевой молекулой). ЗкДНК-вектор имеет ковалентно замкнутые концы и, таким образом, устойчив к расщеплению экзонуклеазой (например, экзонуклеазой I или экзонуклеазой III), например, более часа при 37°С.
[00217] В общем случае зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.
[00218] В данный документ включены способы и композиции, содержащие зкДНК-вектор для продукции белка FVIII, которые могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц. В данном документе раскрыты неограничивающие примерные системы на основе липосомных наночастиц, предусмотренные для применения. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК-вектором, полученным указанным способом, раскрыт в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая полностью включена в данный документ.
[00219] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, не имеют ограничений по упаковке, налагаемых ограниченным пространством внутри вирусного капсида. ЗкДНК-векторы представляют собой жизнеспособную продуцируемую эукариотами альтернативу плазмидным ДНК-векторам, продуцируемым прокариотами, в отличие от инкапсулированных геномов ААВ. Это позволяет вставлять контрольные элементы, например, регуляторные переключатели, раскрытые в данном документе, большие трансгены, множественные трансгены и т.д.
[00220] ФИГ. 1А-1Е схематически показывают неограничивающие примерные зкДНК-векторы для экспрессии белка FVIII или соответствующую последовательность зкДНК-плазмид. ЗкДНК-векторы для экспрессии белка FVIII являются бескапсидными и могут быть получены из плазмиды, кодирующей в указанном порядке: первый ITR, экспрессионную кассету, содержащую трансген, и второй ITR. Экспрессионная кассета может включать одну или более регуляторных последовательностей, которые обеспечивают и/или контролируют экспрессию трансгена, например, экспрессионная кассета может содержать один или более из следующих элементов в указанном порядке: энхансер/промотор, ORF репортера (трансгена), посттранскрипционный регуляторный элемент (например, WPRE) и сигнал полиаденилирования и терминации (например, BGH поли(А)).
[00221] Экспрессионная кассета также может содержать участок внутренней посадки рибосомы (IRES) и/или элемент 2А. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторный переключатель, которые описаны в данном документе в разделе, озаглавленном «Регуляторные переключатели», для контроля и регуляции экспрессии белка FVIII, и могут включать, при необходимости, регуляторный переключатель, который представляет собой «аварийный выключатель» (kill switch) для обеспечения контролируемой гибели клетки, содержащей зкДНК-вектор.
[00222] Экспрессионная кассета может содержать более 4000 нуклеотидов, 5000 нуклеотидов, 10000 нуклеотидов или 20000 нуклеотидов, или 30000 нуклеотидов, или 40000 нуклеотидов, или 50000 нуклеотидов, или любой диапазон примерно от 4000 до 10000 нуклеотидов, или 10000-50000 нуклеотидов, или более 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 75000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 1000 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 5000 нуклеотидов. Векторы зкДНК не имеют ограничений по размеру ААВ-векторов, заключенных в капсид, что позволяет доставлять экспрессионную кассету большого размера для обеспечения эффективной экспрессии трансгена. Согласно некоторым вариантам реализации зкДНК-вектор лишен специфического для прокариот метилирования.
[00223] ЗкДНК-экспрессионная кассета может включать, например, экспрессируемую экзогенную последовательность (например, открытую рамку считывания) или трансген, который кодирует белок, который либо отсутствует, либо не активен, либо обладает недостаточной активностью у субъекта-реципиента, или ген, который кодирует белок, имеющий целевой биологический или терапевтический эффект. Трансген может кодировать продукт гена, функция которого может заключаться в корректировке экспрессии дефектного гена или транскрипта. В принципе, экспрессионная кассета может включать любой ген, который кодирует белок, полипептид или РНК, который либо снижен, либо отсутствует из-за мутации, или который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего раскрытия.
[00224] Экспрессионная кассета может содержать любой трансген (например, кодирующий белок FVIII), например, белок FVIII, который можно применять для лечения гемофилии А у субъекта, то есть терапевтический белок FVIII. ЗкДНК-вектор можно применять для доставки и экспрессии любого белка FVIII, представляющего интерес, у субъекта, по отдельности или в комбинации с нуклеиновыми кислотами, кодирующими полипептиды, или некодирующими нуклеиновыми кислотами (например, РНКи, miR и т.д.), а также экзогенных генов и нуклеотидных последовательностей, включая вирусные последовательности, в геноме субъектов, например, последовательности вируса ВИЧ и тому подобное. Предпочтительно зкДНК-вектор, раскрытый в данном документе, применяют для терапевтических целей (например, для медицинских, диагностических или ветеринарных целей) или для иммуногенных полипептидов. Согласно определенным вариантам реализации зкДНК-вектор можно применять для экспрессии любого гена, представляющего интерес, у субъекта, который включает один или более полипептидов, пептидов, рибозимов, пептидных нуклеиновых кислот, миРНК, РНКи, антисмысловых олигонуклеотидов, антисмысловых полинуклеотидов или РНК (кодирующих или некодирующих; например, киРНК, кшРНК, микро-РНК и их антисмысловых аналогов (например, antagoMiR)), антител, слитых белков или любую их комбинацию.
[00225] Экспрессионная кассета также может кодировать полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, миРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)). Экспрессионные кассеты могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как β-лактамаза, β-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.
[00226] Последовательности, обеспеченные в экспрессионной кассете, экспрессионная конструкция зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут быть оптимизированы по кодонам для целевой клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека, путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Херндон, Виржиния, 20171) или другой общедоступной базы данных. Согласно некоторым вариантам реализации нуклеиновая кислота, кодирующая белок FVIII, оптимизирована для экспрессии у человека и/или представляет собой FVIII человека или его функциональный фрагмент, как известно в данной области техники.
[00227] Трансген, экспрессируемый зкДНК-вектором для экспрессии белка FVIII, как описано в данном документе, кодирует белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII отличаются от экспрессионных векторов на основе плазмид по многим структурным признакам. ЗкДНК-векторы могут обладать одним или более из следующих признаков: отсутствие исходной (т.е. не вставленной) бактериальной ДНК, отсутствие прокариотической точки начала репликации, самодостаточность, т.е. им не требуются никакие последовательности, кроме двух ITR, включая сайт связывания Rep и сайт концевого разрешения (RBS и TRS), и экзогенную последовательность между ITR, присутствие последовательностей ITR, которые образуют шпильки, и отсутствие метилирования ДНК бактериального типа или фактически любого другого метилирования, которое считается аномальным у млекопитающего-хозяина. В целом векторы согласно настоящему изобретению предпочтительно не содержат никакой прокариотической ДНК, но предусмотрено, что некоторая прокариотическая ДНК может быть вставлена в виде экзогенной последовательности, в качестве неограничивающего примера, в промоторной или энхансерной области. Еще один важный признак, отличающий зкДНК-векторы от экспрессионных векторов на основе плазмид, заключается в том, что зкДНК-векторы представляют собой одноцепочечные линейные ДНК с замкнутыми концами, в то время как плазмиды всегда представляют собой двухцепочечные ДНК.
[00228] ЗкДНК-векторы для экспрессии белка FVIII, продуцируемые с помощью способов, предложенных в данном документе, предпочтительно имеют линейную и непрерывную структуру, а не прерывистую структуру, согласно определению с помощью анализа с использованием расщепления рестрикционными ферментами (ФИГ. 4D). Как полагают, линейная и непрерывная структура более устойчива к атаке клеточными эндонуклеазами, а также с меньшей вероятностью рекомбинируется и вызывает мутагенез. Таким образом, зкДНК-вектор в виде линейной и непрерывной структуры является предпочтительным вариантом реализации. Непрерывный, линейный, одноцепочечный, с внутримолекулярным дуплексом зкДНК-вектор может иметь ковалентно связанные концевые участки без последовательностей, кодирующих белки капсида ААВ. Эти зкДНК-векторы структурно отличаются от плазмид (включая зкДНК-плазмиды, описанные в данном документе), которые представляют собой кольцевые дуплексные молекулы нуклеиновых кислот бактериального происхождения. Комплементарные цепи плазмид могут быть разделены после денатурации с получением двух молекул нуклеиновых кислот, в то время как зкДНК-векторы, которые имеют комплементарные цепи, представляют собой единую молекулу ДНК и, следовательно, остаются единой молекулой даже после денатурации. Согласно некоторым вариантам реализации зкДНК-векторы, описанные в данном документе, могут быть получены без метилирования оснований ДНК прокариотического типа, в отличие от плазмид. Таким образом, зкДНК-векторы и зкДНК-плазмиды различаются как по структуре (в частности, линейная в сопоставлении с кольцевой), так и с точки зрения методов, используемых для получения и очистки этих различных объектов (см. ниже), а также с точки зрения метилирования ДНК, которое относится к прокариотическому типу для зкДНК-плазмид и эукариотическому типу для зкДНК-вектора.
[00229] Существует несколько преимуществ применения зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, по сравнению с экспрессионными векторами на основе плазмид, такие преимущества включают, но не ограничиваются перечисленными: 1) плазмиды содержат последовательности бактериальной ДНК и подвергаются метилированию, специфическому для прокариотов, например, метилированию 6-метиладенозина и 5-метилцитозина, в то время как последовательности бескапсидного ААВ-вектора имеют эукариотическое происхождение и не подвергаются метилированию, специфическому для прокариотов; в результате бескапсидные ААВ-векторы с меньшей вероятностью индуцируют воспалительные и иммунные ответы по сравнению с плазмидами; 2) в то время как плазмиды требуют присутствия гена устойчивости во время производственного способа, зкДНК-векторы не требуют; 3) в то время как кольцевая плазмида не доставляется в ядро при введении в клетку и требует чрезмерной нагрузки, чтобы преодолеть разрушение клеточными нуклеазами, зкДНК-векторы содержат вирусные цис-элементы, т.е. ITR, которые придают устойчивость к нуклеазам и могут быть сконструированы для нацеливания и доставки в ядро. Предполагается, что минимальными определяющими элементами, необходимыми для функции ITR, являются сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTTGG-3' (SEQ ID NO: 64) для AAB2) плюс вариабельная палиндромная последовательность, обеспечивающая образование шпильки; и 4) зкДНК-векторы не имеют избыточной представленности динуклеотидов CpG, часто обнаруживаемых в плазмидах прокариотического происхождения, которые, как сообщается, связывают члена Toll-подобного семейства рецепторов, вызывая опосредуемый Т-клетками иммунный ответ. Напротив, трансдукция бескапсидными ААВ-векторами, описанными в данном документе, может быть эффективно нацелена на типы клеток и тканей, которые трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки. IV. Инвертированные концевые повторы (ITR)
[00230] Как раскрыто в данном документе, зкДНК-векторы для экспрессии белка FVIII содержат трансген или гетерологичную последовательность нуклеиновой кислоты, расположенные между двумя последовательностями инвертированных концевых повторов (ITR), причем указанные последовательности ITR могут представлять собой пару асимметричных ITR или пару симметричных или по существу симметричных ITR, в соответствии с определением этих терминов в данном документе. ЗкДНК-вектор, раскрытый в данном документе, может содержать последовательности ITR, которые выбраны из любых из: (i) по меньшей мере одного WT ITR и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию, при этом указанные способы согласно настоящему раскрытию могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц.
[00231] Согласно некоторым вариантам реализации последовательность ITR может происходить из вирусов семейства Parvoviridae, которое включает два подсемейства: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих насекомых. Подсемейство Parvovirinae (называемое парвовирусами) включает род Dependovirus, члены которого, в большинстве условий, нуждаются в коинфекции вспомогательным вирусом, таким как аденовирус или вирус герпеса, для эффективной инфекции. Род Dependovirus включает аденоассоциированный вирус (ААВ), который обычно инфицирует людей (например, серотипы 2, 3А, 3В, 5 и 6) или приматов (например, серотипы 1 и 4), а также родственные вирусы, которые инфицируют других теплокровных животных (например, аденоассоциированные вирусы бычьих, собачьих, лошадиных и овечьих). Парвовирусы и другие члены семейства Parvoviridae в общих чертах описаны в Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Chapter 69 в FIELDS VIROLOGY (3d Ed. 1996).
[00232] Несмотря на то, что ITR, приведенные в качестве примера в описании и Примерах в данном документе, представляют собой WT-ITR ААВ2, обычный специалист в данной области техники понимает, что, как было указано выше, можно использовать ITR из любого известного парвовируса, например, депендовируса, такого как ААВ (например, из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ 5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261, химерные ITR или ITR из любого синтетического ААВ. Согласно некоторым вариантам реализации ААВ может инфицировать теплокровных животных, например, птичьи (ПААВ), бычьи (БААВ), собачьи, лошадиные и овечьи аденоассоциированные вирусы. Согласно некоторым вариантам реализации ITR происходит из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусиного парвовируса (номер доступа в GenBank NC 001701); змеиного парвовируса 1 (номер доступа в GenBank NC 006148). Согласно некоторым вариантам реализации 5' WT-ITR может происходить из одного серотипа, а 3' WT-ITR может происходить из другого серотипа, как обсуждается в данном документе.
[00233] Обычному специалисту известно, что последовательности ITR имеют общую структуру двухцепочечного соединения Холлидея, которое обычно представляет собой Т-образную или Y-образную шпилечную структуру (см., например, ФИГ. 2А и ФИГ. 3А), где каждый WT-ITR образован двумя палиндромными плечами или петлями (В-В' и С-С), встроенными в большее палиндромное плечо (А-А'), и одноцепочечной последовательностью D (при этом порядок этих палиндромных последовательностей определяет «флип» или «флоп» ориентацию ITR). См., например, структурный анализ и сравнение последовательностей ITR из различных серотипов ААВ (ААВ1-ААВ6), описанные в Grimm et at, J. Virology, 2006; 80(1); 426-439; Yan et at, J. Virology, 2005; 364-379; Duan et ai, Virology 1999; 261; 8-14. Обычный специалист в данной области техники может легко определить последовательности WT-ITR из любого серотипа ААВ для использования в зкДНК-векторе или зкДНК-плазмиде на основе примерных последовательностей ITR ААВ2, предложенных в данном документе. См., например, сравнение последовательностей ITR из разных серотипов ААВ (ААВ1-ААВ6, птичий ААВ (ПААВ) и бычий ААВ (БААВ)), описанное в Grimm et al., J. Virology, 2006; 80(1); 426-439; в котором показан % идентичности левого ITR ААВ2 с левым ITR из других серотипов: ААВ-1 (84%), ААВ-3 (86%), ААВ-4 (79%), ААВ-5 (58%), ААВ-6 (левый ITR) (100%) и ААВ-6 (правый ITR) (82%).
А. Пары симметричных ITR
[00234] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), представляющую интерес нуклеотидную последовательность (например, экспрессионную кассету, описанную в данном документе) и второй ITR ААВ, причем указанный первый ITR (5' ITR) и второй ITR (3' ITR) симметричны или по существу симметричны по отношению друг к другу, то есть зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С и В-В' в трехмерном пространстве. В таком варианте реализации пара симметричных ITR или пара по существу симметричных ITR может представлять собой модифицированные ITR (например, mod-ITR), которые не являются ITR дикого типа. Пара mod-ITR может иметь одну и ту же последовательность, которая имеет одну или более модификаций относительно ITR дикого типа, и они обратно комплементарны друг другу (инвертированы). Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разные последовательности, но соответствующую или одинаковую симметричную трехмерную форму.
(i) ITR дикого типа
[00235] Согласно некоторым вариантам реализации симметричные ITR или по существу симметричные ITR относятся к дикому типу (WT-ITR), как описано в данном документе. Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию.
[00236] Соответственно, как раскрыто в данном документе, зкДНК-векторы содержат трансген или гетер о логичную последовательность нуклеиновой кислоты, расположенные между двумя фланкирующими последовательностями инвертированных концевых повторов дикого типа (WT-ITR), которые либо обратно комплементарны (инвертированы) по отношению друг к другу, либо, альтернативно, являются по существу симметричными по отношению друг к другу, то есть пара WT-ITR имеет симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации последовательность ITR дикого типа (например, WT-ITR ААВ) содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO: 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62).
[00237] Согласно одному аспекту зкДНК-векторы для экспрессии белка FVIII могут быть получены из векторного полинуклеотида, который кодирует гетер о логичную нуклеиновую кислоту, функционально расположенную между двумя последовательностями инвертированных концевых повторов WT (WT-ITR) (например, WT-ITR ААВ). Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации 5' WT-ITR происходит из одного серотипа ААВ, а 3' WT-ITR происходит из того же или другого серотипа ААВ. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR являются зеркальными отображениями друг друга, то есть они симметричны. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR происходят из одного и того же серотипа ААВ.
[00238] WT-ITR хорошо известны. Согласно одному варианту реализации два ITR происходят из одного и того же серотипа ААВ2. Согласно некоторым вариантам реализации можно использовать WT из других серотипов. Существует ряд гомологичных серотипов, например, ААВ2, ААВ4, ААВ6, ААВ8. Согласно одному варианту реализации можно применять высокогомологичные ITR (например, ITR со сходной петлевой структурой). Согласно другому варианту реализации можно применять WT-ITR ААВ, которые различаются в большей степени, например, ААВ2 и ААВ5, и еще в одном варианте реализации можно применять ITR, который по существу представляет собой WT, то есть он имеет основную петлевую структуру WT, но некоторые консервативные нуклеотидные изменения, которые не изменяют и не влияют на свойства. При использовании WT-ITR из одного и того же вирусного серотипа можно дополнительно использовать одну или более регуляторных последовательностей. Согласно определенным вариантам реализации регуляторная последовательность представляет собой регуляторный переключатель, который позволяет модулировать активность зкДНК, например, экспрессию кодируемого белка FVIII.
[00239] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к зкДНК-вектору для экспрессии белка FVIII, причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, кодирующую белок FVIII, функционально расположенную между двумя последовательностями инвертированных концевых повторов дикого типа (WT-ITR), при этом указанные WT-ITR могут происходить из одного и того же серотипа, разных серотипов или по существу симметричны по отношению друг к другу (т.е. они имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и B-B' в трехмерном пространстве). Согласно некоторым вариантам реализации симметричные WT-ITR содержат функциональный сайт концевого разрешения и сайт связывания Rep. Согласно некоторым вариантам реализации гетерологичная последовательность нуклеиновой кислоты кодирует трансген, и при этом вектор не находится в вирусном капсиде.
[00240] Согласно некоторым вариантам реализации WT-ITR являются одинаковыми, но обратно комплементарными по отношению друг к другу. Например, последовательность AACG в 5' ITR может представлять собой CGTT (т.е. обратно комплементарную последовательность) в 3' ITR в соответствующем сайте. В одном примере смысловая цепь 5' WT-ITR содержит последовательность ATCGATCG, а соответствующая смысловая цепь 3' WT-ITR содержит CGATCGAT (т.е. обратно комплементарную последовательность ATCGATCG). Согласно некоторым вариантам реализации WT-ITR зкДНК дополнительно содержит сайт концевого разрешения и сайт связывания репликационного белка (RPS) (иногда называемый сайтом связывания репликативного белка), например, сайт связывания Rep.
[00241] Примерные последовательности WT-ITR для применения в зкДНК-векторах для экспрессии белка FVIII, содержащих WT-ITR, представлены в Таблице 3 в данном документе, в которой показаны пары WT-ITR (5' WT-ITR и 3' WT-ITR).
[00242] В качестве иллюстративного примера согласно настоящему раскрытию предложен зкДНК-вектор для экспрессии белка FVIII, содержащий промотор, функционально связанный с трансгеном (например, гетерологичной последовательностью нуклеиновой кислоты), с регуляторным переключателем или без него, причем указанная зкДНК лишена капсидных белков и: (а) продуцируется с зкДНК-плазмиды (например, см. ФИГ. 1F-1G), которая кодирует WT-ITR, при этом каждый WT-ITR имеет одинаковое количество внутримолекулярных дуплексных пар оснований в его шпилечной вторичной конфигурации (предпочтительно исключая делецию любой концевой петли AAA или ТТТ в этой конфигурации по сравнению с этими референсными последовательностями), и (b) идентифицирована как зкДНК с использованием анализа для идентификации зкДНК с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях в Примере 1.
[00243] Согласно некоторым вариантам реализации фланкирующие WT-ITR по существу симметричны друг другу. Согласно этому варианту реализации 5' WT-ITR может происходить из одного серотипа ААВ, а 3' WT-ITR может происходить из другого серотипа ААВ так, что WT-ITR не являются идентичными обратно комплементарными последовательностями. Например, 5' WT-ITR может происходить из ААВ2, а 3' WT-ITR может происходить из другого серотипа (например, ААВ1, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12). Согласно некоторым вариантам реализации WT-ITR могут быть выбраны из двух разных парвовирусов, выбранных из любого из: ААВ1, ААВ2, ААВЗ, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Согласно некоторым вариантам реализации такая комбинация WT ITR представляет собой комбинацию WT ITR из ААВ2 и ААВ6. Согласно одному варианту реализации WT-ITR являются по существу симметричными, когда один ITR инвертирован относительно другого ITR, который идентичен по меньшей мере на 90%, идентичен по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, и имеет ту же симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации пара WT-ITR по существу симметрична, поскольку они имеют симметричную трехмерную пространственную организацию, например, имеют одинаковую трехмерную организацию плеч А, С-С', В-В' и D. Согласно одному варианту реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS). Согласно некоторым вариантам реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS) и в дополнение к вариабельной палиндромной последовательности, обеспечивающей образование шпилечной вторичной структуры. Гомология может быть определена с применением стандартных способов, хорошо известных в данной области техники, таких как BLAST («Basic Local Alignment Search Tool»), BLASTN при настройках по умолчанию.
[00244] Согласно некоторым вариантам реализации структурный элемент ITR может представлять собой любой структурный элемент, который участвует в функциональном взаимодействии ITR с большим белком Rep (например, Rep 78 или Rep 68). Согласно определенным вариантам реализации структурный элемент обеспечивает селективность взаимодействия ITR с большим белком Rep, т.е. определяет, по меньшей мере частично, какой белок Rep функционально взаимодействует с ITR. Согласно другим вариантам реализации структурный элемент физически взаимодействует с большим белком Rep, когда белок Rep связан с ITR. Каждый структурный элемент может представлять собой, например, вторичную структуру ITR, нуклеотидную последовательность ITR, промежуток между двумя или более элементами или комбинацию любого из перечисленных выше. Согласно одному варианту реализации структурные элементы выбраны из группы, состоящей из плеча А и А', плеча В и В', плеча С и С', плеча D, сайта связывания Rep (RBE) и RBE' (т.е. комплементарная последовательность RBE) и сайта концевого разрешения (TRS).
[00245] Только в качестве примера, в Таблице 2 указаны примерные комбинации WT-ITR.
[00246] tgcatgc 2: Примерные комбинации WT-ITR из одного и того же серотипа или разных серотипов, или разных парвовирусов. Показанный порядок не указывает на положение ITR, например, «ААВ1, ААВ2» демонстрирует, что зкДНК может содержать WT ITR ААВ1 в 5'-положении и WT ITR ААВ2 в 3'-положении или наоборот WT ITR ААВ2 в 5'-положении, a WT ITR ААВ1 в 3'-положении. Сокращения: ААВ серотипа 1 (ААВ1), ААВ серотипа 2 (ААВ2), ААВ серотипа 3 (ААВ3), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12); геном AABrh8, AABrh10, AAB-DJ и AAB-DJ8 (например, NCBI: NC 002077; NC 001401; NC 001729; NC 001829; NC 006152; NC 006260; NC 006261), ITR из теплокровных животных (птичий ААВ (ПААВ), бычий ААВ (БААВ), собачий, лошадиный и овечий ААВ), ITR из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусь: гусиного парвовируса (номер доступа в GenBank NC 001701); змея: змеиного парвовируса 1 (номер доступа в GenBank NC 006148).
[00247] Только в качестве примера, в Таблице 3 представлены последовательности примерных WT-ITR из некоторых различных серотипов ААВ.
[00248] Согласно некоторым вариантам реализации нуклеотидная последовательность последовательности WT-ITR может быть модифицирована (например, путем модификации 1, 2, 3, 4 или 5 или более нуклеотидов или любого их диапазона), при этом указанная модификация представляет собой замену комплементарным нуклеотидом, например, G для С, и наоборот, и Т для А, и наоборот.
[00249] Согласно определенным вариантам реализации настоящего изобретения зкДНК-вектор для экспрессии белка FVIII не имеет WT-ITR, состоящего из нуклеотидной последовательности, выбранной из любой из: SEQ ID NO: 1, 2, 5-14. Согласно альтернативным вариантам реализации настоящего изобретения, если зкДНК-вектор имеет WT-ITR, содержащий нуклеотидную последовательность, выбранную из любой из: SEQ ID NO: 1, 2, 5-14, то фланкирующий ITR также представляет собой WT, и зкДНК-вектор содержит регуляторный переключатель, например, как раскрыто в данном документе и в международной заявке PCT/US 18/49996 (например, см. Таблицу 11 PCT/US 18/49996). Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, как раскрыто в данном документе, и выбранный WT-ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 1, 2, 5-14.
[00250] ЗкДНК-вектор, для экспрессии белка FVIII, описанный в данном документе, может включать структуры WT-ITR, которые сохраняют функциональные части RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В, с использованием ITR дикого типа для иллюстративных целей, показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей WT-ITR, которые содержат Rep-связывающий сайт (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один WT-ITR является функциональным. Согласно альтернативным вариантам реализации, в которых зкДНК-вектор для экспрессии белка FVIII содержит два WT-ITR, которые по существу симметричны друг другу, по меньшей мере один WT-ITR является функциональным и по меньшей мере один WT-ITR является нефункциональным.
В. Модифицированные ITR (mod-ITR) в целом для зкДНК-векторов, содержащих пары асимметричных ITR или пары симметричных ITR
[00251] Как обсуждается в данном документе, зкДНК-вектор для экспрессии белка FVIII может содержать пару симметричных ITR или пару асимметричных ITR. В обоих случаях один или оба из ITR могут представлять собой модифицированные ITR - различие заключается в том, что в первом случае (то есть симметричные mod-ITR), mod-ITR имеют одинаковую трехмерную пространственную организацию (т.е. имеют одинаковые конфигурации плеча А-А', С-С' и В-В'), в то время как во втором случае (т.е. асимметричные mod-ITR), mod-ITR имеют разную трехмерную пространственную организацию (т.е. имеют разную конфигурацию плеч А-А', С-С' и В-В').
[00252] Согласно некоторым вариантам реализации модифицированный ITR представляет собой ITR, который модифицирован путем делеции, вставки и/или замены по сравнению с последовательностью ITR дикого типа (например, ITR ААВ). Согласно некоторым вариантам реализации по меньшей мере один из ITR в зкДНК-векторе содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62). В одном варианте реализации по меньшей мере один из ITR представляет собой нефункциональный ITR. Согласно одному варианту реализации не каждый из разных или модифицированных ITR представляет собой ITR дикого типа из разных серотипов.
[00253] Конкретные изменения и мутации в ITR подробно описаны в данном документе, но в контексте ITR «измененный», «мутированный» или «модифицированный» указывает на то, что нуклеотиды были вставлены, удалены и/или заменены относительно дикого типа, референса или исходной последовательности ITR. Измененный или мутированный ITR может представлять собой модифицированный ITR. В данном документе «сконструированный» относится к аспекту манипулирования человеком. Например, полипептид считается «сконструированным», когда по меньшей мере один аспект полипептида, например, его последовательность, подвергся манипуляции человеком, чтобы отличаться от аспекта, который существует в природе.
[00254] Согласно некоторым вариантам реализации mod-ITR может быть синтетическим. Согласно одному варианту реализации синтетический ITR основан на последовательностях ITR более чем из одного серотипа ААВ. Согласно другому варианту реализации синтетический ITR не включает последовательность на основе ААВ. В еще одном варианте реализации синтетический ITR сохраняет структуру ITR, описанную выше, хотя имеет только некоторую часть последовательности, полученной из ААВ, или не имеет ее. Согласно некоторым аспектам синтетический ITR преимущественно может взаимодействовать с Rep дикого типа или Rep конкретного серотипа, или в некоторых случаях не будет распознаваться Rep дикого типа и будет распознаваться только мутированным Rep.
[00255] Квалифицированный специалист может определить соответствующую последовательность в других серотипах с помощью известных средств. Например, определение того, происходит ли изменение в области А, А', В, В', С, С' или D, и определение соответствующей области в другом серотипе. Для определения соответствующей последовательности можно использовать BLAST® (Basic Local Alignment Search Tool) или другие программы гомологического выравнивания с параметрами по умолчанию. Согласно настоящему изобретению также предложены популяции и множество зкДНК-векторов, содержащих mod-ITR из комбинации различных серотипов ААВ, то есть один mod-ITR может происходить из одного серотипа ААВ, а другой mod-ITR может происходить из другого серотипа. Не ограничиваясь какой-либо теорией, согласно одному варианту реализации один ITR может происходить или основываться на последовательности ITR ААВ2, а другой ITR зкДНК-вектора может происходить или основываться на любой одной или более последовательностях ITR ААВ серотипа 1 (ААВ1), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12).
[00256] Любой ITR парвовируса можно применять в качестве ITR или основного ITR для модификации. Предпочтительно парвовирус представляет собой депендовирус. Более предпочтительно ААВ. Выбранный серотип может быть основан на тканевом тропизме серотипа. ААВ2 обладает широким тканевым тропизмом, ААВ1 преимущественно нацелен на нейроны и скелетные мышцы, а ААВ5 преимущественно нацелен на нейроны, пигментный эпителий сетчатки и фоторецепторы. ААВ6 преимущественно нацелен на скелетные мышцы и легкие. ААВ8 преимущественно нацелен на печень, скелетные мышцы, сердце и ткани поджелудочной железы. ААВ9 преимущественно нацелен на печень, скелетную и легочную ткань. Согласно одному варианту реализации модифицированный ITR основан на ITR ААВ2.
[00257] Более конкретно, способность структурного элемента функционально взаимодействовать с конкретным большим белком Rep может быть изменена путем модификации структурного элемента. Например, нуклеотидная последовательность структурного элемента может быть модифицирована по сравнению с последовательностью ITR дикого типа. Согласно одному варианту реализации структурный элемент (например, плечо А, плечо А', плечо В, плечо В', плечо С, плечо С', плечо D, RBE, RBE' и TRS) ITR можно удалить и заменить структурным элементом дикого типа из другого парвовируса. Например, заменяющая структура может происходить из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, собачьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Например, ITR может представлять собой ITR ААВ2, а плечо А или А' или RBE могут быть заменены структурным элементом из ААВ5. В другом примере ITR может представлять собой ITR ААВ5, а плечи С или С', RBE и TRS могут быть заменены структурным элементом из ААВ2. В другом примере ITR ААВ может представлять собой ITR ААВ5, в котором плечи В и В' заменены В и В' ITR ААВ2.
[00258] Только в качестве примера, в Таблице 4 указаны примерные модификации по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях модифицированного ITR, где X указывает на модификацию по меньшей мере одной нуклеиновой кислоты (например, делецию, вставку и/или замену) в этом участке относительно соответствующего ITR дикого типа. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в любой из областей С и/или С', и/или В, и/или В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Например, если модификация приводит к получению любого из: одноплечевого ITR (например, одно плечо С-С' или одно плечо В-В'), или модифицированного плеча С-В' или плеча С'-В, или двухплечевого ITR по меньшей мере с одним усеченным плечом (например, усеченным плечом С-С' и/или усеченным плечом В-В'), по меньшей мере одно плечо или по меньшей мере одно из двух плеч ITR (где одно плечо может быть усечено) сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации усеченное плечо С-С' и/или усеченное плечо В-В' имеет три последовательных Т-нуклеотида (т.е. ТТТ) в концевой петле.
[00259] Таблица 4: Примерные комбинации модификаций по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в различных областях или плечах В-В' и С-С' ITR (X указывает модификацию нуклеотида, например, добавление, делецию или замену по меньшей мере одного нуклеотида в области).
[00260] Согласно некоторым вариантам реализации mod-ITR для применения в зкДНК-векторе для экспрессии белка FVIII содержит пару асимметричных ITR или пару симметричных mod-ITR, как раскрыто в данном документе, может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида в любой одной или более областях, выбранных из: между А' и С, между С и С', между С' и В, между В и В' и между В' и А. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях С или С' либо В или В' по-прежнему сохраняет концевую петлю структуры стебель-петля. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно альтернативным вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида А (т.е. AAA) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в любой одной или более из областей, выбранных из: А', А и/или D. Например, в некоторых вариантах реализации, модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А и/или А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области D.
[00261] Согласно одному варианту реализации нуклеотидная последовательность структурного элемента может быть модифицирована (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона) для получения модифицированного структурного элемента. Согласно одному варианту реализации конкретные модификации ITR приведены в данном документе в качестве примеров (например, SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или показанные на ФИГ. 7А-7В из PCT/US 2018/064242, поданной 6 декабря 2018 г. (например, SEQ ID NO 97-98, 101-103, 105-108, 111-112, 117-134, 545-54 в PCT/US 2018/064242)). Согласно некоторым вариантам реализации ITR может быть модифицирован (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона). Согласно другим вариантам реализации ITR может иметь по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более идентичности последовательности с одним из модифицированных ITR, имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или RBE-содержащим участком плеча А-А' и плеч С-С' и В-В', имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или представленных в Таблицах 2-9 (т.е. SEQ ID NO: 110-112, 115-190, 200-468) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.
[00262] Согласно некоторым вариантам реализации модифицированный ITR может, например, содержать удаление или делецию всего конкретного плеча, например, всего или части плеча А-А', или всего или части плеча В-В', или всего или части плеча С-С', или, альтернативно, удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований, образующих стебель петли, при условии, что конечная петля, кэпирующая стебель (например, одно плечо), все еще присутствует (например, см. ITR-21 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' (см., например, ITR-1 на ФИГ. 3В или ITR-45 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' и удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Предусмотрена любая комбинация удаления пар оснований, например, могут быть удалены 6 пар оснований в плече С-С' и 2 пары оснований в плече В-В'. В качестве иллюстративного примера, ФИГ. 3В показывает примерный модифицированный ITR по меньшей мере с 7 парами оснований, удаленными из каждой из части С и части С', заменой нуклеотида в петле между областями С и С' и делецией по меньшей мере одной пары оснований из каждой из области В и областей В' так, что модифицированный ITR содержит два плеча, из которых по меньшей мере одно плечо (например, С-С') усечено. Согласно некоторым вариантам реализации модифицированный ITR также содержит делецию по меньшей мере одной пары оснований из каждой из области В и областей В' так, что плечо В-В' также усечено относительно WT ITR.
[00263] Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 50 (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50) делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа. Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 30 делеций нуклеотидов относительно полноразмерной последовательности WT ITR. Согласно некоторым вариантам реализации модифицированный ITR имеет от 2 до 20 делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа.
[00264] Согласно некоторым вариантам реализации модифицированный ITR не содержит никаких делеций нуклеотидов в RBE-содержащей части областей А или А', чтобы не препятствовать репликации ДНК (например, связывание RBE белком Rep или образование одноцепочечного разрыва в сайте концевого разрешения). Согласно некоторым вариантам реализации модифицированный ITR, предусмотренный для применения в данном документе, имеет одну или более делеций в области В, В', С и/или С, как описано в данном документе.
[00265] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару симметричных ITR или пару асимметричных ITR, содержит регуляторный переключатель, как раскрыто в данном документе, и по меньшей мере один выбранный модифицированный ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187.
[00266] Согласно другому варианту реализации структура структурного элемента может быть модифицирована. Например, структурный элемент имеет изменение высоты стебля и/или количества нуклеотидов в петле. Например, высота стебля может составлять примерно 2, 3, 4, 5, 6, 7, 8 или 9 нуклеотидов или более или любое значение в пределах указанного диапазона. Согласно одному варианту реализации высота стебля может составлять от примерно 5 нуклеотидов до примерно 9 нуклеотидов и он функционально взаимодействует с Rep. Согласно другому варианту реализации высота стебля может составлять примерно 7 нуклеотидов и он функционально взаимодействует с Rep. В другом примере петля может иметь 3, 4, 5, 6, 7, 8, 9 или 10 нуклеотидов или более или любое значение в пределах указанного диапазона.
[00267] Согласно другому варианту реализации количество сайтов связывания GAGY или родственных GAGY сайтов связывания в RBE или продленном RBE может быть увеличено или уменьшено. В одном примере RBE или продленный RBE может содержать 1, 2, 3, 4, 5 или 6 или более сайтов связывания GAGY или любое значение в пределах указанного диапазона. Каждый сайт связывания GAGY может независимо представлять собой точную последовательность GAGY или последовательность, сходную с GAGY, при условии, что последовательность достаточна для связывания белка Rep.
[00268] Согласно другому варианту реализации расстояние между двумя элементами (такими как, но не ограничиваясь перечисленными, RBE и шпилька) может быть изменено (например, увеличено или уменьшено) для изменения функционального взаимодействия с большим белком Rep. Например, расстояние может составлять примерно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или 21 нуклеотид или более или любое значение в пределах указанного диапазона.
[00269] ЗкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, может включать структуру ITR, которая модифицирована относительно структуры ITR дикого типа ААВ2, раскрытой в данном документе, но все еще сохраняет функциональную часть RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей ITR, которые содержат сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один ITR (wt или модифицированный ITR) является функциональным. Согласно альтернативным вариантам реализации, когда зкДНК-вектор для экспрессии белка FVIII содержит два модифицированных ITR, которые отличаются или асимметричны по отношению друг к другу, по меньшей мере один модифицированный ITR является функциональным и по меньшей мере один модифицированный ITR является нефункциональным.
[00270] Согласно некоторым вариантам реализации модифицированный ITR (например, левый или правый ITR) зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, имеет модификации в плече петли, усеченном плече или спейсере. Примерные последовательности ITR, имеющие модификации в плече петли, усеченном плече или спейсере, перечислены в Таблице 2 (т.е. SEQ ID NO: 135-190, 200-233); Таблице 3 (например, SEQ ID NO: 234-263); Таблице 4 (например, SEQ ID NO: 264-293); Таблице 5 (например, SEQ ID NO: 294-318 в данном документе); Таблице 6 (например, SEQ ID NO: 319-468); и Таблице 7-9 (например, SEQ ID NO: 101-110, 111-112, 115-134) или в Таблице 10А или 10В (например, SEQ ID NO: 9, 100, 469-483, 484-499) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.
[00271] Согласно некоторым вариантам реализации модифицированный ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR, выбирают из любых или из комбинации ITR, приведенных в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 и 10A-10В международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.
[00272] Дополнительные примерные модифицированные ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR в каждом из указанных выше классов, представлены в Таблицах 5А и 5В. Прогнозируемая вторичная структура правых модифицированных ITR в Таблице 5А показана на ФИГ. 7А международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., и прогнозируемая вторичная структура левых модифицированных ITR в Таблице 5В показана на ФИГ. 7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ посредством ссылки.
[00273] В Таблице 5А и Таблице 5В представлены примерные правые и левые модифицированные ITR.
[00274] Таблица 5А: Примерные модифицированные правые ITR. Эти примерные модифицированные правые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).
[00275] ТАБЛИЦА 5В: Примерные модифицированные левые ITR. Эти примерные модифицированные левые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и комплементарную последовательность RBE (т.е. RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).
[00276] Согласно одному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ, причем указанный первый ITR (5'-ITR) и второй ITR (3'-ITR) являются асимметричными по отношению друг к другу, т.е. они имеют разную трехмерную пространственную конфигурацию по отношению друг к другу. В качестве примерного варианта реализации первый ITR может представлять собой ITR дикого типа, а второй ITR может представлять собой мутированный или модифицированный ITR или наоборот первый ITR может представлять собой мутированный или модифицированный ITR, а второй ITR может представлять собой ITR дикого типа. Согласно некоторым вариантам реализации первый ITR и второй ITR оба представляют собой mod-ITR, но имеют разные последовательности или разные модификации и, таким образом, не являются одинаковыми модифицированными ITR и имеют разные трехмерные пространственные конфигурации. Другими словами, зкДНК-вектор с асимметричными ITR содержит ITR, в которых любые изменения в одном ITR относительно WT-ITR не отражаются в другом ITR; или, альтернативно, если асимметричные ITR имеют пару модифицированных асимметричных ITR, они могут иметь различную последовательность и различную трехмерную форму по отношению друг к другу. Примерные асимметричные ITR в зкДНК-векторе для экспрессии белка FVIII и для применения в получении зкДНК-плазмиды представлены в Таблицах 5А и 5В.
[00277] Согласно альтернативному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит два симметричных mod-ITR, то есть оба ITR имеют одинаковую последовательность, но обратно комплементарны (инвертированы) друг другу. Согласно некоторым вариантам реализации пара симметричных mod-ITR содержит по меньшей мере одну или любую комбинацию делеции, вставки или замены относительно последовательности ITR дикого типа из того же серотипа ААВ. Добавления, делеции или замены в симметричных ITR одинаковы, но обратно комплементарны друг другу. Например, вставка 3 нуклеотидов в области С 5' ITR будет отражаться во вставке 3 обратно комплементарных нуклеотидов в соответствующем участке в области С' 3' ITR. Исключительно для целей иллюстрации, если добавление представляет собой AACG в 5' ITR, добавление представляет собой CGTT в 3' ITR в соответствующем сайте. Например, если смысловая цепь 5' ITR представляет собой ATCGATCG с добавлением AACG между G и А, это дает последовательность ATCGAACGATCG (SEQ ID NO: 51). Соответствующая смысловая цепь 3' ITR представляет собой CGATCGAT (обратно комплементарная последовательность ATCGATCG) с добавлением CGTT (т.е. обратно комплементарная последовательность AACG) между Т и С, что дает последовательность CGATCGTTCGAT (SEQ ID NO: 49) (обратно комплементарная последовательность ATCGAACGATCG) (SEQ ID NO: 51).
[00278] Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разную последовательность, но иметь соответствующую или одинаковую симметричную трехмерную форму. Например, один модифицированный ITR может происходить из одного серотипа, а другой модифицированный ITR может происходить из другого серотипа, но они имеют одинаковую мутацию (например, вставку, делецию или замену нуклеотидов) в одной и той же области. Другими словами, только для иллюстративных целей, 5'mod-ITR может происходить из ААВ2 и иметь делецию в области С, а 3' mod-ITR может происходить из ААВ5 и иметь соответствующую делецию в области С', и при условии, что 5'mod-ITR и 3'mod-ITR имеют одинаковую или симметричную трехмерную пространственную организацию, они предусмотрены для применения в настоящем изобретении в качестве пары модифицированных ITR.
[00279] Согласно некоторым вариантам реализации пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR. Только в качестве примера, по существу симметричные ITR могут иметь симметричную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве. Это может происходить, например, когда пара G-C модифицирована, например, в пару C-G или наоборот, или когда пара А-Т модифицирована в пару Т-А, или наоборот. Следовательно, используя приведенный выше иллюстративный пример модифицированного 5' ITR как ATCGAACGATCG (SEQ ID NO: 51) и модифицированного 3' ITR как CGATCGTTCGAT (SEQ ID NO: 49) (т.е. обратно комплементарной последовательности для ATCGAACGATCG (SEQ ID NO: 51)), эти модифицированные ITR все равно были бы симметричными, если бы, например, 5' ITR имел последовательность ATCGAACCATCG (SEQ ID NO: 50), где G в добавлении модифицирован на С, и по существу симметричный 3'-ITR имеет последовательность CGATCGTTCGAT (SEQ ID NO: 49), без соответствующей модификации Т в дополнение к а. Согласно некоторым вариантам реализации такая пара модифицированных ITR является по существу симметричной, поскольку пара модифицированных ITR имеет симметричную стереохимию.
[00280] Таблица 6 показывает примерные пары симметричных модифицированных ITR (т.е. левого модифицированного ITR и симметричного правого модифицированного ITR) для применения в зкДНК-векторе для экспрессии белка FVIII. Выделенный жирным шрифтом (красным) участок последовательностей идентифицирует часть последовательностей ITR (т.е. последовательности петель А-А', С-С' и В-В'), также показанных на ФИГ. 31А-46В. Эти примерные модифицированные ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).
[00281] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару асимметричных ITR, может содержать ITR с модификацией, соответствующей любой из модификаций в последовательностях ITR или неполных последовательностях ITR, представленных в любой одной или более из Таблиц 5А-5В в данном документе, или последовательностях, показанных на ФИГ. 7А-7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ, или раскрытых в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 или 10А-10В международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., полностью включенной в данный документ посредством ссылки.
V. Примерные зкДНК-векторы
[00282] Как описано выше, настоящее раскрытие относится к рекомбинантным экспрессионным зкДНК-векторам и зкДНК-векторам, которые кодируют белок FVIII, содержащим любой из: пары асимметричных ITR, пары симметричных ITR или пары по существу симметричных ITR, как описано выше. Согласно определенным вариантам реализации настоящее раскрытие относится к рекомбинантным зкДНК-векторам для экспрессии белка FVIII, имеющим фланкирующие последовательности ITR и трансген, причем указанные последовательности ITR являются асимметричными, симметричными или по существу симметричными по отношению друг к другу, как определено в данном документе, и зкДНК дополнительно содержит нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, содержащую нуклеиновую кислоту трансгена), расположенную между фланкирующими ITR, при этом указанная молекула нуклеиновой кислоты лишена последовательностей, кодирующих вирусный капсидный белок.
[00283] Экспрессионный зкДНК-вектор для экспрессии белка FVIII может представлять собой любой зкДНК-вектор, который можно удобно подвергнуть методикам рекомбинантной ДНК, включая нуклеотидную последовательность (и), описанную в данном документе, при условии, что по меньшей мере один ITR изменен. ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию совместимы с клеткой-хозяином, в которую должен быть введен зкДНК-вектор. Согласно определенным вариантам реализации зкДНК-векторы могут быть линейными. Согласно определенным вариантам реализации зкДНК-векторы могут существовать как внехромосомные объекты. Согласно определенным вариантам реализации зкДНК-векторы согласно настоящему раскрытию могут содержать элемент (ы), который позволяет интегрировать донорную последовательность в геном клетки-хозяина. В данном документе «трансген» и «гетер о логичная нуклеотидная последовательность» являются синонимами и кодируют белок FVIII, как описано в данном документе.
[00284] На ФИГ. 1A-1G показаны схемы функциональных компонентов двух неограничивающих плазмид, которые можно применять для получения зкДНК-вектора для экспрессии белка FVIII. ФИГ. 1А, 1B, 1D, 1F показывают конструкцию зкДНК-векторов или соответствующих последовательностей зкДНК-плазмид для экспрессии белка FVIII. ЗкДНК-векторы не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, кассету экспрессируемого трансгена и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. ЗкДНК-векторы для экспрессии белка FVIII не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, экспрессируемый трансген (белок или нуклеиновую кислоту) и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. Согласно некоторым вариантам реализации кассета экспрессируемого трансгена включает, при необходимости: энхансер/промотор, одно или более плеч гомологии, донорную последовательность, посттранскрипционный регуляторный элемент (например, WPRE, например, SEQ ID NO: 67), а также сигнал полиаденилирования и терминации (например, BGH поли(А), например, SEQ ID NO: 68).
[00285] ФИГ. 5 изображает гель, подтверждающий продуцирование зкДНК из нескольких плазмидных конструкций с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4А выше и в Примерах.
А. Регуляторные элементы
[00286] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторные переключатели, описанные в данном документе, для регуляции экспрессии трансгена или аварийный выключатель, который может уничтожить клетку, содержащую зкДНК-вектор, кодирующий белок FVIII. Регуляторные элементы, включая регуляторные переключатели, которые можно применять в настоящем изобретении, более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.
[00287] В вариантах реализации вторая нуклеотидная последовательность включает регуляторную последовательность и нуклеотидную последовательность, кодирующую нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность гена функционально связана с нуклеотидной последовательностью, кодирующей нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность пригодна для контроля экспрессии нуклеазы в клетке-хозяине. Согласно определенным вариантам реализации регуляторная последовательность включает подходящую промоторную последовательность, способную направлять транскрипцию гена, функционально связанного с промоторной последовательностью, такого как нуклеотидная последовательность, кодирующая нуклеазу (нуклеазы) согласно настоящему раскрытию. Согласно определенным вариантам реализации вторая нуклеотидная последовательность включает интронную последовательность, связанную с 5'-концом нуклеотидной последовательности, кодирующей нуклеазу. Согласно определенным вариантам реализации последовательность энхансера обеспечена в 5-направлении относительно промотора для повышения эффективности промотора. Согласно определенным вариантам реализации регуляторная последовательность включает энхансер и промотор, причем вторая нуклеотидная последовательность включает интронную последовательность в 5-направлении от нуклеотидной последовательности, кодирующей нуклеазу, при этом интрон включает один или более сайтов расщепления нуклеазой, и при этом промотор функционально связан с нуклеотидной последовательностью, кодирующей нуклеазу.
[00288] ЗкДНК-векторы для экспрессии белка FVIII, полученные синтетическим путем или с использованием метода продуцирования на основе клеток, как описано в данном документе в Примерах, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов, таких как посттранскрипционный регуляторный элемент WHP (WPRE) (например, SEQ ID NO: 67) и BGH поли(А) (SEQ ID NO: 68). Подходящие экспрессионные кассеты для применения в экспрессионных конструкциях не имеют налагаемого вирусным капсидом ограничения по упаковке.
(i) Промоторы:
[00289] Обычный специалист в данной области техники поймет, что промоторы, используемые в зкДНК-векторах для экспрессии белка FVIII, как описано в данном документе, должны быть адаптированы в соответствии с конкретными последовательностями, на которые они оказывают промоторное действие. В соответствии с некоторыми вариантами реализации промотор представляет собой любой промотор или промоторную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.
[00290] В соответствии с некоторыми вариантами реализации промотор представляет собой промотор VandenDriessche (VD). В соответствии с некоторыми вариантами реализации промотор VD содержит SEQ ID NO: 191, представленную ниже:
[00291] В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 85% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 90% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 95% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 96% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 97% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 98% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 99% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор состоит из последовательности нуклеиновой кислоты SEQ ID NO: 191.
[00292] Экспрессионные кассеты зкДНК-вектора для экспрессии белка FVIII могут включать промотор, который может влиять на общие уровни экспрессии, а также на клеточную специфичность. В случае экспрессии трансгена, например, экспрессии белка FVIII, они могут включать высокоактивный немедленный ранний промотор вирусного происхождения. Экспрессионные кассеты могут содержать тканеспецифические эукариотические промоторы для ограничения экспрессии трансгена конкретными типами клеток и снижения токсических эффектов и иммунных ответов, обусловленных нерегулируемой эктопической экспрессией. Согласно некоторым вариантам реализации экспрессионная кассета может содержать промотор или синтетический регуляторный элемент, такой как промотор CAG (SEQ ID NO: 72). Промотор CAG содержит (i) ранний энхансерный элемент цитомегаловируса (CMV), (ii) промотор, первый экзон и первый интрон гена бета-актина курицы, и (iii) акцептор сплайсинга гена бета-глобина кролика. В качестве альтернативы, экспрессионная кассета может содержать промотор альфа-1-антитрипсина (ААТ) (SEQ ID NO: 73 или SEQ ID NO: 74), специфический для печени (LP1) промотор (SEQ ID NO: 75 или SEQ ID NO: 76) или промотор фактора удлинения-1-альфа (EF1a) человека (например, SEQ ID NO: 77 или SEQ ID NO: 78). Согласно некоторым вариантам реализации экспрессионная кассета включает один или более конститутивных промоторов, например, ретровирусный LTR-промотор вируса саркомы Рауса (RSV) (необязательно с энхансером RSV) или немедленный ранний промотор цитомегаловируса (CMV) (необязательно с энхансером CMV, например, SEQ ID NO: 79). В качестве альтернативы, можно применять индуцируемый промотор, нативный для трансгена промотор, тканеспецифический промотор или различные промоторы, известные в данной области техники.
[00293] Подходящие промоторы, включая те, которые описаны в данном документе, могут происходить из вирусов и, соответственно, могут называться вирусными промоторами, или они могут происходить из любого организма, в том числе прокариотических или эукариотических организмов. Для управления экспрессией с помощью любой РНК-полимеразы (например, pol I, pol II, pol III) могут применяться подходящие промоторы. Примерные промоторы включают, но не ограничиваются перечисленными, ранний промотор SV40, промотор длинного концевого повтора (LTR) вируса опухоли молочной железы мыши; большой поздний промотор аденовируса (Ad MLP); промотор вируса простого герпеса (HSV), промотор цитомегаловируса (CMV), такой как область немедленного раннего промотора CMV (CMVIE), промотор вируса саркомы Рауса (RSV), промотор U6 малой ядерной РНК человека (U6, например, SEQ ID NO: 80) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), улучшенный промотор U6 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), промотор H1 человека (H1) (например, SEQ ID NO: 81 или SEQ ID NO: 155), промотор CAG, промотор альфа-1-антитрипсина человека (НААТ) (например, SEQ ID NO: 82) и т.п. Согласно определенным вариантам реализации указанные промоторы изменяют на их содержащем интрон 3'-конце так, чтобы они включали один или более сайтов расщепления нуклеазами. Согласно определенным вариантам реализации ДНК, содержащая сайт(ы) расщепления нуклеазой, является чужеродной для ДНК промотора.
[00294] Согласно одному варианту реализации используемый промотор представляет собой нативный промотор гена, кодирующего терапевтический белок. Промоторы и другие регуляторные последовательности соответствующих генов, кодирующих терапевтические белки, известны и были охарактеризованы. Используемая промоторная область может дополнительно включать одну или более дополнительных регуляторных последовательностей (например, нативных), например, энхансеров (например, SEQ ID NO: 79 и SEQ ID NO: 83), включая энхансер SV40 (SEQ ID NO: 126).
[00295] Согласно некоторым вариантам реализации промотор также может представлять собой промотор из гена человека, такого как убиквитин С человека (hUbC), актин человека, миозин человека, гемоглобин человека, мышечный креатин человека или металлотионеин человека. Промотор также может представлять собой тканеспецифический промотор, такой как специфический для печени промотор, например, альфа-1-антитрипсина человека (НААТ), природный или синтетический. Согласно одному варианту реализации доставку в печень можно обеспечить с использованием специфичного нацеливания на эндогенный АроЕ композиции, содержащей зкДНК-вектор, которую направляют в гепатоциты за счет рецептора липопротеина низкой плотности (ЛНП), присутствующего на поверхности гепатоцита.
[00296] Неограничивающие примеры промоторов, подходящих для применения в соответствии с настоящим изобретением, включают любой из промоторов, описанных в данном документе, или любой из следующих: промотор CAG, например, (SEQ ID NO: 72), промотор НААТ (SEQ ID NO: 82), промотор EF1-α человека (SEQ ID NO: 77) или фрагмент промотора EF1a (SEQ ID NO: 78), промотор IE2 (например, SEQ ID NO: 84) и промотор EF1-α крысы (SEQ ID NO: 85), промотор mEF1 (SEQ ID NO: 59) или фрагмент промотора 1E1 (SEQ ID NO: 125).
(ii) Энхансеры
[00297] Согласно некоторым вариантам реализации зкДНК, экспрессирующая FVIII, содержит один или более энхансеров. Согласно некоторым вариантам реализации последовательность энхансера расположена в 5'-направлении относительно последовательности промотора. Согласно некоторым вариантам реализации последовательность энхансера расположена в 3'-направлении относительно последовательности промотора. В соответствии с некоторыми вариантами реализации энхансер представляет собой любой энхансер или энхансерную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.
(iii) Последовательности 5'-UTR и интронные последовательности
[00298] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 5'-UTR и/или интронную последовательность, которая расположена в 3'-направлении относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации 5'-UTR расположена в 5-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 5'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9А, которая полностью включена в данный документ посредством ссылки.
(iv) Последовательности 3'-UTR
[00299] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 3'-UTR, которая расположена в 5'-направлении относительно последовательности 3'-ITR. Согласно некоторым вариантам реализации 3'-UTR расположена в 3'-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 3'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9В, которая полностью включена в данный документ посредством ссылки.
Последовательности полиаденилирования:
[00300] Последовательность, кодирующая последовательность полиаденилирования, может быть включена в зкДНК-вектор для экспрессии белка FVIII для стабилизации мРНК, экспрессируемой с указанного зкДНК-вектора, и для содействия ядерному экспорту и трансляции. Согласно одному варианту реализации зкДНК-вектор не включает последовательность полиаденилирования. Согласно другим вариантам реализации зкДНК-вектор для экспрессии белка FVIII включает по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50 или более адениновых динуклеотидов. Согласно некоторым вариантам реализации последовательность полиаденилирования содержит примерно 43 нуклеотида, примерно 40-50 нуклеотидов, примерно 40-55 нуклеотидов, примерно 45-50 нуклеотидов, примерно 35-50 нуклеотидов или любой диапазон между указанными значениями.
[00301] Экспрессионные кассеты могут включать любую последовательность полиаденилирования, известную в данной области техники, или ее вариант. Согласно некоторым вариантам реализации последовательность полиаденилирования (поли(А)) выбрана из любой из последовательностей, перечисленных в международной заявке № PCT/US 2020/021328, например, в Таблице 10, которая полностью включена в данный документ посредством ссылки. Также можно использовать другие последовательности поли(А), широко известные в данной области техники, например, включая, но не ограничиваясь перечисленными, природную последовательность, выделенную из бычьего BGHpA (например, SEQ ID NO: 68) или SV40pA вируса (например, SEQ ID NO: 86) или синтетическую последовательность (SEQ ID NO: 87). Некоторые экспрессионные кассеты также могут включать последовательность 5'-энхансера позднего поли(А)-сигнала (USE) SV40. Согласно некоторым вариантам реализации последовательность USE можно применять в комбинации с SV40pA или гетерологичным сигналом поли(А). Последовательности поли(А) расположены в 3-направлении относительно трансгена, кодирующего белок FVIII.
Экспрессионные кассеты также могут включать посттранскрипционный элемент для повышения экспрессии трансгена. Согласно некоторым вариантам реализации для повышения экспрессии трансгена применяют посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WHP) (WPRE) (например, SEQ ID NO: 67). Можно применять другие элементы посттранскрипционного процессинга, такие как посттранскрипционный элемент из гена тимидинкиназы вируса простого герпеса или вируса гепатита В (HBV). С трансгенами могут быть связаны секреторные последовательности, например, последовательности VH-02 и VK-A26, например, SEQ ID NO: 88 и SEQ ID NO: 89.
(vi) Последовательности ядерной локализации
[00302] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более последовательностей ядерной локализации (NLS), например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. Согласно некоторым вариантам реализации одна или более NLS расположены на амино-конце или рядом с ним, на карбокси-конце или рядом с ним, или в их комбинации (например, одна или более NLS на амино-конце и/или одна или более NLS на карбокси-конце). В случае присутствия более чем одной NLS, каждая из них может быть выбрана независимо от других так, что одна NLS будет присутствовать более чем в одной копии и/или в комбинации с одной или более другими NLS, присутствующими в одной или более копиях. Неограничивающие примеры NLS приведены в Таблице 7.
В. Дополнительные компоненты зкДНК-векторов
[00303] ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию могут содержать нуклеотиды, которые кодируют другие компоненты для экспрессии гена. Например, для выбора событий нацеливания на конкретные гены защитная кшРНК может быть встроена в микроРНК и вставлена в рекомбинантный зкДНК-вектор, предназначенный для сайт-специфической интеграции в высокоактивный локус, такой как локус альбумина. Такие варианты реализации могут обеспечивать систему для отбора и размножения генетически модифицированных гепатоцитов in vivo в любом генетическом окружении, например, описанном в Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016. ЗкДНК-векторы согласно настоящему раскрытию могут содержать один или более селективных маркеров, которые позволяют проводить селекцию трансформированных, трансфицированных, трансдуцированных или подобных клеток. Селективный маркер представляет собой ген, продукт которого обеспечивает биоцидную или вирусную устойчивость, устойчивость к тяжелым металлам, прототрофию ауксотрофам, NeoR и т.п. Согласно определенным вариантам реализации в донорные последовательности включены маркеры для положительной селекции, такие как NeoR. Маркеры для отрицательной селекции могут быть включены после донорных последовательностей, например, последовательность нуклеиновой кислоты HSV-tk, кодирующая маркер для отрицательной селекции, может быть включена в конструкцию нуклеиновой кислоты после донорной последовательности.
С. Регуляторные переключатели
[00304] Молекулярный регуляторный переключатель представляет собой переключатель, который генерирует измеряемое изменение состояния в ответ на сигнал. Такие регуляторные переключатели можно подходящим образом комбинировать с зкДНК-векторами для экспрессии белка FVIII, описанными в данном документе, чтобы контролировать выход экспрессии белка FVIII с зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который служит для тонкой настройки экспрессии белка FVIII. Например, он может выполнять функцию биосдерживания зкДНК-вектора. Согласно некоторым вариантам реализации переключатель представляет собой двухпозиционный («ON/OFF») переключатель, который предназначен для запуска или остановки (т.е. прекращения) экспрессии белка FVIII в зкДНК-векторе контролируемым и регулируемым образом. Согласно некоторым вариантам реализации указанный переключатель может включать «аварийный выключатель», который может давать клетке, содержащей указанный зкДНК-вектор, команду для запуска механизма запрограммированной клеточной смерти после активации переключателя. Примерные регуляторные переключатели, предусмотренные для применения в зкДНК-векторе для экспрессии белка FVIII, могут применяться для регуляции экспрессии трансгена и более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.
(i) Бинарные регуляторные переключатели
[00305] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который может служить для контролируемой модуляции экспрессии белка FVIII. Например, экспрессионная кассета, расположенная между ITR зкДНК-вектора, может дополнительно содержать регуляторную область, например, промотор, цис-элемент, репрессор, энхансер и т.д., которая функционально связана с последовательностью нуклеиновой кислоты, кодирующей белок FVIII, причем указанная регуляторная область регулируется одним или более кофакторами или экзогенными агентами. В качестве неограничивающего примера, регуляторные области могут модулироваться низкомолекулярными переключателями или индуцируемыми или репрессируемыми промоторами. Неограничивающие примеры индуцируемых промоторов представляют собой индуцируемые гормонами или индуцируемые металлами промоторы. Другие примерные индуцируемые промоторные/энхансерные элементы включают, но не ограничиваются перечисленными, индуцируемый RU486 промотор, индуцируемый экдизоном промотор, индуцируемый рапамицином промотор и промотор металлотионеина.
(ii) Низкомолекулярные регуляторные переключатели
[00306] Различные известные из уровня техники регуляторные переключатели на основе малых молекул известны в данной области техники и могут быть скомбинированы с зкДНК-векторами для экспрессии белка FVIII, раскрытыми в данном документе, с получением контролируемого регуляторный переключателем зкДНК-вектора. Согласно некоторым вариантам реализации регуляторный переключатель может быть выбран из чего-либо одного или комбинации следующего: пара ортогональный лиганд/ядерный рецептор, например, вариант ретиноидного рецептора/LG335 и GRQCIMFI, вместе с искусственным промотором, контролирующим экспрессию функционально связанного трансгена, как раскрыто в Taylor et al. ВМС Biotechnology 10 (2010): 15; сконструированные рецепторы стероидов, например, модифицированный рецептор прогестерона с усеченным С-концом, который не может связывать прогестерон, но связывает RU486 (мифепристон) (патент США №5364791); рецептор экдизона дрозофилы (Drosophila) и его экдистероидные лиганды (Saez, et al., PNAS, 97(26)(2000), 14512-14517); или переключатель, контролируемый антибиотиком триметопримом (ТМР), как описано в Sando R 3rd; Nat Methods. 2013, 10(11): 1085-8. Согласно некоторым вариантам реализации регуляторный переключатель для контроля трансгена или экспрессируемый зкДНК-вектором представляет собой переключатель для активации пролекарств, такой как раскрытый в патентах США 8771679 и 6339070.
(iii) Регуляторные переключатели «с кодом доступа»
[00307] Согласно некоторым вариантам реализации регуляторный переключатель может представлять собой «переключатель с кодом доступа» или «контур с кодом доступа». Переключатели с кодом доступа позволяют точно настроить контроль экспрессии трансгена с зкДНК-вектора при возникновении конкретных условий, т.е. для осуществления экспрессии и/или репрессии трансгена должна иметься комбинация условий. Например, для осуществления экспрессии трансгена должны возникнуть по меньшей мере условия А и В. Регуляторный переключатель с кодом доступа может представлять собой любое число условий, например, по меньшей мере 2 или по меньшей мере 3, или по меньшей мере 4, или по меньшей мере 5, или по меньшей мере 6, или по меньшей мере 7 или более условий, наличие которых необходимо для осуществления экспрессии трансгена. Согласно некоторым вариантам реализации должны возникнуть по меньшей мере 2 условия (например, условия А, В), а в некоторых вариантах реализации должны возникнуть по меньшей мере 3 условия (например, А, В и С или А, В и D). Только в качестве примера, для осуществления экспрессии гена с зкДНК, содержащей регуляторный переключатель с кодом доступа «АВС», требуется наличие условий А, В и С. Условия А, В и С могут быть следующими; условие А представляет собой наличие состояния или заболевания, условие В представляет собой гормональный ответ, и условие С представляет собой ответ на экспрессию трансгена. Например, если трансген редактирует дефектный ген ЕРО, то условием А является наличие хронической болезни почек (ХБП), условие В осуществляется при наличии гипоксических условий в почках субъекта, условие С заключается в нарушении привлечения эритропоэтин-продуцирующих клеток (ЭПК) в почках; или, альтернативно, в нарушении активации HIF-2. При повышении уровней кислорода или достижении целевого уровня ЕРО трансген снова отключается до момента возникновения 3 условий, которые его опять включат.
[00308] Согласно некоторым вариантам реализации регуляторный переключатель с кодом доступа или «контур с кодом доступа», предусмотренный для применения в зкДНК-векторе, содержит гибридные транскрипционные факторы (TF) для расширения диапазона и уровня сложности сигналов окружающей среды, используемых для определения условий биосдерживания. В отличие от блокирующего (deadman) выключателя, который запускает гибель клетки при наличии заранее определенного условия, «контур с кодом доступа» позволяет обеспечить выживание клеток или экспрессию трансгена при наличии конкретного «кода доступа», и может быть легко перепрограммирован, что позволяет обеспечить экспрессию трансгена и/или выживание клеток только при наличии заранее заданного условия окружающей среды или кода доступа.
[00309] Любые и все комбинации регуляторных переключателей, раскрытых в данном документе, например, низкомолекулярные переключатели, переключатели на основе нуклеиновых кислот, гибридные переключатели на основе малых молекул и нуклеиновых кислот, посттранскрипционные регуляторные переключатели трансгенов, посттрансляционная регуляция, контролируемые излучением переключатели, опосредуемые гипоксией переключатели и другие регуляторные переключатели, известные специалистам в данной области техники, раскрытые в данном документе, могут применяться в регуляторном переключателе с кодом доступа, как раскрыто в данном документе. Регуляторные переключатели, предусмотренные для применения, также обсуждаются в обзорной статье Kis et al., JR Soc Interface. 12: 20141000 (2015) и обобщены в Таблице 1 статьи Kis. Согласно некоторым вариантам реализации регуляторный переключатель для применения в системе с кодом доступа может быть выбран из любых переключателей или их комбинации, раскрытых в Таблице 11 международной заявки на патент PCT/US18/49996, которая полностью включена в данный документ посредством ссылки.
(iv) Регуляторные переключатели на основе нуклеиновых кислот для контроля экспрессии трансгена
[00310] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК основан на механизме контроля на основе нуклеиновых кислот. Примерные механизмы контроля на основе нуклеиновых кислот известны в данной области техники и предусмотрены для применения. Например, такие механизмы включают рибопереключатели, такие как раскрытые, например, в US 2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, патенте США 9222093 и заявке на европейский патент ЕР288071, и раскрытые в обзорной статье Villa JK et al. Microbiol Spectr. 2018 May; 6(3). Также включены чувствительные к метаболитам транскрипционные биосенсоры, такие как раскрытые в WO2018/075486 и WO2017/147585. Другие известные в данной области техники механизмы, предусмотренные для применения, включают подавление трансгена с применением киРНК или молекулы РНКи (например, miR, кшРНК). Например, зкДНК-вектор может содержать регуляторный переключатель, кодирующий молекулу РНКи, которая комплементарна двум частям трансгена, экспрессируемого зкДНК-вектором. При экспрессии такой РНКи, даже если трансген (например, белок FVIII) экспрессируется зкДНК-вектором, будет происходить его подавление под действием комплементарной молекулы РНКи, а если РНКи не экспрессируется, при экспрессии трансгена (например, белка FVIII) зкДНК-вектором, подавление трансгена под действием РНКи не происходит.
[00311] Согласно некоторым вариантам реализации регуляторный переключатель представляет собой тканеспецифический самоинактивирующийся регуляторный переключатель, например, раскрытый в US2002/0022018, благодаря чему регуляторный переключатель преднамеренно выключает трансген (например, белок FVIII) в сайте, где в противном случае экспрессия трансгена могла бы быть неблагоприятной. Согласно некоторым вариантам реализации регуляторный переключатель представляет собой обратимую с помощью рекомбиназы систему экспрессии гена, например, раскрытую в US2014/0127162 и патенте США 8324436.
(v) Посттранскрипционные и посттрансляционные регуляторные переключатели.
[00312] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК-вектором представляет собой систему посттранскрипционной модификации. Например, такой регуляторный переключатель может представлять собой рибопереключатель-аптазим, чувствительный к тетрациклину или теофиллину, раскрытый в US2018/0119156, GB201107768, WO2001/064956A3, патенте ЕР 2707487 и Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et at., Elife. 2016 Nov 2;5. pii: e18858. Согласно некоторым вариантам реализации предусмотрено, что обычный специалист в данной области техники может закодировать как трансген, так и ингибиторную киРНК, которая содержит чувствительный к лиганду аптамер (отрицательный переключатель), в результате чего будет получен положительный переключатель, чувствительный к лиганду.
(vi) Другие примерные регуляторные переключатели
[00313] Любой известный регуляторный переключатель может быть использован в зкДНК-векторе для контроля экспрессии белка FVIII зкДНК-вектором, включая переключатели, запускаемые изменениями окружающей среды. Дополнительные примеры включают, но не ограничиваются перечисленными; метод ВОС согласно Suzuki et al., Scientific Reports 8; 10051 (2018); расширение генетического кода и нефизиологическую аминокислоту; контролируемые излучением или контролируемые ультразвуком положительные/отрицательные (on/off) переключатели (см., например, Scott S. et at, Gene Ther. 2000 Jul; 7(13): 1121-5; патенты США 5612318; 5571797; 5770581; 5817636; и WO 1999/025385 Al. Согласно некоторым вариантам реализации регуляторный переключатель контролируется имплантируемой системой, например, раскрытой в патенте США 7840263; US2007/0190028А1, в которой экспрессия гена контролируется одной или более формами энергии, включая электромагнитную энергию, что активирует промоторы, функционально связанные с трансгеном в зкДНК-векторе.
[00314] Согласно некоторым вариантам реализации регуляторный переключатель, предусмотренный для применения в зкДНК-векторе, представляет собой опосредуемый гипоксией или активируемый стрессом переключатель, например, такой как те, которые раскрыты в WO1999060142A2, патентах США 5834306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, а также элементы FROG, TOAD и NRSE и условно индуцируемые подавляющие элементы, включая элементы ответа на гипоксию (HRE), элементы ответа на воспаление (IRE) и активируемые сдвиговым напряжением элементы (SSAE), например, как раскрыто в патенте США 9394526. Такой вариант реализации можно применять для «включения» экспрессии трансгена с зкДНК-вектора после ишемии или в ишемических тканях и/или в опухолях.
(vii) «Аварийные выключатели»
[00315] Другие варианты реализации, описанные в данном документе, относятся к зкДНК-вектору для экспрессии белка FVIII, описанному в данном документе, содержащему аварийный выключатель. «Аварийный выключатель», раскрытый в данном документе, позволяет уничтожить клетку, содержащую указанный зкДНК-вектор, или подвергнуть ее программируемой клеточной гибели в качестве способа окончательного удаления введенного зкДНК-вектора из системы субъекта. Обычный специалист в данной области техники поймет, что применение «аварийных выключателей» в зкДНК-векторах для экспрессии белка FVIII, как правило, будет сопряжено с нацеливанием зкДНК-вектора на ограниченное число клеток, потеря которого является приемлемой для субъекта, или на тип клеток, апоптоз которых желателен (например, на раковые клетки). Во всех аспектах «аварийный выключатель», раскрытый в данном документе, разработан таким образом, чтобы обеспечить быстрое и надежное уничтожение клетки, содержащей зкДНК-вектор, в отсутствие входного сигнала выживания или другого заданного условия. Другими словами, «аварийный выключатель», кодируемый зкДНК-вектором для экспрессии белка FVIII, описанным в данном документе, может ограничивать выживание клетки, содержащей зкДНК-вектор, окружающей средой, задаваемой специфическими входными сигналами. Такие «аварийные выключатели» служат для обеспечения функции биологического сдерживания, если потребуется удалить зкДНК-вектор для экспрессии белка FVIII у субъекта или обеспечить отсутствие экспрессии с него кодируемого белка FVIII.
[00316] Другие «аварийные выключатели», известные обычному специалисту в данной области техники, предусмотрены для применения в зкДНК-векторе для экспрессии белка FVIII, раскрытом в данном документе, например, как раскрыто в US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, а также «аварийные выключатели», раскрытые в Jusiak et al., Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; и в Reinshagen et al, Science Translational Medicine, 2018, 11.
[00317] Соответственно, согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может содержать конструкцию нуклеиновой кислоты «аварийного выключателя», которая содержит нуклеиновую кислоту, кодирующую эффекторный токсин или репортерный белок, причем экспрессия эффекторного токсина (например, белка смерти) или репортерного белка контролируется с помощью заранее заданного условия. Например, предварительно заданным условием может быть наличие агента окружающей среды, такого как, например, экзогенный агент, без которого клетка по умолчанию будет экспрессировать эффекторный токсин (например, белок смерти) и будет уничтожена. Согласно альтернативным вариантам реализации предварительно заданным условием является наличие двух или более агентов окружающей среды, например, клетка будет выживать только при подаче двух или более необходимых экзогенных агентов, и без какого-либо из них клетка, содержащая зкДНК-вектор, уничтожается.
[00318] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII модифицируют для включения «аварийного выключателя» для разрушения клеток, содержащих указанный зкДНК-вектор, для эффективной остановки экспрессии in vivo трансгена, экспрессируемого указанным зкДНК-вектором (например, экспрессии белка FVIII). В частности, зкДНК-вектор дополнительно генетически сконструирован для экспрессии белка-переключателя, который не функционирует в клетках млекопитающих в нормальных физиологических условиях. Клетки, экспрессирующие белок-переключатель, будут разрушены только после введения лекарственного средства или воздействия условия окружающей среды, специфически нацеленных на указанный белок-переключатель, что остановит экспрессию терапевтического белка или пептида. Например, сообщалось, что клетки, экспрессирующие тимидинкиназу HSV, могут быть уничтожены при введении таких лекарственных средств как ганцикловир и цитозиндезаминаза. См., например, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), в Targets in Gene Therapy, под редакцией You (2011); и Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999). Согласно некоторым вариантам реализации зкДНК-вектор может содержать «аварийный выключатель» на основе киРНК, называемый DISE (гибель, индуцируемая устранением гена выживания, «Death Induced by Survival gene Elimination») (Murmann et al., Oncotarget. 2017; 8:84643-84658. Induction of DISE in ovarian cancer cells in vivo).
VI. Подробное описание способа получения зкДНК-вектора
А. Получение в целом
[00319] Некоторые способы получения зкДНК-вектора для экспрессии белка FVIII, содержащего пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, описаны в разделе IV международной заявки PCT/US18/49996, поданной 7 сентября 2018 г., которая полностью включена в данный документ посредством ссылки. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с использованием клеток насекомых, как описано в данном документе. Согласно альтернативным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен синтетическим способом и, в некоторых вариантах реализации, бесклеточным способом, как раскрыто в международной заявке PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки.
[00320] Как описано в данном документе, согласно одному варианту реализации, зкДНК-вектор для экспрессии белка FVIII может быть получен, например, с помощью способа, включающего этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в atca agcacaacat и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR для продуцирования зкДНК-вектора в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, такое как присутствующее в естественных условиях в ААВ-векторах или других вирусных векторах.
[00321] Присутствие зкДНК-вектора, выделенного из клеток-хозяев, может быть подтверждено путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на неденатурирующем геле для подтверждения присутствия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.
[00322] Согласно еще одному аспекту настоящего изобретения предложено применение линий клеток-хозяев, имеющих стабильно интегрированную в собственный геном полинуклеотидную матрицу для экспрессии ДНК-вектора (зкДНК-матрицу), в получении невирусного ДНК-вектора, например, как описано в Lee, L. et al. (2013) Plos One 8(8): e69879. Предпочтительно Rep добавляют к клеткам-хозяевам при MOI равной примерно 3. Когда линия клеток-хозяев представляет собой линию клеток млекопитающего, например, клетки НЕК293, линии клеток могут иметь стабильно интегрированную полинуклеотидную матрицу вектора, и второй вектор, такой как вирус герпеса, может использоваться для введения в клетки белка Rep, что позволяет вырезать и амплифицировать зкДНК в присутствии Rep и вспомогательного вируса.
[00323] Согласно одному варианту реализации клетки-хозяева, используемые для получения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, представляют собой клетки насекомых, и для доставки как полинуклеотида, который кодирует белок Rep, так и полинуклеотидной матрицы экспрессионной конструкции невирусного ДНК-вектора для зкДНК используют бакуловирус, например, согласно описанию на ФИГ. 4А-4С и в Примере 1. Согласно некоторым вариантам реализации клетку-хозяина конструируют так, чтобы она экспрессировала белок Rep.
[00324] Затем зкДНК-вектор собирают и выделяют из клеток-хозяев. Время сбора и извлечения зкДНК-векторов, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Согласно одному варианту реализации клетки культивируют в достаточных условиях и собирают через достаточное время после инфекции бакуловирусом, чтобы получить зкДНК-векторы, но до начала гибели большинства клеток из-за токсичности бакуловируса. ДНК-векторы могут быть выделены с применением наборов для очистки плазмид, таких как не содержащие эндотоксинов наборы для выделения плазмид (Endo-Free Plasmid Kits) от Qiagen. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для ДНК-векторов. Обычно могут быть использованы любые способы очистки нуклеиновых кислот.
[00325] ДНК-векторы могут быть очищены с помощью любых способов очистки ДНК, известных специалистам в данной области техники. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.
[00326] Наличие зкДНК-вектора для экспрессии белка FVIII может быть подтверждено путем расщепления векторной ДНК, выделенной из клеток, рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, и анализа как расщепленного, так и нерасщепленного ДНК-материала с использованием гель-электрофореза, чтобы подтвердить наличие характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК. ФИГ. 4С и ФИГ. 4D иллюстрируют один вариант реализации для идентификации наличия зкДНК-векторов с замкнутыми концами, продуцируемых с помощью способов, описанных в данном документе.
В. зкДНК-плазмида
[00327] ЗкДНК-плазмида представляет собой плазмиду, используемую для последующего получения зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-плазмида может быть сконструирована с использованием известных методик, чтобы обеспечить по меньшей мере элементы, перечисленные далее, в виде функционально связанных компонентов в направлении транскрипции: (1) модифицированную последовательность 5'-ITR; (2) экспрессионную кассету, содержащую цис-регуляторный элемент, например, промотор, индуцируемый промотор, регуляторный переключатель, энхансеры и т.п.; и (3) модифицированную последовательность 3'-ITR, причем указанная последовательность 3'-ITR симметрична относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации экспрессионная кассета, фланкированная ITR, содержит сайт клонирования для введения экзогенной последовательности. Экспрессионная кассета заменяет области, кодирующие rep и cap, геномов ААВ.
[00328] Согласно одному аспекту зкДНК-вектор для экспрессии белка FVIII получают из плазмиды, называемой в данном документе «зкДНК-плазмидой», кодирующей, в указанном порядке: первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), экспрессионную кассету, содержащую трансген, и мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ. Согласно альтернативным вариантам реализации зкДНК-плазмида кодирует, в указанном порядке: первый (или 5) модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные 5'- и 3'-ITR являются симметричными по отношению друг к другу. Согласно альтернативным вариантам реализации зкДНК-плазмид а кодирует, в указанном порядке: первый (или 5') модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмид а лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные модифицированные 5'- и 3'-ITR имеют одинаковые модификации (т.е. они являются обратно комплементарными или симметричными по отношению друг к другу).
[00329] Согласно дополнительному варианту реализации система зкДНК-плазмиды лишена последовательностей, кодирующих вирусный капсидный белок (т.е. лишена генов капсида ААВ, а также генов капсидов других вирусов). Кроме того, согласно конкретному варианту реализации зкДНК-плазмида также лишена последовательностей, кодирующих белок Rep ААВ. Соответственно, в предпочтительном варианте реализации зкДНК-плазмида лишена функциональных генов cap ААВ и rep ААВ, GG-3' для ААВ2, а также вариабельной палиндромной последовательности, обеспечивающей образование шпильки.
[00330] ЗкДНК-плазмида согласно настоящему изобретению может быть получена с использованием природных нуклеотидных последовательностей из геномов любых серотипов ААВ, хорошо известных в данной области техники. Согласно одному варианту реализации остов зкДНК-плазмиды происходит из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; из указателя вирусов Kotin and Smith («The Springer Index of Viruses»), доступного по ссылке, поддерживаемой Springer (веб-адрес: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (примечание: ссылки на указатель URL или базу данных подразумевают содержание доступного по ссылке ресурса URL или базы данных на фактическую дату подачи данной заявки). В конкретном варианте реализации остов зкДНК-плазмиды происходит из генома ААВ2. В другом конкретном варианте реализации остов зкДНК-плазмиды представляет собой синтетический остов, генетически сконструированный для включения на его 5'- и 3-концах ITR, происходящих из одного из указанных геномов ААВ.
[00331] ЗкДНК-плазмида необязательно может включать селектируемый или селективный маркер для использования при создании линии клеток, продуцирующей зкДНК-вектор. Согласно одному варианту реализации селективный маркер может быть вставлен после (т.е. в 3'-направлении) последовательности 3'-ITR. Согласно другому варианту реализации селективный маркер может быть вставлен перед (т.е. в 5'-направлении) последовательностью 5'-ITR. Подходящие селективные маркеры включают, например, маркеры, придающие устойчивость к лекарственному средству. Селективные маркеры могут представлять собой, например, гены устойчивости к бластицидину S, канамицину, генетицину и т.п. Согласно предпочтительному варианту реализации селективный маркер для отбора по чувствительности к лекарственному средству представляет собой ген устойчивости к бластицидину S.
[00332] Примерный зкДНК-вектор (например, рААВО) для экспрессии белка FVIII получают из плазмиды рААВ. Способ получения рААВ-вектора может включать: (а) доставку в клетку-хозяина плазмиды рААВ, как описано выше, при этом как клетка-хозяин, так и плазмида лишены генов, кодирующих капсидный белок, (b) культивирование клетки-хозяина в условиях, обеспечивающих продуцирование генома зкДНК; и (с) сбор клеток и выделение генома ААВ, продуцированного из указанных клеток.
C. Примерный способ получения зкДНК-векторов из зкДНК-плазмид
[00333] В данном документе также предложены способы получения бескапсидных зкДНК-векторов для экспрессии белка FVIII, в частности, способ с достаточно высоким выходом для обеспечения достаточного количества вектора для экспериментов in vivo.
[00334] Согласно некоторым вариантам реализации способ получения зкДНК-вектора для экспрессии белка FVIII включает следующие этапы: (1) введение конструкции нуклеиновой кислоты, содержащей экспрессионную кассету и последовательности двух симметричных ITR, в клетку-хозяина (например, клетки Sf9), (2) необязательно создание клональной линии клеток, например, с применением селективного маркера, присутствующего на плазмиде, (3) введение кодирующего Rep гена (либо путем трансфекции, либо инфекции бакуловирусом, несущим указанный ген) в указанную клетку насекомого; и (4) сбор клеток и очистку зкДНК-вектора. Конструкция нуклеиновой кислоты, содержащая экспрессионную кассету и последовательности двух ITR, описанная выше для получения зкДНК-вектора, может иметь форму зкДНК-плазмиды или бакмиды, или бакуловируса, полученных с использованием зкДНК-плазмиды, как описано ниже. Конструкция нуклеиновой кислоты может быть введена в клетку-хозяина путем трансфекции, вирусной трансдукции, стабильной интеграции или других способов, известных в данной области техники.
D. Линии клеток
[00335] Линии клеток-хозяев, используемые в получении зкДНК-вектора для экспрессии белка FVIII, могут включать линии клеток насекомых, происходящие из Spodoptera frugiperda, такие как клетки Sf9, Sf21, или клетки Trichoplusia ni, или линии клеток других беспозвоночных животных, позвоночных животных или других эукариотов, включая клетки млекопитающих. Также могут быть использованы другие линии клеток, известные обычному специалисту в данной области техники, такие как HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, моноциты, а также зрелые и незрелые дендритные клетки. Линии клеток-хозяев могут быть трансфицированы для стабильной экспрессии зкДНК-плазмиды для получения зкДНК-вектора с высоким выходом.
[00336] ЗкДНК-плазмиды могут быть введены в клетки Sf9 путем кратковременной трансфекции с использованием реагентов (например, липосомальных, фосфата кальция) или физических средств (например, электропорации), известных в данной области техники. В качестве альтернативы, могут быть созданы стабильные линии клеток Sf9 с зкДНК-плазмидой, стабильно интегрированной в их геномы. Такие стабильные линии клеток могут быть созданы путем включения селективного маркера в зкДНК-плазмиду согласно описанию выше. Если зкДНК-плазмида, используемая для трансфекции линии клеток, включает селективный маркер, например, для антибиотика, клетки, которые были трансфицированы зкДНК-плазмидой и интегрировали ДНК зкДНК-плазмиды в их геном, могут быть отобраны путем добавления антибиотика в среды для культивирования клеток. Затем устойчивые клоны клеток могут быть выделены с помощью методик разведения до получения отдельных клеток или переноса колоний и размножены.
Е. Выделение и очистка зкДНК-векторов:
[00337] Примеры способа получения и выделения зкДНК-векторов описаны на ФИГ. 4А-4Е и в конкретных примерах ниже. ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть получены из клеток-продуцентов, экспрессирующих белок (белки) Rep ААВ, дополнительно трансформированных зкДНК-плазмидой, зкДНК-бакмидой или зкДНК-бакуло вирусом. Плазмиды, которые можно применять для получения зкДНК-векторов, включают плазмиды, которые кодируют белок FVIII, или плазмиды, кодирующие один или более белков REP.
[00338] Согласно одному аспекту полинуклеотид кодирует белок Rep ААВ (Rep 78 или 68), доставляемый в клетку-продуцент в плазмиде (Rep-плазмиде), бакмиде (Rep-бакмиде) или бакуловирусе (Rep-бакуловирусе). Rep-плазмида, Rep-бакмида и Rep-бакуловирус могут быть получены с помощью способов, описанных выше.
[00339] В данном документе описаны способы получения зкДНК-вектора для экспрессии белка FVIII. Экспрессионные конструкции, используемые для получения зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут представлять собой плазмиду (например, зкДНК-плазмиды), бакмиду (например, зкДНК-бакмиду) и/или бакуловирус (например, зкДНК-бакуловирус). В качестве неограничивающего примера, зкДНК-вектор может быть получен из клеток, коинфицированных зкДНК-бакуловирусом и Rep-бакуловирусом. Белки Rep продуцированные с Rep-бакуловируса, могут реплицировать зкДНК-бакуловирус с получением зкДНК-векторов. В качестве варианта, зкДНК-векторы для экспрессии белка FVIII могут быть получены из клеток, стабильно трансфицированных конструкцией, содержащей последовательность, кодирующую белок Rep ААВ (Rep78/52), доставленной в Rep-плазмидах, Rep-бакмидах или Rep-бакуловирусе. зкДНК-бакуловирус может быть кратковременно трансфицирован в клетки, реплицирован с помощью белка Rep и может продуцировать зкДНК-векторы.
[00340] Бакмида (например, зкДНК-бакмида) может быть трансфицирована в пермиссивные клетки насекомых, такие как клетка Sf9, Sf21, Tni (Trichoplusia ni), клетка High Five, и генерировать зкДНК-бакуловирус, который представляет собой рекомбинантный бакуловирус, включающий последовательности, содержащие симметричные ITR и экспрессионную кассету. Клетки насекомых могут быть снова инфицированы зкДНК-бакуловирусом для получения следующего поколения рекомбинантного бакуловируса. Необязательно этап может быть повторен один или более раз для получения большего количества рекомбинантного бакуловируса.
[00341] Время сбора и извлечения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Обычно клетки могут быть собраны через период времени после инфекции бакуловирусом, достаточный для получения зкДНК-векторов (например, зкДНК-векторов), но до начала гибели большинства клеток из-за вирусной токсичности. ЗкДНК-векторы могут быть выделены из клеток Sf9 с использованием наборов для очистки плазмид, таких как наборы Qiagen ENDO-FREE PLASMID®. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для зкДНК-векторов. Обычно можно использовать любые известные в данной области техники способы очистки нуклеиновых кислот, а также коммерчески доступные наборы для экстракции ДНК.
[00342] В качестве альтернативы, очистку можно осуществлять путем щелочного лизиса клеточного осадка, центрифугирования полученного лизата и выполнения хроматографического разделения. В качестве одного неограничивающего примера, указанный способ можно выполнять путем загрузки супернатанта на ионообменную колонку (например, SARTOBIND Q®), которая удерживает нуклеиновые кислоты, с последующим элюированием (например, 1,2 М раствором NaCl) и выполнением дальнейшей хроматографической очистки на колонке для гель-фильтрации (например, на 6 Fast Flow GE). Бескапсидный ААВ-вектор затем выделяют, например, путем осаждения.
[00343] Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII также могут быть очищены в форме экзосом или микрочастиц. В данной области техники известно, что многие типы клеток высвобождают не только растворимые белки, но и сложные грузы белок/нуклеиновая кислота путем отделения мембранных микровезикул (Cocucci et al, 2009; ЕР 10306226.1). Такие везикулы включают микровезикулы (также называемые микрочастицами) и экзосомы (также называемые нановезикулами), и первые, и вторые содержат в качестве груза белки и РНК. Микровезикулы образуются в результате прямого отпочковывания плазматической мембраны, а экзосомы высвобождаются во внеклеточную среду при слиянии мультивезикулярных эндосом с плазматической мембраной. Соответственно, содержащие зкДНК-вектор микровезикулы и/или экзосомы могут быть выделены из клеток, трансдуцированных зкДНК-плазмидой или бакмидой, или бакуловирусом, полученным с использованием зкДНК-плазмиды.
[00344] Микровезикулы могут быть выделены путем фильтрации или ультрацентрифугирования культуральной среды при 20000×g, а экзосомы при 100000×g. Оптимальная продолжительность ультрацентрифугирования может быть определена экспериментально и зависит от конкретного типа клеток, из которых выделяют везикулы. Предпочтительно культуральную среду сначала очищают с помощью низкоскоростного центрифугирования (например, при 2000×g в течение 5-20 минут) и подвергают центробежному концентрированию с использованием, например, центрифужной колонки AMICON® (Millipore, Уотфорд, Великобритания). Микровезикулы и экзосомы могут быть дополнительно очищены с помощью FACS или MACS с использованием специфичных антител, распознающих конкретные поверхностные антигены, присутствующие на микровезикулах и экзосомах. Другие способы очистки микровезикул и экзосом включают, но не ограничиваются перечисленными, иммунопреципитацию, аффинную хроматографию, фильтрацию и магнитные гранулы, покрытые специфичными антителами или аптамерами. После очистки везикулы промывают, например, фосфатно-солевым буфером (ФСБ). Одним из преимуществ использования микровезикул или экзосом для доставки содержащих зкДНК везикул является то, что такие везикулы могут быть нацелены на клетки различных типов путем включения в их мембрану белков, распознаваемых специфическими рецепторами на соответствующих типах клеток. (см. также ЕР 10306226)
[00345] Другой аспект настоящего изобретения относится к способам очистки зкДНК-векторов из линий клеток-хозяев, которые стабильно интегрировали конструкцию зкДНК в их собственный геном. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.
[00346] ФИГ. 5 международной заявки PCT/US18/49996 показывает гель, подтверждающий продуцирование зкДНК из нескольких конструкций зкДНК-плазмид с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4D в Примерах.
VII. Фармацевтические композиции
[00347] Согласно другому аспекту предложены фармацевтические композиции. Фармацевтическая композиция содержит зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, и фармацевтически приемлемый носитель или разбавитель.
[00348] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтические композиции, пригодные для введения субъекту для in vivo доставки в клетки, ткани или органы субъекта. Как правило, фармацевтическая композиция содержит зкДНК-вектор, раскрытый в данном документе, и фармацевтически приемлемый носитель. Например, зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтическую композицию, подходящую для целевого пути терапевтического введения (например, парентерального введения). Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция. Фармацевтические композиции для терапевтических целей могут быть изготовлены в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации, включая зкДНК-вектор, который может быть изготовлен для доставки трансгена в нуклеиновой кислоте в клетки реципиента, что приводит к терапевтической экспрессии в них трансгена или донорной последовательности. Композиция также может включать фармацевтически приемлемый носитель.
[00349] Фармацевтически активные композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, могут быть изготовлены для доставки трансгена для различных целей в клетку, например, в клетки субъекта.
[00350] Фармацевтические композиции для терапевтических целей, как правило, должны быть стерильными и стабильными в условиях изготовления и хранения. Композиция может быть изготовлена в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации.
[00351] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть включен в фармацевтическую композицию, пригодную для местного, системного, внутриамниотического, интратекального, внутричерепного, внутриартериального, внутривенного, внутрилимфатического, внутрибрюшинного, подкожного, трахеального, внутритканевого (например, внутримышечного, внутрисердечного, внутрипеченочного, внутрипочечного, интрацеребрального), интратекального, интравезикального, конъюнктивального (например, экстраорбитального, интраорбитального, ретроорбитального, интраретинального, субретинального, хориоидального, субхориоидального, интрастромального, интракамерального и интравитреального), интракохлеарного и мукозального (например, перорального, ректального, назального) введения. Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция.
[00352] В некоторых аспектах способы, предложенные в данном документе, включают доставку одного или более зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, в клетку-хозяина. В данном документе также предложены клетки, полученные с помощью таких способов, и организмы (такие как животные, растения или грибы), содержащие или полученные из таких клеток. Способы доставки нуклеиновых кислот могут включать липофекцию, нуклеофекцию, микроинъекцию, биолистику, липосомы, иммунолипосомы, конъюгаты поликатион или липид:нуклеиновая кислота, «незащищенную» ДНК и усиленное агентом поглощение ДНК. Липофекция описана, например, в патентах США №№5049386, 4946787 и 4897355, и реагенты для липофекции продаются коммерчески (например, трансфектам (Transfectam™) и липофектин (Lipofectin™)). Доставка может осуществляться в клетки (например, введение in vitro или ex vivo) или в ткани-мишени (например, введение in vivo).
[00353] В данной области техники известны различные методики и способы доставки нуклеиновых кислот в клетки. Например, нуклеиновые кислоты, такие как зкДНК для экспрессии белка FVIII, могут быть изготовлены в виде состава липидных наночастиц (ЛНЧ), липидоидов, липосом, липидных наночастиц, липоплексов или наночастиц типа ядро-оболочка. Как правило, ЛНЧ состоят из молекул нуклеиновой кислоты (например, зкДНК), одного или более ионизируемых или катионных липидов (или их солей), одного или более неионных или нейтральных липидов (например, фосфолипида), молекулы, которая предотвращает агрегацию (например, ПЭГ или конъюгата ПЭГ-липид), и необязательно стерина (например, холестерина).
[00354] Другой способ доставки нуклеиновых кислот, таких как зкДНК для экспрессии белка FVIII, в клетку заключается в конъюгации нуклеиновой кислоты с лигандом, который интернализуется клеткой. Например, лиганд может связывать рецептор на поверхности клетки и интернализоваться за счет эндоцитоза. Лиганд может быть ковалентно связан с нуклеотидом в нуклеиновой кислоте. Примерные конъюгаты для доставки нуклеиновых кислот в клетку описаны, например, в WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 и WO2017/177326.
[00355] Нуклеиновые кислоты, такие как зкДНК-векторы для экспрессии белка FVIII, также могут быть доставлены в клетку путем трансфекции. Подходящие способы трансфекции включают, но не ограничиваются перечисленными, опосредуемую липидами трансфекцию, опосредуемую катионным полимером трансфекцию или осаждение фосфатом кальция. Реагенты для трансфекции хорошо известны в данной области техники и включают, но не ограничиваются перечисленными, реагент для трансфекции TurboFect (Thermo Fisher Scientific), реагент Pro-Ject (Thermo Fisher Scientific), реагент для трансфекции белков TRANSPASS™ Р (New England Biolabs), реагент для доставки белков CHARIOT™ (Active Motif), реагент для трансфекции белков PROTEOJUICE™ (EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTIN™ (Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Базель, Швейцария), FUGENE™ HD (Roche), TRANSFECTAM™ (трансфектам, Promega, Мэдисон, Висконсин), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Геркулес, Калифорния), SILENTFECT™ (Bio-Rad), EfFectene™ (Qiagen, Валенсия, Калифорния), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, Сан-Диего, Калифорния), DHARMAFECT 1™ (Dharmacon, Лафайет, Колорадо), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, Сент-Луис, Миссури) и ESCORT™ IV (Sigma Chemical Co.). Нуклеиновые кислоты, такие как зкДНК, также могут быть доставлены в клетку с помощью микроструйных способов, известных специалистам в данной области техники.
[00356] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, также можно вводить непосредственно в организм для трансдукции клеток in vivo. Введение осуществляют любым из путей, обычно используемых для приведения молекулы в максимальный контакт с клетками крови или тканей, включая, но не ограничиваясь перечисленными, инъекцию, инфузию, местное нанесение и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники, и хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более быструю и более эффективную реакцию по сравнению с другим путем введения.
[00357] Способы введения векторной нуклеиновой кислоты, такой как зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут включать доставку в гемопоэтические стволовые клетки, например, с помощью способов, описанных, например, в патенте США №5928638.
[00358] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды. Примерные липосомы и липосомные составы, включая, но не ограничиваясь перечисленными, соединения, содержащие функциональные группы полиэтиленгликоля (ПЭГ), раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и в международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., например, см. раздел, озаглавленный «Фармацевтические составы».
[00359] Различные способы доставки, известные в данной области техники, или их модификации, могут быть использованы для доставки зкДНК-векторов in vitro или in vivo. Например, согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII доставляют, образуя кратковременное отверстие в клеточной мембране с использованием механической, электрической, ультразвуковой, гидродинамической или лазерной энергии так, чтобы облегчить вход ДНК в целевые клетки. Например, зкДНК-вектор может быть доставлен путем кратковременного разрыва клеточной мембраны путем продавливания клетки через канал ограниченного размера или другими способами, известными в данной области техники. В некоторых случаях зкДНК-вектор по отдельности напрямую вводят в виде незащищенной ДНК путем инъекции в любую из: любой одной или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка, кожи, тимуса, сердечной мышцы или скелетной мышцы. В некоторых случаях зкДНК-вектор доставляют с помощью генной пушки. Сферические частицы золота или вольфрама (диаметром 1-3 мкм), покрытые бескапсидными ААВ-векторами, могут быть разогнаны до высокой скорости с помощью сжатого газа для проникновения в клетки целевой ткани.
[00360] Композиции, содержащие зкДНК-вектор для экспрессии белка FVIII и фармацевтически приемлемый носитель, конкретно предусмотрены в данном документе. Согласно некоторым вариантам реализации зкДНК-вектор изготовлен с липидной системой доставки, например, липосомами, как описано в данном документе. Согласно некоторым вариантам реализации такие композиции вводят любым путем, желательным для квалифицированного специалиста. Композиции могут быть введены субъекту различными путями, включая пероральный, парентеральный, сублингвальный, трансдермальный, ректальный, трансмукозальный, местный, путем ингаляции, путем буккального введения, внутриплевральный, внутривенный, внутриартериальный, внутрибрюшинный, подкожный, внутримышечный, интраназальный, интратекальный и внутрисуставной или их комбинации. Для ветеринарного применения композиция может быть введена в виде достаточно приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринарный врач может легко определить схему дозирования и путь введения, которые наиболее подходят для конкретного животного. Композиции могут быть ведены с помощью обычных шприцев, безыгольных инъекционных устройств, «генных пушек с бомбардировкой микрочастицами» или других физических методов, таких как электропорация («ЭП»), гидродинамические методы или применение ультразвука.
[00361] В некоторых случаях зкДНК-вектор для экспрессии белка FVIII доставляют путем гидродинамической инъекции, которая представляет собой простой и высокоэффективный способ прямой внутриклеточной доставки любых водорастворимых соединений и частиц во внутренние органы и скелетные мышцы во всей конечности.
[00362] В некоторых случаях зкДНК-векторы для экспрессии белка FVIII доставляют с помощью ультразвука, создавая наноскопические поры в мембране для облегчения внутриклеточной доставки частиц ДНК в клетки внутренних органов или опухолей, поэтому размер и концентрация плазмидной ДНК имеют большое значение для эффективности системы. В некоторых случаях зкДНК-векторы доставляют путем магнитофекции с использованием магнитных полей для концентрирования частиц, содержащих нуклеиновую кислоту, в клетках-мишенях.
[00363] В некоторых случаях могут быть использованы химические системы доставки, например, с использованием наномерных комплексов, которые включают уплотнение отрицательно заряженной нуклеиновой кислоты поликатионными наномерными частицами, в составе катионной липосомы/мицеллы или катионных полимеров. Катионные липиды, используемые в указанном способе доставки, включают, но не ограничиваются перечисленными, моновалентные катионные липиды, поливалентные катионные липиды, гуанидин-содержащие соединения, соединения производных холестерина, катионные полимеры (например, полиэтиленимин, поли-L-лизин, протамин, другие катионные полимеры) и гибриды липид-полимер.
А. Экзосомы
[00364] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют упакованным в экзосоме. Экзосомы представляют собой небольшие мембранные везикулы эндоцитарного происхождения, которые высвобождаются во внеклеточную среду после слияния мультивезикулярных телец с плазматической мембраной. Их поверхность состоит из липидного бислоя клеточной мембраны донорной клетки, они содержат цитозоль из клетки, которая продуцировала экзосому, и экспонируют на поверхности мембранные белки родительской клетки. Экзосомы продуцируются различными типами клеток, в том числе эпителиальными клетками, В- и Т-лимфоцитами, тучными клетками (МС), а также дендритными клетками (DC). Согласно некоторым вариантам реализации для применения предусмотрены экзосомы с диаметром от 10 нм до 1 мкм, от 20 нм до 500 нм, от 30 нм до 250 нм, от 50 до 100 нм. Экзосомы могут быть выделены для доставки в целевые клетки либо с использованием их донорных клеток, либо путем введения в них конкретных нуклеиновых кислот. Для получения экзосом, содержащих бескапсидные ААВ-векторы согласно настоящему изобретению, могут быть использованы различные подходы, известные в данной области техники.
В. Микрочастица/наночастицы
[00365] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью липидной наночастицы. Обычно липидные наночастицы содержат ионизируемый аминолипид (например, гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат, DLin-MC3-DMA, фосфатидилхолин(1,2-дистеароил-sn-глицеро-3-фосфохолин, DSPC), холестерин и липид оболочки (полиэтиленгликоль-димиристоилглицерин, ПЭГ-ДМГ), например, как раскрыто Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507.
[00366] Согласно некоторым вариантам реализации липидная наночастица имеет средний диаметр от примерно 10 до примерно 1000 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 10 до примерно 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 200 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 25 до примерно 200 нм. Согласно некоторым вариантам реализации препарат липидных наночастиц (например, композиция, содержащая множество липидных наночастиц) имеет распределение по размерам, при котором средний размер (например, диаметр) составляет от примерно 70 нм до примерно 200 нм, и более типично средний размер составляет примерно 100 нм или менее.
[00367] Для доставки ДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, могут быть использованы различные липидные наночастицы, известные в данной области техники. Например, различные способы доставки с применением липидных наночастиц описаны в патентах США №№9404127, 9006417 и 9518272.
[00368] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью наночастицы золота. Обычно нуклеиновая кислота может быть ковалентно связана с наночастицей золота или нековалентно связана с наночастицей золота (например, связана заряд-зарядным взаимодействием), например, согласно описанию Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. Согласно некоторым вариантам реализации конъюгаты наночастицы золота с нуклеиновой кислотой получают с использованием способов, описанных, например, в патенте США №6812334.
C. Конъюгаты
[00369] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован (например, ковалентно связан) с агентом, который увеличивает клеточное поглощение. «Агент, который увеличивает клеточное поглощение» представляет собой молекулу, которая облегчает транспорт нуклеиновой кислоты через липидную мембрану. Например, нуклеиновая кислота может быть конъюгирована с липофильным соединением (например, холестерином, токоферолом и т.д.), проникающим в клетки пептидом (СРР) (например, пенетратином, TAT, Syn1B и т.д.) и полиаминами (например, спермином). Дополнительные примеры агентов, которые увеличивают поглощение клетками, раскрыты, например, в Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.
[00370] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полимером (например, полимерной молекулой) или молекулой фолата (например, молекулой фолиевой кислоты). В целом, доставка нуклеиновых кислот, конъюгированных с полимерами, известна в данной области техники, например, описана в WO2000/34343 и WO2008/022309. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полиамидным полимером, например, согласно описанию в патенте США №8987377. Согласно некоторым вариантам реализации нуклеиновая кислота, описанная в настоящем раскрытии, конъюгирована с молекулой фолиевой кислоты согласно описанию в патенте США №8507455.
[00371] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с углеводом, например, как описано в патенте США №8450467.
D. Нанокапсула
[00372] В качестве альтернативы, могут применяться нанокапсульные составы зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Обычно нанокапсулы могут захватывать вещества стабильным и воспроизводимым образом. Чтобы избежать побочных эффектов, обусловленных внутриклеточной перегрузкой полимерами, такие ультрадисперсные частицы (размером около 0,1 мкм) необходимо конструировать с использованием полимеров, способных разлагаться in vivo. Предусмотрено применение биоразлагаемых полиалкил-цианоакрилатных наночастиц, которые удовлетворяют таким требованиям.
E. Липосомы
[00373] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.
[00374] Изготовление и применение липосом в целом известно специалистам в данной области техники. Были разработаны липосомы с улучшенной стабильностью в сыворотке и временем полужизни в кровотоке (патент США №5741516). Кроме того, были описаны различные способы получения липосом и липосомоподобных препаратов в качестве потенциальных носителей лекарственных средств (патенты США №№5567434; 5552157; 5565213; 5738868 и 5795587).
F. Примерные композиции липосом и липидных наночастиц (ЛНЧ)
[00375] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку, например, в клетку, нуждающуюся в экспрессии трансгена. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.
[00376] Липидные наночастицы (ЛНЧ), содержащие зкДНК-векторы, раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ, и предусмотрены для применения в способах и композициях зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.
[00377] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который включает одно или более соединений с функциональной группой полиэтиленгликоля (ПЭГ) (так называемых «пегилированных соединений»), которые могут снижать иммуногенность/антигенность, обеспечивать гидрофильность и гидрофобность, а также уменьшать частоту дозирования соединения (соединений). В других случаях, липосомальный состав просто включает полимер полиэтиленгликоль (ПЭГ) в качестве дополнительного компонента. В таких аспектах молекулярная масса ПЭГ или функциональной группы ПЭГ может составлять от 62 Да до примерно 5000 Да.
[00378] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который доставит АФИ с профилем пролонгированного или контролируемого высвобождения на протяжении периода времени от нескольких часов до недель. Согласно некоторым родственным аспектам липосомальный состав может содержать водные камеры, которые ограничены липидными бислоями. Согласно другим родственным аспектам липосомальный состав инкапсулирует АФИ с компонентами, которые претерпевают физический переход при повышенной температуре, который высвобождает АФИ в течение периода от нескольких часов до недель.
[00379] Согласно некоторым аспектам липосомальный состав содержит сфингомиелин и один или более липидов, раскрытых в данном документе. Согласно некоторым аспектам липосомальный состав содержит оптисомы.
[00380] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит один или более липидов, выбранных из: натриевой соли N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина, (дистеароил-sn-глицерофосфоэтаноламина), MPEG (метоксиполиэтиленгликоль)-конъюгированного липида, HSPC (гидрогенизированного соевого фосфатидилхолина); ПЭГ (полиэтиленгликоля); DSPE (дистеароил-sn-глицерофосфоэтаноламина); DSPC (дистеароилфосфатидилхолина); DOPC (диолеоилфосфатидилхолина); DPPG (дипальмитоилфосфатидилглицерина); ЕРС (яичного фосфатидилхолина); DOPS (диолеоилфосфатидилсерина); РОРС (пальмитоилолеоилфосфатидилхолина); SM (сфингомиелина); MPEG (метоксиполиэтиленгликоля); DMPC (димиристоилфосфатидилхолина); DMPG (димиристоилфосфатидилглицерина); DSPG (дистеароилфосфатидилглицерина); DEPC (диэрукоилфосфатидилхолина); DOPE (диолеоил-sn-глицерофосфоэтаноламина); сульфата холестерина (CS); дипальмитоилфосфатидилглицерина (DPPG); DOPC (диолеоил-sn-глицерофосфатидилхолина) или любой их комбинации.
[00381] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий фосфолипид, холестерин и пегилированный липид в молярном соотношении 56:38:5. Согласно некоторым аспектам общее содержание липидов в липосомальном составе составляет 2-16 мг/мл. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид, в молярном соотношении 3:0,015:2, соответственно. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, холестерин и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, и холестерин. Согласно некоторым аспектам пегилированный липид представляет собой ПЭГ-2000-DSPE. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий DPPG, соевый ФХ, липидный конъюгат MPEG-DSPE и холестерин.
[00382] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более липидов, содержащих фосфатидилхолиновую функциональную группу, и один или более липидов, содержащих этаноламиновую функциональную группу. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более из: липидов, содержащих фосфатидилхолиновую функциональную группу, липидов, содержащих этаноламиновую функциональную группу, и стеринов, например, холестерина. Согласно некоторым аспектам липосомальный состав содержит DOPC/DEPC; и DOPE.
[00383] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, дополнительно содержащий одно или более фармацевтических вспомогательных веществ, например, сахарозу и/или глицин.
[00384] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав с униламеллярной или мультиламеллярной структурой. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит мультивезикулярные частицы и/или частицы на основе пены. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, относительный размер которого больше, чем у обычных наночастиц, и составляет примерно от 150 до 250 нм. Согласно некоторым аспектам липосомальный состав представляет собой лиофилизированный порошок.
[00385] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который получают и нагружают зкДНК-векторами, раскрытыми или описанными в данном документе, путем добавления слабого основания к смеси, содержащей выделенную зкДНК вне липосомы. Такое добавление повышает значение рН вне липосом до приблизительно 7,3 и стимулирует вход АФИ в липосому. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, имеющий кислый рН внутри липосомы. В таких случаях значение рН внутри липосом может составлять 4-6,9 и более предпочтительно рН 6,5. Согласно другим аспектам настоящего раскрытия предложен липосомальный состав, полученный с применением технологии внутрилипосомальной стабилизации лекарственных средств. В таких случаях используют полимерные или неполимерные высокозаряженные анионы и внутрилипосомальные захватывающие агенты, например, полифосфат или октасульфат сахарозы.
[00386] Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК, полученной с помощью способа, раскрытого в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая включена в данный документ.Это можно осуществлять путем интенсивного смешивания этанольных растворов липидов с водным раствором зкДНК при низком рН, при котором происходит протонирование ионизируемого липида и обеспечиваются благоприятные энергетические характеристики для ассоциации зкДНК/липида и нуклеации частиц. Частицы могут быть дополнительно стабилизированы путем разбавления водой и удаления органического растворителя. Частицы могут быть сконцентрированы до целевого уровня.
[00387] Обычно липидные частицы получают при соотношении общего количества липида и зкДНК (массовом или весовом) от примерно 10:1 до 30:1. Согласно некоторым вариантам реализации соотношение липида и зкДНК (массовое соотношение; отношение масс/масс.) может находиться в диапазоне значений от примерно 1:1 до примерно 25:1, от примерно 10:1 до примерно 14:1, от примерно 3:1 до примерно 15:1, от примерно 4:1 до примерно 10:1, от примерно 5:1 до примерно 9:1 или от примерно 6:1 до примерно 9:1. Количества липидов и зкДНК могут быть скорректированы, чтобы обеспечить целевое соотношение N/P, например, соотношение N/P, равное 3, 4, 5, 6, 7, 8, 9, 10 или выше. Обычно общее содержание липидов в составе липидных частиц может быть в диапазоне от примерно 5 мг/мл до примерно 30 мг/мл.
[00388] Ионизируемый липид, как правило, применяется для конденсации груза нуклеиновой кислоты, например, зкДНК, при низком рН, и для стимуляции ассоциации мембран и их фузогенности. Обычно ионизируемые липиды представляют собой липиды, содержащие по меньшей мере одну аминогруппу, которая положительно заряжена или становится протонированной в кислых условиях, например, при рН 6,5 или ниже. В данном документе ионизируемые липиды также называют катионными липидами.
[00389] Примерные ионизируемые липиды описаны в международных РСТ публикациях патентов WO 2015/095340, WO 2015/199952, WO 2018/011633, WO 2017/049245, WO 2015/061467, WO 2012/040184, WO 2012/000104, WO 2015/074085, WO 2016/081029, WO 2017/004143, WO 2017/075531, WO 2017/117528, WO 2011/022460, WO 2013/148541, WO 2013/116126, WO 2011/153120, WO 2012/044638, WO 2012/054365, WO 2011/090965, WO 2013/016058, WO 2012/162210, WO 2008/042973, WO 2010/129709, WO 2010/144740, WO 2012/099755, WO 2013/049328, WO 2013/086322, WO 2013/086373, WO 2011/071860, WO 2009/132131, WO 2010/048536, WO 2010/088537, WO 2010/054401, WO 2010/054406, WO 2010/054405, WO 2010/054384, WO 2012/016184, WO 2009/086558, WO 2010/042877, WO 2011/000106, WO 2011/000107, WO 2005/120152, WO 2011/141705, WO 2013/126803, WO 2006/007712, WO 2011/038160, WO 2005/121348, WO 2011/066651, WO 2009/127060, WO 2011/141704, WO 2006/069782, WO 2012/031043, WO 2013/006825, WO 2013/033563, WO 2013/089151, WO 2017/099823, WO 2015/095346 и WO 2013/086354, и публикациях патентов США US 2016/0311759, US 2015/0376115, US 2016/0151284, US 2017/0210697, US 2015/0140070, US 2013/0178541, US 2013/0303587, US 2015/0141678, US 2015/0239926, US 2016/0376224, US 2017/0119904, US 2012/0149894, US 2015/0057373, US 2013/0090372, US 2013/0274523, US 2013/0274504, US 2013/0274504, US 2009/0023673, US 2012/0128760, US 2010/0324120, US 2014/0200257, US 2015/0203446, US 2018/0005363, US 2014/0308304, US 2013/0338210, US 2012/0101148, US 2012/0027796, US 2012/0058144, US 2013/0323269, US 2011/0117125, US 2011/0256175, US 2012/0202871, US 2011/0076335, US 2006/0083780, US 2013/0123338, US 2015/0064242, US 2006/0051405, US 2013/0065939, US 2006/0008910, US 2003/0022649, US 2010/0130588, US 2013/0116307, US 2010/0062967, US 2013/0202684, US 2014/0141070, US 2014/0255472, US 2014/0039032, US 2018/0028664, US 2016/0317458 и US 2013/0195920, содержание которых полностью включено в данный документ посредством ссылки.
[00390] Согласно некоторым вариантам реализации ионизируемый липид представляет собой МС3 (6Z,9Z,28Z,31Z)-гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (DLin-MC3-DMA или МСЗ), имеющий следующую структуру:
[00391] Липид DLin-MC3-DMA описан в Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533, содержание которой полностью включено в данный документ посредством ссылки.
[00392] Согласно некоторым вариантам реализации ионизируемый липид представляет собой липид АТХ-002, описанный в WO 2015/074085, содержание которого полностью включено в данный документ посредством ссылки.
[00393] Согласно некоторым вариантам реализации ионизируемый липид представляет собой (13Z,16Z)-N,N-диметил-3-нонилдокоза-13,16-диен-1-амин (Соединение 32), описанный в WO 2012/040184, содержание которого полностью включено в данный документ посредством ссылки.
[00394] Согласно некоторым вариантам реализации ионизируемый липид представляет собой Соединение 6 или Соединение 22, описанные в WO 2015/199952, содержание которого полностью включено в данный документ посредством ссылки.
[00395] Без ограничений, ионизируемый липид может составлять 20-90% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, молярное содержание ионизируемого липида может составлять 20-70% (мол.), 30-60% (мол.) или 40-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации ионизируемый липид составляет от примерно 50 мол. % до примерно 90 мол. % от общего количества липидов, присутствующих в липидной наночастице.
[00396] Согласно некоторым аспектам липидная наночастица может дополнительно содержать некатионный липид. Неионогенные липиды включают амфипатические липиды, нейтральные липиды и анионные липиды. Соответственно, некатионный липид может представлять собой нейтральный незаряженный, цвиттерионный или анионный липид. Некатионные липиды, как правило, применяют для усиления фузогенности.
[00397] Примерные некатионные липиды, предусмотренные для применения в способах и композициях, раскрытых в данном документе, описаны в международной заявке PCT7US 2018/050042, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ. Примерные некатионные липиды описаны в публикации международной заявки WO 2017/099823 и публикации патента США US 2018/0028664, содержание которых полностью включено в данный документ посредством ссылки.
[00398] Некатионный липид может составлять 0-30% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, содержание некатионного липида составляет 5-20% (мол.) или 10-15% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно различным вариантам реализации молярное соотношение ионизируемого липида и нейтрального липида колеблется от примерно 2:1 до примерно 8:1.
[00399] Согласно некоторым вариантам реализации липидные наночастицы не содержат каких-либо фосфолипидов. Согласно некоторым аспектам липидная наночастица может дополнительно содержать компонент, такой как стерин, для обеспечения целостности мембраны.
[00400] Один примерный стерин, который подходит для применения в липидной наночастице, представляет собой холестерин и его производные. Примерные производные холестерина описаны в международной заявке WO 2009/127060 и публикации патента США US 2010/0130588, содержание которых полностью включено в данный документ посредством ссылки.
[00401] Компонент, обеспечивающий целостность мембраны, такой как стерин, может составлять 0-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации такой компонент составляет 20-50% (мол.) 30-40% (мол.) от общего содержания липидов липидной наночастицы.
[00402] 1200
содержать полиэтиленгликоль (ПЭГ) или молекулу конъюгированного липида. Обычно их используют для ингибирования агрегации липидных наночастиц и/или для обеспечения стерической стабилизации. Примерные конъюгированные липиды включают, но не ограничиваются перечисленными, конъюгаты ПЭГ-липид, конъюгаты полиоксазолин (Р07)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид), конъюгаты катионная группа-полимер-липид (CPL); и их смеси. Согласно некоторым вариантам реализации молекула конъюгированного липида представляет собой конъюгат ПЭГ-липид, например, метоксиполиэтиленгликоль-конъюгированный липид. Примерные конъюгаты ПЭГ-липид включают, но не ограничиваются перечисленными, ПЭГ-диацилглицерин (ДАТ) (такой как 1-(монометоксиполиэтиленгликоль)-2,3-димиристоилглицерин (ПЭГ-ДМГ)), ПЭГ-диалкилоксипропил (ДАА), ПЭГ-фосфолипид, ПЭГ-церамид (Cer), пегилированный фосфатидилэтаноламин (ПЭГ-ФЭ), ПЭГ-сукцинатдиацилглицерин (PEGS-DAG) (такой как 4-O-(2',3'-ди(тетрадеканоилокси)пропил-1-O)-(w-метокси(полиэтокси)этил)бутандиоат (PEG-S-DMG)), ПЭГ-диалкоксипропилкарбам, натриевая соль N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина или их смесь. Дополнительные примерные конъюгаты ПЭГ-липид описаны, например, в US5885613, US6287591, US 2003/0077829, US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2010/0130588, US 2016/0376224 и US 2017/0119904, содержание которых полностью включено в данный документ посредством ссылки.
[00403] Согласно некоторым вариантам реализации ПЭГ-липид представляет собой соединение, раскрытое в US 2018/0028664, содержание которого включено в данный документ посредством ссылки в полном объеме. Согласно некоторым вариантам реализации ПЭГ-липид раскрыт в US 20150376115 или в US 2016/0376224, содержание которых полностью включено в данный документ посредством ссылки.
[00404] Конъюгат ПЭГ-ДАА может представлять собой, например, ПЭГ-дилаурилоксипропил, ПЭГ-димиристилоксипропил, ПЭГ-дипальмитилоксипропил или ПЭГ-дистеарилоксипропил. ПЭГ-липид может представлять собой одно или более из ПЭГ-ДМГ, ПЭГ-дилаурилглицерина, ПЭГ-дипальмитоилглицерина, ПЭГ-дистерилглицерина, ПЭГ-дилаурилгликамида, ПЭГ-димиристилгликамида, ПЭГ-дипальмитоилгликамида, ПЭГ-дистерилгликамида, ПЭГ-холестерина (1-[8'-(холест-5-ен-3β-окси)карбоксамидо-3',6'-диоксаоктанил]карбамоил-[омега]-метилполиэтиленгликоль), ПЭГ-DMB (простой эфир 3,4-дитетрадекоксилбензил-[омега]-метилполиэтиленгликоля) и 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-К-[метоксиполиэтиленгликоля-2000]. В некоторых примерах ПЭГ-липид может быть выбран из группы, состоящей из ПЭГ-ДМГ, 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-N-[метоксиполиэтиленгликоля-2000].
[00405] Липиды, конъюгированные с молекулой, отличной от ПЭГ, также могут быть использованы вместо ПЭГ-липида. Например, конъюгаты полиоксазолин (POZ)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид) и конъюгаты катионная группа-полимер-липид (CPL) могут применяться вместо или вместе с ПЭГ-липидом. Примерные конъюгированные липиды, т.е. ПЭГ-липиды, конъюгаты (POZ)-липид, конъюгаты АТТА-липид и катионный полимер-липиды, описаны в публикациях международных заявок на патент WO1996/010392, WO1998/051278, WO 2002/087541, WO 2005/026372, WO 2008/147438, WO 2009/086558, WO 2012/000104, WO 2017/117528, WO 2017/099823, WO 2015/199952, WO 2017/004143, WO 2015/095346, WO 2012/000104, WO 2012/000104 и WO 2010/006282, публикациях заявок на патент США US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2013/0303587, US 2018/0028664, US 2015/0376115, US 2016/0376224, US 2016/0317458, US 2013/0303587, US 2013/0303587 и US 20110123453, и патентах США US 5885613, US 6287591, US 6320017 и US 6586559, содержание которых полностью включено в данный документ посредством ссылки.
[00406] Согласно некоторым вариантам реализации одно или более дополнительных соединений могут представлять собой терапевтический агент. Терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран в соответствии с терапевтической целью и целевым биологическим действием. Например, если зкДНК в ЛНЧ можно применять для лечения гемофилии А, дополнительное соединение может представлять собой агент, направленный против гемофилии А (например, химиотерапевтический агент или другую терапию гемофилии А (включая, но не ограничиваясь перечисленными, малую молекулу или антитело). Согласно другому примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения инфекции, дополнительное соединение может представлять собой антимикробный агент (например, антибиотик или противовирусное соединение). Согласно еще одному примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения иммунного заболевания или нарушения, дополнительное соединение может представлять собой соединение, которое модулирует иммунный ответ (например, иммуносупрессор, иммуностимулирующее соединение или соединение, модулирующее один или более конкретных иммунных путей). Согласно некоторым вариантам реализации в композициях и способах согласно настоящему изобретению могут применяться другие смеси различных липидных наночастиц, содержащих другие соединения, такие как зкДНК, кодирующая другой белок или другое соединение, такое как терапевтическое средство.
[00407] Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуномодулирующий агент. Например, дополнительное соединение представляет собой иммуносупрессор. Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуностимулирующий агент. В данном документе также предложена фармацевтическая композиция, содержащая инкапсулированный в липидную наночастицу продуцируемый клеткой насекомого или синтетически продуцируемый зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и фармацевтически приемлемый носитель или вспомогательное вещество.
[00408] Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, дополнительно содержащий одно или более фармацевтических вспомогательных веществ. Согласно некоторым вариантам реализации состав липидных наночастиц дополнительно содержит сахарозу, tris, трегалозу и/или глицин.
[00409] ЗкДНК-вектор может образовывать комплексы с липидной частью (portion) частицы или может быть инкапсулирован в липидной части (position) липидной наночастицы. Согласно некоторым вариантам реализации зкДНК может быть полностью инкапсулирована в липидной части липидной наночастицы, что защищает ее от разрушения нуклеазой, например, в водном растворе. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после воздействия на липидную наночастицу нуклеазы при 37°С в течение по меньшей мере примерно 20, 30, 45 или 60 минут. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после инкубации частицы в сыворотке при 37°С в течение по меньшей мере примерно 30, 45 или 60 минут, или по меньшей мере примерно 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 или 36 часов.
[00410] Согласно определенным вариантам реализации липидные наночастицы по существу нетоксичны для субъекта, например, млекопитающего, такого как человек. Согласно некоторым аспектам состав липидных наночастиц представляет собой лиофилизированный порошок.
[00411] Согласно некоторым вариантам реализации липидные наночастицы представляют собой частицы с твердой сердцевиной, которые имеют по меньшей мере один липидный бислой. Согласно другим вариантам реализации липидные наночастицы имеют небислойную структуру, т.е. имеют неламеллярную (т.е. небислойную) морфологию. Без ограничений, небислойная морфология может включать, например, трехмерные трубки, стержни, частицы кубической симметрии и т.д. Например, морфологию липидных наночастиц (ламеллярных в сравнении с неламеллярными) можно легко оценить и охарактеризовать с использованием, например, анализа методом «крио-ТЭМ» (криотрансмиссионная электронная микроскопия), как описано в US 2010/0130588, содержание которого полностью включено в данный документ посредством ссылки.
[00412] Согласно некоторым другим вариантам реализации липидные наночастицы, имеющие неламеллярную морфологию, являются электронно-плотными. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, которая является либо однослойной, либо многослойной по структуре. Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, который содержит мультивезикулярные частицы и/или частицы на основе пены.
[00413] Контролируя композицию и содержание липидных компонентов, можно контролировать скорость, с которой липидный конъюгат высвобождается из липидной частицы, и, в свою очередь, скорость, с которой липидная наночастица становится фузогенной. Кроме того, другие переменные, включая, например, рН, температуру или ионную силу, могут применяться для изменения и/или контроля скорости, с которой липидная наночастица становится фузогенной. Другие способы, которые могут применяться для контроля скорости, с которой указанная липидная наночастица становится фузогенной, будут понятны обычным специалистам в данной области техники после ознакомления с указанным описанием. Также будет понятно, что размер липидных частиц можно контролировать путем контроля композиции и концентрации липидного конъюгата.
[00414] pKa катионных липидов в составах может быть сопоставлена с эффективностью ЛНЧ для доставки нуклеиновых кислот (см. Jayaraman et al., Angewandte Chemie, International Edition (2012), 51(34), 8529-8533; Semple et al, Nature Biotechnology 28, 172-176 (2010), обе работы полностью включены в данный документ посредством ссылки). Предпочтительный диапазон pKa составляет от ~5 до ~7. pKa катионного липида в липидных наночастицах может быть определена с использованием анализа, основанного на флуоресценции 2-(п-толуидино)-6-нафталинсульфоновой кислоты (TNS). VIII. Способы применения
[00415] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также можно применять в способе доставки представляющей интерес нуклеотидной последовательности (например, кодирующей белок FVIII) в клетку-мишень (например, клетку-хозяина). Способ может представлять собой, в частности, способ доставки белка FVIII к клетке субъекта, нуждающегося в этом, и лечения гемофилии А. Настоящее изобретение обеспечивает экспрессию in vivo белка FVIII, закодированного в зкДНК-векторе, в клетке у субъекта так, чтобы возник терапевтический эффект экспрессии белка FVIII. Указанные результаты наблюдаются как в in vivo, так и в in vitro режимах доставки зкДНК-вектора.
[00416] Кроме того, согласно настоящему изобретению предложен способ доставки белка FVIII в клетку субъекта, нуждающегося в этом, включающий многократные введения зкДНК-вектора согласно настоящему изобретению, кодирующего указанный белок FVIII. Поскольку зкДНК-вектор согласно настоящему изобретению не индуцирует иммунный ответ, подобный тому, который обычно наблюдается против инкапсидированных вирусных векторов, такая стратегия многократного введения, вероятно, будет иметь больший успех в системе на основе зкДНК. ЗкДНК-вектор вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса генов и экспрессии белка FVIII без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются перечисленными, введение в сетчатку (например, субретинальную инъекцию, супрахориоидальную инъекцию или интравитреальную инъекцию), внутривенное введение (например, в липосомальном составе), прямую доставку в выбранный орган (например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка), внутримышечный и другие парентеральные пути введения. Пути введения могут быть скомбинированы, если требуется.
[00417] Доставка зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, не ограничивается доставкой экспрессируемого белка FVIII. Например, зкДНК-векторы, полученные с помощью обычного способа (например, с использованием способа продуцирования на основе клеток (например, способов продуцирования в клетках насекомых)) или синтетического способа, как описано в данном документе, можно применять вместе с другими предложенными системами доставки, чтобы обеспечить часть генной терапии. Один неограничивающий пример системы, которую можно комбинировать с зкДНК-векторами в соответствии с настоящим раскрытием, включает системы, которые доставляют по отдельности один или более кофакторов или иммунных супрессоров для эффективной генной экспрессии зкДНК-вектора, экспрессирующего белок FVIII.
[00418] Согласно настоящему изобретению также предложен способ лечения гемофилии А у субъекта, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Выбранный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, который можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую последовательность белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.
[00419] Композиции и векторы, предложенные в данном документе, можно применять для доставки белка FVIII с различными целями. Согласно некоторым вариантам реализации трансген кодирует белок FVIII, который предназначен для применения в исследовательских целях, например, для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции продукта белка FVIII. В другом примере трансген кодирует белок FVIII, который предназначен для применения с целью создания модели гемофилии А на животных. Согласно некоторым вариантам реализации кодируемый белок FVIII можно применять для лечения или предотвращения состояний гемофилии А у млекопитающего-субъекта. Белок FVIII может быть перенесен в организм пациента (например, экспрессирован у пациента) в количестве, достаточном для лечения гемофилии А, ассоциированной с пониженной экспрессией, отсутствием экспрессии или дисфункцией указанного гена.
[00420] В принципе, экспрессионная кассета может включать нуклеиновую кислоту или любой трансген, который кодирует белок FVIII, который либо снижен, либо отсутствует из-за мутации, либо который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего изобретения. Предпочтительно не вставленная бактериальная ДНК не присутствует и предпочтительно бактериальная ДНК не присутствует в композициях зкДНК, предложенных в данном документе.
[00421] ЗкДНК-вектор не ограничивается одной молекулой зкДНК-вектора. Таким образом, в другом аспекте несколько зкДНК-векторов, экспрессирующих разные белки или один и тот же белок FVIII, но функционально связанный с различными промоторами или цис-регуляторными элементами, могут быть доставлены одновременно или последовательно в целевую клетку, ткань, орган или в организм субъекта. Таким образом, эта стратегия может обеспечить одновременную генную терапию несколькими белками или доставку их генов. Также можно разместить разные части белка FVIII в отдельных зкДНК-векторах (например, разные домены и/или кофакторы, необходимые для функциональности белка FVIII), например, которые могут быть введены одновременно или в разные моменты времени, и которые можно регулировать по отдельности, добавляя посредством этого дополнительный уровень контроля экспрессии белка FVIII. Доставку также можно выполнять несколько раз и, что важно для генной терапии в клинических условиях, с последующим увеличением или снижением доз, учитывая отсутствие иммунного ответа хозяина против капсида вследствие отсутствия вирусного капсида. Ожидается, что ответ против капсида не возникнет из-за отсутствия капсида.
[00422] Согласно настоящему изобретению также предложен способ лечения у субъекта гемофилии А, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, представляющую интерес, которую можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую экзогенную последовательность ДНК, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого полипептида, белка или олигонуклеотида, кодируемого указанной экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.
Способы доставки зкДНК-векторов для продукции белка FVIII
[00423] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может быть доставлен в клетку-мишень in vitro или in vivo различными подходящими способами. ЗкДНК-векторы могут быть применены или инъецированы по отдельности. ДНК-векторы могут быть доставлены в клетку без помощи реагента для трансфекции или других физических средств. В качестве альтернативы, зкДНК-векторы для экспрессии белка FVIII могут быть доставлены с использованием любого известного в данной области техники реагента для трансфекции или других известных в данной области техники физических средств, которые облегчают проникновение ДНК в клетку, например, липосом, спиртов, соединений, богатых полилизином, соединений, богатых аргинином, фосфата кальция, микровезикул, микроинъекции, электропорации и т.п.
[00424] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть эффективно нацелены на типы клеток и тканей, которые обычно трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки.
[00425] Один аспект технологии, описанной в данном документе, относится к способу доставки белка FVIII в клетку. Как правило, для способов in vivo и in vitro зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен в клетку с использованием способов, раскрытых в данном документе, а также других способов, известных в данной области техники. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, предпочтительно вводят в клетку в биологически эффективном количестве. Если зкДНК-вектор вводят в клетку in vivo (например, субъекту), биологически эффективное количество зкДНК-вектора представляет собой количество, достаточное для трансдукции и экспрессии белка FVIII в клетке-мишени.
[00426] Примерные способы введения зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают пероральный, ректальный, трансмукозальный, интраназальный, ингаляционный (например, с помощью аэрозоля), буккальный (например, сублингвальный), вагинальный, интратекальный, внутриглазной, трансдермальный, внутриэндотелиальный, in utero (или in ovo), парентеральный (например, внутривенный, подкожный, внутрикожный, внутричерепной, внутримышечный [включая введение в скелетную, диафрагмальную и/или сердечную мышцу], внутриплевральный, внутримозговой и внутрисуставной). Введение может представлять собой системную или прямую доставку в печень или куда-либо еще (например, в любые почки, желчный пузырь, простату, надпочечники, сердце, кишечник, легкое и желудок).
[00427] Введение может быть местным (например, на поверхность кожи и слизистых оболочек, включая поверхности дыхательных путей и трансдермальное введение), внутрилимфатическим и т.п., а также путем прямой инъекции в ткань или орган (например, но не ограничиваясь этим, в печень, а также в глаз, мышцы, включая скелетную мышцу, сердечную мышцу, диафрагмальную мышцу, или головной мозг).
[00428] ЗкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из печени и/или также глаз, головного мозга, скелетной мышцы, гладкой мышцы, сердца, диафрагмы, эпителия дыхательных путей, почки, селезенки, поджелудочной железы, кожи.
[00429] Наиболее подходящий путь в любом конкретном случае будет зависеть от характера и тяжести состояния, подлежащего лечению, облегчению и/или предотвращению, а также от характера конкретного используемого зкДНК-вектора. Кроме того, зкДНК позволяет вводить более одного белка FVIII в одном векторе или в нескольких зкДНК-векторах (например, смесь зкДНК).
А. Внутримышечное введение зкДНК-вектора
[00430] Согласно некоторым вариантам реализации способ лечения заболевания у субъекта включает введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, кодирующего белок FVIII, необязательно с фармацевтически приемлемым носителем. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в мышечную ткань субъекта.
[00431] Согласно некоторым вариантам реализации зкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из скелетной мышцы, гладкой мышцы, сердца, диафрагмы или мышц глаза.
[00432] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в скелетную мышцу в соответствии с настоящим изобретением включает, но не ограничивается этим, введение в скелетную мышцу в конечностях (например, верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. ЗкДНК-вектор, раскрытый в данном документе, может быть доставлен в скелетную мышцу путем внутривенного введения, внутриартериального введения, внутрибрюшинного введения, перфузии конечности (необязательно изолированной перфузии конечности для ноги и/или руки; см., например, Arruda et al., (2005) Blood 105: 3458-3464), и/или путем прямой внутримышечной инъекции. Согласно конкретным вариантам реализации зкДНК-вектор, раскрытый в данном документе, вводят в печень, глаз, конечность (руку и/или ногу) субъекта (например, субъекта с мышечной дистрофией, такой как МДД) путем перфузии конечности, необязательно изолированной перфузии конечности (например, путем внутривенного или внутрисуставного введения). В вариантах реализации зкДНК-вектор, раскрытый в данном документе, можно вводить без применения «гидродинамических» методик.
[00433] Например, доставка в ткань (например, сетчатку) обычных вирусных векторов часто усиливается гидродинамическими методиками (например, внутривенным/внутривенным введением в большом объеме), которые увеличивают давление в сосудистой сети и облегчают способность вирусного вектора пересекать барьер из эндотелиальных клеток. Согласно конкретным вариантам реализации зкДНК-векторы, описанные в данном документе, можно вводить без гидродинамических методик, таких как инфузии большого объема и/или повышенное внутрисосудистое давление (например, выше нормального систолического давления, например, повышение внутрисосудистого давления на величину менее или равную 5%, 10%, 15%, 20%, 25% от нормального систолического давления). Такие методы могут уменьшить или позволяют избежать побочных эффектов, ассоциированных с гидродинамическими методиками, таких как отек, повреждение нервов и/или синдром сдавливания.
[00434] Кроме того, композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, которую вводят в скелетную мышцу, может быть введена в скелетную мышцу в конечностях (например, в верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. Подходящие скелетные мышцы включают, без ограничений, отводящую мышцу мизинца (в кисти), отводящую мышцу мизинца (в стопе), отводящую мышцу большого пальца, отводящую мышцу пятой плюсневой кости, короткую мышцу, отводящую большой палец кисти, длинную мышцу, отводящую большой палец кисти, короткую приводящую мышцу, мышцу, приводящую большой палец стопы, длинную приводящую мышцу, большую приводящую мышцу, мышцу, приводящую большой палец кисти, локтевую мышцу, переднюю лестничную мышцу, суставную мышцу колена, двуглавую мышцу плеча, двуглавую мышцу бедра, плечевую мышцу, плечелучевую мышцу, щечную мышцу, клювовидно-плечевую мышцу, мышцу, сморщивающую бровь, дельтовидную мышцу, мышцу, опускающую угол рта, мышцу, опускающую нижнюю губу, двубрюшную мышцу, тыльные межкостные мышцы (кисти), тыльные межкостные мышцы (стопы), короткий лучевой разгибатель запястья, длинный лучевой разгибатель запястья, локтевой разгибатель запястья, разгибатель мизинца, разгибатель пальцев кисти, короткий разгибатель пальцев кисти, длинный разгибатель пальцев кисти, короткий разгибатель большого пальца стопы, длинный разгибатель большого пальца стопы, разгибатель указательного пальца, короткий разгибатель большого пальца, длинный разгибатель большого пальца, лучевой сгибатель запястья, локтевой сгибатель запястья, короткий сгибатель мизинца (кисти), короткий сгибатель мизинца (стопы), короткий сгибатель пальцев стопы, длинный сгибатель пальцев стопы, глубокий сгибатель пальцев кисти, поверхностный сгибатель пальцев кисти, короткий сгибатель большого пальца стопы, длинный сгибатель большого пальца стопы, короткий сгибатель большого пальца кисти, длинный сгибатель большого пальца кисти, лобную мышцу, икроножную мышцу, подбородочно-подъязычную мышцу, большую ягодичную мышцу, среднюю ягодичную мышцу, малую ягодичную мышцу, тонкую мышцу, подвздошно-реберную мышцу шеи, подвздошно-реберную мышцу поясницы, подвздошно-реберную мышцу груди, подвздошную мышцу, нижнюю близнецовую мышцу, нижнюю косую мышцу, нижнюю прямую мышцу, подостную мышцу, межостистые мышцы, межпоперечные мышцы, латеральную крыловидную мышцу, латеральную прямую мышцу, широчайшую мышцу спины, мышцу, поднимающую угол рта, мышцу, поднимающую верхнюю губу, мышцу, поднимающую верхнюю губу и крыло носа, мышцу, поднимающую верхнее веко, мышцу, поднимающую лопатку, длинные мышцы-вращатели, длиннейшую мышцу головы, длиннейшую мышцу шеи, длиннейшую мышцу груди, длинную мышцу головы, длинную мышцу шеи, червеобразные мышцы (кисти), червеобразные мышцы (стопы), жевательную мышцу, медиальную крыловидную мышцу, медиальную прямую мышцу, среднюю лестничную мышцу, многораздельные мышцы, челюстно-подъязычную мышцу, нижнюю косую мышцу головы, верхнюю косую мышцу головы, наружную запирательную мышцу, внутреннюю запирательную мышцу, затылочную мышцу, лопаточно-подъязычную мышцу, мышцу, противопоставляющую мизинец, мышцу, противопоставляющую большой палец кисти, круговую мышцу глаза, круговую мышцу рта, ладонную межкостную мышцу, короткую ладонную мышцу, длинную ладонную мышцу, гребенчатую мышцу, большую грудную мышцу, малую грудную мышцу, короткую малоберцовую мышцу, длинную малоберцовую мышцу, третью малоберцовую мышцу, грушевидную мышцу, подошвенные межкостные мышцы, подошвенную мышцу, подкожную мышцу шеи, подколенную мышцу, заднюю лестничную мышцу, квадратный пронатор, круглый пронатор, большую поясничную мышцу, квадратную мышцу бедра, квадратную мышцу подошвы, переднюю прямую мышцу головы, латеральную прямую мышцу головы, большую заднюю прямую мышцу головы, малую заднюю прямую мышцу головы, прямую мышцу бедра, большую ромбовидную мышцу, малую ромбовидную мышцу, мышцы смеха, портняжную мышцу, наименьшую лестничную мышцу, полуперепончатую мышцу, полуостистую мышцу головы, полуостистую мышцу шеи, полуостистую мышцу груди, полусухожильную мышцу, переднюю зубчатую мышцу, короткие мышцы-вращатели, камбаловидную мышцу, остистую мышцу головы, остистую мышцу шеи, остистую мышцу груди, ременную мышцу головы, ременную мышцу шеи, грудино-ключично-сосцевидную мышцу, грудино-подъязычную мышцу, грудино-щитовидную мышцу, шило-подъязычную мышцу, подключичную мышцу, подлопаточную мышцу, верхнюю близнецовую мышцу, верхнюю косую мышцу, верхнюю прямую мышцу, супинатор, надостную мышцу, височную мышцу, мышцу, напрягающую широкую фасцию, большую круглую мышцу, малую круглую мышцу, мышцы груди, щито-подъязычную мышцу, переднюю болыпеберцовую мышцу, заднюю болынеберцовую мышцу, трапециевидную мышцу, трехглавую мышцу плеча, промежуточную широкую мышцу бедра, латеральную широкую мышцу бедра, медиальную широкую мышцу бедра, большую скуловую мышцу и малую скуловую мышцу, и любые другие подходящие скелетные мышцы, известные в данной области.
[00435] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в диафрагмальную мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно некоторым вариантам реализации доставка экспрессированного с зкДНК-вектора трансгена в ткань-мишень также может быть достигнута путем доставки синтетического депо, содержащего зкДНК-вектор, причем депо, содержащее зкДНК-вектор, имплантируют в скелетную, гладкомышечную, сердечную и/или диафрагмальную мышечную ткань или мышечная ткань может быть приведена в контакт с пленкой или другим матриксом, содержащим зкДНК-вектор, как описано в данном документе. Такие имплантируемые матриксы или субстраты описаны в патенте США №7201898.
[00436] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в сердечную мышцу включает введение в левое предсердие, правое предсердие, левый желудочек, правый желудочек и/или перегородку. ЗкДНК-вектор, описанный в данном документе, может быть доставлен в сердечную мышцу путем внутривенного введения, внутриартериального введения, такого как внутриаортальное введение, прямой сердечной инъекции (например, в левое предсердие, правое предсердие, левый желудочек, правый желудочек), и/или перфузии коронарной артерии.
[00437] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в гладкую мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно одному варианту реализации введение можно осуществлять в эндотелиальные клетки, присутствующие в гладких мышцах, рядом с ними и/или на них. Неограничивающие примеры гладких мышц включают радужную оболочку глаза, бронхиолы легкого, мышцы гортани (голосовые связки), мышечные слои желудка, пищевода, тонкого и толстого кишечника желудочно-кишечного тракта, мочеточника, детрузора мочевого пузыря, миометрия матки, полового члена или простаты.
[00438] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в скелетную мышцу, диафрагмальную мышцу и/или сердечную мышцу. В типичных вариантах реализации зкДНК-вектор в соответствии с настоящим изобретением применяют для лечения и/или предотвращения нарушений скелетной, сердечной и/или диафрагмальной мышцы.
[00439] В частности, предусмотрено, что композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть доставлена в одну или более мышц глаза (например, боковую прямую мышцу, медиальную прямую мышцу, верхнюю прямую мышцу, нижнюю прямую мышцу, верхнюю косую мышцу, нижнюю косую мышцу), мимические мышцы (такие как затылочно-лобная мышца, височно-теменная мышца, мышца гордецов, носовая мышца, мышца, опускающая перегородку носа, круговая мышца глаза, мышца, сморщивающая бровь, мышца, опускающая бровь, ушные мышцы, круговая мышца рта, опускающая угол рта мышца, мышца смеха, большая скуловая мышца, малая скуловая мышца, поднимающая верхнюю губу мышца, поднимающая верхнюю губу и крыло носа мышца, опускающая нижнюю губу мышца, поднимающая угол рта мышца, щечная мышца, подбородочная мышца) или мышцы языка (например, подбородочно-язычную мышцу, подъязычно-язычную мышцу, хрящеязычную мышцу, шилоязычную мышцу, небно-язычную мышцу, верхнюю продольную мышцу, нижнюю продольную мышцу, вертикальную мышцу и поперечную мышцу).
(i) Внутримышечная инъекция: Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введена путем инъекции в одно или более мест конкретной мышцы, например, скелетной мышцы (например, дельтовидной, латеральной широкой мышцы бедра, вентро-ягодичной мышцы тыльной ягодичной мышцы или переднебоковой мышцы бедра для младенцев), у субъекта с помощью иглы. Композиция, содержащая зкДНК, может быть введена в другие подтипы мышечных клеток. Неограничивающие примеры подтипов мышечных клеток включают клетки скелетных мышц, клетки сердечной мышцы, клетки гладких мышц и/или клетки диафрагмальной мышцы.
[00440] Способы внутримышечной инъекции известны специалистам в данной области техники и поэтому в данном документе подробно не описываются. Однако при выполнении внутримышечной инъекции соответствующий размер иглы следует определять на основании возраста и комплекции пациента, вязкости композиции, а также места инъекции. В Таблице 8 приведены рекомендации по примерным местам инъекции и соответствующему размеру иглы:
[00441] Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в небольшом объеме, например, примерном объеме, представленном в Таблице 8, для конкретного субъекта. Согласно некоторым вариантам реализации перед инъекцией субъекту может быть введен общий или местный анестетик, при необходимости. Это особенно желательно, если требуется несколько инъекций или если инъекцию вводят в более глубокую мышцу, а не в обычные места инъекций, указанные выше.
[00442] Согласно некоторым вариантам реализации внутримышечную инъекцию можно комбинировать с электропорацией, давлением доставки или использованием реагентов для трансфекции для усиления клеточного поглощения зкДНК-вектора.
(ii) Реагенты для трансфекции: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в виде композиций, содержащих один или более реагентов для трансфекции, чтобы облегчить поглощение векторов в мышечные трубочки или мышечную ткань. Таким образом, в одном варианте реализации, нуклеиновые кислоты, описанные в данном документе, вводят в мышечную клетку, мышечную трубочку или мышечную ткань путем трансфекции с использованием способов, описанных в другом месте в данном документе.
(iii) Электропорация: Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят без носителя для облегчения проникновения зкДНК в клетки или в физиологически инертном фармацевтически приемлемом носителе (т.е. в любом носителе, который не улучшает или не усиливает поглощение бескапсидных невирусных векторов в мышечные трубочки). Согласно таким вариантам реализации поглощение бескапсидного невирусного вектора может быть облегчено путем электропорации клетки или ткани.
[00443] Клеточные мембраны естественным образом устойчивы к проникновению внеклеточных объектов в цитоплазму клетки. Одним из методов временного уменьшения этой устойчивости является «электропорация», когда электрические поля используют для создания пор в клетках, не вызывая необратимого повреждения клеток. Эти поры достаточно велики, чтобы позволить ДНК-векторам, фармацевтическим препаратам, ДНК и другим полярным соединениям проникать внутрь клетки. Со временем поры в клеточной мембране закрываются, и клетка снова становится непроницаемой.
[00444] Электропорацию можно использовать в приложениях как in vitro, так и in vivo для введения, например, экзогенной ДНК в живые клетки. Для приложений in vitro, как правило, смешивают образец живых клеток с композицией, содержащей, например, ДНК. Затем клетки помещают между электродами, такими как параллельные пластины, и к смеси клетка/композиция прикладывают электрическое поле.
[00445] Существует ряд методов электропорации in vivo; электроды могут быть обеспечены в различных конфигурациях, таких как, например, штангенциркуль, который захватывает эпидермис, лежащий над областью клеток, подлежащих обработке. В качестве альтернативы, в ткань могут быть введены игольчатые электроды для доступа к клеткам, расположенным глубже. В любом случае, после инъекционного введения композиции, содержащей, например, нуклеиновые кислоты, в область обработки,
электроды прикладывают к области электрическое поле. В некоторых приложениях электропорации электрическое поле представляет собой одиночный прямоугольный импульс порядка 100-500 В/см с длительностью от 10 до 60 мс. Такой импульс может генерироваться, например, в известных приложениях Electro Square Porator Т820, производимых ВТХ Division Genetronics, Inc.
[00446] Как правило, успешное поглощение, например, нуклеиновых кислот происходит только в том случае, если мышцу электрически стимулировать сразу или вскоре после введения композиции, например, путем инъекции в мышцу.
[00447] Согласно определенным вариантам реализации электропорация достигается с использованием импульсов электрических полей или с использованием схем обработки с низким напряжением/длинными импульсами (например, с использованием системы электропорации с прямоугольными импульсами). Примерные генераторы импульсов, способные генерировать импульсное электрическое поле, включают, например, ЕСМ600, который может генерировать экспоненциальную форму волны, и ElectroSquarePorator (Т820), который может генерировать прямоугольную форму волны, оба из которых доступны от ВТХ, подразделения Genetronics, Inc. (Сан-Диего, Калифорния). Системы электропорации с прямоугольной волной доставляют контролируемые электрические импульсы, которые быстро повышаются до заданного напряжения, остаются на этом уровне в течение заданного периода времени (длительность импульса), а затем быстро падают до нуля.
[00448] Согласно некоторым вариантам реализации местный анестетик вводят, например, путем инъекции в место обработки, чтобы уменьшить боль, которая может быть ассоциирована с электропорацией ткани в присутствии композиции, содержащей бескапсидный невирусный вектор, как описано в данном документе. Кроме того, специалист в данной области техники поймет, что следует выбирать дозу композиции, которая сводит к минимуму и/или предотвращает чрезмерное повреждение ткани, приводящее к фиброзу, некрозу или воспалению мышцы.
(iv) Давление доставки: Согласно некоторым вариантам реализации доставку зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечную ткань облегчают с помощью давления доставки, при котором используется комбинация больших объемов и быстрой инъекции в артерию, снабжающую конечность (например, подвздошную артерию). Этот способ введения может быть достигнут с помощью множества способов, которые включают вливание в сосудистую сеть конечности композиции, содержащей зкДНК-вектор, как правило, при изоляции мышцы от большого круга кровообращения с помощью жгута сосудистого зажима. В одном методе композиция циркулирует через сосудистую сеть конечности, чтобы обеспечить возможность экстравазации в клетки. В другом методе внугрисосудистое гидродинамическое давление увеличивается для расширения сосудистых лож и увеличения поглощения зкДНК-вектора в мышечные клетки или ткань. Согласно одному варианту реализации композицию зкДНК вводят в артерию.
(v) Композиции липидпых напочастиц: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, для внутримышечной доставки изготавливают в виде композиции, содержащей липосому, как описано в другом месте в данном документе
(vi) Системное введение зкДНК-вектора, нацеленного на мышечную ткань: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготовлен для нацеливания на мышцу за счет введения путем непрямой доставки, при котором зкДНК транспортируется в мышцу, а не в печень. Соответственно, технология, описанная в данном документе, включает непрямое введение композиций, содержащих зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, в мышечную ткань, например, путем системного введения. Такие композиции можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, подкожно, внутрь полости, и их можно доставлять с помощью перистальтических средств, при необходимости, или с помощью других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно, например, путем внутривенной инфузии.
[00449] Согласно некоторым вариантам реализации поглощение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечные клетки/ткань увеличивается за счет использования нацеливающего агента или фрагмента, который преимущественно направляет вектор в мышечную ткань. Таким образом, в некоторых вариантах реализации бескапсидный зкДНК-вектор может быть сконцентрирован в мышечной ткани по сравнению с количеством бескапсидных зкДНК-векторов, присутствующих в других клетках или тканях организма.
[00450] Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, дополнительно содержит фрагмент, нацеливающий на мышечные клетки. Согласно другим вариантам реализации экспрессированный генный продукт содержит нацеливающий фрагмент, специфический для ткани, в котором его действие является желательным. Нацеливающий фрагмент может включать любую молекулу или комплекс молекул, которые способны нацеливаться, взаимодействовать, соединяться и/или связываться с внутриклеточным, поверхностным или внеклеточным биомаркером клетки или ткани. Биомаркер может включать, например, клеточную протеазу, киназу, белок, рецептор клеточной поверхности, липид и/или алифатическую кислоту. Другие примеры биомаркеров, на которые могут быть нацелены, с которыми могут взаимодействовать, соединяться и/или связываться нацеливающие фрагменты, включают молекулы, ассоциированные с конкретным заболеванием. Например, биомаркеры могут включать рецепторы клеточной поверхности, участвующие в развитии рака, такие как рецептор эпидермального фактора роста и рецептор трансферрина. Нацеливающие фрагменты могут включать, но не ограничиваются перечисленными, синтетические соединения, природные соединения или продукты, макромолекулярные объекты, биосконструированные молекулы (например, полипептиды, липиды, полинуклеотиды, антитела, фрагменты антител) и малые объекты (например, малые молекулы, нейротрансмиттеры, субстраты, лиганды, гормоны и соединения элементов), которые связываются с молекулами, экспрессируемыми в целевой мышечной ткани.
[00451] Согласно определенным вариантам реализации нацеливающий фрагмент может дополнительно содержать рецепторную молекулу, включая, например, рецепторы, которые естественным образом распознают конкретную целевую молекулу клетки-мишени. Такие рецепторные молекулы включают рецепторы, которые были модифицированы для повышения их специфичности взаимодействия с молекулой-мишенью, рецепторы, которые были модифицированы для взаимодействия с целевой молекулой-мишенью, не распознаваемой рецептором в естественных условиях, и фрагменты таких рецепторов (см., например, Skerra, 2000, J. Molecular Recognition, 13:167-187). Предпочтительный рецептор представляет собой рецептор хемокина. Примерные рецепторы хемокинов описаны, например, в Lapidot et al, 2002, Exp Hematol, 30:973-81 и Onuffer et al., 2002, Trends Pharmacol Sci, 23:459-67.
[00452] Согласно другим вариантам реализации дополнительный нацеливающий фрагмент может содержать молекулу лиганда, включая, например, лиганды, которые естественным образом распознают конкретный целевой рецептор клетки-мишени, такой как лиганд трансферрина (Tf). Такие молекулы лигандов включают лиганды, которые были модифицированы для повышения их специфичности взаимодействия с рецептором-мишенью, лиганды, которые были модифицированы для взаимодействия с целевым рецептором, который не распознается лигандом в естественных условиях, и фрагменты таких лигандов.
[00453] Согласно другим вариантам реализации нацеливающий фрагмент может содержать аптамер. Аптамеры представляют собой олигонуклеотиды, выбранные для специфичного связывания с целевой молекулярной структурой клетки-мишени. Аптамеры, как правило, представляют собой продукты способа селекции по аффинности, сходного с селекцией по аффинности при фаговом дисплее (также известной как молекулярная эволюция in vitro). Способ включает выполнение нескольких тандемных итераций разделения по аффинности, например, с использованием твердой подложки, с которой связан патологический иммуноген, с последующей полимеразной цепной реакцией (ПЦР) для амплификации нуклеиновых кислот, которые связались с иммуногенами. Таким образом, каждый раунд аффинного разделения обогащает популяцию нуклеиновых кислот молекулами, которые успешно связывают целевой иммуноген. Таким путем случайный пул нуклеиновых кислот может быть «обучен» с получением аптамеров, которые специфично связывают молекулы-мишени. Аптамеры, как правило, представляют собой РНК, но могут представлять собой ДНК или ее аналоги или производные, такие как, без ограничения, пептидные нуклеиновые кислоты (ПНК) и фосфотиоатные нуклеиновые кислоты.
[00454] Согласно некоторым вариантам реализации нацеливающий фрагмент может содержать фоторазлагаемый лиганд (т.е. «запертый» лиганд), который высвобождается, например, под действием сфокусированного луча света так, что бескапсидные невирусные векторы или генный продукт нацеливаются на конкретную ткань.
[00455] В данном документе также предусмотрено, что композиции доставляют в несколько мест в одной или более мышцах субъекта. Таким образом, инъекции могут быть сделаны в по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 35, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50, по меньшей мере 55, по меньшей мере 60, по меньшей мере 65, по меньшей мере 70, по меньшей мере 75, по меньшей мере 80, по меньшей мере 85, по меньшей мере 90, по меньшей мере 95, по меньшей мере 100 местах инъекций. Такие места могут быть распределены по площади одной мышцы или могут быть распределены между несколькими мышцами.
В. Введение зкДНК-вектора для экспрессии белка FVIII в немышечные места
[00456] Согласно другому варианту реализации зкДНК-вектор для экспрессии белка FVIII вводят в печень. ЗкДНК-вектор также можно вводить в различные области глаза, такие как роговица и/или зрительный нерв. ЗкДНК-вектор также можно вводить в спинной мозг, ствол мозга (продолговатый мозг, мост), средний мозг (гипоталамус, таламус, эпиталамус, гипофиз, черную субстанцию, эпифиз), мозжечок, конечный мозг (полосатое тело, полушария головного мозга, включая затылочную, височную, теменную и лобную доли, кору, базальные ганглии, гиппокамп и амигдалу), лимбическую систему, неокортекс, полосатое тело, полушария головного мозга и нижний холмик четверохолмия. ЗкДНК-вектор может быть доставлен в спинномозговую жидкость (например, с помощью люмбальной пункции). ЗкДНК-вектор для экспрессии белка FVIII можно дополнительно Glu G1 внутрисосудисто в ЦНС в ситуациях, когда нарушен гематоэнцефалический барьер (например, опухоль головного мозга или церебральный инфаркт).
[00457] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII можно вводить в целевую область (области) глаза любым путем, известным в данной области техники, включая, но не ограничиваясь перечисленными, интратекальную, внутриглазную, интрацеребральную, в нутриже луд очковую, внутривенную (например, в присутствии сахара, такого как маннит), интраназальную, внутриушную, внутриглазную (например, интравитреальную, субретинальную, в переднюю камеру) и периокулярную (например, в субтенонову область) доставку, а также внутримышечную доставку с ретроградной доставкой к двигательным нейронам.
[00458] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в жидком составе путем прямой инъекции (например, стереотаксической инъекции) в целевую область или компартмент в ЦНС. Согласно другим вариантам реализации зкДНК-вектор может быть обеспечен путем местного нанесения на целевую область или путем интраназального введения аэрозольного состава. Введение в глаз можно осуществлять путем местного нанесения жидких капель. В качестве дополнительной альтернативы зкДНК-вектор можно вводить в виде твердого состава с медленным высвобождением (см., например, патент США №7201898). Согласно другим дополнительным вариантам реализации зкДНК-вектор можно применять для ретроградного транспорта для лечения, облегчения и/или предотвращения заболеваний и нарушений, затрагивающих двигательные нейроны (например, бокового амиотрофического склероза (БАС); спинальной мышечной атрофии (СМА) и т.д.). Например, зкДНК-вектор может быть доставлен в мышечную ткань, из которой он может мигрировать в нейроны.
С. Лечение ex vivo
[00459] Согласно некоторым вариантам реализации клетки извлекают из организма субъекта, вводят в них зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и затем клетки возвращают в организм субъекта. Способы извлечения клеток из организма субъекта для лечения ex vivo с последующим введением обратно в организм субъекта известны в данной области техники (см., например, патент США №5399346; содержание которого полностью включено в данный документ). В качестве альтернативы, зкДНК-вектор вводят в клетки, полученные от другого субъекта, в культивируемые клетки или в клетки из любого другого подходящего источника, и указанные клетки вводят нуждающемуся в этом субъекту.
[00460] Клетки, трансдуцированные зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе, предпочтительно вводят субъекту в «терапевтически эффективном количестве» в комбинации с фармацевтическим носителем. Специалисты в данной области техники поймут, что терапевтические эффекты не обязательно должны быть полными или обеспечивать исцеление, при условии, что для субъекта они в какой-то мере благоприятны.
[00461] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, описанный в данном документе (иногда называемый трансгеном или гетерологичной нуклеотидной последовательностью), который должен продуцироваться в клетке in vitro, ex vivo или in vivo. Например, в отличие от применения зкДНК-векторов, описанных в данном документе, в способе лечения, который обсуждается в данном документе, в некоторых вариантах реализации зкДНК-вектор для экспрессии белка FVIII может быть введен в культивируемые клетки, и экспрессированный белок FVIII может быть выделен из клеток, например, для получения антител и слитых белков. Согласно некоторым вариантам реализации культивируемые клетки, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для коммерческого получения антител или слитых белков, например, в качестве источника клеток для мелкомасштабного или крупномасштабного биоизготовления антител или слитых белков. В альтернативных вариантах реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в клетки у субъекта-хозяина, не являющегося человеком, для продуцирования антител или слитых белков in vivo, включая мелкомасштабное получение, а также коммерческое крупномасштабное получение белка FVIII.
[00462] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять как в ветеринарных, так и в медицинских приложениях. Подходящие субъекты для способов доставки генов ex vivo, описанных выше, включают как птиц (например, кур, уток, гусей, перепелов, индеек и фазанов), так и млекопитающих (например, человека, бычьих, овечьих, козьих, лошадиных, кошачьих, собачьих и зайцеобразных), при этом предпочтительными являются млекопитающие. Субъекты-люди являются наиболее предпочтительными. Субъекты-люди включают новорожденных, младенцев, детей и подростков, и взрослых людей.
D. Диапазоны доз
[00463] В данном документе предложены способы лечения, включающие введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий белок FVIII, как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к введенному количеству композиции зкДНК, которое приводит к экспрессии белка FVIII в «терапевтически эффективном количестве» для лечения гемофилии А.
[00464] Анализы in vivo и/или in vitro необязательно можно использовать, чтобы облегчить определение оптимальных диапазонов дозировок для применения. Точная доза, которая должна быть использована в составе, также будет зависеть от пути введения и серьезности состояния и должна определяться в соответствии с суждением обычного специалиста в данной области техники и обстоятельствами каждого субъекта. Эффективные дозы можно экстраполировать из кривых доза-ответ, полученных из тест-систем in vitro или в моделях на животных.
[00465] для экс пр есс ии белка FVIII, раскрытые в данном документе, вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса и экспрессии генов без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются ими, те, которые описаны выше в разделе «Введение», такие как прямая доставка в выбранный орган (например, внутрипортальная доставка в печень), пероральный, ингаляционный (включая интраназальную и внутритрахеальную доставку), 1035 внутриопухолевый и другие исходные пути введения. Пути введения могут быть скомбинированы, если требуется.
[00466] Доза количества зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, необходимая для достижения определенного «терапевтического эффекта», будет варьироваться в зависимости от нескольких факторов, включая, но не ограничиваясь перечисленными: путь введения нуклеиновой кислоты, уровень экспрессии гена или РНК, необходимый для достижения терапевтического эффекта, конкретное заболевание или нарушение, которое лечат, и стабильность гена (ов), продукта (ов) РНК или полученного экспрессированного белка (ов). Специалист в данной области техники может легко определить диапазон доз зкДНК-вектора для лечения пациента, страдающего конкретным заболеванием или нарушением, на основании вышеупомянутых факторов, а также других факторов, которые хорошо известны в данной области техники.
[00467] Схему дозирования можно корректировать для обеспечения оптимального терапевтического ответа. Например, олигонуклеотид может быть введен повторно, например, несколько доз могут быть введены ежедневно или дозу можно пропорционально уменьшать в соответствии с требованиями терапевтической ситуации. Обычный специалист в данной области техники легко сможет определить подходящие дозы и схемы введения рассматриваемых олигонуклеотидов, независимо от того, должны быть введены олигонуклеотиды в клетки или субъектам.
[00468] «Терапевтически эффективная доза» будет находиться в относительно широком диапазоне, который может быть определен посредством клинических исследований, и будет зависеть от конкретного применения (нервным клеткам потребуются очень небольшие количества, в то время как системная инъекция потребует больших количеств). Например, для прямой инъекции in vivo в скелетную или сердечную мышцу субъекта-человека терапевтически эффективная доза будет порядка от примерно 1 мкг до 100 г зкДНК-вектора. Если для доставки зкДНК-вектора используются экзосомы или микрочастицы, то терапевтически эффективная доза может быть определена экспериментально, но ожидается, что она доставит от 1 мкг до примерно 100 г вектора. Более того, терапевтически эффективная доза представляет собой количество зкДНК-вектора, которое экспрессирует достаточное количество трансгена, чтобы оказывать влияние на субъекта, которое приводит к уменьшению одного или более симптомов заболевания, но не приводит к значительным нецелевым эффектам или значительным нежелательным побочным эффектам. Согласно одному варианту реализации «терапевтически эффективное количество» представляет собой количество экспрессированного белка FVIII, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера гемофилии А или уменьшения симптома конкретного заболевания. Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК-вектора.
[00469] Изготовление растворов фармацевтически приемлемых вспомогательных веществ и носителей хорошо известно специалистам в данной области техники, как и разработка подходящих схем дозирования и лечения для использования конкретных композиций, описанных в данном документе, в различных схемах лечения.
[00470] Для трансфекции in vitro эффективное количество зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, для доставки в клетки (1×106 клеток) будет порядка от 0,1 до 100 мкг зкДНК-вектора, предпочтительно от 1 до 20 мкг и более предпочтительно от 1 до 15 мкг или от 8 до 10 мкг. Для более крупных зкДНК-векторов потребуются более высокие дозы. При использовании экзосом или микрочастиц, эффективная доза in vitro может быть определена экспериментально, но она будет предназначена для доставки в целом того же количества зкДНК-вектора.
[00471] Для лечения гемофилии А подходящая дозировка зкДНК-вектора, который экспрессирует белок FVIII, раскрытого в данном документе, будет зависеть от конкретного типа заболевания, подлежащего лечению, типа белка FVIII, степени тяжести и течения заболевания гемофилией А, предыдущей терапии, истории болезни пациента и реакции на антитело, а также от решения лечащего врача. ЗкДНК-вектор, кодирующий белок FVIII, подходящим образом вводят пациенту за один раз или в течение ряда обработок. В данном документе предусмотрены различные схемы дозирования, включая, но не ограничиваясь перечисленными, однократное или многократное введение в различные моменты времени, болюсное введение и импульсную инфузию.
[00472] В зависимости от типа и степени тяжести заболевания зкДНК-вектор вводят в количестве, при котором кодируемый белок FVIII экспрессируется в диапазоне от примерно 0,3 мг/кг до 100 мг/кг (например, от 15 мг/кг до 100 мг/кг или любой дозировке в пределах этого диапазона), с помощью одного или более отдельных введений или непрерывной инфузии. Одной типичной суточной дозы зкДНК-вектора достаточно, чтобы привести к экспрессии кодируемого белка FVIII в диапазоне от примерно 15 мг/кг до 100 мг/кг или более, в зависимости от факторов, упомянутых выше. Одна примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII, как раскрыто в данном документе, в диапазоне от примерно 10 мг/кг до примерно 50 мг/кг. Таким образом, пациенту может быть введена одна или более доз зкДНК-вектора в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII при примерно 0,5 мг/кг, 1 мг/кг, 1,5 мг/кг, 2,0 мг/кг, 3 мг/кг, 4,0 мг/кг, 5 мг/кг, 10 мг/кг, 15 мг/кг, 20 мг/кг, 25 мг/кг, 30 мг/кг, 35 мг/кг, 40 мг/кг, 50 мг/кг, 60 мг/кг, 70 мг/кг, 80 мг/кг, 90 мг/кг или 100 мг/кг (или любой их комбинации). Согласно некоторым вариантам реализации зкДНК-вектор представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII для общей дозы в диапазоне от 50 мг до 2500 мг. Примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к общей экспрессии кодируемого белка FVIII примерно 50 мг, примерно 100 мг, 200 мг, 300 мг, 400 мг, примерно 500 мг, примерно 600 мг, примерно 700 мг, примерно 720 мг, примерно 1000 мг, примерно 1050 мг, примерно 1100 мг, примерно 1200 мг, примерно 1300 мг, примерно 1400 мг, примерно 1500 мг, примерно 1600 мг, примерно 1700 мг, примерно 1800 мг, примерно 1900 мг, примерно 2000 мг, примерно 2050 мг, примерно 2100 мг, примерно 2200 мг, примерно 2300 мг, примерно 2400 мг или примерно 2500 мг (или любой их комбинации). Поскольку экспрессию белка FVIII с зкДНК-вектора можно тщательно контролировать с помощью регуляторных переключателей в данном документе или, альтернативно, многократной дозы зкДНК-вектора, вводимой субъекту, экспрессию белка FVIII с зкДНК-вектора можно контролировать так, что дозы экспрессированного белка FVIII можно вводить с перерывами, например, каждую неделю, каждые две недели, каждые три недели, каждые четыре недели, каждый месяц, каждые два месяца, каждые три месяца или каждые шесть месяцев с зкДНК-вектора. Ход этой терапии можно контролировать с помощью обычных методик и анализов.
[00473] Согласно определенным вариантам реализации зкДНК-вектор вводят в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII в дозе 15 мг/кг, 30 мг/кг, 40 мг/кг, 45 мг/кг, 50 мг/кг, 60 мг/кг или в фиксированной дозе, например, 300 мг, 500 мг, 700 мг, 800 мг или выше. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждый день, через день, каждую неделю, каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно определенным вариантам реализации период времени составляет 6 месяцев, один год, восемнадцать месяцев, два года, пять лет, десять лет, 15 лет, 20 лет или продолжительность жизни пациента.
[00474] Лечение может включать введение однократной дозы или многократных доз. Согласно некоторым вариантам реализации субъекту можно вводить более одной дозы; фактически, при необходимости можно вводить многократные дозы, поскольку зкДНК-вектор не вызывает иммунного ответа хозяина против капсида ввиду отсутствия вирусного капсида. Таким образом, специалист в данной области техники может легко определить подходящее количество доз. Количество вводимых доз может составлять, например, порядка 1-100, предпочтительно 2-20 доз.
[00475] Не ограничиваясь какой-либо конкретной теорией, отсутствие типичного противовирусного иммунного ответа, вызванного введением зкДНК-вектора, как описано в настоящем раскрытии (т.е. отсутствие компонентов капсида), позволяет вводить хозяину зкДНК-вектор для экспрессии белка FVIII несколько раз. Согласно некоторым вариантам реализации количество раз доставки гетерологичной нуклеиновой кислоты субъекту находится в диапазоне от 2 до 10 раз (например, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз). Согласно некоторым вариантам реализации зкДНК-вектор доставляют субъекту более 10 раз.
[00476] Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарный день (например, в течение 24-часового периода). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в 2, 3, 4, 5, 6 или 7 календарных дней. Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарную неделю (например, 7 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще, чем один раз в две недели (например, один раз в период в две календарные недели). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный месяц (например, один раз в 30 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в шесть календарных месяцев. Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный год (например, 365 дней или 366 дней в високосный год).
[00477] В конкретных вариантах реализации для достижения целевого уровня экспрессии гена на протяжении различных периодов времени, например, ежедневно, еженедельно, ежемесячно, ежегодно и т.д., можно использовать более одного введения (например, два, три, четыре или более введений) зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе.
[00478] Согласно некоторым вариантам реализации терапевтический белок FVIII, кодируемый зкДНК-вектором, раскрытым в данном документе, можно регулировать с помощью регуляторного переключателя, индуцируемого или репрессируемого промотора так, что он экспрессируется у субъекта в течение по меньшей мере 1 часа, по меньшей мере 2 часов, по меньшей мере 5 часов, по меньшей мере 10 часов, по меньшей мере 12 часов, по меньшей мере 18 часов, по меньшей мере 24 часов, по меньшей мере 36 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Согласно одному варианту реализации экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы. В качестве альтернативы, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может дополнительно содержать компоненты системы редактирования генов (например, CRISPR/Cas, TALEN, эндонуклеазы цинковых пальцев и т.д.), что позволяет вставлять одну или более последовательностей нуклеиновых кислот, кодирующих белок FVIII, для по существу постоянного лечения или «излечения» заболевания. Такие зкДНК-векторы, содержащие компоненты редактирования генов, раскрыты в международной заявке PCT/US18/64242 и могут включать 5' и 3' плечи гомологии (например, SEQ ID NO: 151-154, или последовательности, имеющие по меньшей мере 40%, 50%, 60%, 70% или 80% гомологии с ними) для вставки нуклеиновой кислоты, кодирующей белок FVIII, в области «безопасной гавани», такие как, но не включая их, ген альбумина или ген CCR5. В качестве примера, зкДНК-вектор, экспрессирующий белок FVIII, может содержать по меньшей мере одно плечо гомологии, специфичное в отношении геномной «безопасной гавани» (GSH), для встраивания трансгена FVIII в геномную «безопасную гавань», как раскрыто в международной заявке на патент PCT/US2019/020225, поданной 1 марта 2019 г., которая полностью включена в данный документ посредством ссылки.
[00479] Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Предусмотрено непрерывное введение относительно низких поддерживающих доз после начальной более высокой терапевтической дозы.
Е. Единичные лекарственные формы
[00480] Согласно некоторым вариантам реализации фармацевтические композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут быть удобно представлены в виде единичной лекарственной формы. Единичная лекарственная форма, как правило, адаптирована для одного или более конкретных путей введения фармацевтической композиции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для капель, которые будут введены непосредственно в глаз. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения путем ингаляции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью испарителя. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью небулайзера. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью генератора аэрозоля. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для перорального введения, для буккального введения или для сублингвального введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для внутривенного, внутримышечного или подкожного введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для субретинальной инъекции, супрахориоидальной инъекции или интравитреальной инъекции.
[00481] Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для интратекального или интрацеребровентрикулярного введения. Согласно некоторым вариантам реализации фармацевтическая композиция изготовлена для местного введения. Количество активного ингредиента, которое можно комбинировать с материалом носителя для получения единичной лекарственной формы, обычно будет представлять собой количество соединения, которое вызывает терапевтический эффект.
X. Способы лечения
[00482] Технология, описанная в данном документе, также демонстрирует способы получения, а также способы применения раскрытых зкДНК-векторов для экспрессии белка FVIII различными путями, включая, например, ex vivo, ex situ, in vitro и in vivo приложения, методологии, диагностические процедуры и/или схемы генной терапии.
[00483] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII, экспрессируемый с зкДНК-вектора, раскрытого в данном документе, является функциональным для лечения заболевания. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.
[00484] В данном документе предложен способ лечения гемофилии А у субъекта, включающий введение в клетку-мишень, которая нуждается в этом (например, мышечную клетку или ткань, или другой тип пораженных клеток), указанного субъекта терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, как описано в данном документе, которую можно применять для лечения заболевания. В частности, зкДНК-вектор для экспрессии белка FVIII может содержать целевую последовательность ДНК белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении в организм субъекта. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен любым подходящим путем, как описано выше и в других разделах настоящего документа.
[00485] В данном документе раскрыты композиции и составы зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, которые включают один или более зкДНК-векторов согласно настоящему изобретению вместе с одним или более фармацевтически приемлемыми буферами, разбавителями или вспомогательными веществами. Такие композиции могут быть включены в один или более диагностических или терапевтических наборов для диагностики, предотвращения, лечения или облегчения одного или более симптомов гемофилии А. В одном аспекте заболевание, поражение, нарушение, травма или дисфункция представляет собой заболевание, поражение, нарушение, травму или дисфункцию человека.
[00486] Другой аспект технологии, описанной в данном документе, обеспечивает способ обеспечения субъекту, нуждающемуся в этом, диагностически или терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, причем указанный способ включает обеспечение в клетке, ткани или органе субъекта, нуждающегося в этом, количества зкДНК-вектора, раскрытого в данном документе; и в течение времени, эффективного для обеспечения экспрессии белка FVIII с зкДНК-вектора, что обеспечивает субъекту диагностически или терапевтически эффективное количество белка FVIII, экспрессируемого зкДНК-вектором. Согласно дополнительному аспекту субъект представляет собой человека.
[00487] Другой аспект технологии, описанной в данном документе, обеспечивает способ диагностики, предотвращения, лечения или облегчения по меньшей мере одного или более симптомов гемофилии А, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В целом и в общем смысле, способ включает по меньшей мере этап введения субъекту, нуждающемуся в этом, одного или более из раскрытых зкДНК-векторов для продукции белка FVIII в количестве и в течение времени, достаточных для диагностики, предотвращения, лечения или облегчения одного или более симптомов заболевания, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В таком варианте реализации у субъекта может быть оценена эффективность белка FVIII или, альтернативно, проведено детектирование белка FVIII или тканевого расположения белка FVIII (включая клеточное и субклеточное расположение) у субъекта. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять в качестве диагностического инструмента in vivo, например, для детектирования рака или других показаний. Согласно дополнительному аспекту субъект представляет собой человека.
[00488] Другим аспектом является применение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в качестве инструмента для лечения или уменьшения одного или более симптомов гемофилии А или патологических состояний. Существует ряд наследственных заболеваний, при которых известны дефектные гены, и, как правило, они делятся на два класса: дефицитные состояния, обычно ферментов, которые обычно наследуются рецессивным образом, и несбалансированные состояния, которые могут включать регуляторные или структурные белки и которые, как правило, но не всегда, наследуются доминантным образом. Для несбалансированных патологических состояний зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для создания состояния гемофилии А в модельной системе, которую затем можно использовать в мероприятиях по противодействию патологическому состоянию. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, позволяет лечить генетические заболевания. В данном документе состояние гемофилии А лечат путем частичного или полного излечения дефицита или дисбаланса, который вызывает заболевание или делает его более тяжелым.
А. Клетки-хозяева
[00489] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляет трансген белка FVIII в рассматриваемую клетку-хозяина. Согласно некоторым вариантам реализации клетки представляют собой фоторецепторные клетки. Согласно некоторым вариантам реализации клетки представляют собой клетки RPE. Согласно некоторым вариантам реализации рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека, включая, например, клетки крови, стволовые клетки, гемопоэтические клетки, CD34+ клетки, клетки печени, раковые клетки, сосудистые клетки, мышечные клетки, клетки поджелудочной железы, нервные клетки, клетки глаза или клетки сетчатки, эпителиальные или эндотелиальные клетки, дендритные клетки, фибробласты или любые другие клетки, происходящие от млекопитающего, включая, без ограничения, клетки печени (т.е. печеночные), клетки легких, сердечные клетки, клетки поджелудочной железы, клетки кишечника, диафрагмальные клетки, почечные клетки (т.е. почки), нервные клетки, клетки крови, клетки костного мозга или любой одной или более выбранных тканей субъекта, для которых предусмотрена генная терапия. В одном аспекте рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека.
[00490] Настоящее раскрытие также относится к рекомбинантным клеткам-хозяевам, как упомянуто выше, включая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе. Таким образом, можно использовать несколько клеток-хозяев в зависимости от цели, что очевидно для квалифицированного специалиста. Конструкцию или зкДНК-вектор для экспрессии белка FVIII, раскрытые в данном документе, включая донорную последовательность, вводят в клетку-хозяина так, что донорная последовательность поддерживается в интегрированном в хромосому виде, как описано ранее. Термин «клетка-хозяин» включает любое потомство родительской клетки, которое не идентично родительской клетке из-за мутаций, происходящих во время репликации. Выбор клетки-хозяина будет в значительной степени зависеть от донорной последовательности и ее источника.
[00491] Клетка-хозяин также может представлять собой эукариота, например, клетку млекопитающего, насекомого, растения или гриба. Согласно одному варианту реализации клетка-хозяин представляет собой клетку человека (например, первичную клетку, стволовую клетку или иммортализо ванную линию клеток). Согласно некоторым вариантам реализации в клетку-хозяина можно вводить зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, ex vivo, а затем доставлять субъекту после события генной терапии. Клетка-хозяин может представлять собой любой тип клеток, например, соматическую клетку или стволовую клетку, индуцированную плюрипотентную стволовую клетку или клетку крови, например, Т-клетку или В-клетку, или клетку костного мозга. Согласно определенным вариантам реализации клетка-хозяин представляет собой аллогенную клетку. Например, конструирование Т-клеточного генома можно применять для разных видов иммунотерапии рака, модуляции заболевания, такой как терапия ВИЧ (например, нокаут рецептора, такого как CXCR4 и CCR5), и разных видов терапии иммунодефицита. Мишенями для иммунотерапии могут быть рецепторы ГКГС на В-клетках. Согласно некоторым вариантам реализации клетки-хозяева с модифицированным геномом, например, стволовые клетки костного мозга, например, CD34+ клетки, или индуцированные плюрипотентные стволовые клетки могут быть трансплантированы обратно пациенту для экспрессии терапевтического белка. В. Дополнительные заболевания для генной терапии:
[00492] В целом зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки любого белка FVIII в соответствии с приведенным выше описанием для лечения, предотвращения или облегчения симптомов, ассоциированных с гемофилией А, связанной с нарушенной экспрессией белка или экспрессией гена у субъекта.
[00493] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки белка FVIII в скелетную, сердечную или диафрагмальную мышцу, для продукции белка FVIII для секреции и циркуляции в крови или для системной доставки в другие ткани для лечения, облегчения и/или предотвращения гемофилии А.
[00494] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в легкие субъекта с помощью любых подходящих средств, необязательно путем введения аэрозольной суспензии пригодных для вдыхания частиц, содержащих зкДНК-векторы, которые субъект вдыхает. Пригодные для вдыхания частицы могут быть жидкими или твердыми. Аэрозоли жидких частиц, содержащих зкДНК-векторы, могут быть получены с помощью любых подходящих средств, таких как аэрозольный небулайзер под давлением или ультразвуковой небулайзер, как известно специалистам в данной области техники. См., например, патент США №4501729. Аэрозоли твердых частиц, содержащих зкДНК-векторы, могут быть получены сходным образом с помощью любого генератора аэрозолей лекарственного средства в виде твердых частиц с помощью методик, известных в фармацевтике.
[00495] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в ткани ЦНС (например, головной мозг, глаз).
[00496] Глазные нарушения, которые можно лечить, облегчать или предотвращать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают офтальмологические расстройства, затрагивающие сетчатку, задний тракт и зрительный нерв (например, пигментный ретинит, диабетическую ретинопатию и другие дегенеративные заболевания сетчатки, увеит, возрастную дегенерацию макулы, глаукому). Многие офтальмологические заболевания и нарушения ассоциированы с одним или более из трех типов показаний: (1) ангиогенезом, (2) воспалением и (3) дегенерацией. Согласно некоторым вариантам реализации зкДНК-вектор, раскрытый в данном документе, можно применять для доставки антиангиогенных факторов; противовоспалительных факторов; факторов, которые замедляют дегенерацию клеток, способствуют сохранению клеток или способствуют росту клеток, и комбинаций перечисленных выше. Например, диабетическая ретинопатия характеризуется ангиогенезом. Диабетическую ретинопатию можно лечить путем доставки одного или более антиангиогенных антител или слитых белков интраокулярно (например, в стекловидное тело) или периокулярно (например, в субтеноновую область). Дополнительные глазные заболевания, которые можно лечить, облегчать или предотвращать с помощью зкДНК-векторов согласно настоящему изобретению, включают географическую атрофию, сосудистую или «влажную» дегенерацию макулы, ФКУ, врожденный амавроз Лебера (LCA), синдром Ушера, эластическую псевдоксантому (РХЕ), х-связанный пигментный ретинит (XLRP), х-связанное расслоение сетчатки (XLRS), хороидеремию, наследственную оптическую нейропатию Лебера (LHON), архоматопсию, палочко-колбочковую дистрофию, эндотелиальную дистрофию роговицы Фукса, диабетический макулярный отек и глазной рак или опухоли.
[00497] Согласно некоторым вариантам реализации воспалительные глазные заболевания или нарушения (например, увеит) можно лечить, облегчать или предупреждать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Одно или более противовоспалительных антител или слитых белков могут быть экспрессированы путем внутриглазного (например, стекловидное тело или передняя камера) введения зкДНК-вектора, раскрытого в данном документе.
Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, который ассоциирован с трансгеном, кодирующим репортерный полипептид (например, фермент, такой как зеленый флуоресцентный белок или щелочная фосфатаза). Согласно некоторым вариантам реализации трансген, который кодирует репортерный белок, подходящий для экспериментальных или диагностических целей, выбирают из любого из: р-лактамазы, р-галактозидазы (LacZ), щелочной фосфатазы, тимидинкиназы, зеленого флуоресцентного белка (GFP), хлорамфениколацетилтрансферазы (CAT), люциферазы и других, хорошо известных в данной области техники. В некоторых аспектах зкДНК-векторы, экспрессирующие белок FVIII, связанный с репортерный полипептидом, можно применять для диагностических целей, а также для определения эффективности или в качестве маркеров активности зкДНК-вектора у субъекта, которому их вводят.
С. Тестирование успешной экспрессии гена с использованием зкДНК-вектора
[00498] Для тестирования эффективности доставки гена белка FVIII с помощью зкДНК-вектора можно использовать анализы, хорошо известные в данной области техники, которые можно выполнять как на моделях in vitro, так и на моделях in vivo. Уровни экспрессии белка FVIII с помощью зкДНК могут быть оценены специалистом в данной области техники путем измерения уровней мРНК и белка FVIII (например, ГЩР с обратной транскрипцией, анализ методом Вестерн-блоттинга и иммуноферментный анализ (ИФА)). Согласно одному варианту реализации зкДНК содержит репортерный белок, который можно использовать для оценки экспрессии белка FVIII, например, путем исследования экспрессии репортерного белка с помощью флуоресцентной микроскопии или устройства для считывания люминесценции планшетов. В случае приложений in vivo для тестирования функциональности данного белка FVIII можно использовать анализы функции белков, чтобы определить успешность экспрессии гена. Специалист сможет определить лучший тест для измерения функциональности белка FVIII, экспрессируемого вектором зкДНК, in vitro или in vivo.
[00499] В данном документе предусмотрено, что эффекты экспрессии гена белка FVIII с зкДНК-вектора в клетке или у субъекта могут длиться по меньшей мере 1 месяц, по меньшей мере 2 месяца, по меньшей мере 3 месяца, по меньшей мере четыре месяца, по меньшей мере 5 месяцев, по меньшей мере шесть месяцев, по меньшей мере 10 месяцев, по меньшей мере 12 месяцев, по меньшей мере 18 месяцев, по меньшей мере 2 года, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 20 лет или они могут быть постоянными.
[00500] Согласно некоторым вариантам реализации белок FVIII в экспрессионной кассете, экспрессионной конструкции или зкДНК-векторе, описанных в данном документе, может быть оптимизирован по кодонам для клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека (например, гуманизация), путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc.) или другой общедоступной базы данных.
D. Определение эффективности путем оценки экспрессии белка FVIII с зкДНК-вектора
[00501] По существу любой метод, известный в данной области техники для определения экспрессии белка, может быть использован для анализа экспрессии белка FVIII с зкДНК-вектора. Неограничивающие примеры таких методов/анализов включают иммуноферментный анализ (ИФА), аффинный ИФА, ELISPOT, последовательное разведение, проточную цитометрию, анализ методом поверхностного плазмонного резонанса, анализ кинетического исключения, масс-спектрометрию, Вестерн-блоттинг, иммунопреципитацию и ПЦР.
[00502] Для оценки экспрессии белка FVIII in vivo биологический образец может быть получен от субъекта для анализа. Примеры биологических образцов включают образец биожидкости, образец физиологической жидкости, кровь (включая цельную кровь), сыворотку, плазму, мочу, слюну, биопсию и/или образец ткани и т.д. Биологический образец или образец ткани также может относиться к образцу ткани или жидкости, выделенному у индивидуума, включая, но не ограничиваясь перечисленными, биопсию опухоли, стул, спинномозговую жидкость, плевральную жидкость, аспираты сосков, лимфатическую жидкость, внешние срезы кожи, дыхательного, кишечного и мочеполового путей, слезы, слюну, грудное молоко, клетки (включая, но не ограничиваясь перечисленными, клетки крови), опухоли, органы, а также образцы компонентов культуры клеток in vitro. Термин также включает смесь упомянутых выше образцов. Термин «образец» также включает необработанные или предварительно обработанные (или подвергнутые предварительному процессингу) биологические образцы. Согласно некоторым вариантам реализации образец, используемый для анализов и способов, описанных в данном документе, включает образец сыворотки, собранный у субъекта, подлежащего тестированию.
Е. Определение эффективности экспрессированного белка FVIII по клиническим параметрам
[00503] Эффективность данного белка FVIII, экспрессированного зкДНК-вектором, для лечения гемофилии А (т.е. функциональная экспрессия) может быть определена квалифицированным клиницистом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы гемофилии А изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим терапевтический белок FVIII, как описано в данном документе. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации гемофилии А или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование гемофилии А, например, прекращение или замедление прогрессирования гемофилии А; или (2) облегчение гемофилии А, например, вызывающее регресс симптома гемофилии А; и (3) предотвращение или снижение вероятности развития заболевания гемофилией А, или предотвращение вторичных заболеваний/нарушений, ассоциированных с гемофилией А.
Эффективное количество для лечения заболевания означает такое количество, которое при введении млекопитающему, нуждающемуся в этом, является достаточным, чтобы привести к эффективному лечению этого заболевания, в соответствии с определением этого термина в данном документе. Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для заболевания гемофилией А. Врач может оценить любой один или более клинических симптомов гемофилии А, которые включают: необъяснимое и чрезмерное кровотечение из порезов или повреждений, или после хирургического или стоматологического вмешательства; много больших или глубоких синяков; необычное кровотечение после вакцинаций; боль, отек или стеснение в суставах; кровь в моче или стуле; кровотечение из носа без известной причины; у младенцев - необъяснимую раздражительность.
XI. Различные приложения зкДНК-векторов, экспрессирующих антитела или слитые белки
[00504] Как раскрыто в данном документе, композиции и зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, можно применять для экспрессии белка FVIII для ряда целей. Согласно одному варианту реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции или прогрессирования заболевания гемофилией А. Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для лечения, предотвращения или облегчения состояний гемофилии А или нарушений у субъекта-млекопитающего.
[00505] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения заболевания, ассоциированного с повышенной экспрессией, повышенной активностью продукта гена или нефизиологической положительной регуляцией гена.
[00506] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения гемофилии А со сниженной экспрессией, отсутствием экспрессии или дисфункцией белка.
[00507] Обычный специалист в данной области техники поймет, что трансген может не представлять собой открытую рамку считывания гена, который сам транскрибируется; вместо этого он может представлять собой промоторную область или репрессорную область гена-мишени, и зкДНК-вектор может модифицировать такую область, что в результате модулирует экспрессию гена FVIII.
[00508] Композиции и зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять для доставки белка FVIII для различных целей, как описано выше.
[00509] Согласно некоторым вариантам реализации трансген кодирует один или более белков FVIII, которые можно применять для лечения, облегчения или предотвращения состояний гемофилии А у субъекта-млекопитающего. Белок FVIII, экспрессируемый зкДНК-вектором, вводят пациенту в количестве, достаточном для лечения гемофилии А, ассоциированной с аномальной последовательностью гена, что может привести к любому одному или более из следующего: повышенной экспрессии белка, сверхактивности белка, сниженной экспрессии, отсутствию экспрессии или дисфункции целевого гена или белка.
[00510] 1010 некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, предназначены для применения в методах диагностики и скрининга, посредством которых белок FVIII временно или стабильно экспрессируется в системе на основе культуры клеток или, альтернативно, в модели на трансгенном животном.
[00511] Другой аспект технологии, описанной в данном документе, обеспечивает способ трансдукции популяции клеток млекопитающего зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе. В целом и в общем смысле, способ включает по меньшей мере этап введения в одну или более клеток популяции композиции, которая содержит эффективное количество одного или более из зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.
[00512] Кроме того, согласно настоящему изобретению предложены композиции, а также терапевтические и/или диагностические наборы, которые включают один или более из раскрытых зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, или композиций зкДНК, изготовленных с одним или более дополнительными ингредиентами или приготовленных в соответствии с одной или более инструкциями по их применению.
[00513] Клетка, в которую должен быть введен зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть любого типа, включая, но не ограничиваясь перечисленными, нервные клетки (включая клетки периферической и центральной нервной системы, в частности, клетки головного мозга), клетки легких, клетки сетчатки, эпителиальные клетки (например, кишечные и респираторные эпителиальные клетки), мышечные клетки, дендритные клетки, клетки поджелудочной железы (включая островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки простаты, половые клетки и т.п. В качестве альтернативы, клетка может представлять собой любую клетку-предшественника. В качестве дополнительной альтернативы, клетка может представлять собой стволовую клетку (например, нервную стволовую клетку, стволовую клетку печени). В качестве еще одной альтернативы, клетка может представлять собой раковую или опухолевую клетку. Более того, клетки могут быть любого видового происхождения, как указано выше.
А. Получение и очистка зкДНК-векторов, экспрессирующих FVIII
[00514] ЗкДНК-векторы, раскрытые в данном документе, должны применяться для получения белка FVIII как in vitro, так и in vivo. Белки FVIII, полученные таким образом, могут быть выделены, протестированы в отношении целевой функции и очищены для дальнейшего использования в исследованиях или в качестве терапевтического лечения. Каждая система получения белка имеет свои преимущества/недостатки. В то время как белки, полученные in vitro, можно легко очистить и получить белки за короткое время, белки, полученные in vivo, могут иметь посттрансляционные модификации, такие как гликозилирование.
[00515] Терапевтический белок FVIII, полученный с использованием зкДНК-векторов, может быть очищен с помощью любого метода, известного специалистам в данной области техники, например, ионообменной хроматографии, аффинной хроматографии, осаждения или электрофореза.
[00516] Терапевтический белок FVIII, полученный с помощью способов и композиций, описанных в данном документе, может быть протестирован для оценки связывания с целевым белком-мишенью.
ПРИМЕРЫ
[00517] Примеры ниже представлены в качестве иллюстрации, а не ограничения. Обычные специалисты в данной области техники поймут, что зкДНК-векторы могут быть сконструированы из любых ITR дикого типа или модифицированных ITR, описанных в данном документе, и что примерные методы ниже могут быть использованы для конструирования и оценки активности таких зкДНК-векторов. Несмотря на то, что способы приведены в качестве примера для определенных зкДНК-векторов, они применимы к любому зкДНК-вектору в соответствии с описанием.
ПРИМЕР 1: Конструирование зкДНК-векторов с использованием метода на основе клеток насекомых
[00518] Получение зкДНК-векторов с использованием полинуклеотидной матрицы конструкции описано в Примере 1 заявки PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.
[00519] Примерный способ получения зкДНК-векторов представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от ThermoFisher Scientific.
[00520] Получение зкДНК-бакмид:
[00521] Компетентные клетки DHlOBac (компетентные клетки MAX EFFICIENCY® DH10Bac™, Thermo Fisher) трансформировали либо тестируемой, либо контрольной плазмидами, следуя протоколу в соответствии с инструкциями производителя. Чтобы получить рекомбинантные зкДНК-бакмиды, в клетках DHlOBac индуцировали рекомбинацию между плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного скринингового отбора на основании скрининга по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG с антибиотиками для отбора трансформантов и поддержания бакмиды и плазмид на основе транспозаз. Белые колонии, образующиеся в результате транспозиции, которая разрушает индикаторный ген β-галактозидазы, собирали и культивировали в 10 мл сред.
[00522] Рекомбинантные зкДНК-бакмиды выделяли из E.coli и трансфицировали ими клетки насекомых Sf9 или Sf21 с использованием FugeneHD для получения инфекционного бакуловируса. Адгезивные клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в колбах Т25 при 25°С. Через 4 дня культуральную среду (содержащую вирус Р0) отделяли от клеток, фильтровали через фильтр с размером пор 0,45 мкм, отделяя инфекционные бакуловирусные частицы от клеток или клеточного дебриса.
[00523] Необязательно первое поколение бакуловируса (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 в 50-500 мл сред. Клетки поддерживали в суспензионных культурах в инкубаторе с орбитальным шейкером при 130 об./мин при 25°С, отслеживая диаметр и жизнеспособность клеток до тех пор, пока клетки не достигнут диаметра 18-19 нм (от диаметра наивных клеток, равного 14-15 нм) и плотности ~4,0×106 клеток/мл. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали после центрифугирования для удаления клеток и дебриса с последующей фильтрацией через фильтр с размером пор 0,45 мкм.
[00524] ЗкДНК-бакуловирус, содержащий тестируемые конструкции, собирали и определяли инфекционную активность или титр бакуловируса. В частности, четыре х20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях: 1/1000, 1/10000, 1/50000, 1/100000 и инкубировали при 25-27°С. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.
[00525] «Rep-плазмиду», раскрытую на ФИГ. 8А из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки, получали в экспрессионном векторе pFASTBAC™-Dual (ThermoFisher), содержащем как Rep78 (SEQ ID NO: 131 или 133), так и Rep52 (SEQ ID NO: 132) или Rep68 (SEQ ID NO: 130) и Rep40 (SEQ ID NO: 129). Rep-плазмиду трансформировали в компетентные клетки DH10Bac (компетентные клетки MAX EFFICIENCY® DH10Bac™ (Thermo Fisher)), следуя предоставленному производителем протоколу. Для получения рекомбинантных бакмид («Rep-бакмид») в клетках DH10Bac индуцировали рекомбинацию между Rep-плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного отбора, который включал скрининг по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG. Одиночные белые колонии собирали и инокулировали в 10 мл селективных сред (канамицин, гентамицин, тетрациклин в бульоне LB). Рекомбинантные бакмиды (Rep-бакмиды) выделяли из E.coli, и трансфицировали клетки насекомых Sf9 или Sf21 указанными Rep-бакмидами, чтобы получить инфекционный бакуловирус.
[00526] Клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в течение 4 дней и выделяли из культуры инфекционный рекомбинантный бакуловирус («Rep-бакуловирус»). Необязательно Rep-бакуловирус первого поколения (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 и культивировали в 50-500 мл сред. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали, отделяя клетки путем центрифугирования или фильтрации, или используя другой способ фракционирования. Собирали Rep-бакуловирус и определяли инфекционную активность бакуловируса. В частности, четыре x20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях, 1/1000, 1/10000, 1/50000, 1/100000, и инкубировали. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.
[00527] Получение и характеристика зкДНК-вектора
[00528] На ФИГ. 4В среду для культивирования клеток насекомых Sf9, содержащую (1) образец, содержащий зкДНК-бакмиду или зкДНК-бакуловирус, и (2) Rep-бакуловирус, описанный выше, затем добавляли к свежей культуре клеток Sf9 (2,5×106 клеток/мл, 20 мл) при соотношении 1:1000 и 1:10000, соответственно. Затем клетки культивировали при 130 об./мин при 25°С. Через 4-5 дней после ко инфицирования детектировали диаметр и жизнеспособность клеток. Когда диаметр клеток достигал 18-20 нм при жизнеспособности -70-80%, клеточные культуры центрифугировали, среду удаляли и собирали клеточные осадки. Клеточные осадки сначала ресуспендировали в достаточном объеме водной среды, либо воды, либо буфера. ЗкДНК-вектор выделяли и очищали из клеток с использованием протокола очистки Qiagen MIDI PLUS™ (Qiagen, 0,2 мг массы осадка клеток, обработанной на колонку).
[00529] Значения выхода зкДНК-векторов, полученных и очищенных из клеток насекомых Sf9, первоначально определяли на основании поглощения в УФ-диапазоне при 260 нм.
[00530] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.
[00531] Структуры выделенных зкДНК-векторов анализировали далее путем расщепления ДНК, полученной из коинфицированных клеток Sf9 (как описано в данном документе), рестрикционными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4D и 4Е, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как бескапсидный вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс.п.о.
[00532] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4D).
[00533] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с 1x SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм).
[00534] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.
[00535] Для сравнительных целей в Примере 1 описано получение зкДНК-векторов с использованием метода на основе клеток насекомых и полинуклеотидной матрицы конструкции, а также описано в Примере 1 из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению в соответствии с Примером 1, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.
[00536] Примерный способ получения зкДНК-векторов в способе с использованием клетки насекомого представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от Thermo Fisher Scientific.
ПРИМЕР 2: Синтетическое получение зкДНК путем вырезания из двухцепочечной молекулы ДНК
[00537] Синтетическое получение зкДНК-векторов описано в Примерах 2-6 международной заявки PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки. Один примерный способ получения зкДНК-вектора с применением синтетического способа включает вырезание двухцепочечной молекулы ДНК. В общих чертах, зкДНК-вектор может быть получен с применением конструкции двухцепочечной ДНК, например, см. ФИГ. 7А-8Е из PCT/US19/14122. Согласно некоторым вариантам реализации конструкция двухцепочечной ДНК представляет собой зкДНК-плазмиду, например, см. ФИГ. 6 в международной заявке на патент PCT/US2018/064242, поданной 6 декабря 2018 г.
[00538] Согласно некоторым вариантам реализации конструкция для получения зкДНК-вектора содержит регуляторный переключатель, описанный в данном документе.
[00539] В иллюстративных целях в Примере 2 описано получение зкДНК-векторов в качестве примерных ДНК-векторов с замкнутыми концами, полученных с использованием этого метода. Однако, хотя в этом Примере зкДНК-векторы приведены в качестве примеров для иллюстрации синтетических способов получения in vitro для получения ДНК-вектора с замкнутыми концами путем вырезания двухцепочечного полинуклеотида, содержащего ITR и экспрессионную кассету (например, гетерологичную последовательность нуклеиновой кислоты), с последующим лигированием свободных 3' и 5' концов, как описано в данном документе, обычному специалисту в данной области техники известно, что, как проиллюстрировано выше, полинуклеотидную молекулу двухцепочечной ДНК можно модифицировать так, чтобы получить любой целевой ДНК-вектор с замкнутыми концами, включая, но не ограничиваясь этим, doggybone ДНК, гантелеобразную ДНК и т.п. Примерные зкДНК-векторы для получения антител или слитых белков, которые могут быть получены с помощью синтетического метода получения, описанного в Примере 2, обсуждаются в разделах, озаглавленных «III зкДНК-векторы в целом». Примерные антитела и слитые белки, экспрессируемые зкДНК векторами, описаны в разделе, озаглавленном «ПС Примерные антитела и слитые белки, экспрессируемые зкДНК-векторами».
[00540] Способ включает (i) вырезание последовательности, кодирующей экспрессионную кассету, из конструкции двухцепочечной ДНК, и (ii) образование шпилечных структур на одном или более ITR, и (iii) соединение свободных 5'- и 3'-концов путем лигирования, например, с помощью ДНК-лигазы Т4.
[00541] Конструкция двухцепочечной ДНК содержит, в порядке от 5' к 3': первый сайт рестрикционной эндонуклеазы; левый ITR; экспрессионную кассету; правый ITR; и второй сайт рестрикционной эндонуклеазы. Конструкцию двухцепочечной ДНК затем приводят в контакт с одной или более рестрикционными эндонуклеазами для образования двухцепочечных разрывов в обоих сайтах рестрикционных эндонуклеаз. Одна эндонуклеаза может нацелено действовать на оба сайта, или каждый сайт может быть мишенью разной эндонуклеазы, при условии, что сайты рестрикции не присутствуют в матрице зкДНК-вектора. Это позволяет вырезать последовательность между сайтами рестрикционной эндонуклеазы из остальной части конструкции двухцепочечной ДНК (см. Фиг. 9 PCT/US19/14122). После лигирования образуется ДНК-вектор с замкнутыми концами.
[00542] Один или оба ITR, используемые в способе, могут представлять собой ITR дикого типа. Также могут быть использованы модифицированные ITR, причем указанная модификация может включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С' (см., например, Фиг. 6-8 и 10, ФИГ. 11В из PCT/US19/14122), и может иметь две или более шпилечных петель (см., например, ФИГ. 6-8, ФИГ. 11В из PCT/US 19/14122) или одну шпилечную петлю (см., например, ФИГ. 10А-10В, ФИГ. 11В из PCT/US19/14122). ITR, модифицированный шпилечной петлей, может быть получен путем генетической модификации существующего олиго или путем биологического и/или химического синтеза de novo.
[00543] В неограничивающем примере ITR-6 слева и справа (SEQ ID NO: 111 и 112) включают 40 делеций нуклеотидов в плечах В-В' и С-С' из ITR дикого типа ААВ2. Прогнозируется, что нуклеотиды, оставшиеся в модифицированном ITR, образуют одну шпилечную структуру. Свободная энергия Гиббса разворачивания структуры составляет примерно -54,4 ккал/моль. В ITR также могут быть внесены другие модификации, включая необязательную делецию функционального сайта связывания Rep или сайта TRS. ПРИМЕР 3: получение зкДНК за счет конструирования олигонуклеотидов
[00544] Другой примерный способ получения зкДНК-вектора с использованием синтетического способа, который включает сборку различных олигонуклеотидов, представлен в Примере 3 из PCT/US19/14122, в котором зкДНК-вектор получают путем синтеза 5'-олигонуклеотида и 3'-олигонуклеотида ITR и лигирования указанных олигонуклеотидов ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету. На ФИГ. 11В из PCT/US19/14122 представлен примерный способ лигирования 3'-олигонуклеотида ITR и 3'-олигонуклеотида ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету.
[00545] Как раскрыто в данном документе, олигонуклеотиды ITR могут содержать WT-ITR (например, см. ФИГ. 3А, ФИГ. 3С) или модифицированные ITR (например, см. ФИГ. 3В и ФИГ. 3D). (См. также, например, ФИГ. 6А, 6В, 7А и 7В из PCT/US 19/14122, которая полностью включена в данный документ). Примерные олигонуклеотиды ITR включают, но не ограничиваются перечисленными, SEQ ID NO: 134-145 (например, см. Таблицу 7 в PCT/US19/14122). Модифицированные ITR могут включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С'. Олигонуклеотиды ITR, содержащие WT-ITR или mod-ITR, описанные в данном документе, для использования в бесклеточном синтезе могут быть получены путем генетической модификации или биологического и/или химического синтеза. Как обсуждается в данном документе, олигонуклеотиды ITR в Примерах 2 и 3 могут содержать WT-ITR или модифицированные ITR (mod-ITR) в симметричных или асимметричных конфигурациях, как обсуждается в данном документе. ПРИМЕР 4: получение зкДНК за счет одноцепочечной молекулы ДНК
[00546] В другом примерном способе получения зкДНК-вектора с использованием синтетического способа, представленном в Примере 4 из PCT/US19/14122, используют одноцепочечную линейную ДНК, содержащую два смысловых ITR, которые фланкируют смысловую последовательность экспрессионной кассеты и ковалентно присоединены к двум антисмысловым ITR, которые фланкируют антисмысловую последовательность экспрессионной кассеты, а концы указанной одноцепочечной линейной ДНК затем лигируют с образованием одноцепочечной молекулы с замкнутыми концами. Один неограничивающий пример включает синтез и/или продуцирование молекулы одноцепочечной ДНК, ренатурацию частей указанной молекулы с образованием одной линейной молекулы ДНК, которая содержит одну или более областей вторичной структуры со спаренными основаниями, с последующим лигированием свободных 5'- и 3'-концов между собой с образованием замкнутой одноцепочечной молекулы.
[00547] Примерная одноцепочечная молекула ДНК для получения зкДНК-вектора содержит, от 5' к 3': смысловой первый ITR; смысловую последовательность экспрессионной кассеты; смысловой второй ITR; антисмысловой второй ITR; антисмысловую последовательность экспрессионной кассеты; и антисмысловой первый ITR.
[00548] Молекула одноцепочечной ДНК для использования в примерном способе Примера 4 может быть образована с помощью любой методологии синтеза ДНК, описанной в данном документе, например, путем синтеза ДНК in vitro, или обеспечена путем расщепления конструкции ДНК (например, плазмиды) нуклеазами и плавления полученных фрагментов дцДНК для получения фрагментов оцДНК.
[00549] Ренатурацию можно осуществлять путем понижения температуры ниже расчетных температур плавления пар смысловой и антисмысловой последовательностей. Температура плавления зависит от содержания конкретных нуклеотидных оснований и характеристик используемого раствора, например, от концентрации соли. Температуры плавления для любой конкретной последовательности и комбинации растворов легко рассчитываются обычным специалистом в данной области техники.
[00550] Свободные 5' и 3' концы ренатурированной молекулы могут быть лигированы друг с другом или лигированы со шпилечной молекулой с образованием зкДНК-вектора. Подходящие примерные методологии лигирования и шпилечные молекулы описаны в Примерах 2 и 3.
ПРИМЕР 5: Очистка и/или подтверждение получения зкДНК
[00551] Любой из продуктов ДНК-вектора, полученных с помощью способов, описанных в данном документе, например, включая способы получения на основе клеток насекомых, описанные в Примере 1, или синтетические способы получения, описанные в Примерах 2-4, может быть очищен, например, для удаления примесей, неиспользованных компонентов или побочных продуктов с использованием методов, обычно известных квалифицированному специалисту; и/или может быть проанализирован для подтверждения того, что полученный ДНК-вектор (в данном случае зкДНК-вектор) представляет собой целевую молекулу. Примерным методом очистки ДНК-вектора, например, зкДНК, является использование протокола очистки Qiagen Midi Plus (Qiagen) и/или очистки на геле.
[00552] Ниже приведен примерный метод подтверждения идентичности зкДНК-векторов.
[00553] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.
[00554] Структуры выделенных зкДНК-векторов были дополнительно проанализированы путем расщепления очищенной ДНК рестрикциоиными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4С и 4D, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как зкДНК-вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс. п. о.
[00555] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4Е).
[00556] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с lx SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм). Вышеупомянутый метод на основе геля может быть адаптирован для целей очистки путем выделения зкДНК-вектора из полосы геля и обеспечения его ренатурации.
[00557] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса - например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.
ПРИМЕР 6: Контролируемая экспрессия трансгена с зкДНК: экспрессия трансгена с зкДНК-вектора in vivo может поддерживаться и/или повышаться путем повторного введения дозы.
[00558] ЗкДНК-вектор получали в соответствии со способами, описанными в Примере 1 выше, с использованием зкДНК-плазмиды, содержащей промотор CAG (SEQ ID NO: 72) и трансген люциферазы (SEQ ID NO: 56), в качестве примерного FVIII, фланкированный асимметричными ITR (например, 5'-WT-ITR (SEQ ID NO: 2) и 3' mod-ITR (SEQ ID NO: 3)), и оценивали в различных программах лечения in vivo. Этот зкДНК-вектор использовали во всех последующих экспериментах, описанных в Примерах 6-10. В Примере 6 зкДНК-вектор очищали, изготавливали в виде состава с липидной наночастицей (ЛНЧ-зкДНК) и вводили путем инъекции в хвостовую вену каждой мыши CD-I® IGS. Липосомы изготавливали с использованием подходящей смеси липидов, содержащей четыре компонента для образования липосом на основе липидных наночастиц (ЛНЧ), включая катионные липиды, вспомогательные липиды, холестерин и ПЭГ-липиды.
[00559] Для оценки устойчивой экспрессии трансгена in vivo с зкДНК-вектора на протяжении длительного периода времени ЛНЧ-зкДНК вводили в стерильном ФСБ путем внутривенной инъекции в хвостовую вену мышам CD-I® IGS в возрасте приблизительно 5-7 недель. Была проведена оценка трех групп с разными дозировками: 0,1 мг/кг, 0,5 мг/кг и 1,0 мг/кг, по десять мышей на группу (за исключением группы 1,0 мг/кг, в которой было 15 мышей на группу). Инъекции вводили в день 0. Пять мышей из каждой группы получали инъекцию дополнительной идентичной дозы в день 28. Экспрессию люциферазы измеряли путем визуализации IVIS после внутривенного введения мышам CD-I® IGS (Charles River Laboratories; мыши дикого типа (WT)). Экспрессию люциферазы оценивали с помощью визуализации IVIS после введения путем внутрибрюшинной инъекции 150 мг/кг субстрата люциферина в дни 3, 4, 7, 14, 21, 28, 31, 35 и 42 и регулярно (например, еженедельно, два раза в неделю или через каждые 10 суток, или через каждые 2 недели) в период между днями 42-110. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 132 дней после 3 разных протоколов введения (данные не показаны).
[00560] Расширенное исследование выполняли для изучения эффекта повторной дозы, например, повторного введения ЛНЧ-зкДНК, экспрессирующей люциферазу, субъектам, получавшим ЛНЧ-зкДНК. В частности, оценивали возможность повышения уровней экспрессии путем одного или более дополнительных введений зкДНК-вектора.
[00561] В этом исследовании биораспределение экспрессии люциферазы с зкДНК-вектора оценивали с помощью IVIS у мышей CD-1® IGS после первоначального внутривенного введения 1,0 мг/кг (т.е. праймирующей дозы) в дни 0 и 28 (Группа А). Второе введение зкДНК-вектора осуществляли путем инъекции в хвостовую вену 3 мг/кг (Группа В) или 10 мг/кг (Группа С) в 1,2 мл в хвостовую вену в день 84. В этом исследовании использовали по пять (5) мышей CD-1® в каждой из Групп А, В и С. Визуализацию IVIS экспрессии люциферазы у мышей выполняли перед введением дополнительных доз в дни 49, 56, 63 и 70, как описано выше, а также после введения повторных доз в день 84 и в дни 91, 98, 105, 112 и 132. Экспрессию люциферазы оценивали и детектировали во всех трех Группах А, В и С по меньшей мере до дня 110 (самый продолжительный оцененный период).
[00562] Было показано, что уровень экспрессии люциферазы повышается с помощью повторной дозы (т.е. повторного введения композиции зкДНК) ЛНЧ-зкДНК-Luc, согласно определению путем оценки активности люциферазы в присутствии люциферина. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 110 дней после 3 разных протоколов введения (Группы А, В и С). У мышей, не получавших никакой дополнительной повторной дозы (праймирующая доза 1 мг/кг (т.е. Группа А)), наблюдали стабильную экспрессию люциферазы на протяжении всего исследования. Мыши в группе В, которым вводили повторную дозу 3 мг/кг зкДНК-вектора, демонстрировали приблизительно семикратное увеличение наблюдаемой светимости по сравнению с мышами в Группе С. Неожиданно, мыши, получившие повторную дозу 10 мг/кг зкДНК-вектора, продемонстрировали 17-кратное увеличение наблюдаемой светимости люциферазы по сравнению с мышами, не получавшими никакой повторной дозы (Группа А).
[00563] Группа А мышей CD-1® IGS демонстрирует экспрессию люциферазы после внутривенного введения 1 мг/кг зкДНК-вектора в хвостовую вену в дни 0 и 28. Группы В и С мышей CD-1® IGS демонстрируют экспрессию люциферазы после введения 1 мг/кг зкДНК-вектора в первый момент времени (день 0) и введения повторной дозы зкДНК-вектора во второй момент времени в день 84. Второе введение (т.е. повторная доза) зкДНК-вектора повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз.
[00564] 3-кратное увеличение дозы (т.е. количества) зкДНК-вектора при повторном введении дозы в Группе В (т.е. при повторном введении дозы 3 мг/кг) привело к 7-кратному увеличению экспрессии люциферазы. Также неожиданно 10-кратное увеличение количества зкДНК-вектора при повторном введении дозы (т.е. при повторном введении дозы 10 мг/кг) в Группе С привело к 17-кратному увеличению экспрессии люциферазы. Таким образом, второе введение (т.е. повторная доза) зкДНК повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз. Это показывает, что повышение экспрессии трансгена в результате повторной дозы больше, чем ожидалось, и зависит от дозы или количества зкДНК-вектора при введении повторной дозы и, по-видимому, является синергическим по отношению к начальной экспрессии трансгена после первоначального праймирующего введения в день 0. Таким образом, дозозависимое повышение экспрессии трансгена не является аддитивным, скорее, уровень экспрессии трансгена является дозозависимым и сверхпропорционален суммарному количеству зкДНК-вектора, введенному в каждый момент времени.
[00565] Обе группы В и С показали значительное дозозависимое повышение экспрессии люциферазы по сравнению с контрольными мышами (Группа А), которые не получали повторной дозы зкДНК-вектора во второй момент времени. В совокупности эти данные показывают, что экспрессия трансгена с зкДНК-вектора может быть повышена дозозависимым образом с помощью повторной дозы (т.е. повторного введения) зкДНК-вектора по меньшей мере во второй момент времени.
[00566] В совокупности эти данные демонстрируют, что уровень экспрессии трансгена, например, FVIII, с зкДНК-векторов может поддерживаться на устойчивом уровне на протяжении по меньшей мере 84 дней и может быть повышен in vivo после повторной дозы зкДНК-вектора, введенной по меньшей мере во второй момент времени. ПРИМЕР 7: Устойчивая экспрессия трансгена in vivo зкДНК-векторами, изготовленными в виде составов с ЛНЧ
[00567] Воспроизводимость результатов, полученных в Примере 6, с другой липидной наночастицей оценивали in vivo на мышах. В день 0 мышам вводили дозу либо зкДНК-вектора, содержащего трансген люциферазы, управляемый промотором CAG, который был инкапсулирован в ЛНЧ, отличную от использованной в Примере 6, либо тех же ЛНЧ, содержащих поли(С), но без зкДНК или гена люциферазы. В частности, самцам мышей CD-1® в возрасте приблизительно 4 недель вводили однократную инъекцию 0,5 мг/кг ЛНЧ-зкДНК-люциферазы или контрольных ЛНЧ-поли(С), вводимых внутривенно через латеральную хвостовую вену в день 0. В день 14 животным вводили системно люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг. Приблизительно через 15 минут после введения люциферина каждое животное визуализировали с использованием системы визуализации in vivo («IVIS»).
[00568] Как показано на ФИГ. 7, значительная флуоресценция в печени наблюдалась у всех четырех мышей, получивших зкДНК, при этом за исключением места инъекции у животных наблюдалась очень незначительная флуоресценция, это указывает на то, что ЛНЧ опосредовали специфичную для печени доставку конструкции зкДНК, и что доставленный зкДНК-вектор был способен к контролируемой устойчивой экспрессии своего трансгена в течение по меньшей мере двух недель после введения. ПРИМЕР 8: Устойчивая экспрессия трансгена в печени in vivo после введения зкД НК-вектора
[00569] В отдельном эксперименте оценивали локализацию зкДНК, доставленной с помощью ЛНЧ, в печени экспериментальных животных. ЗкДНК-вектор, содержащий представляющий интерес функциональный трансген, инкапсулировали в те же ЛНЧ, что и использованные в Примере 7, и вводили мышам in vivo при уровне дозы 0,5 мг/кг путем внутривенной инъекции. Через 6 часов мышей умерщвляли и отбирали образцы печени, фиксировали формалином и заливали парафином с использованием стандартных протоколов. Анализы методом гибридизации in situ RNAscope® выполняли для визуализации зкДНК-векторов в ткани с использованием зонда, специфичного для трансгена зкДНК, и детектирования с использованием хромогенной реакции и окрашивания гематоксилином (Advanced Cell Diagnostics). ФИГ. 8 показывает результаты, которые указывают на наличие зкДНК в гепатоцитах. ПРИМЕР 9: Устойчивая экспрессия трансгена зкДНК в глазах in vivo
[00570] Устойчивость экспрессии трансгена зкДНК-вектора в тканях, отличных от печени, оценивали для определения переносимости и экспрессии зкДНК-вектора после введения в глаза in vivo. Несмотря на то, что люциферазу использовали в качестве примерного трансгена в Примере 9, обычный специалист может легко заменить трансген люциферазы последовательностью FVIII из любой из последовательностей, перечисленных в Таблице 1.
[00571] В день 0 самцам крыс Sprague Dawley в возрасте приблизительно 9 недель вводили путем субретинальной инъекции 5 мкл либо зкДНК-вектора, содержащего трансген люциферазы, в виде состава с реагентом для трансфекции jetPEI® (Polyplus), либо плазмидной ДНК, кодирующей люциферазу, в виде состава с jetPEI®, в обоих случаях в концентрации 0,25 мкг/мкл. В каждой группе тестировали по четыре крысы. Животным давали седативное средство и вводили исследуемый препарат в правый глаз путем субретинальной инъекции с помощью иглы калибра 33. Левый глаз каждого животного оставляли интактным. Сразу после инъекции глаза проверяли методом оптической когерентной томографии или визуализации глазного дна, чтобы подтвердить наличие субретинального пузырька. Крысы получали бупренорфин и местную мазь с антибиотиком в соответствии со стандартными процедурами.
[00572] В дни 7, 14, 21, 28 и 35 животным в обеих группах вводили системно свежеприготовленный люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг.Через 5-15 минут после введения люциферина всех животных визуализировали с использованием IVIS под анестезией изофлураном. Полный поток [фотон/с] и средний поток (фотон/с/ср/см2) в представляющей интерес области, включающей глаз, получали при экспозиции 5 минут. Результаты представлены графически в виде средней светимости в обработанном глазу («инъецированный») для каждой группы лечения относительно средней светимости в необработанном глазу («неинъецированный») для каждой группы лечения (ФИГ. 9В). Значительная флуоресценция легко детектировалась в глазах, в которые был введен зкДНК-вектор, но была намного слабее в глазах, в которые была введена плазмида (ФИГ. 9А). Через 35 дней крыс, которым инъецировали плазмиду, умерщвляли, продолжая исследование для крыс, получивших зкДНК, с инъекцией люциферина и визуализацией IVIS в дни 42, 49, 56, 63, 70 и 99. Результаты демонстрируют, что зкДНК-вектор, введенный в глаз крысы путем однократной инъекции, опосредует экспрессию трансгена in vivo и что такая экспрессия поддерживалась на высоком уровне на протяжении по меньшей мере 99 дней после инъекции.
ПРИМЕР 10: Длительное введение доз и введение повторных доз зкДНК-вектора у мышей Rag2.
[00573] В ситуациях, когда один или более трансгенов, кодируемых в экспрессионной генной кассете зкДНК-вектора, экспрессируются в среде хозяина (например, в клетке или в организме субъекта), где экспрессированный белок распознается как чужеродный, существует вероятность того, что у хозяина выработается адаптивный иммунный ответ, который может привести к нежелательному истощению продукта экспрессии, которое может быть ошибочно принято за отсутствие экспрессии. В некоторых случаях это может происходить с репортерной молекулой, которая является гетерологичной для нормальной среды хозяина. Соответственно, экспрессию трансгена зкДНК-вектора оценивали in vivo в модели на мышах Rag2, в которой отсутствуют В- и Т-клетки и, следовательно, не вырабатывается адаптивный иммунный ответ на ненативные для мышей белки, такие как люцифераза. В общих чертах, в день 0 мышам линий c57b1/6 и Rag2 с подавленными генами вводили путем внутривенной инъекции в хвостовую вену 0,5 мг/кг инкапсулированного в ЛНЧ зкДНК-вектора, экспрессирующего люциферазу, или контроля поли(С), а в день 21 некоторым мышам вводили повторную дозу того же самого ЛНЧ-инкапсулированного зкДНК-вектора при том же уровне дозы. Все тестируемые группы состояли из 4 мышей в каждой. Визуализацию IVIS выполняли после инъекции люциферина, как описано в Примере 9, с недельными интервалами.
[00574] При сравнении полного потока, наблюдаемого в анализах IVIS, флуоресценция, наблюдаемая у мышей дикого типа (косвенная мера присутствия экспрессированной люциферазы), которым вводили ЛНЧ-зкДНК-вектор-Luc, постепенно снижалась после дня 21, в то время как мыши Rag2, которым вводили тот же самый препарат, проявили относительно постоянную устойчивую экспрессию люциферазы на протяжении 42 дней эксперимента (ФИГ. 10А). Временная точка приблизительно в день 21, в которой у мышей наблюдали снижение, соответствует временному интервалу, в котором можно ожидать появления адаптивного иммунного ответа. Повторное введение ЛНЧ с зкДНК-вектором мышам Rag2 приводило к заметному увеличению экспрессии, которая была устойчивой в течение по меньшей мере 21 дня, на протяжении которых проводили наблюдения в этом исследовании (ФИГ. 10В). Результаты позволяют предположить, что адаптивный иммунитет может играть определенную роль при экспрессии ненативного белка с зкДНК-вектора у хозяина, и что наблюдаемое снижение экспрессии в период времени 20+ дней с момента первоначального введения может указывать на мешающий адаптивный иммунный ответ на экспрессируемую молекулу, а не на снижение экспрессии (или в дополнение к ней). Следует отметить, что этот ответ, как ожидается, будет низким в случае экспрессии у хозяина нативных белков, когда, предположительно, хозяин будет правильно распознавать экспрессированные молекулы как собственные и не будет вырабатывать такой иммунный ответ.
ПРИМЕР 11: Влияние специфической для печени экспрессии и модуляции CpG на устойчивую экспрессию
[00575] Как описано в Примере 10, нежелательный иммунный ответ хозяина в некоторых случаях может искусственно ослаблять то, что иначе могло бы быть устойчивой экспрессией одного или более целевых трансгенов с введенного зкДНК-вектора. Использовали два подхода, чтобы оценить влияние избегания и/или ослабления потенциального иммунного ответа хозяина на устойчивую экспрессию с зкДНК-вектора.
Во-первых, поскольку вектор зкДНК-Luc, использованный в предшествующих примерах, находился под контролем конститутивного промотора CAG, была получена сходная конструкция с использованием специфического для печени промотора (hAAT) или другого конститутивного промотора (hEF-1), чтобы определить, будет ли избегание длительного воздействия миелоидных клеток или тканей, не относящихся к печени, снижать любые наблюдаемые иммунные эффекты. Во-вторых, некоторые конструкции зкДНК-люцифераза конструировали так, чтобы иметь пониженное содержание CpG, известного триггера иммунной реакции хозяина. Измеряли экспрессию гена люциферазы, кодируемой зкДНК, при введении мышам таких модифицированных зкДНК-векторов с замененным промотором.
[00576] Использовали три разных зкДНК-вектора, каждый из которых кодировал люциферазу в качестве трансгена. Первый зкДНК-вектор имел большое количество неметилированного CpG (~350) и содержал конститутивный промотор С AG («зкДНК CAG»); второй имел умеренное количество неметилированного CpG (~60) и содержал специфический для печени промотор hAAT («зкДНК hAAT с низким содержанием CpG»); и третий представлял собой метилированную форму второго, не содержащую неметилированного CpG, и также содержал промотор hAAT («зкДНК hAAT без CpG»). В остальном зкДНК-векторы были идентичны. Векторы готовили, как описано выше.
[00577] Четыре группы по четыре самца мышей CD-1®, в возрасте приблизительно 4 недель, получали один из зкДНК-векторов, инкапсулированных в ЛНЧ, или контроль поли(С). В день 0 каждой мыши вводили путем однократной внутривенной инъекции в хвостовую вену 0,5 мг/кг зкДНК-вектора в объеме 5 мл/кг. Значения массы тела регистрировали в дни -1, -, 1, 2, 3, 7 и еженедельно после этого, до умерщвления мышей. Образцы цельной крови и сыворотки брали в дни 0, 1 и 35. Прижизненную визуализацию проводили в дни 7, 14, 21, 28 и 35, и затем еженедельно с использованием системы визуализации in vivo (IVIS). Для визуализации каждой мыши вводили люциферин при 150 мг/кг путем внугрибрюшинной инъекции при 2,5 мл/кг. Через 15 минут каждую мышь анестезировали и визуализировали. Мышей умерщвляли в день 93 и собирали терминальные ткани, включая печень и селезенку. Измерения цитокинов проводили через 6 часов после введения дозы в день 0.
[00578] Несмотря на то, что у всех получивших зкДНК мышей наблюдали значительную флуоресценцию в дни 7 и 14, у мышей, получивших зкДНК CAG, флуоресценция быстро снижалась после дня 14 и более постепенно уменьшалась на протяжении оставшейся части исследования. Напротив, у мышей, получивших зкДНК hAAT с низким содержанием CpG и без CpG, полный поток оставался на стабильно высоком уровне (Фиг. 11). Это позволяет предположить, что направление доставки зкДНК-вектора специфически в печень приводило к устойчивой и длительной экспрессии трансгена с вектора в течение по меньшей мере 77 дней после однократной инъекции. Конструкции с минимизированным содержанием CpG или с полным отсутствием CpG имели сходные профили длительной устойчивой экспрессии, в то время как конструкция с конститутивным промотором и высоким содержанием CpG проявила снижение экспрессии с течением времени, это позволяет предположить, что иммунная активация хозяина при введении зкДНК-вектора может играть определенную роль в любом снижении экспрессии, наблюдаемом при введении такого вектора субъекту. Эти результаты обеспечивают альтернативные методы адаптации продолжительности ответа к желаемому уровню путем выбора ограниченного конкретной тканью промотора и/или изменения содержания CpG в зкДНК-векторе в том случае, если наблюдается иммунный ответ хозяина потенциально, специфичный в отношении трансгена ответ.
ПРИМЕР 12: Гидродинамическая доставка зкДНК, экспрессирующей FVIII
[00579] Гидродинамическая инъекция в хвостовую вену является хорошо известным методом введения нуклеиновой кислоты в печень у грызунов. В этой системе инъекция под давлением большого объема неинкапсулированной нуклеиновой кислоты приводит к кратковременному увеличению проницаемости клеток и доставке непосредственно в ткани и клетки. Это обеспечивает экспериментальный механизм обхода многих иммунных систем хозяина, таких как привлечение макрофагов, что обеспечивает возможность наблюдать доставку и экспрессию в отсутствие такой активности.
[00580] Три разных зкДНК-вектора, каждый с левым ITR дикого типа и усеченным мутантным правым ITR и имеющие трансгенную область, кодирующую FVIII, получали и очищали, как описано выше в Примерах 1 и 5. ЗкДНК FVIII-векторы под контролем специфического для печени промотора или только ФСБ вводили самцам мышей C57bl/6J в возрасте приблизительно 6 недель. Незащищенные зкДНК-векторы вводили в дозе 0,005 мг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 1,2 мл, введенной в течение 5 секунд, или в дозе 100 мл/кг, введенной в течение 5-8 секунд. Массу тела измеряли в дни 0, 1, 2, 3 и 7, а затем еженедельно. Образцы крови собирали у каждого обработанного животного в дни 3, 7, 14, 21, а также в последний день 28. Наличие экспрессированного FVIII в образцах плазмы измеряли с помощью набора для ИФА общего фактора VIII человека (ELISA Human Total Factor VIII (Innovative Research)).
[00581] Как показано на ФИГ. 11А, FVIII легко детектировался в образцах плазмы, взятой в день 3 и 7 у мышей, обработанных двумя из трех зкДНК FVIII-векторов, но не наблюдался у мышей, получавших ФСБ. ФИГ. 11В показывает, что экспрессия FVIII зависела от объема дозы в случае двух векторов, для которых наблюдали экспрессию FVIII, и оставалась относительно постоянной на протяжении 28-дневного исследования, за исключением вектора 3, экспрессия которого быстро снижалась после дня 7. Этот эксперимент продемонстрировал, что зкДНК-векторы были способны экспрессировать FVIII из печени после гидродинамической инъекции и что FVIII быстро и легко детектировался в сыворотке после введения зкДНК.
[00582] ПРИМЕР 13: Гидродинамическая доставка зкДНК, экспрессирующей FVIII-тестирование различных зкДНК-векторов, экспрессирующих FVIII
[00583] Систему гидродинамической доставки, описанную в Примере 12, использовали для тестирования эффекта различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор способен экспрессировать FVIII после инъекции.
[00584] зкДНК-векторы получали, как описано в Примере 12. Каждый из зкДНКFVIII-векторов (по отдельности, без какой-либо инкапсуляции в ЛНЧ) и контроль вводили путем гидродинамической внутривенной (в/в) инъекции мышам C57BL/6. ЗкДНК-векторы вводили в дозе 5 мкг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 90-100 мг/мл. Конечной временной точкой был день 7. В качестве контроля использовали носитель по отдельности.
[00585] Следующие зкДНК-векторы тестировали в трех отдельных экспериментах. Последовательности зкДНК-векторов ниже представлены в Таблице 9. В Таблице 9 открытая рамка считывания показана подчеркиванием. Промотор показан жирным шрифтом.
(1) зкДНКFVIII-вектор 4, зкДНКFVIII-вектор 6, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 14, зкДНКFVIII-вектор 16, зкДНКFVIII-вектор 18, зкДНКFVIII-вектор 19, зкДНКFVIII-вектор 21, зкДНКFVIII-вектор 22;
(2) зкДНКFVIII-вектор 1, зкДНКFVIII-вектор 2, зкДНКFVIII-вектор 3, зкДНКFVIII-вектор 5, зкДНКFVIII-вектор 7, зкДНКFVIII-вектор 8, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 13, зкДНКFVIII-вектор 15;
(3) зкДНКFVIII-вектор 9, зкДНКFVIII-вектор 10, зкДНКFVIII-вектор 11, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 17, зкДНКFVIII-вектор 20, зкДНКFVIII-вектор 24, зкДНКFVIII-вектор 25, зкДНКFVIII-вектор 26.
[00586] Исследуемые препараты поставлялись в виде концентрированного исходного раствора и хранились при номинальной температуре 4°С. Составы не перемешивали на вортексе и не центрифугировали. Группы размещали в прозрачных поликарбонатных клетках с контактной подстилкой на вентилируемой стойке в процедурной комнате. Корм и фильтрованную водопроводную воду, подкисленную 1 н. HCl до целевого рН 2,5-3,0, предоставляли животным ad libitum. Кровь собирали в промежуточных и конечных временных точках, как показано ниже:
[00587] Сбор образцов крови выполняли следующим образом:
[00588] Детали исследования описаны далее:
[00589] Вид (количество, пол, возраст): Мыши C57BL/6 (JAX 000664) (Ν=40 и 4 запасные, самцы, в возрасте 6 недель на момент прибытия) из Jackson Laboratories.
[00590] Класс соединения: зкДНК.
[00591] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.
[00592] Клинические наблюдения: Клинические наблюдения выполняли через 1, 5-6 и 24 часа после введения дозы в День 0.
[00593] Масса тела: Массу тела всех животных регистрировали в Дни 0, 3 и 7, в том числе до умерщвления.
[00594] Лекарственная форма: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.
[00595] Введение дозы: Исследуемые материалы вводили в День 0 путем гидродинамического в/в введения в установленном объеме на животное, 90-100 мл/кг (в зависимости от самого легкого животного в группе) через латеральную хвостовую вену (введение дозы в течение 5 секунд).
[00596] Сбор крови: У животных собирали промежуточный образец крови в День 3 в соответствии с таблицей выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. У животных собирали кровь в соответствии с приведенными выше таблицами сбора крови. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Готовили одну (1) аликвоту и отмечали любое свертывание в образце цельной крови или гемолиз в плазме. Все образцы хранили при номинальной температуре -70°С. Все образцы хранили при номинальной температуре -70°С до отправки.
[00597] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.
[00598] Умерщвление и терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения сыворотки в соответствии с СОП учреждения и хранили в двух (2) аликвотах. Для сборов плазмы цельную кровь собирали с помощью шприца, и 600 мкл немедленно помещали в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали четыре (4) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.
[00599] Результаты: Результаты, показанные на ФИГ. 12-15, показывают эффект различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор был способен экспрессировать FVIII после инъекции. ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.
ПРИМЕР 14: Экспрессия FVIII после доставки ЛНЧ:зкДНК в комбинации с ингибитором киназы у самцов мышей CD-1
[00600] ЛНЧ:зкДНК-векторы получали, как описано в Примере 6. Эффект составов зкДНК:липид тестировали на самцах мышей CD-1. Носитель для дозирования и приготовления ингибитора представлял собой 0,5% метилцеллюлозу.
[00601] Исследуемый материал ЛНЧ:зкДНК («зкДНКFVIII-вектор 23») вводили следующим образом:
[00602] Образцы крови (промежуточные и конечные) отбирали, как указано ниже:
[00603] Образцы тканей собирали, как указано ниже:
[00604] Детали исследования описаны далее:
[00605] Вид (количество, пол, возраст): Мыши CD-1 (Ν=10+2 запасные, самцы, в возрасте 4 недель на момент прибытия) из Charles River Laboratories.
[00606] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.
[00607] Клинические наблюдения: Клинические наблюдения выполняли примерно через 1, 5-6 и 24 часа после введения дозы исследуемого материала в День 0.
[00608] Масса тела: Массу тела всех животных регистрировали в Дни 0, 1, 2, 3 и 7, в том числе до умерщвления.
[00609] Лекарственная форма исследуемого материала: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.
[00610] Введение дозы: Исследуемые препараты вводили в дозе 5 мл/кг в День 0 для Групп 1-2 путем внутривенного введения через латеральную хвостовую вену.
[00611] Сбор крови: У всех животных в Группах 1-2 собирали промежуточные образцы крови в День 3 в соответствии с таблицей сбора крови, приведенной выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия с помощью пункции орбитального синуса под анестезией в соответствии с СОП учреждения. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 пл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Была сделана одна (1) аликвота, и будет отмечаться любое свертывание в образце цельной крови или гемолиз в плазме.
[00612] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.
[00613] Терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения плазмы. Для сборов плазмы цельную кровь собирали с помощью шприца и сразу помещали 600 мкл в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали две (2) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.
[00614] Перфузия: После обескровливания всех животных подвергали перфузии сердца физиологическим раствором. В общих чертах, внутрисердечную перфузию всего тела выполняли путем введения иглы калибра 23/21, прикрепленной к 10 мл шприцу, содержащему физиологический раствор, в просвет левого желудочка для перфузии. Правое предсердие было рассечено, чтобы обеспечить дренажный выход для перфузата. После того, как игла была помещена в сердце, к поршню прикладывали легкое и постоянное давление для перфузии животного. Соответствующий поток промывочного раствора обеспечивали до тех пор, пока выходящий перфузат не станет прозрачным (без видимой крови), это указывает на то, что промывочный раствор насытил тело и процедура завершена.
[00615] Сбор ткани: Терминальные ткани собирали у агонирующих животных, которых умерщвляли до запланированной временной точки. При наличии возможности, собирали и сохраняли ткани животных, которые были найдены мертвыми.
[00616] После умерщвления и перфузии забирали печень. Из печени собирали и взвешивали четыре (4) среза по 25-50 мг. Срезы мгновенно замораживали по отдельности и хранили при номинальной температуре -70°С до отправки.
[00617] Результаты: ФИГ. 16 показывает концентрацию FVIII в плазме (МЕ/мл) через 7 дней после введения исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23. Как показано на ФИГ. 16, FVIII легко детектировался в образцах плазмы мышей, получавших исследуемый препарат ЛНЧ:зкДНКFVIII-вектор 23, но не наблюдался у мышей, получавших только носитель.
ССЫЛКИ
[00618] Все публикации и ссылки, включая, но не ограничиваясь перечисленными, патенты и заявки на патенты, указанные в данном описании и в Примерах в данном документе, полностью включены посредством ссылки, как если бы каждая отдельная публикация или ссылка была конкретно и по отдельности указана для включения в данный документ посредством ссылки во всей полноте. Любая заявка на патент, согласно которой настоящая заявка испрашивает приоритет, также включена в данный документ посредством ссылки способом, описанным выше для публикаций и ссылок.
--->
Перечень последовательностей
<110> ДЖЕНЕРЕЙШЕН БИО КО.
<120> НЕВИРУСНЫЕ ДНК-ВЕКТОРЫ И ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ ДЛЯ ЭКСПРЕССИИ
ТЕРАПЕВТИЧЕСКОГО СРЕДСТВА НА ОСНОВЕ ФАКТОРА VIII (FVIII)
<130> 131698-06020
<140> PCT/US2020/022738
<141> 2020-03-13
<150> 62/856,432
<151> 2019-06-03
<150> 62/817,904
<151> 2019-03-13
<160> 398
<170> PatentIn version 3.5
<210> 1
<211> 141
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 1
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc
120
gagcgcgcag ctgcctgcag g
141
<210> 2
<211> 141
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 2
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca
120
actccatcac taggggttcc t
141
<210> 3
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 3
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc
120
tgcctgcagg
130
<210> 4
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 4
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt
60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact
120
aggggttcct
130
<210> 5
<211> 143
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 5
ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc
60
agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt
120
gggcaactcc atcactaggg taa
143
<210> 6
<211> 144
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 6
ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc
60
agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt
120
ggccaactcc atcactagag gtat
144
<210> 7
<211> 127
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 7
ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc
60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg
120
gccaact
127
<210> 8
<211> 166
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 8
tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc
60
gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc
120
gacagggggg agagtgccac actctcaagc aagggggttt tgtaag
166
<210> 9
<211> 144
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 9
ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg
60
cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt
120
gggcaactcc atcactaggg gtat
144
<210> 10
<211> 143
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 10
ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc
60
ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga
120
gcgcgcagag agggagtggg caa
143
<210> 11
<211> 144
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 11
atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc
60
ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg
120
agtgcgcata gagggagtgg ccaa
144
<210> 12
<211> 127
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 12
agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct
60
ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag
120
tggccaa
127
<210> 13
<211> 166
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 13
cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc
60
gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt
120
cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga
166
<210> 14
<211> 144
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 14
atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc
60
ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga
120
gcgcgcatta gagggagtgg gcaa
144
<210> 15
<211> 120
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 15
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg
120
<210> 16
<211> 122
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 16
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca
120
gg
122
<210> 17
<211> 129
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 17
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct
120
gcctgcagg
129
<210> 18
<211> 101
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 18
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g
101
<210> 19
<211> 139
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga
120
gcgcgcagct gcctgcagg
139
<210> 20
<211> 137
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 20
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc
120
gcgcagctgc ctgcagg
137
<210> 21
<211> 135
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 21
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc
120
gcagctgcct gcagg
135
<210> 22
<211> 133
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 22
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc
120
agctgcctgc agg
133
<210> 23
<211> 139
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 23
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga
120
gcgcgcagct gcctgcagg
139
<210> 24
<211> 137
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 24
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc
120
gcgcagctgc ctgcagg
137
<210> 25
<211> 135
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 25
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc
120
gcagctgcct gcagg
135
<210> 26
<211> 133
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 26
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc
120
agctgcctgc agg
133
<210> 27
<211> 131
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 27
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag
120
ctgcctgcag g
131
<210> 28
<211> 129
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 28
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct
120
gcctgcagg
129
<210> 29
<211> 127
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 29
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc
120
ctgcagg
127
<210> 30
<211> 122
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 30
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca
120
gg
122
<210> 31
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 31
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc
120
tgcctgcagg
130
<210> 32
<211> 120
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 32
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg
60
cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct
120
<210> 33
<211> 122
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 33
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc
60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc
120
ct
122
<210> 34
<211> 122
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 34
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc
120
ct
122
<210> 35
<211> 129
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 35
cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg
60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta
120
ggggttcct
129
<210> 36
<211> 101
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 36
cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc
60
gcgcagagag ggagtggcca actccatcac taggggttcc t
101
<210> 37
<211> 139
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 37
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60
gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac
120
tccatcacta ggggttcct
139
<210> 38
<211> 137
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 38
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60
gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc
120
catcactagg ggttcct
137
<210> 39
<211> 135
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 39
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60
gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca
120
tcactagggg ttcct
135
<210> 40
<211> 133
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 40
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60
gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc
120
actaggggtt cct
133
<210> 41
<211> 139
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 41
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg
60
gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac
120
tccatcacta ggggttcct
139
<210> 42
<211> 137
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 42
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc
60
gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc
120
catcactagg ggttcct
137
<210> 43
<211> 135
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 43
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga
60
cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca
120
tcactagggg ttcct
135
<210> 44
<211> 133
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 44
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc
60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc
120
actaggggtt cct
133
<210> 45
<211> 131
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 45
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt
60
tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac
120
taggggttcc t
131
<210> 46
<211> 129
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 46
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg
60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta
120
ggggttcct
129
<210> 47
<211> 127
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 47
cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt
60
cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg
120
ggttcct
127
<210> 48
<211> 122
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 48
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca
120
gg
122
<210> 49
<211> 12
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 49
cgatcgttcg at
12
<210> 50
<211> 12
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 50
atcgaaccat cg
12
<210> 51
<211> 12
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 51
atcgaacgat cg
12
<210> 52
<211> 165
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 52
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc
120
gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct
165
<210> 53
<211> 140
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 53
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc
60
cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg
120
cgcagagaga tcactagggg
140
<210> 54
<211> 91
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 54
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg
60
tcgcccggcc tcagtgagcg agcgagcgcg c
91
<210> 55
<211> 91
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 55
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc
60
ccgggcggcc tcagtgagcg agcgagcgcg c
91
<210> 56
<211> 1662
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 56
gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg
60
gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct
120
ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc
180
gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga
240
atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt
300
atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt
360
atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg
420
aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat
480
taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat
540
gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac
600
tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg
660
agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt
720
ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata
780
tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt
840
caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa
900
agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct
960
cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg
1020
caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat
1080
aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat
1140
accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt
1200
atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg
1260
ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc
1320
ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc
1380
ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc
1440
ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag
1500
atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg
1560
tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag
1620
atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa
1662
<210> 57
<211> 453
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Любая аминокислота
<400> 57
Xaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met Asp
100 105 110
Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys
115 120 125
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
130 135 140
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
145 150 155 160
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
165 170 175
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
180 185 190
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
195 200 205
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro
210 215 220
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
225 230 235 240
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
245 250 255
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
260 265 270
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
275 280 285
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
290 295 300
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
305 310 315 320
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
325 330 335
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
340 345 350
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
355 360 365
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
370 375 380
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
385 390 395 400
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
405 410 415
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
420 425 430
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
435 440 445
Ser Leu Ser Pro Gly
450
<210> 58
<211> 214
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 58
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr
20 25 30
Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 59
<211> 1310
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 59
ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga
60
ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc
120
atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg
180
ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct
240
ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt
300
tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg
360
gccgccgagc tggaggtcct gctccgagcg ggccgggccc cgctgtcgtc ggcggggatt
420
agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag
480
cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc
540
cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct
600
gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc
660
cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc
720
cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc
780
ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga
840
tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg
900
gcaccagttg cgtgcgtgga aagatggccg ctcccgggcc ctgttgcaag gagctcaaaa
960
tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc
1020
ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca
1080
cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt
1140
ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg
1200
gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg
1260
tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa
1310
<210> 60
<211> 16
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 60
gcgcgctcgc tcgctc
16
<210> 61
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 61
ggttga
6
<210> 62
<211> 4
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 62
agtt
4
<210> 63
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 63
ggttgg
6
<210> 64
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 64
agttgg
6
<210> 65
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 65
agttga
6
<210> 66
<211> 6
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 66
rrttrr
6
<210> 67
<211> 581
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 67
gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat
60
ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt
120
actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc
180
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt
240
aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct
300
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt
360
ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac
420
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct
480
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca
540
ggggctaggt tgctgggcac tgataattcc gtggtgttgt c
581
<210> 68
<211> 225
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 68
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct
60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct
120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg
180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc
225
<210> 69
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 69
actgaggc
8
<210> 70
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 70
gcctcagt
8
<210> 71
<211> 16
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 71
gagcgagcga gcgcgc
16
<210> 72
<211> 1923
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 72
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta
60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc
120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg
180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc
240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat
300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc
360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga
420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg
480
gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg
540
cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta
600
attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg
660
gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg
720
cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg
780
aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg
840
ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc
900
gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt
960
ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc
1020
ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc
1080
ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg
1140
aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag
1200
gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc
1260
tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg
1320
gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg
1380
ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc
1440
ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg
1500
taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct
1560
gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg
1620
aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc
1680
cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg
1740
ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc
1800
ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg
1860
acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag
1920
cca
1923
<210> 73
<211> 1272
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 73
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc
60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc
120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc
180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc
240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt
300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag
360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa
420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg
480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc
540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt
600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag
660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt
720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat
780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt
840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct
900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg
960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag
1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc
1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag
1140
cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt
1200
tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac
1260
ctttggaact ga
1272
<210> 74
<211> 1177
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 74
ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc
60
tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac
120
ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac
180
agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca
240
tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc
300
ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag
360
tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa
420
tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt
480
tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga
540
cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca
600
agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt
660
tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta
720
attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt
780
accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca
840
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca
900
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg
960
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg
1020
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca
1080
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc
1140
tcctcagctt caggcaccac cactgacctg ggacagt
1177
<210> 75
<211> 547
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 75
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc
60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc
120
cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag
180
gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag
240
gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct
300
gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt
360
gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca
420
ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa
480
gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg
540
gaactga
547
<210> 76
<211> 556
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 76
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc
60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc
120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt
180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc
240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt
300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc
360
ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct
420
tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa
480
aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc
540
caacctttgg aactga
556
<210> 77
<211> 1179
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 77
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg
60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt
120
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca
180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc
240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt
300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg
360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg
420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct
480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg
540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc
600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga
660
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct
720
ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca
780
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg
840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg
900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat
960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg
1020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa
1080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca
1140
gtggttcaaa gtttttttct tccatttcag gtgtcgtga
1179
<210> 78
<211> 141
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 78
aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt
60
cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc
120
tgcggcgcgc gcagcacctt t
141
<210> 79
<211> 317
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 79
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt
60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca
120
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa
180
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag
240
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag
300
gcctaggctt ttgcaaa
317
<210> 80
<211> 241
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 80
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag
60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga
120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat
180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga
240
c
241
<210> 81
<211> 215
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 81
gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa
60
cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc
120
tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg
180
gatttgggaa tcgtataaga actgtatgag accac
215
<210> 82
<211> 546
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 82
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc
60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc
120
cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag
180
gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag
240
gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct
300
gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt
360
gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca
420
ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa
480
gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg
540
gaactg
546
<210> 83
<211> 576
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 83
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa
60
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata
120
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag
180
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc
240
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta
300
tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg
360
cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt
420
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca
480
aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag
540
gtctatataa gcagagctgg tttagtgaac cgtcag
576
<210> 84
<211> 150
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 84
ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc
60
gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct
120
gcggcgcgcg cagcaccttt gcggccatct
150
<210> 85
<211> 1313
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 85
ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga
60
ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc
120
atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg
180
gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg
240
tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt
300
agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg
360
gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc
420
gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg
480
ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc
540
tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct
600
gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta
660
aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc
720
gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg
780
aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc
840
tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca
900
ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg
960
gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct
1020
tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc
1080
gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt
1140
tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg
1200
aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt
1260
attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa
1313
<210> 86
<211> 213
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 86
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta
60
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag
120
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt
180
tttaaagcaa gtaaaacctc tacaaatgtg gta
213
<210> 87
<211> 7
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический пептид
<400> 87
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 88
<211> 19
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический пептид
<400> 88
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Ala His Ser
<210> 89
<211> 19
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический пептид
<400> 89
Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala
1 5 10 15
Ser Arg Gly
<210> 90
<211> 7
<212> БЕЛОК
<213> Обезьяний вирус 40
<400> 90
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 91
<211> 21
<212> ДНК
<213> Обезьяний вирус 40
<400> 91
cccaagaaga agaggaaggt g
21
<210> 92
<211> 16
<212> БЕЛОК
<213> Неизвестное
<220>
<223> Описание неизвестного: двухкомпонентная последовательность NLS
нуклеоплазмина
<400> 92
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 93
<211> 9
<212> БЕЛОК
<213> Неизвестное
<220>
<223> Описание неизвестного: последовательность NLS C-myc
<400> 93
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 94
<211> 11
<212> БЕЛОК
<213> Неизвестное
<220>
<223> Описание неизвестного: последовательность NLS C-myc
<400> 94
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 95
<211> 38
<212> БЕЛОК
<213> Homo sapiens
<400> 95
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 96
<211> 42
<212> БЕЛОК
<213> Неизвестное
<220>
<223> Описание неизвестного: домен IBB из последовательности
импортина-альфа
<400> 96
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 97
<211> 8
<212> БЕЛОК
<213> Неизвестное
<220>
<223> Описание неизвестного: последовательность белка Т миомы
<400> 97
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 98
<211> 8
<212> БЕЛОК
<213> Неизвестное
<220>
<223> Описание неизвестного: последовательность белка Т миомы
<400> 98
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 99
<211> 8
<212> БЕЛОК
<213> Homo sapiens
<400> 99
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 100
<211> 12
<212> БЕЛОК
<213> Mus musculus
<400> 100
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 101
<211> 70
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 101
gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga
60
gcgagcgcgc
70
<210> 102
<211> 70
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 102
gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga
60
gcgagcgcgc
70
<210> 103
<211> 72
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 103
gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc
60
gagcgagcgc gc
72
<210> 104
<211> 72
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 104
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc
60
gagcgagcgc gc
72
<210> 105
<211> 72
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 105
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc
60
gagcgagcgc gc
72
<210> 106
<211> 72
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 106
gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc
60
gagcgagcgc gc
72
<210> 107
<211> 83
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 107
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg
60
cctcagtgag cgagcgagcg cgc
83
<210> 108
<211> 83
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 108
gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg
60
cctcagtgag cgagcgagcg cgc
83
<210> 109
<211> 77
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 109
gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag
60
tgagcgagcg agcgcgc
77
<210> 110
<211> 77
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 110
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag
60
tgagcgagcg agcgcgc
77
<210> 111
<211> 51
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 111
gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c
51
<210> 112
<211> 51
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 112
gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c
51
<210> 113
<211> 80
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 113
gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct
60
cagtgagcga gcgagcgcgc
80
<210> 114
<211> 80
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 114
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
60
cagtgagcga gcgagcgcgc
80
<210> 115
<211> 79
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 115
gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc
60
agtgagcgag cgagcgcgc
79
<210> 116
<211> 79
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 116
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc
60
agtgagcgag cgagcgcgc
79
<210> 117
<211> 5
<212> БЕЛОК
<213> Вирус гриппа
<400> 117
Asp Arg Leu Arg Arg
1 5
<210> 118
<211> 7
<212> БЕЛОК
<213> Вирус гриппа
<400> 118
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 119
<211> 10
<212> БЕЛОК
<213> Вирус гепатита дельта
<400> 119
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 120
<211> 10
<212> БЕЛОК
<213> Mus musculus
<400> 120
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 121
<211> 20
<212> БЕЛОК
<213> Homo sapiens
<400> 121
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 122
<211> 17
<212> БЕЛОК
<213> Homo sapiens
<400> 122
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 123
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 123
gtttaaac
8
<210> 124
<211> 8
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 124
ttaattaa
8
<210> 125
<211> 141
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 125
aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt
60
cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc
120
tgcggcgcgc gcagcacctt t
141
<210> 126
<211> 317
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 126
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt
60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca
120
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa
180
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag
240
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag
300
gcctaggctt ttgcaaa
317
<210> 127
<211> 72
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 127
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc
60
gagcgagcgc gc
72
<210> 128
<211> 60
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 128
gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac
60
<210> 129
<211> 1260
<212> ДНК
<213> Аденоассоциированный вирус - 2
<400> 129
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag
60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag
120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg
180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta
240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc
300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg
360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt
420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc
480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa
540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg
600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg
660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag
720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc
780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag
840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc
900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg
960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga
1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa
1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc
1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt
1200
taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga
1260
<210> 130
<211> 1932
<212> ДНК
<213> Аденоассоциированный вирус - 2
<400> 130
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc
60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat
120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag
180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg
240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg
300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt
360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc
420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa
480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg
540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag
600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact
660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag
720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg
780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc
840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa
900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc
960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag
1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc
1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg
1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc
1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc
1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg
1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag
1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg
1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca
1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg
1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg
1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc
1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt
1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg
1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa
1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga
1920
cactctctct ga
1932
<210> 131
<211> 1876
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 131
cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg
60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt
120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga
180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct
240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac
300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat
360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac
420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt
480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag
540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc
600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag
660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac
720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc
780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac
840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg
900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct
960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac
1020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt
1080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg
1140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag
1200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat
1260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca
1320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga
1380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt
1440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc
1500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac
1560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca
1620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc
1680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc
1740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat
1800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg
1860
catctttgaa caataa
1876
<210> 132
<211> 1194
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 132
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag
60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag
120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg
180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta
240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc
300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg
360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt
420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc
480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa
540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg
600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg
660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag
720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc
780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag
840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc
900
aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg
960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga
1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa
1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc
1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa
1194
<210> 133
<211> 1876
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 133
cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg
60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt
120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga
180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct
240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac
300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat
360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac
420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt
480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag
540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc
600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag
660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac
720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc
780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac
840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg
900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct
960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac
1020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt
1080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg
1140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag
1200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat
1260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca
1320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga
1380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt
1440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc
1500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac
1560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca
1620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc
1680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc
1740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat
1800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg
1860
catctttgaa caataa
1876
<210> 134
<211> 51
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 134
ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c
51
<210> 135
<211> 65
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 135
ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct
60
cagtc
65
<210> 136
<211> 67
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 136
ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag
60
tcctgca
67
<210> 137
<211> 41
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 137
gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a
41
<210> 138
<211> 56
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 138
ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca
56
<210> 139
<211> 54
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 139
ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc
54
<210> 140
<211> 48
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 140
ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca
48
<210> 141
<211> 46
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 141
ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc
46
<210> 142
<211> 67
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 142
ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag
60
tcctgca
67
<210> 143
<211> 47
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 143
atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg
47
<210> 144
<211> 29
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 144
atacctaggg gccgcacgcg tgttactag
29
<210> 145
<211> 42
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 145
atacactcag tgcctgcagg cacgtggtcc ggagatccag ac
42
<210> 146
<211> 3754
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 146
cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct
60
tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc
120
catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt
180
gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg
240
gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc
300
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa
360
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac
420
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca
480
agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg
540
gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt
600
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc
660
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat
720
gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg
780
cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc
840
ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg
900
agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc
960
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc
1020
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa
1080
gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc
1140
gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct
1200
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg
1260
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt
1320
gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac
1380
ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt
1440
ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg
1500
gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc
1560
ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg
1620
cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc
1680
ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag
1740
ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg
1800
cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg
1860
accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc
1920
ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat
1980
ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca
2040
ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg
2100
acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct
2160
acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca
2220
ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga
2280
agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct
2340
tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc
2400
tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc
2460
acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga
2520
acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg
2580
ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc
2640
actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg
2700
tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt
2760
aattaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt
2820
gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg
2880
atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg
2940
ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac
3000
tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct
3060
gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt
3120
gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt
3180
gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg
3240
gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg
3300
ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc
3360
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc
3420
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg
3480
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa
3540
tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa
3600
gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg
3660
gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg
3720
tcgcccgacg cccgggcggc ctcagtcctg cagg
3754
<210> 147
<211> 8418
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 147
ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga
60
cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca
120
tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca
180
atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg
240
gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat
300
atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc
360
attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc
420
tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt
480
aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca
540
cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg
600
taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca
660
gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt
720
cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt
780
attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg
840
gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc
900
gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag
960
cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg
1020
cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg
1080
acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc
1140
tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc
1200
tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg
1260
gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg
1320
ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct
1380
gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt
1440
aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg
1500
ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg
1560
gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc
1620
ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa
1680
tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg
1740
aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag
1800
gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag
1860
cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc
1920
ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc
1980
tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca
2040
gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca
2100
gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca
2160
tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg
2220
agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc
2280
ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct
2340
accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc
2400
aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt
2460
tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg
2520
gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg
2580
ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg
2640
gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc
2700
tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga
2760
agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg
2820
acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc
2880
tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca
2940
tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt
3000
taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat
3060
ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc
3120
tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt
3180
gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg
3240
cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg
3300
tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc
3360
cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt
3420
gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt
3480
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca
3540
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga
3600
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca
3660
tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc
3720
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg
3780
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag
3840
cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac
3900
ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa
3960
cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct
4020
gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca
4080
ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc
4140
cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg
4200
cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca
4260
gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat
4320
ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg
4380
agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc
4440
ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat
4500
aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca
4560
gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg
4620
actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg
4680
gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag
4740
cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt
4800
aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag
4860
ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg
4920
ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct
4980
ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat
5040
ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc
5100
aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac
5160
gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat
5220
atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg
5280
gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac
5340
gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca
5400
taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat
5460
tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt
5520
tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt
5580
ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa
5640
taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg
5700
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg
5760
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag
5820
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga
5880
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct
5940
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc
6000
tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg
6060
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc
6120
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca
6180
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag
6240
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct
6300
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc
6360
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga
6420
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca
6480
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat
6540
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac
6600
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt
6660
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt
6720
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag
6780
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct
6840
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt
6900
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc
6960
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt
7020
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg
7080
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg
7140
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct
7200
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc
7260
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt
7320
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt
7380
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg
7440
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat
7500
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg
7560
cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc
7620
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc
7680
ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag
7740
agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc
7800
gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa
7860
gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg
7920
aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt
7980
gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc
8040
gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt
8100
aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat
8160
gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat
8220
gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa
8280
ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat
8340
acgaaaatta aaaatgacaa aatagtttgg aactagattt cacttatctg gttcggatct
8400
cctagtgagc tccctgca
8418
<210> 148
<211> 225
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 148
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct
60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct
120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg
180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc
225
<210> 149
<211> 1177
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 149
ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc
60
tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac
120
ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac
180
agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca
240
tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc
300
ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag
360
tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa
420
tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt
480
tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga
540
cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca
600
agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt
660
tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta
720
attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt
780
accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca
840
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca
900
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg
960
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg
1020
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca
1080
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc
1140
tcctcagctt caggcaccac cactgacctg ggacagt
1177
<210> 150
<211> 1326
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 150
ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca
60
aggggagagc ccagggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc
120
acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct
180
cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg
240
gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tgggggagaa
300
cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga
360
acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc
420
gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga
480
gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc
540
gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg
600
cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg
660
tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg
720
aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg
780
aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc
840
tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga
900
ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt
960
gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcacccac
1020
acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc
1080
ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat
1140
ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg
1200
ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct
1260
cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa
1320
ttcaaa
1326
<210> 151
<211> 573
<212> ДНК
<213> Mus musculus
<400> 151
gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat
60
tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt
120
gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt
180
ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa
240
ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac
300
ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact
360
aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta
420
gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa
480
cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag
540
agaggaacca ttgccacctt cagattttcc tgt
573
<210> 152
<211> 1993
<212> ДНК
<213> Mus musculus
<400> 152
acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag
60
cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc
120
cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat
180
ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt
240
aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag
300
tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga
360
gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa
420
ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg
480
agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg
540
gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag
600
atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg
660
tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta
720
aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca
780
gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa
840
tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat
900
atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg
960
ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa
1020
gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc
1080
ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc
1140
cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag
1200
acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga
1260
ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat
1320
cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccagggt
1380
gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa
1440
aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg
1500
ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac
1560
taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc
1620
aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg
1680
aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt
1740
catggatctg aaagagagca agggggctta catgagaggg tttggaggga ggggttggag
1800
ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca
1860
aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc
1920
aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag
1980
aaaacatgga agg
1993
<210> 153
<211> 1350
<212> ДНК
<213> Homo sapiens
<400> 153
taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca
60
tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag
120
tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct
180
gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct
240
cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta
300
aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt
360
gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga
420
agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta
480
attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca
540
ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc
600
acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat
660
acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg
720
ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg
780
ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct
840
gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac
900
tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga
960
atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt
1020
gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg
1080
gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat
1140
tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca
1200
ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg
1260
ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg
1320
cttatcttca ccatcatgat tgtttatttt
1350
<210> 154
<211> 1223
<212> ДНК
<213> Homo sapiens
<400> 154
tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg
60
gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct
120
gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc
180
gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg
240
acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg
300
tgggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccattt
360
atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa
420
tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta
480
ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga
540
gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg
600
tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct
660
ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat
720
gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag
780
acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca
840
tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta
900
gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga
960
accttgacgg cattgctccg tctaagtcat gagctgagca gggagatcct ggttggtgtt
1020
gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga
1080
gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg
1140
atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg
1200
aggatgcaga gtcagcagaa ctg
1223
<210> 155
<211> 215
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 155
gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa
60
cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc
120
tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg
180
gatttgggaa tcttataagt tctgtatgag accac
215
<210> 156
<211> 141
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 156
cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc
60
gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca
120
actccatcac taggggttcc t
141
<210> 157
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 157
gcgcgctcgc tcgctcacc
19
<210> 158
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 158
ctaggtgagc gagcgagcgc gc
22
<210> 159
<211> 75
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 159
cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg
60
cctcagtcct gcagg
75
<210> 160
<211> 130
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 160
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt
60
gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc
120
tgcctgcagg
130
<210> 161
<211> 142
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 161
cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg
60
acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc
120
aactccatca ctaggggttc ct
142
<210> 162
<211> 80
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 162
gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact
60
cagtgagcga gcgagcgcgc
80
<210> 163
<211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 163
gcgcgctcgc tcgctcactg a
21
<210> 164
<211> 18
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 164
gtgagcgagc gagcgcgc
18
<210> 165
<211> 89
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 165
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc
60
gcccggcctc agtgagcgag cgagcgcgc
89
<210> 166
<211> 89
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 166
gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc
60
gggcggcctc agtgagcgag cgagcgcgc
89
<210> 167
<211> 87
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 167
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc
60
ccggcctcag tgagcgagcg agcgcgc
87
<210> 168
<211> 87
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 168
gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg
60
gcggcctcag tgagcgagcg agcgcgc
87
<210> 169
<211> 85
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 169
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc
60
ggcctcagtg agcgagcgag cgcgc
85
<210> 170
<211> 85
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 170
gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc
60
ggcctcagtg agcgagcgag cgcgc
85
<210> 171
<211> 89
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 171
gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc
60
gcccggcctc agtgagcgag cgagcgcgc
89
<210> 172
<211> 89
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 172
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc
60
gggcggcctc agtgagcgag cgagcgcgc
89
<210> 173
<211> 87
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 173
gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc
60
ccggcctcag tgagcgagcg agcgcgc
87
<210> 174
<211> 87
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 174
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg
60
gcggcctcag tgagcgagcg agcgcgc
87
<210> 175
<211> 85
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 175
gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc
60
ggcctcagtg agcgagcgag cgcgc
85
<210> 176
<211> 85
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 176
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc
60
ggcctcagtg agcgagcgag cgcgc
85
<210> 177
<211> 83
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 177
gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg
60
cctcagtgag cgagcgagcg cgc
83
<210> 178
<211> 83
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 178
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg
60
cctcagtgag cgagcgagcg cgc
83
<210> 179
<211> 81
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 179
gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc
60
tcagtgagcg agcgagcgcg c
81
<210> 180
<211> 81
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 180
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc
60
tcagtgagcg agcgagcgcg c
81
<210> 181
<211> 79
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 181
gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc
60
agtgagcgag cgagcgcgc
79
<210> 182
<211> 79
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 182
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc
60
agtgagcgag cgagcgcgc
79
<210> 183
<211> 81
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 183
ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc
60
agtgagcgag cgagcgcgca g
81
<210> 184
<211> 81
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 184
ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc
60
agtgagcgag cgagcgcgca g
81
<210> 185
<211> 72
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 185
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc
60
gagcgagcgc gc
72
<210> 186
<211> 80
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 186
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
60
cagtgagcga gcgagcgcgc
80
<210> 187
<211> 79
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 187
gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc
60
agtgagcgag cgagcgcgc
79
<210> 188
<211> 48
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 188
ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc
48
<210> 189
<211> 99
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 189
attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca
60
gtcatctgtg tttggaagaa agggagcgac tatgaggcc
99
<210> 190
<211> 588
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 190
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt
60
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc
120
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag
180
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac
240
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc
300
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc
360
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca
420
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt
480
gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg
540
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc
588
<210> 191
<211> 399
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 191
cgggggaggc tgctggtgaa tattaaccaa ggtcacccca gttatcggag gagcaaacag
60
gggctaagtc cacacgcgtg gtaccgtctg tctgcacatt tcgtagagcg agtgttccga
120
tactctaatc tccctaggca aggttcatat ttgtgtaggt tacttattct ccttttgttg
180
actaagtcaa taatcagaat cagcaggttt ggagtcagct tggcagggat cagcagcctg
240
ggttggaagg agggggtata aaagcccctt caccaggaga agccgtcaca cagatccaca
300
agctcctgaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt
360
acctggagca cctgcctgaa atcacttttt ttcaggttg
399
<210> 192
<211> 14359
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 192
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct
4380
gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag
4440
tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag
4500
caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga
4560
gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag
4620
aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca
4680
cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc
4740
atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca
4800
tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca
4860
ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca
4920
agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag
4980
acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg
5040
ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc
5100
aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag
5160
tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc
5220
ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta
5280
agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact
5340
cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg
5400
ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg
5460
aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg
5520
gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt
5580
gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga
5640
tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa
5700
gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc
5760
tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg
5820
tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc
5880
ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg
5940
tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt
6000
cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag
6060
aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa
6120
acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc
6180
tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc
6240
tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg
6300
agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct
6360
ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg
6420
gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac
6480
ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg
6540
ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg
6600
gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg
6660
tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg
6720
aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata
6780
acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc
6840
actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg
6900
acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata
6960
agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc
7020
acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca
7080
tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc
7140
ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc
7200
tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga
7260
gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg
7320
ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca
7380
accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt
7440
cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg
7500
aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca
7560
gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg
7620
cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt
7680
acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa
7740
accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag
7800
ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg
7860
aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcccaga agcttcagcc
7920
agaatagcag acacccctcc accagacaga agcagttcaa cgccacaaca atccccgaga
7980
acgacatcga gaaaaccgat ccttggtttg cccacagaac ccctatgcct aagatccaga
8040
acgtgtcctc cagcgatctg ctgatgctcc tgagacagag ccctacacct cacggactga
8100
gcctgtccga tctgcaagag gccaaatacg aaaccttcag cgacgaccct tctcctggcg
8160
ccatcgacag caacaatagc ctgagcgaga tgacccactt cagaccacag ctgcaccaca
8220
gcggcgacat ggtgtttaca cctgagagcg gcctccagct gagactgaat gagaagctgg
8280
gaaccaccgc cgccaccgag ctgaagaaac tggacttcaa ggtgtcctct accagcaaca
8340
acctgatcag cacaatcccc tccgacaacc tggctgccgg caccgacaac acatcttctc
8400
tgggcccacc tagcatgccc gtgcactacg atagccagct ggataccaca ctgttcggca
8460
agaagtctag ccctctgaca gagtctggcg gccctctgtc tctgagcgag gaaaacaacg
8520
acagcaagct gctggaatcc ggcctgatga acagccaaga gtcctcctgg ggcaagaatg
8580
tgtccagcac cgagtccggc agactgttca agggaaagag agcccacgga cctgctctgc
8640
tgaccaagga taacgccctg ttcaaagtgt ccatcagcct gctcaagacc aacaagacct
8700
ccaacaactc cgccaccaac agaaagaccc acatcgacgg ccctagcctg ctgatcgaga
8760
atagccctag cgtctggcag aatatcctgg aaagcgacac cgagttcaag aaagtgaccc
8820
ctctgatcca cgaccggatg ctcatggaca agaacgccac cgctctgcgg ctgaaccaca
8880
tgagcaacaa gacaaccagc agcaagaata tggaaatggt gcagcagaag aaagagggcc
8940
ccattcctcc agacgctcag aaccccgata tgagcttctt caagatgctc tttctgcccg
9000
agagcgcccg gtggattcag agaacacacg gcaagaactc cctgaactcc ggccagggac
9060
cttctccaaa gcagctggtt tccctgggac ctgagaagtc cgtggaagga cagaacttcc
9120
tgagcgaaaa gaacaaagtg gtcgtcggca agggcgagtt caccaaggat gtgggcctga
9180
aagagatggt ctttcccagc agccggaacc tgttcctgac caacctggac aacctgcacg
9240
agaacaacac ccacaatcaa gagaagaaga tccaagagga aatcgaaaag aaagagacac
9300
tcatccaaga gaacgtggtg ctgcctcaga tccacacagt gaccggcacc aagaacttta
9360
tgaagaatct gttcctgctg agtacccggc agaacgtgga aggcagctac gatggcgctt
9420
atgcccctgt gctgcaggac ttcagatccc tgaacgactc caccaatcgg acaaagaagc
9480
acacagccca cttctccaag aagggcgaag aagagaacct ggaaggactg ggcaatcaga
9540
ccaagcagat cgtcgagaag tacgcctgca ccaccagaat cagccccaac acaagccagc
9600
agaacttcgt gacccagcgg agcaaaagag ccctgaagca gtttcggctg cccctggaag
9660
aaaccgagct ggaaaagcgg atcatcgtgg acgacaccag cacacagtgg tccaagaaca
9720
tgaagcactt gacccctagc acactgaccc agatcgacta caacgagaaa gagaagggcg
9780
ctatcacaca gagcccactg agcgactgtc tgaccagaag ccacagcatc cctcaggcca
9840
acagatcccc tctgccaatc gccaaagtgt ctagcttccc cagcatcaga cccatctacc
9900
tgaccagagt gctgttccag gacaacagca gccatctgcc agccgccagc taccggaaga
9960
aagattctgg cgtgcaagag agcagccact ttctgcaggg cgctaagaag aacaatctga
10020
gcctggctat tctgaccctg gaaatgaccg gcgatcagag agaagtcggc tctctgggca
10080
ccagcgccac aaatagcgtg acctacaaaa aggtggaaaa caccgtgctg cctaagcctg
10140
acctgccaaa gacaagcggc aaggtggaac tgctgccaaa ggtgcacatc taccagaagg
10200
acctgtttcc taccgagaca agcaacggct ctcccggcca tctggatctg gtggaaggat
10260
ctctgctgca gggaaccgag ggcgccatca agtggaacga ggccaataga cctggcaagg
10320
tgcccttcct gagagtggcc acagagtcca gcgccaagac accctctaaa ctgctggacc
10380
ctctggcctg ggacaaccac tatggcactc agatccccaa agaggaatgg aagtcccaag
10440
agaagtcccc tgaaaagacc gccttcaaga agaaggacac cattctgtcc ctgaatgcct
10500
gcgagagcaa ccacgccatt gccgccatca atgagggcca gaacaagccc gagatcgaag
10560
tgacctgggc caagcaggga agaaccgaga gactgtgtag ccagaatcct cctgtgctga
10620
agcggcacca gagagaaatc acccggacca cactgcagag cgaccaagaa gagatcgatt
10680
acgacgatac catcagcgtc gagatgaaga aagaagattt cgacatctac gacgaggacg
10740
agaatcagag ccctcggagc ttccagaaga aaaccaggca ctactttatt gccgccgtcg
10800
agcggctgtg ggactacgga atgtctagct ctcctcacgt gctgcggaat agagcccagt
10860
ctggtagcgt gccccagttc aaaaaggtcg tgttccaaga gttcaccgac ggcagcttca
10920
cccagccact gtatagaggc gagctgaacg agcatctggg cctgctgggc ccttatatca
10980
gagccgaagt ggaagataac atcatggtca ccttccggaa tcaggctagc cggccttaca
11040
gcttctacag ctccctgatc tcctacgaag aggaccagag acagggcgca gagccccgga
11100
agaatttcgt gaagcccaac gagactaaga cctacttttg gaaggtgcag caccatatgg
11160
cccctacaaa ggacgagttc gactgcaaag cctgggccta cttctccgat gtggacctcg
11220
aaaaggacgt gcacagcgga ctcatcggcc cactgcttgt gtgccacacc aacacactga
11280
accccgctca cggcagacaa gtgacagtgc aagagttcgc cctgtttttc accatcttcg
11340
acgaaacgaa gtcctggtac ttcaccgaaa acatggaaag aaactgcagg gccccttgca
11400
acattcagat ggaagatccc accttcaaag agaactaccg gttccacgcc atcaacggct
11460
acatcatgga cacactgccc ggcctggtta tggcccagga tcagagaatc cggtggtatc
11520
tgctgtccat gggctccaac gagaatatcc actccatcca cttcagcggc cacgtgttca
11580
ccgtgcggaa aaaagaagag tacaaaatgg ccctgtacaa tctgtaccct ggggtgttcg
11640
aaaccgttga gatgctgcct agcaaggccg gaatttggag agtggaatgt ctgattggag
11700
agcacctcca cgccgggatg agcaccctgt ttctggtgta ctccaacaag tgtcagaccc
11760
ctctcggcat ggcctctggc cacattagag acttccagat caccgccagc ggacagtatg
11820
gacagtgggc ccctaaactg gccagactgc actactccgg cagcatcaat gcctggtcca
11880
ccaaagagcc tttcagctgg atcaaagtgg acctgctggc tcccatgatc atccacggaa
11940
tcaagaccca gggcgccaga caaaagttca gcagcctgta catcagccag ttcatcatca
12000
tgtacagcct ggacggaaag aagtggcaga cctaccgggg caatagcacc ggcacactga
12060
tggtgttctt cggcaacgtg gactccagcg gcattaagca caacatcttc aaccctccaa
12120
tcattgcccg gtacatccgg ctgcacccca cacactacag catcaggtct accctgagaa
12180
tggaactgat gggctgcgac ctgaacagct gctctatgcc cctcggaatg gaaagcaagg
12240
ccatcagcga cgcccagatc acagcctcta gctacttcac caacatgttc gccacttgga
12300
gcccctctaa ggcccggctt catctgcaag gcagaagcaa cgcttggagg ccccaagtga
12360
acaaccccaa agaatggctc caggtggact ttcagaaaac catgaaagtg acaggcgtga
12420
ccacacaggg cgtcaagtcc ctgctgacct ctatgtacgt gaaagagttt ctgatcagct
12480
ccagccagga cggccaccag tggaccctgt tcttccagaa cggcaaagtg aaagtgttcc
12540
agggaaatca ggacagcttc acacccgtgg tcaatagtct ggacccacca ctgctgaccc
12600
gctacctgcg aattcaccct cagtcttggg tgcaccagat tgccctgcgg atggaagtgc
12660
tgggctgtga agctcaggac ctctactagt taattaagag catcttaccg ccatttattc
12720
ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata aaacaaaatg
12780
gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg tattgccaca
12840
agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta atcaacctct
12900
ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc cttttacgct
12960
gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta cggctttcgt
13020
tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt ggcccgttgt
13080
ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg gctggggcat
13140
tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga tcgccacggc
13200
agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc tgggcactga
13260
taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt gcccctcccc
13320
cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga
13380
aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga
13440
cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat
13500
ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta actacacctg
13560
caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact
13620
gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg
13680
cagctgcctg caggggcgcg cctcgaggca tgcggtacca agcttgtcga gaagtactag
13740
aggatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca
13800
cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt
13860
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt
13920
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg
13980
atctgatcac tgatatcgcc taggagatcc gaaccagata agtgaaatct agttccaaac
14040
tattttgtca tttttaattt tcgtattagc ttacgacgct acacccagtt cccatctatt
14100
ttgtcactct tccctaaata atccttaaaa actccatttc cacccctccc agttcccaac
14160
tattttgtcc gcccacagcg gggcattttt cttcctgtta tgtttttaat caaacatcct
14220
gccaactcca tgtgacaaac cgtcatcttc ggctactttt tctctgtcac agaatgaaaa
14280
tttttctgtc atctcttcgt tattaatgtt tgtaattgac tgaatatcaa cgcttatttg
14340
cagcctgaat ggcgaatgg
14359
<210> 193
<211> 11677
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 193
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct
4380
gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag
4440
tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag
4500
caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga
4560
gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag
4620
aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca
4680
cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc
4740
atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca
4800
tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca
4860
ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca
4920
agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag
4980
acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg
5040
ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc
5100
aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag
5160
tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc
5220
ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta
5280
agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact
5340
cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg
5400
ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg
5460
aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg
5520
gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt
5580
gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga
5640
tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa
5700
gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc
5760
tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg
5820
tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc
5880
ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg
5940
tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt
6000
cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag
6060
aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa
6120
acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc
6180
tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc
6240
tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg
6300
agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct
6360
ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg
6420
gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac
6480
ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg
6540
ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg
6600
gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg
6660
tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg
6720
aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata
6780
acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc
6840
actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg
6900
acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata
6960
agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc
7020
acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca
7080
tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc
7140
ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc
7200
tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga
7260
gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg
7320
ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca
7380
accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt
7440
cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg
7500
aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca
7560
gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg
7620
cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt
7680
acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa
7740
accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag
7800
ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg
7860
aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg agcttcagcc
7920
agaatcctcc tgtgctgaag cggcaccagc gcgagatcac cagaacaacc ctgcagagcg
7980
accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa gaagatttcg
8040
acatctacga cgaggacgag aatcagagcc ccagaagctt tcagaaaaag acccggcact
8100
acttcattgc cgccgtcgag agactgtggg actacggcat gtctagcagc cctcacgtgc
8160
tgagaaatag agcccagagc ggcagcgtgc cccagttcaa gaaagtggtg ttccaagagt
8220
tcaccgacgg cagcttcacc cagccactgt atagaggcga gctgaacgag catctgggcc
8280
tgctgggccc ttatatcaga gccgaagtgg aagataacat catggtcacc ttccggaatc
8340
aggctagccg gccttacagc ttctacagct ccctgatcag ctacgaagag gaccagagac
8400
agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc tacttttgga
8460
aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaagcc tgggcctact
8520
tctccgatgt ggatctggaa aaggacgtgc acagcgggct catcggacca ctgcttgtgt
8580
gccacaccaa cacactgaac cccgctcacg gcagacaagt gacagtgcaa gagttcgccc
8640
tgttcttcac catcttcgac gaaacaaaga gctggtactt caccgagaat atggaacgga
8700
actgcagagc cccttgcaac atccagatgg aagatcccac cttcaaagag aactaccggt
8760
tccacgccat caacggctac atcatggaca cactgcccgg cctggttatg gcccaggatc
8820
agagaatccg gtggtatctg ctgtccatgg gctccaacga gaatatccac agcatccact
8880
tcagcggcca cgtgttcacc gtgcggaaaa aagaagagta caaaatggcc ctgtacaatc
8940
tgtaccctgg ggtgttcgaa accgtggaaa tgctgccttc caaggccggc atttggagag
9000
tggaatgtct gattggagag cacctccacg ccggaatgag caccctgttt ctggtgtaca
9060
gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac ttccagatca
9120
ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tcggctgcac tacagcggca
9180
gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac ctgctggctc
9240
ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc agcctgtaca
9300
tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc tacagaggca
9360
acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc attaagcaca
9420
acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca cactacagca
9480
tccggtctac cctgagaatg gaactgatgg gctgcgacct gaacagctgc tctatgcccc
9540
tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc tacttcacca
9600
acatgttcgc cacttggagc ccctccaagg ctagactgca tctgcagggc agaagcaacg
9660
cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggttgacttt caaaagacca
9720
tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct atgtacgtga
9780
aagagttcct gatctccagc agccaggacg gccatcagtg gaccctgttt ttccagaacg
9840
gcaaagtgaa agtgttccag ggcaatcagg acagcttcac acccgtggtc aattctctgg
9900
accctccact gctgaccaga tacctgcgga ttcaccctca gtcttgggtg caccagatcg
9960
ctctgcggat ggaagtgctg ggctgtgaag ctcaggacct ctactagtta attaagagca
10020
tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa
10080
tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag
10140
ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt
10200
tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta
10260
tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc
10320
ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga
10380
ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac
10440
ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc
10500
cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc
10560
taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc
10620
tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct
10680
ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg
10740
gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg
10800
ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt
10860
aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg
10920
cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc
10980
agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg cggtaccaag
11040
cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga ggttttactt
11100
gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt
11160
gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat
11220
ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat
11280
gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga accagataag
11340
tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt acgacgctac
11400
acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac tccatttcca
11460
cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct tcctgttatg
11520
tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg ctactttttc
11580
tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg taattgactg
11640
aatatcaacg cttatttgca gcctgaatgg cgaatgg
11677
<210> 194
<211> 13634
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 194
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca
4380
aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct
4440
gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca
4500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc
4560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat
4620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat
4680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac
4740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc
4800
taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc
4860
tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag
4920
ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat
4980
tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc
5040
gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg
5100
tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg
5160
cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc
5220
atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat
5280
tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac
5340
gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc
5400
cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc
5460
aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc
5520
aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc
5580
aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct
5640
agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg
5700
atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag
5760
gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc
5820
ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag
5880
tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag
5940
gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac
6000
tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc
6060
cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat
6120
atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga
6180
agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa
6240
gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag
6300
agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc
6360
aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc
6420
ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct
6480
ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac
6540
cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc
6600
ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag
6660
atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg
6720
tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat
6780
cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg
6840
cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag
6900
accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag
6960
gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc
7020
ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg
7080
ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac
7140
atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat
7200
agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac
7260
atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg
7320
tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg
7380
tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc
7440
gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc
7500
gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc
7560
accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg
7620
atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc
7680
ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag
7740
tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc
7800
aagctgctgg aatccggcct gatgaacagc caagagtcct cctggggcaa gaatgtgtcc
7860
agcaccgagt ccggcagact gttcaaggga aagagagccc acggacctgc tctgctgacc
7920
aaggataacg ccctgttcaa agtgtccatc agcctgctca agaccaacaa gacctccaac
7980
aactccgcca ccaacagaaa gacccacatc gacggcccta gcctgctgat cgagaatagc
8040
cctagcgtct ggcagaatat cctggaaagc gacaccgagt tcaagaaagt gacccctctg
8100
atccacgacc ggatgctcat ggacaagaac gccaccgctc tgcggctgaa ccacatgagc
8160
aacaagacaa ccagcagcaa gaatatggaa atggtgcagc agaagaaaga gggccccatt
8220
cctccagacg ctcagaaccc cgatatgagc ttcttcaaga tgctctttct gcccgagagc
8280
gcccggtgga ttcagagaac acacggcaag aactccctga actccggcca gggaccttct
8340
ccaaagcagc tggtttccct gggacctgag aagtccgtgg aaggacagaa cttcctgagc
8400
gaaaagaaca aagtggtcgt cggcaagggc gagttcacca aggatgtggg cctgaaagag
8460
atggtctttc ccagcagccg gaacctgttc ctgaccaacc tggacaacct gcacgagaac
8520
aacacccaca atcaagagaa gaagatccaa gaggaaatcg aaaagaaaga gacactcatc
8580
caagagaacg tggtgctgcc tcagatccac acagtgaccg gcaccaagaa ctttatgaag
8640
aatctgttcc tgctgagtac ccggcagaac gtggaaggca gctacgatgg cgcttatgcc
8700
cctgtgctgc aggacttcag atccctgaac gactccacca atcggacaaa gaagcacaca
8760
gcccacttct ccaagaaggg cgaagaagag aacctggaag gactgggcaa tcagaccaag
8820
cagatcgtcg agaagtacgc ctgcaccacc agaatcagcc ccaacacaag ccagcagaac
8880
ttcgtgaccc agcggagcaa aagagccctg aagcagtttc ggctgcccct ggaagaaacc
8940
gagctggaaa agcggatcat cgtggacgac accagcacac agtggtccaa gaacatgaag
9000
cacttgaccc ctagcacact gacccagatc gactacaacg agaaagagaa gggcgctatc
9060
acacagagcc cactgagcga ctgtctgacc agaagccaca gcatccctca ggccaacaga
9120
tcccctctgc caatcgccaa agtgtctagc ttccccagca tcagacccat ctacctgacc
9180
agagtgctgt tccaggacaa cagcagccat ctgccagccg ccagctaccg gaagaaagat
9240
tctggcgtgc aagagagcag ccactttctg cagggcgcta agaagaacaa tctgagcctg
9300
gctattctga ccctggaaat gaccggcgat cagagagaag tcggctctct gggcaccagc
9360
gccacaaata gcgtgaccta caaaaaggtg gaaaacaccg tgctgcctaa gcctgacctg
9420
ccaaagacaa gcggcaaggt ggaactgctg ccaaaggtgc acatctacca gaaggacctg
9480
tttcctaccg agacaagcaa cggctctccc ggccatctgg atctggtgga aggatctctg
9540
ctgcagggaa ccgagggcgc catcaagtgg aacgaggcca atagacctgg caaggtgccc
9600
ttcctgagag tggccacaga gtccagcgcc aagacaccct ctaaactgct ggaccctctg
9660
gcctgggaca accactatgg cactcagatc cccaaagagg aatggaagtc ccaagagaag
9720
tcccctgaaa agaccgcctt caagaagaag gacaccattc tgtccctgaa tgcctgcgag
9780
agcaaccacg ccattgccgc catcaatgag ggccagaaca agcccgagat cgaagtgacc
9840
tgggccaagc agggaagaac cgagagactg tgtagccaga atcctcctgt gctgaagcgg
9900
caccagagag aaatcacccg gaccacactg cagagcgacc aagaagagat cgattacgac
9960
gataccatca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat
10020
cagagccctc ggagcttcca gaagaaaacc aggcactact ttattgccgc cgtcgagcgg
10080
ctgtgggact acggaatgtc tagctctcct cacgtgctgc ggaatagagc ccagtctggt
10140
agcgtgcccc agttcaaaaa ggtcgtgttc caagagttca ccgacggcag cttcacccag
10200
ccactgtata gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc
10260
gaagtggaag ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc
10320
tacagctccc tgatctccta cgaagaggac cagagacagg gcgcagagcc ccggaagaat
10380
ttcgtgaagc ccaacgagac taagacctac ttttggaagg tgcagcacca tatggcccct
10440
acaaaggacg agttcgactg caaagcctgg gcctacttct ccgatgtgga cctcgaaaag
10500
gacgtgcaca gcggactcat cggcccactg cttgtgtgcc acaccaacac actgaacccc
10560
gctcacggca gacaagtgac agtgcaagag ttcgccctgt ttttcaccat cttcgacgaa
10620
acgaagtcct ggtacttcac cgaaaacatg gaaagaaact gcagggcccc ttgcaacatt
10680
cagatggaag atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc
10740
atggacacac tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg
10800
tccatgggct ccaacgagaa tatccactcc atccacttca gcggccacgt gttcaccgtg
10860
cggaaaaaag aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc
10920
gttgagatgc tgcctagcaa ggccggaatt tggagagtgg aatgtctgat tggagagcac
10980
ctccacgccg ggatgagcac cctgtttctg gtgtactcca acaagtgtca gacccctctc
11040
ggcatggcct ctggccacat tagagacttc cagatcaccg ccagcggaca gtatggacag
11100
tgggccccta aactggccag actgcactac tccggcagca tcaatgcctg gtccaccaaa
11160
gagcctttca gctggatcaa agtggacctg ctggctccca tgatcatcca cggaatcaag
11220
acccagggcg ccagacaaaa gttcagcagc ctgtacatca gccagttcat catcatgtac
11280
agcctggacg gaaagaagtg gcagacctac cggggcaata gcaccggcac actgatggtg
11340
ttcttcggca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt
11400
gcccggtaca tccggctgca ccccacacac tacagcatca ggtctaccct gagaatggaa
11460
ctgatgggct gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc
11520
agcgacgccc agatcacagc ctctagctac ttcaccaaca tgttcgccac ttggagcccc
11580
tctaaggccc ggcttcatct gcaaggcaga agcaacgctt ggaggcccca agtgaacaac
11640
cccaaagaat ggctccaggt ggactttcag aaaaccatga aagtgacagg cgtgaccaca
11700
cagggcgtca agtccctgct gacctctatg tacgtgaaag agtttctgat cagctccagc
11760
caggacggcc accagtggac cctgttcttc cagaacggca aagtgaaagt gttccaggga
11820
aatcaggaca gcttcacacc cgtggtcaat agtctggacc caccactgct gacccgctac
11880
ctgcgaattc accctcagtc ttgggtgcac cagattgccc tgcggatgga agtgctgggc
11940
tgtgaagctc aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata
12000
tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg
12060
gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca
12120
aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt
12180
acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg
12240
gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct
12300
cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc
12360
aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca
12420
ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac
12480
tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt
12540
ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc
12600
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg
12660
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca
12720
agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc
12780
tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga
12840
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc
12900
cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct
12960
gcctgcaggg gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat
13020
cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct
13080
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc
13140
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc
13200
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg
13260
atcactgata tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt
13320
tgtcattttt aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc
13380
actcttccct aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt
13440
tgtccgccca cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa
13500
ctccatgtga caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt
13560
ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc
13620
tgaatggcga atgg
13634
<210> 195
<211> 10952
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 195
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca
4380
aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct
4440
gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca
4500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc
4560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat
4620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat
4680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac
4740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc
4800
taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc
4860
tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag
4920
ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat
4980
tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc
5040
gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg
5100
tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg
5160
cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc
5220
atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat
5280
tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac
5340
gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc
5400
cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc
5460
aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc
5520
aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc
5580
aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct
5640
agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg
5700
atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag
5760
gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc
5820
ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag
5880
tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag
5940
gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac
6000
tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc
6060
cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat
6120
atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga
6180
agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa
6240
gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag
6300
agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc
6360
aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc
6420
ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct
6480
ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac
6540
cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc
6600
ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag
6660
atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg
6720
tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat
6780
cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg
6840
cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag
6900
accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag
6960
gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc
7020
ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg
7080
ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac
7140
atcagcgcct acctgctgag caagaacaat gccatcgagc ctcggagctt cagccagaat
7200
cctcctgtgc tgaagcggca ccagcgcgag atcaccagaa caaccctgca gagcgaccaa
7260
gaggaaatcg attacgacga caccatcagc gtcgagatga agaaagaaga tttcgacatc
7320
tacgacgagg acgagaatca gagccccaga agctttcaga aaaagacccg gcactacttc
7380
attgccgccg tcgagagact gtgggactac ggcatgtcta gcagccctca cgtgctgaga
7440
aatagagccc agagcggcag cgtgccccag ttcaagaaag tggtgttcca agagttcacc
7500
gacggcagct tcacccagcc actgtataga ggcgagctga acgagcatct gggcctgctg
7560
ggcccttata tcagagccga agtggaagat aacatcatgg tcaccttccg gaatcaggct
7620
agccggcctt acagcttcta cagctccctg atcagctacg aagaggacca gagacagggc
7680
gctgagccca gaaagaactt cgtgaagccc aacgagacta agacctactt ttggaaggtg
7740
cagcaccaca tggcccctac aaaggacgag ttcgactgca aagcctgggc ctacttctcc
7800
gatgtggatc tggaaaagga cgtgcacagc gggctcatcg gaccactgct tgtgtgccac
7860
accaacacac tgaaccccgc tcacggcaga caagtgacag tgcaagagtt cgccctgttc
7920
ttcaccatct tcgacgaaac aaagagctgg tacttcaccg agaatatgga acggaactgc
7980
agagcccctt gcaacatcca gatggaagat cccaccttca aagagaacta ccggttccac
8040
gccatcaacg gctacatcat ggacacactg cccggcctgg ttatggccca ggatcagaga
8100
atccggtggt atctgctgtc catgggctcc aacgagaata tccacagcat ccacttcagc
8160
ggccacgtgt tcaccgtgcg gaaaaaagaa gagtacaaaa tggccctgta caatctgtac
8220
cctggggtgt tcgaaaccgt ggaaatgctg ccttccaagg ccggcatttg gagagtggaa
8280
tgtctgattg gagagcacct ccacgccgga atgagcaccc tgtttctggt gtacagcaac
8340
aagtgtcaga cccctctcgg catggcctct ggacacatca gagacttcca gatcaccgcc
8400
tctggccagt acggacagtg ggctcctaaa ctggctcggc tgcactacag cggcagcatc
8460
aatgcctggt ccaccaaaga gcccttcagc tggatcaagg tggacctgct ggctcccatg
8520
atcatccacg gaatcaagac ccagggcgcc agacagaagt tcagcagcct gtacatcagc
8580
cagttcatca tcatgtacag cctggacggc aagaagtggc agacctacag aggcaacagc
8640
accggcacac tcatggtgtt cttcggcaac gtggactcca gcggcattaa gcacaacatc
8700
ttcaaccctc caatcattgc ccggtacatc cggctgcacc ccacacacta cagcatccgg
8760
tctaccctga gaatggaact gatgggctgc gacctgaaca gctgctctat gcccctcgga
8820
atggaaagca aggccatcag cgacgcccag atcacagcca gcagctactt caccaacatg
8880
ttcgccactt ggagcccctc caaggctaga ctgcatctgc agggcagaag caacgcttgg
8940
aggccccaag tgaacaaccc caaagagtgg ctgcaggttg actttcaaaa gaccatgaaa
9000
gtgaccggcg tgaccacaca gggcgtcaag tctctgctga cctctatgta cgtgaaagag
9060
ttcctgatct ccagcagcca ggacggccat cagtggaccc tgtttttcca gaacggcaaa
9120
gtgaaagtgt tccagggcaa tcaggacagc ttcacacccg tggtcaattc tctggaccct
9180
ccactgctga ccagatacct gcggattcac cctcagtctt gggtgcacca gatcgctctg
9240
cggatggaag tgctgggctg tgaagctcag gacctctact agttaattaa gagcatctta
9300
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta
9360
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag
9420
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg
9480
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg
9540
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc
9600
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt
9660
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca
9720
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc
9780
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt
9840
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg
9900
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct
9960
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg
10020
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg
10080
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca
10140
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc
10200
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga
10260
gcgagcgagc gcgcagctgc ctgcaggggc gcgcctcgag gcatgcggta ccaagcttgt
10320
cgagaagtac tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt
10380
aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt
10440
taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac
10500
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc
10560
ttatcatgtc tggatctgat cactgatatc gcctaggaga tccgaaccag ataagtgaaa
10620
tctagttcca aactattttg tcatttttaa ttttcgtatt agcttacgac gctacaccca
10680
gttcccatct attttgtcac tcttccctaa ataatcctta aaaactccat ttccacccct
10740
cccagttccc aactattttg tccgcccaca gcggggcatt tttcttcctg ttatgttttt
10800
aatcaaacat cctgccaact ccatgtgaca aaccgtcatc ttcggctact ttttctctgt
10860
cacagaatga aaatttttct gtcatctctt cgttattaat gtttgtaatt gactgaatat
10920
caacgcttat ttgcagcctg aatggcgaat gg
10952
<210> 196
<211> 14266
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 196
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc
4380
ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt
4440
ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg
4500
ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg
4560
ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt
4620
atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg
4680
agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc
4740
ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc
4800
accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac
4860
ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca
4920
ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat
4980
gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag
5040
ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg
5100
caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg
5160
ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca
5220
cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc
5280
gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt
5340
ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta
5400
ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt
5460
ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt
5520
gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc
5580
tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg
5640
actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc
5700
ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca
5760
ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta
5820
caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc
5880
ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg
5940
acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca
6000
cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga
6060
catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag
6120
ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt
6180
tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca
6240
gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga
6300
acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact
6360
ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca
6420
ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga
6480
ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc
6540
accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc
6600
tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga
6660
tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg
6720
ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt
6780
acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg
6840
gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga
6900
cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg
6960
gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca
7020
tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg
7080
tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg
7140
tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca
7200
gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct
7260
acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc
7320
tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc
7380
tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc
7440
actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg
7500
cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg
7560
gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg
7620
gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca
7680
gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca
7740
ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca
7800
atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc
7860
agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc
7920
acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga
7980
gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa
8040
ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga
8100
cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc
8160
tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg
8220
acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg
8280
ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata
8340
gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc
8400
ctctgtctct gagcgaggaa aacaacgaca gcaagctgct ggaatccggc ctgatgaaca
8460
gccaagagtc ctcctggggc aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg
8520
gaaagagagc ccacggacct gctctgctga ccaaggataa cgccctgttc aaagtgtcca
8580
tcagcctgct caagaccaac aagacctcca acaactccgc caccaacaga aagacccaca
8640
tcgacggccc tagcctgctg atcgagaata gccctagcgt ctggcagaat atcctggaaa
8700
gcgacaccga gttcaagaaa gtgacccctc tgatccacga ccggatgctc atggacaaga
8760
acgccaccgc tctgcggctg aaccacatga gcaacaagac aaccagcagc aagaatatgg
8820
aaatggtgca gcagaagaaa gagggcccca ttcctccaga cgctcagaac cccgatatga
8880
gcttcttcaa gatgctcttt ctgcccgaga gcgcccggtg gattcagaga acacacggca
8940
agaactccct gaactccggc cagggacctt ctccaaagca gctggtttcc ctgggacctg
9000
agaagtccgt ggaaggacag aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg
9060
gcgagttcac caaggatgtg ggcctgaaag agatggtctt tcccagcagc cggaacctgt
9120
tcctgaccaa cctggacaac ctgcacgaga acaacaccca caatcaagag aagaagatcc
9180
aagaggaaat cgaaaagaaa gagacactca tccaagagaa cgtggtgctg cctcagatcc
9240
acacagtgac cggcaccaag aactttatga agaatctgtt cctgctgagt acccggcaga
9300
acgtggaagg cagctacgat ggcgcttatg cccctgtgct gcaggacttc agatccctga
9360
acgactccac caatcggaca aagaagcaca cagcccactt ctccaagaag ggcgaagaag
9420
agaacctgga aggactgggc aatcagacca agcagatcgt cgagaagtac gcctgcacca
9480
ccagaatcag ccccaacaca agccagcaga acttcgtgac ccagcggagc aaaagagccc
9540
tgaagcagtt tcggctgccc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg
9600
acaccagcac acagtggtcc aagaacatga agcacttgac ccctagcaca ctgacccaga
9660
tcgactacaa cgagaaagag aagggcgcta tcacacagag cccactgagc gactgtctga
9720
ccagaagcca cagcatccct caggccaaca gatcccctct gccaatcgcc aaagtgtcta
9780
gcttccccag catcagaccc atctacctga ccagagtgct gttccaggac aacagcagcc
9840
atctgccagc cgccagctac cggaagaaag attctggcgt gcaagagagc agccactttc
9900
tgcagggcgc taagaagaac aatctgagcc tggctattct gaccctggaa atgaccggcg
9960
atcagagaga agtcggctct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg
10020
tggaaaacac cgtgctgcct aagcctgacc tgccaaagac aagcggcaag gtggaactgc
10080
tgccaaaggt gcacatctac cagaaggacc tgtttcctac cgagacaagc aacggctctc
10140
ccggccatct ggatctggtg gaaggatctc tgctgcaggg aaccgagggc gccatcaagt
10200
ggaacgaggc caatagacct ggcaaggtgc ccttcctgag agtggccaca gagtccagcg
10260
ccaagacacc ctctaaactg ctggaccctc tggcctggga caaccactat ggcactcaga
10320
tccccaaaga ggaatggaag tcccaagaga agtcccctga aaagaccgcc ttcaagaaga
10380
aggacaccat tctgtccctg aatgcctgcg agagcaacca cgccattgcc gccatcaatg
10440
agggccagaa caagcccgag atcgaagtga cctgggccaa gcagggaaga accgagagac
10500
tgtgtagcca gaatcctcct gtgctgaagc ggcaccagag agaaatcacc cggaccacac
10560
tgcagagcga ccaagaagag atcgattacg acgataccat cagcgtcgag atgaagaaag
10620
aagatttcga catctacgac gaggacgaga atcagagccc tcggagcttc cagaagaaaa
10680
ccaggcacta ctttattgcc gccgtcgagc ggctgtggga ctacggaatg tctagctctc
10740
ctcacgtgct gcggaataga gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt
10800
tccaagagtt caccgacggc agcttcaccc agccactgta tagaggcgag ctgaacgagc
10860
atctgggcct gctgggccct tatatcagag ccgaagtgga agataacatc atggtcacct
10920
tccggaatca ggctagccgg ccttacagct tctacagctc cctgatctcc tacgaagagg
10980
accagagaca gggcgcagag ccccggaaga atttcgtgaa gcccaacgag actaagacct
11040
acttttggaa ggtgcagcac catatggccc ctacaaagga cgagttcgac tgcaaagcct
11100
gggcctactt ctccgatgtg gacctcgaaa aggacgtgca cagcggactc atcggcccac
11160
tgcttgtgtg ccacaccaac acactgaacc ccgctcacgg cagacaagtg acagtgcaag
11220
agttcgccct gtttttcacc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca
11280
tggaaagaaa ctgcagggcc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga
11340
actaccggtt ccacgccatc aacggctaca tcatggacac actgcccggc ctggttatgg
11400
cccaggatca gagaatccgg tggtatctgc tgtccatggg ctccaacgag aatatccact
11460
ccatccactt cagcggccac gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc
11520
tgtacaatct gtaccctggg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa
11580
tttggagagt ggaatgtctg attggagagc acctccacgc cgggatgagc accctgtttc
11640
tggtgtactc caacaagtgt cagacccctc tcggcatggc ctctggccac attagagact
11700
tccagatcac cgccagcgga cagtatggac agtgggcccc taaactggcc agactgcact
11760
actccggcag catcaatgcc tggtccacca aagagccttt cagctggatc aaagtggacc
11820
tgctggctcc catgatcatc cacggaatca agacccaggg cgccagacaa aagttcagca
11880
gcctgtacat cagccagttc atcatcatgt acagcctgga cggaaagaag tggcagacct
11940
accggggcaa tagcaccggc acactgatgg tgttcttcgg caacgtggac tccagcggca
12000
ttaagcacaa catcttcaac cctccaatca ttgcccggta catccggctg caccccacac
12060
actacagcat caggtctacc ctgagaatgg aactgatggg ctgcgacctg aacagctgct
12120
ctatgcccct cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gcctctagct
12180
acttcaccaa catgttcgcc acttggagcc cctctaaggc ccggcttcat ctgcaaggca
12240
gaagcaacgc ttggaggccc caagtgaaca accccaaaga atggctccag gtggactttc
12300
agaaaaccat gaaagtgaca ggcgtgacca cacagggcgt caagtccctg ctgacctcta
12360
tgtacgtgaa agagtttctg atcagctcca gccaggacgg ccaccagtgg accctgttct
12420
tccagaacgg caaagtgaaa gtgttccagg gaaatcagga cagcttcaca cccgtggtca
12480
atagtctgga cccaccactg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc
12540
accagattgc cctgcggatg gaagtgctgg gctgtgaagc tcaggacctc tactagttaa
12600
ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat
12660
acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt
12720
aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt
12780
acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat
12840
tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct
12900
agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc
12960
tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc
13020
tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt
13080
cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg
13140
gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg
13200
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc
13260
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc
13320
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag
13380
gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca
13440
tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact
13500
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg
13560
ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc
13620
ggtaccaagc ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag
13680
gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat
13740
gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc
13800
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa
13860
ctcatcaatg tatcttatca tgtctggatc tgatcactga tatcgcctag gagatccgaa
13920
ccagataagt gaaatctagt tccaaactat tttgtcattt ttaattttcg tattagctta
13980
cgacgctaca cccagttccc atctattttg tcactcttcc ctaaataatc cttaaaaact
14040
ccatttccac ccctcccagt tcccaactat tttgtccgcc cacagcgggg catttttctt
14100
cctgttatgt ttttaatcaa acatcctgcc aactccatgt gacaaaccgt catcttcggc
14160
tactttttct ctgtcacaga atgaaaattt ttctgtcatc tcttcgttat taatgtttgt
14220
aattgactga atatcaacgc ttatttgcag cctgaatggc gaatgg
14266
<210> 197
<211> 11584
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 197
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc
4380
ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt
4440
ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg
4500
ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg
4560
ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt
4620
atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg
4680
agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc
4740
ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc
4800
accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac
4860
ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca
4920
ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat
4980
gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag
5040
ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg
5100
caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg
5160
ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca
5220
cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc
5280
gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt
5340
ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta
5400
ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt
5460
ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt
5520
gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc
5580
tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg
5640
actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc
5700
ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca
5760
ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta
5820
caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc
5880
ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg
5940
acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca
6000
cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga
6060
catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag
6120
ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt
6180
tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca
6240
gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga
6300
acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact
6360
ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca
6420
ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga
6480
ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc
6540
accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc
6600
tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga
6660
tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg
6720
ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt
6780
acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg
6840
gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga
6900
cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg
6960
gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca
7020
tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg
7080
tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg
7140
tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca
7200
gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct
7260
acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc
7320
tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc
7380
tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc
7440
actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg
7500
cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg
7560
gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg
7620
gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca
7680
gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca
7740
ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca
7800
atgccatcga gcctcggagc ttcagccaga atcctcctgt gctgaagcgg caccagcgcg
7860
agatcaccag aacaaccctg cagagcgacc aagaggaaat cgattacgac gacaccatca
7920
gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat cagagcccca
7980
gaagctttca gaaaaagacc cggcactact tcattgccgc cgtcgagaga ctgtgggact
8040
acggcatgtc tagcagccct cacgtgctga gaaatagagc ccagagcggc agcgtgcccc
8100
agttcaagaa agtggtgttc caagagttca ccgacggcag cttcacccag ccactgtata
8160
gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc gaagtggaag
8220
ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc tacagctccc
8280
tgatcagcta cgaagaggac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc
8340
ccaacgagac taagacctac ttttggaagg tgcagcacca catggcccct acaaaggacg
8400
agttcgactg caaagcctgg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca
8460
gcgggctcat cggaccactg cttgtgtgcc acaccaacac actgaacccc gctcacggca
8520
gacaagtgac agtgcaagag ttcgccctgt tcttcaccat cttcgacgaa acaaagagct
8580
ggtacttcac cgagaatatg gaacggaact gcagagcccc ttgcaacatc cagatggaag
8640
atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc atggacacac
8700
tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg tccatgggct
8760
ccaacgagaa tatccacagc atccacttca gcggccacgt gttcaccgtg cggaaaaaag
8820
aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc gtggaaatgc
8880
tgccttccaa ggccggcatt tggagagtgg aatgtctgat tggagagcac ctccacgccg
8940
gaatgagcac cctgtttctg gtgtacagca acaagtgtca gacccctctc ggcatggcct
9000
ctggacacat cagagacttc cagatcaccg cctctggcca gtacggacag tgggctccta
9060
aactggctcg gctgcactac agcggcagca tcaatgcctg gtccaccaaa gagcccttca
9120
gctggatcaa ggtggacctg ctggctccca tgatcatcca cggaatcaag acccagggcg
9180
ccagacagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg
9240
gcaagaagtg gcagacctac agaggcaaca gcaccggcac actcatggtg ttcttcggca
9300
acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt gcccggtaca
9360
tccggctgca ccccacacac tacagcatcc ggtctaccct gagaatggaa ctgatgggct
9420
gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc agcgacgccc
9480
agatcacagc cagcagctac ttcaccaaca tgttcgccac ttggagcccc tccaaggcta
9540
gactgcatct gcagggcaga agcaacgctt ggaggcccca agtgaacaac cccaaagagt
9600
ggctgcaggt tgactttcaa aagaccatga aagtgaccgg cgtgaccaca cagggcgtca
9660
agtctctgct gacctctatg tacgtgaaag agttcctgat ctccagcagc caggacggcc
9720
atcagtggac cctgtttttc cagaacggca aagtgaaagt gttccagggc aatcaggaca
9780
gcttcacacc cgtggtcaat tctctggacc ctccactgct gaccagatac ctgcggattc
9840
accctcagtc ttgggtgcac cagatcgctc tgcggatgga agtgctgggc tgtgaagctc
9900
aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tttgttctgt
9960
ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt
10020
acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa
10080
gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg
10140
tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc
10200
tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta
10260
taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt
10320
ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca
10380
actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc
10440
ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt
10500
gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac
10560
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg
10620
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga
10680
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc tagagcatgg
10740
ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga ggaaccccta
10800
gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca
10860
aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg
10920
gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat cataatcagc
10980
cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac
11040
ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt
11100
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct
11160
agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg atcactgata
11220
tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt tgtcattttt
11280
aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc actcttccct
11340
aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt tgtccgccca
11400
cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa ctccatgtga
11460
caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctgtcatctc
11520
ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc tgaatggcga
11580
atgg
11584
<210> 198
<211> 11558
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 198
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca
4380
aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct
4440
gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca
4500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc
4560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat
4620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat
4680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac
4740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc
4800
taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc
4860
tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag
4920
ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat
4980
tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc
5040
gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg
5100
tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg
5160
cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc
5220
atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat
5280
tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac
5340
gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc
5400
cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc
5460
aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc
5520
aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc
5580
aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct
5640
agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg
5700
atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag
5760
gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc
5820
ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag
5880
tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag
5940
gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac
6000
tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc
6060
cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat
6120
atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga
6180
agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa
6240
gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag
6300
agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc
6360
aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc
6420
ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct
6480
ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac
6540
cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc
6600
ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag
6660
atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg
6720
tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat
6780
cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg
6840
cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag
6900
accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag
6960
gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc
7020
ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg
7080
ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac
7140
atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat
7200
agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac
7260
atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg
7320
tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg
7380
tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc
7440
gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc
7500
gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc
7560
accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg
7620
atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc
7680
ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag
7740
tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc
7800
aagctgcctc ctgtgctgaa gcggcaccag cgggaaatca ccagaaccac actgcagagc
7860
gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc
7920
gacatctacg acgaggacga gaatcagagc cccagatcct ttcagaaaaa gacccggcac
7980
tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg
8040
ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag
8100
ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc
8160
ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat
8220
caggctagcc ggccttacag cttctacagc tccctgatct cctacgaaga ggaccagaga
8280
cagggcgctg agccccggaa gaatttcgtg aagcccaacg agactaagac ctacttttgg
8340
aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac
8400
ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg
8460
tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc
8520
ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg
8580
aactgcaggg ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg
8640
ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat
8700
cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac
8760
ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat
8820
ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga
8880
gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac
8940
tccaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc
9000
accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctactccggc
9060
agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct
9120
cccatgatca tccacggaat caagacccag ggcgcaagac agaagttcag cagcctgtac
9180
atcagccagt tcatcatcat gtacagcctg gacggaaaga agtggcagac ctaccggggc
9240
aatagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac
9300
aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc
9360
atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc
9420
ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc
9480
aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac
9540
gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc
9600
atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg
9660
aaagagttcc tgattagcag cagccaggac ggccaccagt ggaccctgtt tttccagaac
9720
ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg
9780
gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc
9840
gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc
9900
atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa
9960
atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta
10020
gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg
10080
ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact
10140
atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg
10200
cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag
10260
aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa
10320
cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc
10380
ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg
10440
ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat
10500
ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc
10560
tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg
10620
ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg
10680
gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag catggcgggt
10740
taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct
10800
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
10860
cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa
10920
gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact
10980
tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt
11040
tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa
11100
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa
11160
tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa
11220
gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta
11280
cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc
11340
acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat
11400
gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt
11460
ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact
11520
gaatatcaac gcttatttgc agcctgaatg gcgaatgg
11558
<210> 199
<211> 12190
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 199
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt
180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
4020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
4080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
4140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
4200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
4260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
4320
tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc
4380
ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt
4440
ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg
4500
ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg
4560
ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt
4620
atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg
4680
agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc
4740
ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc
4800
accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac
4860
ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca
4920
ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat
4980
gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag
5040
ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg
5100
caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg
5160
ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca
5220
cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc
5280
gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt
5340
ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta
5400
ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt
5460
ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt
5520
gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc
5580
tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg
5640
actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc
5700
ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca
5760
ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta
5820
caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc
5880
ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg
5940
acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca
6000
cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga
6060
catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag
6120
ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt
6180
tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca
6240
gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga
6300
acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact
6360
ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca
6420
ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga
6480
ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc
6540
accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc
6600
tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga
6660
tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg
6720
ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt
6780
acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg
6840
gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga
6900
cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg
6960
gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca
7020
tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg
7080
tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg
7140
tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca
7200
gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct
7260
acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc
7320
tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc
7380
tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc
7440
actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg
7500
cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg
7560
gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg
7620
gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca
7680
gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca
7740
ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca
7800
atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc
7860
agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc
7920
acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga
7980
gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa
8040
ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga
8100
cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc
8160
tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg
8220
acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg
8280
ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata
8340
gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc
8400
ctctgtctct gagcgaggaa aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc
8460
agcgggaaat caccagaacc acactgcaga gcgaccaaga ggaaatcgat tacgacgaca
8520
ccatcagcgt cgagatgaag aaagaagatt tcgacatcta cgacgaggac gagaatcaga
8580
gccccagatc ctttcagaaa aagacccggc actacttcat tgccgccgtc gagagactgt
8640
gggactacgg catgtctagc agccctcacg tgctgagaaa tagagcccag agcggcagcg
8700
tgccccagtt caagaaagtg gtgttccaag agttcaccga cggcagcttc acccagccac
8760
tgtatagagg cgagctgaac gagcatctgg gcctgctggg cccttatatc agagccgaag
8820
tggaagataa catcatggtc accttccgga atcaggctag ccggccttac agcttctaca
8880
gctccctgat ctcctacgaa gaggaccaga gacagggcgc tgagccccgg aagaatttcg
8940
tgaagcccaa cgagactaag acctactttt ggaaggtgca gcaccacatg gcccctacaa
9000
aggacgagtt cgactgcaaa gcctgggcct acttctccga tgtggatctg gaaaaggacg
9060
tgcacagcgg gctcatcgga ccactgcttg tgtgccacac caacacactg aaccccgctc
9120
acggcagaca agtgacagtg caagagttcg ccctgttctt caccatcttc gacgaaacaa
9180
agagctggta cttcaccgag aatatggaac ggaactgcag ggccccttgc aacatccaga
9240
tggaagatcc caccttcaaa gagaactacc ggttccacgc catcaacggc tacatcatgg
9300
acacactgcc cggcctggtt atggcccagg atcagagaat ccggtggtat ctgctgtcca
9360
tgggctccaa cgagaatatc cacagcatcc acttcagcgg ccacgtgttc accgtgcgga
9420
aaaaagaaga gtacaaaatg gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg
9480
aaatgctgcc ttccaaggcc ggcatttgga gagtggaatg tctgattgga gagcacctcc
9540
acgccggaat gagcaccctg tttctggtgt actccaacaa gtgtcagacc cctctcggca
9600
tggcctctgg acacatcaga gacttccaga tcaccgcctc tggccagtac ggacagtggg
9660
ctcctaaact ggctcggctg cactactccg gcagcatcaa tgcctggtcc accaaagagc
9720
ccttcagctg gatcaaggtg gacctgctgg ctcccatgat catccacgga atcaagaccc
9780
agggcgcaag acagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc
9840
tggacggaaa gaagtggcag acctaccggg gcaatagcac cggcacactc atggtgttct
9900
tcggcaacgt ggactccagc ggcattaagc acaacatctt caaccctcca atcattgccc
9960
ggtacatccg gctgcacccc acacactaca gcatccggtc taccctgaga atggaactga
10020
tgggctgcga cctgaacagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg
10080
acgcccagat cacagccagc agctacttca ccaacatgtt cgccacttgg agcccctcca
10140
aggctagact gcatctgcag ggcagaagca acgcttggag gccccaagtg aacaacccca
10200
aagagtggct gcaggttgac tttcaaaaga ccatgaaagt gaccggcgtg accacacagg
10260
gcgtcaagtc tctgctgacc tctatgtacg tgaaagagtt cctgattagc agcagccagg
10320
acggccacca gtggaccctg tttttccaga acggcaaagt gaaagtgttc cagggcaatc
10380
aggacagctt cacacccgtg gtcaattctc tggaccctcc actgctgacc agatacctgc
10440
ggattcaccc tcagtcttgg gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg
10500
aagctcagga cctctactag ttaattaaga gcatcttacc gccatttatt cccatatttg
10560
ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa
10620
tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca
10680
tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa
10740
aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata
10800
tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc
10860
cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg
10920
tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac
10980
ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat
11040
cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt
11100
ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc
11160
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc
11220
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg
11280
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga
11340
gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa
11400
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg
11460
cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct
11520
gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata
11580
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc
11640
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat
11700
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg
11760
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca
11820
ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc
11880
atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc
11940
ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc
12000
cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc
12060
atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt
12120
catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa
12180
tggcgaatgg
12190
<210> 200
<211> 12165
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 200
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg
300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag
360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc
420
cgccatgcta cttatcgcgg ccgctcaata ttggccatta gccatattat tcattggtta
480
tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat atcataatat
540
gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat tattgactag
600
ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt
660
tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac
720
gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg
780
ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag
840
tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat
900
gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat
960
ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc
1020
aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg
1080
ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg
1140
tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg
1200
gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc
1260
ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg
1320
cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct
1380
tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg
1440
agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg
1500
agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc
1560
tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg
1620
gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag
1680
ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc ccgagttgct
1740
gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg
1800
ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg
1860
gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg
1920
agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc
1980
caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg
2040
gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg
2100
cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt
2160
tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc
2220
ctctgctaac catgttttag cctttcttct ttttcctaca gctcctgggc aacgtgctgg
2280
ttattgtgct gtctcatcat ttgtcgacag aattcctcga agatccgaag gggttcaagc
2340
ttggcattcc ggtactgttg gtaaagccag tttaaaccgc agccaccatg cagatcgagc
2400
tgtctacctg cttcttcctg tgcctgctgc ggttctgctt cagcgccacc agaagatatt
2460
acctgggcgc cgtggaactg agctgggact acatgcagtc tgacctggga gagctgcccg
2520
tggacgctag atttcctcca agagtgccca agagcttccc cttcaacacc tccgtggtgt
2580
acaagaaaac cctgttcgtg gaattcaccg accacctgtt caatatcgcc aagcctcggc
2640
ctccttggat gggactgctg ggacctacaa ttcaggccga ggtgtacgac accgtggtca
2700
tcaccctgaa gaacatggcc agccatcctg tgtctctgca cgccgtggga gtgtcttatt
2760
ggaaggcttc tgagggcgcc gagtacgacg atcagacaag ccagagagag aaagaggacg
2820
acaaggtttt ccctggcggc agccacacct atgtctggca ggtcctgaaa gaaaacggcc
2880
ctatggcctc cgatcctctg tgcctgacat acagctacct gagccacgtg gacctggtca
2940
aggacctgaa ttctggcctg atcggagccc tgctcgtgtg tagagaaggc agcctggcca
3000
aagagaaaac ccagacactg cacaagttca tcctgctgtt cgccgtgttc gacgagggca
3060
agagctggca cagcgagaca aagaacagcc tgatgcagga cagggatgcc gcctctgcta
3120
gagcttggcc taagatgcac accgtgaacg gctacgtgaa cagaagcctg cctggactga
3180
tcggctgcca cagaaagtcc gtgtactggc acgtgatcgg catgggcaca acacctgagg
3240
tgcacagcat ctttctggaa ggccacacct tcctcgtgcg gaaccacaga caggccagcc
3300
tggaaatcag ccctatcacc ttcctgaccg ctcagaccct gctgatggat ctgggccagt
3360
ttctgctgtt ctgccacatc agctcccacc agcacgatgg catggaagcc tacgtgaagg
3420
tggacagctg ccccgaagaa ccccagctgc ggatgaagaa caacgaggaa gccgaggact
3480
acgacgacga cctgaccgac tctgagatgg acgtcgtcag attcgacgac gataacagcc
3540
ccagcttcat ccagatcaga agcgtggcca agaagcaccc caagacctgg gtgcactata
3600
tcgccgccga ggaagaggac tgggattacg ctcctctggt gctggcccct gacgacagaa
3660
gctacaagag ccagtacctg aacaacggcc ctcagcggat cggccggaag tataagaaag
3720
tgcggttcat ggcctacacc gacgagacat tcaagaccag agaggccatc cagcacgaga
3780
gcggaattct gggccctctg ctgtatggcg aagtgggcga tacactgctg atcatcttca
3840
agaaccaggc cagcagaccc tacaacatct accctcacgg catcaccgat gtgcggcccc
3900
tgtattctag aaggctgccc aagggcgtga agcacctgaa ggacttccct atcctgcctg
3960
gcgagatttt caagtacaag tggaccgtga ccgtggaaga tggccccacc aagagcgacc
4020
ctagatgtct gacacggtac tacagcagct tcgtgaacat ggaacgcgac ctggccagcg
4080
gcctgattgg acctctgctg atctgctaca aagaaagcgt ggaccagcgg ggcaaccaga
4140
tcatgagcga caagcggaac gtgatcctgt ttagcgtgtt cgatgagaac cggtcctggt
4200
atctgaccga gaacatccag cggtttctgc ccaatcctgc cggggtgcaa ctggaagatc
4260
ctgagttcca ggcaagcaac atcatgcact ccatcaatgg ctatgtgttc gacagcctgc
4320
agctgagcgt gtgcctgcac gaagtggcct actggtacat cctgagcatt ggcgcccaga
4380
ccgacttcct gtccgtgttc tttagcggct acaccttcaa gcacaagatg gtgtacgagg
4440
ataccctgac actgttccca ttcagcggcg agacagtgtt catgagcatg gaaaaccccg
4500
gcctgtggat tctgggctgt cacaacagcg acttccggaa cagaggcatg acagccctgc
4560
tgaaggtgtc cagctgcgac aagaacaccg gcgactacta cgaggacagc tatgaggaca
4620
tcagcgccta cctgctgagc aagaacaatg ccatcgagcc tcggagcttc agccagaatc
4680
ctcctgtgct gaagcggcac cagcgcgaga tcaccagaac aaccctgcag agcgaccaag
4740
aggaaatcga ttacgacgac accatcagcg tcgagatgaa gaaagaagat ttcgacatct
4800
acgacgagga cgagaatcag agccccagaa gctttcagaa aaagacccgg cactacttca
4860
ttgccgccgt cgagagactg tgggactacg gcatgtctag cagccctcac gtgctgagaa
4920
atagagccca gagcggcagc gtgccccagt tcaagaaagt ggtgttccaa gagttcaccg
4980
acggcagctt cacccagcca ctgtatagag gcgagctgaa cgagcatctg ggcctgctgg
5040
gcccttatat cagagccgaa gtggaagata acatcatggt caccttccgg aatcaggcta
5100
gccggcctta cagcttctac agctccctga tcagctacga agaggaccag agacagggcg
5160
ctgagcccag aaagaacttc gtgaagccca acgagactaa gacctacttt tggaaggtgc
5220
agcaccacat ggcccctaca aaggacgagt tcgactgcaa agcctgggcc tacttctccg
5280
atgtggatct ggaaaaggac gtgcacagcg ggctcatcgg accactgctt gtgtgccaca
5340
ccaacacact gaaccccgct cacggcagac aagtgacagt gcaagagttc gccctgttct
5400
tcaccatctt cgacgaaaca aagagctggt acttcaccga gaatatggaa cggaactgca
5460
gagccccttg caacatccag atggaagatc ccaccttcaa agagaactac cggttccacg
5520
ccatcaacgg ctacatcatg gacacactgc ccggcctggt tatggcccag gatcagagaa
5580
tccggtggta tctgctgtcc atgggctcca acgagaatat ccacagcatc cacttcagcg
5640
gccacgtgtt caccgtgcgg aaaaaagaag agtacaaaat ggccctgtac aatctgtacc
5700
ctggggtgtt cgaaaccgtg gaaatgctgc cttccaaggc cggcatttgg agagtggaat
5760
gtctgattgg agagcacctc cacgccggaa tgagcaccct gtttctggtg tacagcaaca
5820
agtgtcagac ccctctcggc atggcctctg gacacatcag agacttccag atcaccgcct
5880
ctggccagta cggacagtgg gctcctaaac tggctcggct gcactacagc ggcagcatca
5940
atgcctggtc caccaaagag cccttcagct ggatcaaggt ggacctgctg gctcccatga
6000
tcatccacgg aatcaagacc cagggcgcca gacagaagtt cagcagcctg tacatcagcc
6060
agttcatcat catgtacagc ctggacggca agaagtggca gacctacaga ggcaacagca
6120
ccggcacact catggtgttc ttcggcaacg tggactccag cggcattaag cacaacatct
6180
tcaaccctcc aatcattgcc cggtacatcc ggctgcaccc cacacactac agcatccggt
6240
ctaccctgag aatggaactg atgggctgcg acctgaacag ctgctctatg cccctcggaa
6300
tggaaagcaa ggccatcagc gacgcccaga tcacagccag cagctacttc accaacatgt
6360
tcgccacttg gagcccctcc aaggctagac tgcatctgca gggcagaagc aacgcttgga
6420
ggccccaagt gaacaacccc aaagagtggc tgcaggttga ctttcaaaag accatgaaag
6480
tgaccggcgt gaccacacag ggcgtcaagt ctctgctgac ctctatgtac gtgaaagagt
6540
tcctgatctc cagcagccag gacggccatc agtggaccct gtttttccag aacggcaaag
6600
tgaaagtgtt ccagggcaat caggacagct tcacacccgt ggtcaattct ctggaccctc
6660
cactgctgac cagatacctg cggattcacc ctcagtcttg ggtgcaccag atcgctctgc
6720
ggatggaagt gctgggctgt gaagctcagg acctctacta gttaattaag agcatcttac
6780
cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa
6840
taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg
6900
tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt
6960
taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc
7020
tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg
7080
tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt
7140
gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac
7200
tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc
7260
gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt
7320
gctgggcact gataattccg tggtgttgtc atcgattcca taaagtagga aacactacac
7380
gattccataa agtaggaaac actacatcac tccataaagt aggaaacact acagttaact
7440
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg
7500
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg
7560
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg
7620
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcggcgcg ccgcatggct
7680
acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt
7740
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa
7800
ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggtcg
7860
acgctagcag ctgatgcata gcatgcggta ccgggagatg ggggaggcta actgaaacac
7920
ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa
7980
cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct
8040
gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca
8100
ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc
8160
cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg
8220
cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca
8280
gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat
8340
ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg
8400
agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc
8460
ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat
8520
aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca
8580
gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg
8640
actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg
8700
gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag
8760
cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt
8820
aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag
8880
ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg
8940
ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct
9000
ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat
9060
ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc
9120
aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac
9180
gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat
9240
atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg
9300
gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac
9360
gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca
9420
taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat
9480
tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt
9540
tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt
9600
ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa
9660
taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg
9720
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg
9780
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag
9840
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga
9900
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct
9960
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc
10020
tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg
10080
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc
10140
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca
10200
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag
10260
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct
10320
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc
10380
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga
10440
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca
10500
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat
10560
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac
10620
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt
10680
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt
10740
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag
10800
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct
10860
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt
10920
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc
10980
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt
11040
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg
11100
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg
11160
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct
11220
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc
11280
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt
11340
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt
11400
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg
11460
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat
11520
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg
11580
cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc
11640
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc
11700
ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag
11760
agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc
11820
gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa
11880
gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg
11940
aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt
12000
gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc
12060
gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt
12120
aataacgaag agatgacaga aaaattttca ttctgtgaca gagaa
12165
<210> 201
<211> 11512
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 201
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg
300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag
360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc
420
cgccatgcta cttatcgcgg ccgcaggctc agaggcacac aggagtttct gggctcaccc
480
tgcccccttc caacccctca gttcccatcc tccagcagct gtttgtgtgc tgcctctgaa
540
gtccacactg aacaaacttc agcctactca tgtccctaaa atgggcaaac attgcaagca
600
gcaaacagca aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag
660
agacctctct gggcccatgc cacctccaac atccactcga ccccttggaa tttcggtgga
720
gaggagcaga ggttgtcctg gcgtggttta ggtagtgtga gagggtccgg gttcaaaacc
780
acttgctggg tggggagtcg tcagtaagtg gctatgcccc gaccccgaag cctgtttccc
840
catctgtaca atggaaatga taaagacgcc catctgatag ggtttttgtg gcaaataaac
900
atttggtttt tttgttttgt tttgttttgt tttttgagat ggaggtttgc tctgtcgccc
960
aggctggagt gcagtgacac aatctcatct caccacaacc ttcccctgcc tcagcctccc
1020
aagtagctgg gattacaagc atgtgccacc acacctggct aattttctat ttttagtaga
1080
gacgggtttc tccatgttgg tcagcctcag cctcccaagt aactgggatt acaggcctgt
1140
gccaccacac ccggctaatt ttttctattt ttgacaggga cggggtttca ccatgttggt
1200
caggctggtc tagaggtacc ggatcttgct accagtggaa cagccactaa ggattctgca
1260
gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc
1320
cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt
1380
aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac
1440
tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg
1500
gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac
1560
gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatcc
1620
ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat
1680
tgtttctctc ttttagattc caacctttgg aactgagttt aaaccgcagc caccatgcag
1740
atcgagctgt ctacctgctt cttcctgtgc ctgctgcggt tctgcttcag cgccaccaga
1800
agatattacc tgggcgccgt ggaactgagc tgggactaca tgcagtctga cctgggagag
1860
ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga gcttcccctt caacacctcc
1920
gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc acctgttcaa tatcgccaag
1980
cctcggcctc cttggatggg actgctggga cctacaattc aggccgaggt gtacgacacc
2040
gtggtcatca ccctgaagaa catggccagc catcctgtgt ctctgcacgc cgtgggagtg
2100
tcttattgga aggcttctga gggcgccgag tacgacgatc agacaagcca gagagagaaa
2160
gaggacgaca aggttttccc tggcggcagc cacacctatg tctggcaggt cctgaaagaa
2220
aacggcccta tggcctccga tcctctgtgc ctgacataca gctacctgag ccacgtggac
2280
ctggtcaagg acctgaattc tggcctgatc ggagccctgc tcgtgtgtag agaaggcagc
2340
ctggccaaag agaaaaccca gacactgcac aagttcatcc tgctgttcgc cgtgttcgac
2400
gagggcaaga gctggcacag cgagacaaag aacagcctga tgcaggacag ggatgccgcc
2460
tctgctagag cttggcctaa gatgcacacc gtgaacggct acgtgaacag aagcctgcct
2520
ggactgatcg gctgccacag aaagtccgtg tactggcacg tgatcggcat gggcacaaca
2580
cctgaggtgc acagcatctt tctggaaggc cacaccttcc tcgtgcggaa ccacagacag
2640
gccagcctgg aaatcagccc tatcaccttc ctgaccgctc agaccctgct gatggatctg
2700
ggccagtttc tgctgttctg ccacatcagc tcccaccagc acgatggcat ggaagcctac
2760
gtgaaggtgg acagctgccc cgaagaaccc cagctgcgga tgaagaacaa cgaggaagcc
2820
gaggactacg acgacgacct gaccgactct gagatggacg tcgtcagatt cgacgacgat
2880
aacagcccca gcttcatcca gatcagaagc gtggccaaga agcaccccaa gacctgggtg
2940
cactatatcg ccgccgagga agaggactgg gattacgctc ctctggtgct ggcccctgac
3000
gacagaagct acaagagcca gtacctgaac aacggccctc agcggatcgg ccggaagtat
3060
aagaaagtgc ggttcatggc ctacaccgac gagacattca agaccagaga ggccatccag
3120
cacgagagcg gaattctggg ccctctgctg tatggcgaag tgggcgatac actgctgatc
3180
atcttcaaga accaggccag cagaccctac aacatctacc ctcacggcat caccgatgtg
3240
cggcccctgt attctagaag gctgcccaag ggcgtgaagc acctgaagga cttccctatc
3300
ctgcctggcg agattttcaa gtacaagtgg accgtgaccg tggaagatgg ccccaccaag
3360
agcgacccta gatgtctgac acggtactac agcagcttcg tgaacatgga acgcgacctg
3420
gccagcggcc tgattggacc tctgctgatc tgctacaaag aaagcgtgga ccagcggggc
3480
aaccagatca tgagcgacaa gcggaacgtg atcctgttta gcgtgttcga tgagaaccgg
3540
tcctggtatc tgaccgagaa catccagcgg tttctgccca atcctgccgg ggtgcaactg
3600
gaagatcctg agttccaggc aagcaacatc atgcactcca tcaatggcta tgtgttcgac
3660
agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact ggtacatcct gagcattggc
3720
gcccagaccg acttcctgtc cgtgttcttt agcggctaca ccttcaagca caagatggtg
3780
tacgaggata ccctgacact gttcccattc agcggcgaga cagtgttcat gagcatggaa
3840
aaccccggcc tgtggattct gggctgtcac aacagcgact tccggaacag aggcatgaca
3900
gccctgctga aggtgtccag ctgcgacaag aacaccggcg actactacga ggacagctat
3960
gaggacatca gcgcctacct gctgagcaag aacaatgcca tcgagcctcg gagcttcagc
4020
cagaatcctc ctgtgctgaa gcggcaccag cgcgagatca ccagaacaac cctgcagagc
4080
gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc
4140
gacatctacg acgaggacga gaatcagagc cccagaagct ttcagaaaaa gacccggcac
4200
tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg
4260
ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag
4320
ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc
4380
ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat
4440
caggctagcc ggccttacag cttctacagc tccctgatca gctacgaaga ggaccagaga
4500
cagggcgctg agcccagaaa gaacttcgtg aagcccaacg agactaagac ctacttttgg
4560
aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac
4620
ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg
4680
tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc
4740
ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg
4800
aactgcagag ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg
4860
ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat
4920
cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac
4980
ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat
5040
ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga
5100
gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac
5160
agcaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc
5220
accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctacagcggc
5280
agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct
5340
cccatgatca tccacggaat caagacccag ggcgccagac agaagttcag cagcctgtac
5400
atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacagaggc
5460
aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac
5520
aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc
5580
atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc
5640
ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc
5700
aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac
5760
gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc
5820
atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg
5880
aaagagttcc tgatctccag cagccaggac ggccatcagt ggaccctgtt tttccagaac
5940
ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg
6000
gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc
6060
gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc
6120
atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa
6180
atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta
6240
gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg
6300
ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact
6360
atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg
6420
cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag
6480
aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa
6540
cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc
6600
ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg
6660
ctaggttgct gggcactgat aattccgtgg tgttgtcatc gattccataa agtaggaaac
6720
actacacgat tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca
6780
gttaactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt
6840
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca
6900
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga
6960
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cggcgcgccg
7020
catggctacg tagataagta gcatggcggg ttaatcatta actacacctg caggaggaac
7080
ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc
7140
gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg
7200
caggtcgacg ctagcagctg atgcatagca tgcggtaccg ggagatgggg gaggctaact
7260
gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag
7320
aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg
7380
gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg tttcttcctt
7440
ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc
7500
ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact atagctagag
7560
tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac cacttcatcc
7620
ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc ctgaagccag
7680
ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa tgcctgacga
7740
tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc ctcgacttcg
7800
ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc acgaacccag
7860
ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg ctcacgcaac
7920
tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt tttcatggct
7980
tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca agcgcgttac
8040
gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca gcaacgatgt
8100
tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcatcattcg
8160
cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg atcttttcgg
8220
tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg attacctcgg
8280
gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag aagcggttgt
8340
tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg agatctatat
8400
ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg cgctcatcaa
8460
tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc aagcagatta
8520
cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagtgatgca
8580
ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga tcggcttccc
8640
ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt accatgccct
8700
tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga agagtttgct
8760
ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga tttcagttta
8820
caactattct gtctagttta agactttatt gtcatagttt agatctattt tgttcagttt
8880
aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta ctcaaccgta
8940
accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca gatgcgtaag
9000
gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt
9060
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga
9120
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg
9180
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa
9240
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt
9300
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct
9360
gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct
9420
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc
9480
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt
9540
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc
9600
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat
9660
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa
9720
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa
9780
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga
9840
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct
9900
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga
9960
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc
10020
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg
10080
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat
10140
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat
10200
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg
10260
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc
10320
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa
10380
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc
10440
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt
10500
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag
10560
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt
10620
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag
10680
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac
10740
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc
10800
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca
10860
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg
10920
ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt
10980
aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg
11040
caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg
11100
gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta
11160
tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg
11220
ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa
11280
gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct
11340
ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct
11400
acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc agtcaattac
11460
aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag aa
11512
<210> 202
<211> 10563
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 202
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg
300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag
360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc
420
cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac
480
cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca
540
catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt
600
aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc
660
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag
720
gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg
780
ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg
840
ttggtttaaa ccgcagccac catgcagatc gagctgtcta cctgcttctt cctgtgcctg
900
ctgcggttct gcttcagcgc caccagaaga tattacctgg gcgccgtgga actgagctgg
960
gactacatgc agtctgacct gggagagctg cccgtggacg ctagatttcc tccaagagtg
1020
cccaagagct tccccttcaa cacctccgtg gtgtacaaga aaaccctgtt cgtggaattc
1080
accgaccacc tgttcaatat cgccaagcct cggcctcctt ggatgggact gctgggacct
1140
acaattcagg ccgaggtgta cgacaccgtg gtcatcaccc tgaagaacat ggccagccat
1200
cctgtgtctc tgcacgccgt gggagtgtct tattggaagg cttctgaggg cgccgagtac
1260
gacgatcaga caagccagag agagaaagag gacgacaagg ttttccctgg cggcagccac
1320
acctatgtct ggcaggtcct gaaagaaaac ggccctatgg cctccgatcc tctgtgcctg
1380
acatacagct acctgagcca cgtggacctg gtcaaggacc tgaattctgg cctgatcgga
1440
gccctgctcg tgtgtagaga aggcagcctg gccaaagaga aaacccagac actgcacaag
1500
ttcatcctgc tgttcgccgt gttcgacgag ggcaagagct ggcacagcga gacaaagaac
1560
agcctgatgc aggacaggga tgccgcctct gctagagctt ggcctaagat gcacaccgtg
1620
aacggctacg tgaacagaag cctgcctgga ctgatcggct gccacagaaa gtccgtgtac
1680
tggcacgtga tcggcatggg cacaacacct gaggtgcaca gcatctttct ggaaggccac
1740
accttcctcg tgcggaacca cagacaggcc agcctggaaa tcagccctat caccttcctg
1800
accgctcaga ccctgctgat ggatctgggc cagtttctgc tgttctgcca catcagctcc
1860
caccagcacg atggcatgga agcctacgtg aaggtggaca gctgccccga agaaccccag
1920
ctgcggatga agaacaacga ggaagccgag gactacgacg acgacctgac cgactctgag
1980
atggacgtcg tcagattcga cgacgataac agccccagct tcatccagat cagaagcgtg
2040
gccaagaagc accccaagac ctgggtgcac tatatcgccg ccgaggaaga ggactgggat
2100
tacgctcctc tggtgctggc ccctgacgac agaagctaca agagccagta cctgaacaac
2160
ggccctcagc ggatcggccg gaagtataag aaagtgcggt tcatggccta caccgacgag
2220
acattcaaga ccagagaggc catccagcac gagagcggaa ttctgggccc tctgctgtat
2280
ggcgaagtgg gcgatacact gctgatcatc ttcaagaacc aggccagcag accctacaac
2340
atctaccctc acggcatcac cgatgtgcgg cccctgtatt ctagaaggct gcccaagggc
2400
gtgaagcacc tgaaggactt ccctatcctg cctggcgaga ttttcaagta caagtggacc
2460
gtgaccgtgg aagatggccc caccaagagc gaccctagat gtctgacacg gtactacagc
2520
agcttcgtga acatggaacg cgacctggcc agcggcctga ttggacctct gctgatctgc
2580
tacaaagaaa gcgtggacca gcggggcaac cagatcatga gcgacaagcg gaacgtgatc
2640
ctgtttagcg tgttcgatga gaaccggtcc tggtatctga ccgagaacat ccagcggttt
2700
ctgcccaatc ctgccggggt gcaactggaa gatcctgagt tccaggcaag caacatcatg
2760
cactccatca atggctatgt gttcgacagc ctgcagctga gcgtgtgcct gcacgaagtg
2820
gcctactggt acatcctgag cattggcgcc cagaccgact tcctgtccgt gttctttagc
2880
ggctacacct tcaagcacaa gatggtgtac gaggataccc tgacactgtt cccattcagc
2940
ggcgagacag tgttcatgag catggaaaac cccggcctgt ggattctggg ctgtcacaac
3000
agcgacttcc ggaacagagg catgacagcc ctgctgaagg tgtccagctg cgacaagaac
3060
accggcgact actacgagga cagctatgag gacatcagcg cctacctgct gagcaagaac
3120
aatgccatcg agcctcggag cttcagccag aatcctcctg tgctgaagcg gcaccagcgc
3180
gagatcacca gaacaaccct gcagagcgac caagaggaaa tcgattacga cgacaccatc
3240
agcgtcgaga tgaagaaaga agatttcgac atctacgacg aggacgagaa tcagagcccc
3300
agaagctttc agaaaaagac ccggcactac ttcattgccg ccgtcgagag actgtgggac
3360
tacggcatgt ctagcagccc tcacgtgctg agaaatagag cccagagcgg cagcgtgccc
3420
cagttcaaga aagtggtgtt ccaagagttc accgacggca gcttcaccca gccactgtat
3480
agaggcgagc tgaacgagca tctgggcctg ctgggccctt atatcagagc cgaagtggaa
3540
gataacatca tggtcacctt ccggaatcag gctagccggc cttacagctt ctacagctcc
3600
ctgatcagct acgaagagga ccagagacag ggcgctgagc ccagaaagaa cttcgtgaag
3660
cccaacgaga ctaagaccta cttttggaag gtgcagcacc acatggcccc tacaaaggac
3720
gagttcgact gcaaagcctg ggcctacttc tccgatgtgg atctggaaaa ggacgtgcac
3780
agcgggctca tcggaccact gcttgtgtgc cacaccaaca cactgaaccc cgctcacggc
3840
agacaagtga cagtgcaaga gttcgccctg ttcttcacca tcttcgacga aacaaagagc
3900
tggtacttca ccgagaatat ggaacggaac tgcagagccc cttgcaacat ccagatggaa
3960
gatcccacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacaca
4020
ctgcccggcc tggttatggc ccaggatcag agaatccggt ggtatctgct gtccatgggc
4080
tccaacgaga atatccacag catccacttc agcggccacg tgttcaccgt gcggaaaaaa
4140
gaagagtaca aaatggccct gtacaatctg taccctgggg tgttcgaaac cgtggaaatg
4200
ctgccttcca aggccggcat ttggagagtg gaatgtctga ttggagagca cctccacgcc
4260
ggaatgagca ccctgtttct ggtgtacagc aacaagtgtc agacccctct cggcatggcc
4320
tctggacaca tcagagactt ccagatcacc gcctctggcc agtacggaca gtgggctcct
4380
aaactggctc ggctgcacta cagcggcagc atcaatgcct ggtccaccaa agagcccttc
4440
agctggatca aggtggacct gctggctccc atgatcatcc acggaatcaa gacccagggc
4500
gccagacaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac
4560
ggcaagaagt ggcagaccta cagaggcaac agcaccggca cactcatggt gttcttcggc
4620
aacgtggact ccagcggcat taagcacaac atcttcaacc ctccaatcat tgcccggtac
4680
atccggctgc accccacaca ctacagcatc cggtctaccc tgagaatgga actgatgggc
4740
tgcgacctga acagctgctc tatgcccctc ggaatggaaa gcaaggccat cagcgacgcc
4800
cagatcacag ccagcagcta cttcaccaac atgttcgcca cttggagccc ctccaaggct
4860
agactgcatc tgcagggcag aagcaacgct tggaggcccc aagtgaacaa ccccaaagag
4920
tggctgcagg ttgactttca aaagaccatg aaagtgaccg gcgtgaccac acagggcgtc
4980
aagtctctgc tgacctctat gtacgtgaaa gagttcctga tctccagcag ccaggacggc
5040
catcagtgga ccctgttttt ccagaacggc aaagtgaaag tgttccaggg caatcaggac
5100
agcttcacac ccgtggtcaa ttctctggac cctccactgc tgaccagata cctgcggatt
5160
caccctcagt cttgggtgca ccagatcgct ctgcggatgg aagtgctggg ctgtgaagct
5220
caggacctct actagttaat taagagcatc ttaccgccat ttattcccat atttgttctg
5280
tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt
5340
tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta
5400
agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt
5460
gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg
5520
ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt
5580
ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg
5640
tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc
5700
aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg
5760
cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt
5820
tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga
5880
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt
5940
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg
6000
attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg
6060
gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct
6120
agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc
6180
aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg
6240
ggcgcgcctc gagccatggt gctagcagct gatgcatagc atgcggtacc gggagatggg
6300
ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa
6360
taaaaagaca gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg
6420
tcccagggct ggcactctgt cgatacccca ccgagacccc attgggacca atacgcccgc
6480
gtttcttcct tttccccacc ccaaccccca agttcgggtg aaggcccagg gctcgcagcc
6540
aacgtcgggg cggcaagccc tgccatagcc actacgggta cgtaggccaa ccactagaac
6600
tatagctaga gtcctgggcg aacaaacgat gctcgccttc cagaaaaccg aggatgcgaa
6660
ccacttcatc cggggtcagc accaccggca agcgccgcga cggccgaggt ctaccgatct
6720
cctgaagcca gggcagatcc gtgcacagca ccttgccgta gaagaacagc aaggccgcca
6780
atgcctgacg atgcgtggag accgaaacct tgcgctcgtt cgccagccag gacagaaatg
6840
cctcgacttc gctgctgccc aaggttgccg ggtgacgcac accgtggaaa cggatgaagg
6900
cacgaaccca gttgacataa gcctgttcgg ttcgtaaact gtaatgcaag tagcgtatgc
6960
gctcacgcaa ctggtccaga accttgaccg aacgcagcgg tggtaacggc gcagtggcgg
7020
ttttcatggc ttgttatgac tgtttttttg tacagtctat gcctcgggca tccaagcagc
7080
aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc
7140
agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaggtgg ctcaagtatg
7200
ggcatcattc gcacatgtag gctcggccct gaccaagtca aatccatgcg ggctgctctt
7260
gatcttttcg gtcgtgagtt cggagacgta gccacctact cccaacatca gccggactcc
7320
gattacctcg ggaacttgct ccgtagtaag acattcatcg cgcttgctgc cttcgaccaa
7380
gaagcggttg ttggcgctct cgcggcttac gttctgccca ggtttgagca gccgcgtagt
7440
gagatctata tctatgatct cgcagtctcc ggcgagcacc ggaggcaggg cattgccacc
7500
gcgctcatca atctcctcaa gcatgaggcc aacgcgcttg gtgcttatgt gatctacgtg
7560
caagcagatt acggtgacga tcccgcagtg gctctctata caaagttggg catacgggaa
7620
gaagtgatgc actttgatat cgacccaagt accgccacct aacaattcgt tcaagccgag
7680
atcggcttcc cggccgcgga gttgttcggt aaattgtcac aacgccgcga atatagtctt
7740
taccatgccc ttggccacgc ccctctttaa tacgacgggc aatttgcact tcagaaaatg
7800
aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat aactggactg
7860
atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt tagatctatt
7920
ttgttcagtt taagacttta ttgtccgccc acacccgctt acgcagggca tccatttatt
7980
actcaaccgt aaccgatttt gccaggttac gcggctggtc tgcggtgtga aataccgcac
8040
agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg
8100
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg
8160
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag
8220
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac
8280
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga
8340
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt
8400
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc
8460
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc
8520
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta
8580
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat
8640
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca
8700
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct
8760
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt
8820
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct
8880
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc
8940
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa
9000
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta
9060
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc
9120
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat
9180
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta
9240
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt
9300
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt
9360
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg
9420
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc
9480
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc
9540
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg
9600
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga
9660
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta
9720
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct
9780
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag
9840
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga
9900
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat
9960
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt
10020
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag
10080
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt
10140
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga
10200
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg
10260
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct
10320
tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc
10380
gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt
10440
aatgcgccgc tacagggcgc gtcccattcg ccattcaggc tgcaaataag cgttgatatt
10500
cagtcaatta caaacattaa taacgaagag atgacagaaa aattttcatt ctgtgacaga
10560
gaa
10563
<210> 203
<211> 9871
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 203
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gagtttgctg cttgcaatgt ttgcccattt tagggtggac
240
acaggacgct gtggtttctg agccaggggg cgactcagat cccagccagt ggacttagcc
300
cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc
360
gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct
420
tcaggcacca ccactgacct gggacagtga atcgccacca tgcagattga gctgagcacc
480
tgcttcttcc tgtgcctgct gaggttctgc ttctctgcca ccaggagata ctacctgggg
540
gctgtggagc tgagctggga ctacatgcag tctgacctgg gggagctgcc tgtggatgcc
600
aggttccccc ccagagtgcc caagagcttc cccttcaaca cctctgtggt gtacaagaag
660
accctgtttg tggagttcac tgaccacctg ttcaacattg ccaagcccag gcccccctgg
720
atgggcctgc tgggccccac catccaggct gaggtgtatg acactgtggt gatcaccctg
780
aagaacatgg ccagccaccc tgtgagcctg catgctgtgg gggtgagcta ctggaaggcc
840
tctgaggggg ctgagtatga tgaccagacc agccagaggg agaaggagga tgacaaggtg
900
ttccctgggg gcagccacac ctatgtgtgg caggtgctga aggagaatgg ccccatggcc
960
tctgaccccc tgtgcctgac ctacagctac ctgagccatg tggacctggt gaaggacctg
1020
aactctggcc tgattggggc cctgctggtg tgcagggagg gcagcctggc caaggagaag
1080
acccagaccc tgcacaagtt catcctgctg tttgctgtgt ttgatgaggg caagagctgg
1140
cactctgaaa ccaagaacag cctgatgcag gacagggatg ctgcctctgc cagggcctgg
1200
cccaagatgc acactgtgaa tggctatgtg aacaggagcc tgcctggcct gattggctgc
1260
cacaggaagt ctgtgtactg gcatgtgatt ggcatgggca ccacccctga ggtgcacagc
1320
atcttcctgg agggccacac cttcctggtc aggaaccaca ggcaggccag cctggagatc
1380
agccccatca ccttcctgac tgcccagacc ctgctgatgg acctgggcca gttcctgctg
1440
ttctgccaca tcagcagcca ccagcatgat ggcatggagg cctatgtgaa ggtggacagc
1500
tgccctgagg agccccagct gaggatgaag aacaatgagg aggctgagga ctatgatgat
1560
gacctgactg actctgagat ggatgtggtg aggtttgatg atgacaacag ccccagcttc
1620
atccagatca ggtctgtggc caagaagcac cccaagacct gggtgcacta cattgctgct
1680
gaggaggagg actgggacta tgcccccctg gtgctggccc ctgatgacag gagctacaag
1740
agccagtacc tgaacaatgg cccccagagg attggcagga agtacaagaa ggtcaggttc
1800
atggcctaca ctgatgaaac cttcaagacc agggaggcca tccagcatga gtctggcatc
1860
ctgggccccc tgctgtatgg ggaggtgggg gacaccctgc tgatcatctt caagaaccag
1920
gccagcaggc cctacaacat ctacccccat ggcatcactg atgtgaggcc cctgtacagc
1980
aggaggctgc ccaagggggt gaagcacctg aaggacttcc ccatcctgcc tggggagatc
2040
ttcaagtaca agtggactgt gactgtggag gatggcccca ccaagtctga ccccaggtgc
2100
ctgaccagat actacagcag ctttgtgaac atggagaggg acctggcctc tggcctgatt
2160
ggccccctgc tgatctgcta caaggagtct gtggaccaga ggggcaacca gatcatgtct
2220
gacaagagga atgtgatcct gttctctgtg tttgatgaga acaggagctg gtacctgact
2280
gagaacatcc agaggttcct gcccaaccct gctggggtgc agctggagga ccctgagttc
2340
caggccagca acatcatgca cagcatcaat ggctatgtgt ttgacagcct gcagctgtct
2400
gtgtgcctgc atgaggtggc ctactggtac atcctgagca ttggggccca gactgacttc
2460
ctgtctgtgt tcttctctgg ctacaccttc aagcacaaga tggtgtatga ggacaccctg
2520
accctgttcc ccttctctgg ggagactgtg ttcatgagca tggagaaccc tggcctgtgg
2580
attctgggct gccacaactc tgacttcagg aacaggggca tgactgccct gctgaaagtc
2640
tccagctgtg acaagaacac tggggactac tatgaggaca gctatgagga catctctgcc
2700
tacctgctga gcaagaacaa tgccattgag cccaggagct tcagccagaa ccccccagtg
2760
ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt
2820
gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag
2880
gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt cattgctgct
2940
gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc
3000
cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc
3060
ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac
3120
atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc
3180
tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc
3240
aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac
3300
atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac
3360
ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc
3420
ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc
3480
tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc
3540
tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat
3600
ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg
3660
tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg
3720
ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg
3780
tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt
3840
ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag
3900
acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag
3960
tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg
4020
agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat
4080
ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc
4140
atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc
4200
ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc
4260
cccatcattg ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg
4320
aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc
4380
aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc
4440
tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag
4500
gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg
4560
gtgaccaccc agggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc
4620
agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg
4680
ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg
4740
accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag
4800
gtgctgggct gtgaggccca ggacctgtac tgaaataaaa gatctttatt ttcattagat
4860
ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt
4920
taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct
4980
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
5040
cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa
5100
gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact
5160
tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt
5220
tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa
5280
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa
5340
tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa
5400
gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta
5460
cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc
5520
acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat
5580
gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt
5640
ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact
5700
gaatatcaac gcttatttgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat
5760
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag
5820
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc
5880
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc
5940
ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt
6000
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa
6060
caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg
6120
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat
6180
taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt
6240
tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc
6300
ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc
6360
ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa
6420
aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg
6480
gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag
6540
ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc
6600
gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta
6660
cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg
6720
cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca
6780
acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac
6840
caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat
6900
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg
6960
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata
7020
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta
7080
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa
7140
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag
7200
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg
7260
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact
7320
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg
7380
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc
7440
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata
7500
ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta
7560
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc
7620
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg
7680
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac
7740
agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg
7800
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt
7860
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct
7920
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg
7980
ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata
8040
accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca
8100
gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc
8160
tgtgcggtat ttcacaccgc agaccagccg cgtaacctgg caaaatcggt tacggttgag
8220
taataaatgg atgccctgcg taagcgggtg tgggcggaca ataaagtctt aaactgaaca
8280
aaatagatct aaactatgac aataaagtct taaactagac agaatagttg taaactgaaa
8340
tcagtccagt tatgctgtga aaaagcatac tggacttttg ttatggctaa agcaaactct
8400
tcattttctg aagtgcaaat tgcccgtcgt attaaagagg ggcgtggcca agggcatggt
8460
aaagactata ttcgcggcgt tgtgacaatt taccgaacaa ctccgcggcc gggaagccga
8520
tctcggcttg aacgaattgt taggtggcgg tacttgggtc gatatcaaag tgcatcactt
8580
cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt
8640
gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg
8700
cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct
8760
cactacgcgg ctgctcaaac ctgggcagaa cgtaagccgc gagagcgcca acaaccgctt
8820
cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat
8880
cggagtccgg ctgatgttgg gagtaggtgg ctacgtctcc gaactcacga ccgaaaagat
8940
caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc
9000
ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc
9060
tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct
9120
tgctgcttgg atgcccgagg catagactgt acaaaaaaac agtcataaca agccatgaaa
9180
accgccactg cgccgttacc accgctgcgt tcggtcaagg ttctggacca gttgcgtgag
9240
cgcatacgct acttgcatta cagtttacga accgaacagg cttatgtcaa ctgggttcgt
9300
gccttcatcc gtttccacgg tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag
9360
gcatttctgt cctggctggc gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca
9420
ttggcggcct tgctgttctt ctacggcaag gtgctgtgca cggatctgcc ctggcttcag
9480
gagatcggaa gacctcggcc gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg
9540
gttcgcatcc tcggttttct ggaaggcgag catcgtttgt tcgcccagga ctctagctat
9600
agttctagtg gttggctacg tatactccgg aatattaata gatcatggag ataattaaaa
9660
tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa
9720
aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg gatctcggtc
9780
cgaaaccatg tcgtactacc atcaccatca ccatcacgat tacgatatcc caacgaccga
9840
aaacctgtat tttcagggcg ccatgggatc c
9871
<210> 204
<211> 9969
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 204
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gagtctgtct gcacatttcg tagagcgagt gttccgatac
240
tctaatctcc ctaggcaagg ttcatattga cttaggttac ttattctcct tttgttgact
300
aagtcaataa tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt
360
tggaaggagg gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc
420
tcctgctagc aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat
480
ggcccttgcg tgccttgaat tactgacact gacatccact ttttcttttt ctccacaggt
540
ttaaacgcca ccatgcagat tgagctgagc acctgcttct tcctgtgtct gctgaggttc
600
tgcttctctg ccaccaggag gtattacctg ggggctgtgg agctgagctg ggactatatg
660
cagtctgacc tgggggagct gcctgtggat gctaggttcc cccccagggt gcccaagagc
720
ttccccttta acacttctgt ggtgtacaag aagaccctgt ttgtggagtt cactgaccac
780
ctgttcaaca ttgccaagcc caggcccccc tggatggggc tgctggggcc caccatccag
840
gctgaggtgt atgacactgt ggtgatcacc ctgaagaaca tggccagcca ccctgtgagc
900
ctgcatgctg tgggggtgag ctactggaag gcttctgagg gggctgagta tgatgaccag
960
actagccaga gggagaagga ggatgacaag gtgtttcctg ggggcagcca tacctatgtg
1020
tggcaggtgc tgaaggagaa tggccccatg gcctctgacc ccctgtgcct gacctacagc
1080
tacctgtctc atgtggacct ggtgaaggac ctgaactctg gcctgattgg ggctctgctg
1140
gtgtgtaggg agggcagcct ggctaaggaa aagacccaga ccctgcataa gtttatcctg
1200
ctgtttgctg tgtttgatga gggcaagagc tggcactctg agaccaagaa cagcctgatg
1260
caggataggg atgctgcctc tgccagggct tggcctaaga tgcacactgt gaatgggtat
1320
gtgaatagga gcctgcctgg cctgattggc tgccacagga agtctgtgta ctggcatgtg
1380
attgggatgg gcaccacccc tgaggtccat agcatcttcc tggagggcca cactttcctg
1440
gtgaggaacc acagacaggc ctctctggag atctctccca tcaccttcct gactgctcag
1500
actctgctga tggacctggg ccagttcctg ctgttttgcc atattagcag ccaccagcat
1560
gatgggatgg aggcctatgt gaaggtggat agctgccctg aggagcctca gctgaggatg
1620
aagaacaatg aggaggctga agactatgat gatgacctga ctgattctga gatggatgtg
1680
gtgaggtttg atgatgacaa tagccccagc ttcattcaga tcaggtctgt ggccaagaaa
1740
caccccaaga cctgggtgca ctacattgct gctgaggaag aggactggga ctatgctccc
1800
ctggtgctgg cccctgatga taggtcttat aagagccagt acctgaacaa tgggccccag
1860
aggattggca ggaagtacaa gaaggtgagg ttcatggcct acactgatga aaccttcaaa
1920
accagggagg ccattcagca tgagtctggc atcctgggcc ctctgctgta tggggaggtg
1980
ggggacaccc tgctgatcat cttcaagaac caggccagca ggccctacaa catctatcct
2040
catggcatca ctgatgtgag gcccctgtac agcaggaggc tgcccaaggg ggtgaagcac
2100
ctgaaagact tccccatcct gcctggggag atctttaagt ataagtggac tgtgactgtg
2160
gaggatggcc ctaccaagtc tgaccccagg tgtctgacca ggtactattc tagctttgtg
2220
aacatggaga gggacctggc ctctggcctg attgggcccc tgctgatctg ctacaaggag
2280
tctgtggacc agaggggcaa ccagatcatg tctgacaaga ggaatgtgat cctgttttct
2340
gtgtttgatg agaataggag ctggtacctg actgagaaca tccagaggtt tctgcccaat
2400
cctgctgggg tgcagctgga ggatcctgag ttccaggcca gcaatatcat gcatagcatc
2460
aatggctatg tgtttgacag cctgcagctg tctgtgtgcc tgcatgaggt ggcctactgg
2520
tacatcctga gcattggggc ccagactgac tttctgtctg tgttcttttc tggctatacc
2580
ttcaagcaca agatggtgta tgaggatacc ctgaccctgt tccccttctc tggggagact
2640
gtgttcatga gcatggagaa tcctgggctg tggatcctgg ggtgccacaa ctctgatttt
2700
aggaacaggg ggatgactgc cctgctgaag gtgtctagct gtgataagaa cactggggac
2760
tactatgagg acagctatga ggacatttct gcttatctgc tgtctaagaa taatgccatt
2820
gagcccagaa gcttcagcca gaatccccct gtgctgaaga gacatcagag ggagatcacc
2880
agaactaccc tgcagtctga tcaggaggag attgactatg atgacactat ctctgtggag
2940
atgaagaagg aggactttga catctatgat gaggatgaga atcagtctcc caggagcttt
3000
cagaagaaga ccagacatta cttcattgct gctgtggaga ggctgtggga ctatggcatg
3060
agctctagcc ctcatgtgct gaggaacagg gcccagtctg gctctgtgcc ccagttcaag
3120
aaggtggtgt tccaggaatt cactgatggc agcttcaccc agcccctgta caggggggag
3180
ctgaatgagc acctgggcct gctggggcct tatatcaggg ctgaggtgga ggataatatt
3240
atggtgactt tcaggaacca ggccagcagg ccctactctt tctatagcag cctgatctct
3300
tatgaggagg atcagaggca gggggctgag cctaggaaga actttgtgaa gcccaatgag
3360
actaagacct acttctggaa ggtccagcac cacatggccc ctaccaagga tgagtttgac
3420
tgcaaggcct gggcctattt ctctgatgtg gatctggaga aggatgtcca ttctgggctg
3480
attggccccc tgctggtgtg ccacactaac actctgaatc ctgcccatgg caggcaggtg
3540
actgtccagg agtttgccct gttcttcact atctttgatg agaccaagag ctggtacttt
3600
actgagaaca tggagaggaa ctgcagagct ccttgcaata ttcagatgga ggaccccacc
3660
ttcaaggaga attacaggtt ccatgccatt aatgggtaca tcatggacac cctgcctggc
3720
ctggtgatgg ctcaggacca gaggatcagg tggtacctgc tgagcatggg ctctaatgag
3780
aatatccaca gcatccactt ctctgggcat gtgttcactg tgaggaagaa ggaggagtac
3840
aagatggctc tgtataatct gtaccctggg gtgtttgaaa ctgtggagat gctgccctct
3900
aaggctggca tctggagggt ggagtgcctg attggggagc acctgcatgc tggcatgagc
3960
accctgttcc tggtgtacag caacaagtgc cagacccccc tgggcatggc ctctggccac
4020
atcagggact tccagatcac tgcctctggc cagtatggcc agtgggcccc caagctggcc
4080
aggctgcact attctggcag catcaatgcc tggagcacca aggagccctt cagctggatc
4140
aaggtggacc tgctggcccc catgatcatt catggcatca agacccaggg ggccaggcag
4200
aagttcagct ctctgtacat ctctcagttc atcatcatgt actctctgga tgggaagaag
4260
tggcagacct acaggggcaa cagcactggc accctgatgg tgttctttgg gaatgtggac
4320
tcttctggca tcaagcacaa catcttcaat ccccccatca ttgctaggta tattaggctg
4380
catcccaccc actacagcat caggtctacc ctgaggatgg agctgatggg ctgtgacctg
4440
aactcttgca gcatgcccct gggcatggag tctaaggcca tctctgatgc ccagattact
4500
gccagcagct acttcaccaa catgtttgcc acctggagcc cctctaaggc caggctgcat
4560
ctgcagggga ggagcaatgc ctggaggcct caggtgaaca accccaagga gtggctgcag
4620
gtggatttcc agaagaccat gaaggtgact ggggtgacca cccagggggt caagagcctg
4680
ctgaccagca tgtatgtgaa ggagttcctg atcagcagca gccaggatgg ccaccagtgg
4740
actctgttct ttcagaatgg gaaggtgaag gtgtttcagg gcaatcagga ctctttcacc
4800
cctgtggtga acagcctgga cccccccctg ctgaccagat acctgaggat ccacccccag
4860
tcttgggtgc atcagattgc cctgaggatg gaggtgctgg gctgtgaggc tcaggatctg
4920
tactgagcgg ccgcaataaa agatcagagc tctagagatc tgtgtgttgg ttttttgtgt
4980
tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag
5040
gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag
5100
gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag
5160
ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gtactagagg
5220
atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac
5280
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca
5340
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt
5400
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc
5460
tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tccaaactat
5520
tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc atctattttg
5580
tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt tcccaactat
5640
tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa acatcctgcc
5700
aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga atgaaaattt
5760
ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc ttatttgcag
5820
cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt
5880
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt
5940
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc
6000
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga
6060
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc
6120
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt
6180
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct
6240
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa tttcaggtgg
6300
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa
6360
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa
6420
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct
6480
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg
6540
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg
6600
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt
6660
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga
6720
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga
6780
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac
6840
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg
6900
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac
6960
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct
7020
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct
7080
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg
7140
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat
7200
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg
7260
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat
7320
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct
7380
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa
7440
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa
7500
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc
7560
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta
7620
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct
7680
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg
7740
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag
7800
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc
7860
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg
7920
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt
7980
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg
8040
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca
8100
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg
8160
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc
8220
ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag
8280
accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat gccctgcgta
8340
agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa actatgacaa
8400
taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta tgctgtgaaa
8460
aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa gtgcaaattg
8520
cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt cgcggcgttg
8580
tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgaattgtta
8640
ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc ccaactttgt
8700
atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca cataagcacc
8760
aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cctgcctccg
8820
gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct gctcaaacct
8880
gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg cagcaagcgc
8940
gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct gatgttggga
9000
gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gcatggattt
9060
gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc cacctaactt
9120
tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca tcgttgctgc
9180
tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat gcccgaggca
9240
tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac
9300
cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca
9360
gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttccacggtg
9420
tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga
9480
acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct
9540
acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt
9600
cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg
9660
aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt tggctacgta
9720
tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa
9780
taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tattccggat
9840
tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc gtactaccat
9900
caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt tcagggcgcc
9960
atgggatcc
9969
<210> 205
<211> 10063
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 205
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gaggaaccat tgccaccttc agggggaggc tgctggtgaa
240
tattaaccaa gatcacccca gttaccggag gagcaaacag ggactaagtt cacacgcgtg
300
gtaccgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tccctaggca
360
aggttcatat ttgtgtaggt tacttattct ccttttgttg actaagtcaa taatcagaat
420
cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg agggggtata
480
aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgaa gaggtaaggg
540
tttaagttat cgttagttcg tgcaccatta atgtttaatt acctggagca cctgcctgaa
600
atcatttttt tttcaggttg gctagtatgc agatcgagct ctccacctgc ttctttctgt
660
gcctgttgag attctgcttc agcgccacca ggagatacta cctgggggct gtggagctga
720
gctgggacta catgcagtct gacctggggg agctgcctgt ggatgccagg ttccccccca
780
gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta caagaagacc ctgtttgtgg
840
agttcactga ccacctgttc aacattgcca agcccaggcc cccctggatg ggcctgctgg
900
gccccaccat ccaggctgag gtgtatgaca ctgtggtgat caccctgaag aacatggcca
960
gccaccctgt gagcctgcat gctgtggggg tgagctactg gaaggcctct gagggggctg
1020
agtatgatga ccagaccagc cagagggaga aggaggatga caaggtgttc cctgggggca
1080
gccacaccta tgtgtggcag gtgctgaagg agaatggccc catggcctct gaccccctgt
1140
gcctgaccta cagctacctg agccatgtgg acctggtgaa ggacctgaac tctggcctga
1200
ttggggccct gctggtgtgc agggagggca gcctggccaa ggagaagacc cagaccctgc
1260
acaagttcat cctgctgttt gctgtgtttg atgagggcaa gagctggcac tctgaaacca
1320
agaacagcct gatgcaggac agggatgctg cctctgccag ggcctggccc aagatgcaca
1380
ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat tggctgccac aggaagtctg
1440
tgtactggca tgtgattggc atgggcacca cccctgaggt gcacagcatc ttcctggagg
1500
gccacacctt cctggtcagg aaccacaggc aggccagcct ggagatcagc cccatcacct
1560
tcctgactgc ccagaccctg ctgatggacc tgggccagtt cctgctgttc tgccacatca
1620
gcagccacca gcatgatggc atggaggcct atgtgaaggt ggacagctgc cctgaggagc
1680
cccagctgag gatgaagaac aatgaggagg ctgaggacta tgatgatgac ctgactgact
1740
ctgagatgga tgtggtgagg tttgatgatg acaacagccc cagcttcatc cagatcaggt
1800
ctgtggccaa gaagcacccc aagacctggg tgcactacat tgctgctgag gaggaggact
1860
gggactatgc ccccctggtg ctggcccctg atgacaggag ctacaagagc cagtacctga
1920
acaatggccc ccagaggatt ggcaggaagt acaagaaggt caggttcatg gcctacactg
1980
atgaaacctt caagaccagg gaggccatcc agcatgagtc tggcatcctg ggccccctgc
2040
tgtatgggga ggtgggggac accctgctga tcatcttcaa gaaccaggcc agcaggccct
2100
acaacatcta cccccatggc atcactgatg tgaggcccct gtacagcagg aggctgccca
2160
agggggtgaa gcacctgaag gacttcccca tcctgcctgg ggagatcttc aagtacaagt
2220
ggactgtgac tgtggaggat ggccccacca agtctgaccc caggtgcctg accagatact
2280
acagcagctt tgtgaacatg gagagggacc tggcctctgg cctgattggc cccctgctga
2340
tctgctacaa ggagtctgtg gaccagaggg gcaaccagat catgtctgac aagaggaatg
2400
tgatcctgtt ctctgtgttt gatgagaaca ggagctggta cctgactgag aacatccaga
2460
ggttcctgcc caaccctgct ggggtgcagc tggaggaccc tgagttccag gccagcaaca
2520
tcatgcacag catcaatggc tatgtgtttg acagcctgca gctgtctgtg tgcctgcatg
2580
aggtggccta ctggtacatc ctgagcattg gggcccagac tgacttcctg tctgtgttct
2640
tctctggcta caccttcaag cacaagatgg tgtatgagga caccctgacc ctgttcccct
2700
tctctgggga gactgtgttc atgagcatgg agaaccctgg cctgtggatt ctgggctgcc
2760
acaactctga cttcaggaac aggggcatga ctgccctgct gaaagtctcc agctgtgaca
2820
agaacactgg ggactactat gaggacagct atgaggacat ctctgcctac ctgctgagca
2880
agaacaatgc cattgagccc aggagcttca gccagaatcc acccgtcctt aagcgccatc
2940
agcgcgagat caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca
3000
ccatctctgt ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga
3060
gccccaggag cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt
3120
gggactatgg catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg
3180
tgccccagtt caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc
3240
tgtacagagg ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg
3300
tggaggacaa catcatggtg accttcagga accaggccag caggccctac agcttctaca
3360
gcagcctgat cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg
3420
tgaagcccaa tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca
3480
aggatgagtt tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg
3540
tgcactctgg cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc
3600
atggcaggca ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca
3660
agagctggta cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga
3720
tggaggaccc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg
3780
acaccctgcc tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca
3840
tgggcagcaa tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga
3900
agaaggagga gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg
3960
agatgctgcc cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc
4020
atgctggcat gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca
4080
tggcctctgg ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg
4140
cccccaagct ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc
4200
ccttcagctg gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc
4260
agggggccag gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc
4320
tggatggcaa gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct
4380
ttggcaatgt ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca
4440
gatacatcag gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga
4500
tgggctgtga cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg
4560
atgcccagat cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca
4620
aggccaggct gcatctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca
4680
aggagtggct gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg
4740
gggtgaagag cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg
4800
atggccacca gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc
4860
aggacagctt cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga
4920
ggattcaccc ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg
4980
aggcccagga cctgtactga ggatccaata aaatatcttt attttcatta catctgtgtg
5040
ttggtttttt gtgtgttttc ctgtaacgat cgggtctaga gcatggctac gtagataagt
5100
agcatggcgg gttaatcatt aactacacct gcaggaggaa cccctagtga tggagttggc
5160
cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg
5220
cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc gcctcgaggc
5280
atgcggtacc aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt
5340
agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat
5400
gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa
5460
tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc
5520
caaactcatc aatgtatctt atcatgtctg gatctgatca ctgatatcgc ctaggagatc
5580
cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag
5640
cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa
5700
aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt
5760
tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt
5820
cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt
5880
ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct
5940
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg
6000
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg
6060
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac
6120
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct
6180
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt
6240
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt
6300
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt
6360
ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa
6420
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac
6480
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg
6540
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc
6600
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg
6660
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga
6720
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc
6780
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag
6840
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga
6900
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg
6960
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga
7020
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt
7080
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact
7140
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt
7200
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg
7260
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta
7320
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac
7380
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta
7440
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt
7500
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt
7560
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt
7620
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc
7680
agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg
7740
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg
7800
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt
7860
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac
7920
tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg
7980
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg
8040
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat
8100
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt
8160
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg
8220
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa
8280
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc
8340
tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg
8400
gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc
8460
ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt
8520
tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct
8580
aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc
8640
caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg
8700
ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa
8760
agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac
8820
cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga
8880
gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat
8940
agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc
9000
caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt
9060
tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac
9120
gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg
9180
tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg
9240
taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg
9300
gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa
9360
caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac
9420
cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc
9480
aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc
9540
agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg
9600
catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg
9660
ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc
9720
ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag
9780
gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa tagatcatgg
9840
agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag
9900
ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ccatcgggcg
9960
cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg attacgatat
10020
cccaacgacc gaaaacctgt attttcaggg cgccatggga tcc
10063
<210> 206
<211> 11668
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 206
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg
240
cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt
300
ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc
360
aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag
420
acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga
480
ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac
540
ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca
600
tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat
660
ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag
720
gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa
780
gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga
840
cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc
900
caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca
960
ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt
1020
gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc
1080
tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa
1140
gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc
1200
agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt
1260
taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga
1320
ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg
1380
actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg
1440
tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatc
1500
gagctgtcta cctgcttctt cctgtgcctg ctgcggttct gcttcagcgc caccagaaga
1560
tattacctgg gcgccgtgga actgagctgg gactacatgc agtctgacct gggagagctg
1620
cccgtggacg ctagatttcc tccaagagtg cccaagagct tccccttcaa cacctccgtg
1680
gtgtacaaga aaaccctgtt cgtggaattc accgaccacc tgttcaatat cgccaagcct
1740
cggcctcctt ggatgggact gctgggacct acaattcagg ccgaggtgta cgacaccgtg
1800
gtcatcaccc tgaagaacat ggccagccat cctgtgtctc tgcacgccgt gggagtgtct
1860
tattggaagg cttctgaggg cgccgagtac gacgatcaga caagccagag agagaaagag
1920
gacgacaagg ttttccctgg cggcagccac acctatgtct ggcaggtcct gaaagaaaac
1980
ggccctatgg cctccgatcc tctgtgcctg acatacagct acctgagcca cgtggacctg
2040
gtcaaggacc tgaattctgg cctgatcgga gccctgctcg tgtgtagaga aggcagcctg
2100
gccaaagaga aaacccagac actgcacaag ttcatcctgc tgttcgccgt gttcgacgag
2160
ggcaagagct ggcacagcga gacaaagaac agcctgatgc aggacaggga tgccgcctct
2220
gctagagctt ggcctaagat gcacaccgtg aacggctacg tgaacagaag cctgcctgga
2280
ctgatcggct gccacagaaa gtccgtgtac tggcacgtga tcggcatggg cacaacacct
2340
gaggtgcaca gcatctttct ggaaggccac accttcctcg tgcggaacca cagacaggcc
2400
agcctggaaa tcagccctat caccttcctg accgctcaga ccctgctgat ggatctgggc
2460
cagtttctgc tgttctgcca catcagctcc caccagcacg atggcatgga agcctacgtg
2520
aaggtggaca gctgccccga agaaccccag ctgcggatga agaacaacga ggaagccgag
2580
gactacgacg acgacctgac cgactctgag atggacgtcg tcagattcga cgacgataac
2640
agccccagct tcatccagat cagaagcgtg gccaagaagc accccaagac ctgggtgcac
2700
tatatcgccg ccgaggaaga ggactgggat tacgctcctc tggtgctggc ccctgacgac
2760
agaagctaca agagccagta cctgaacaac ggccctcagc ggatcggccg gaagtataag
2820
aaagtgcggt tcatggccta caccgacgag acattcaaga ccagagaggc catccagcac
2880
gagagcggaa ttctgggccc tctgctgtat ggcgaagtgg gcgatacact gctgatcatc
2940
ttcaagaacc aggccagcag accctacaac atctaccctc acggcatcac cgatgtgcgg
3000
cccctgtatt ctagaaggct gcccaagggc gtgaagcacc tgaaggactt ccctatcctg
3060
cctggcgaga ttttcaagta caagtggacc gtgaccgtgg aagatggccc caccaagagc
3120
gaccctagat gtctgacacg gtactacagc agcttcgtga acatggaacg cgacctggcc
3180
agcggcctga ttggacctct gctgatctgc tacaaagaaa gcgtggacca gcggggcaac
3240
cagatcatga gcgacaagcg gaacgtgatc ctgtttagcg tgttcgatga gaaccggtcc
3300
tggtatctga ccgagaacat ccagcggttt ctgcccaatc ctgccggggt gcaactggaa
3360
gatcctgagt tccaggcaag caacatcatg cactccatca atggctatgt gttcgacagc
3420
ctgcagctga gcgtgtgcct gcacgaagtg gcctactggt acatcctgag cattggcgcc
3480
cagaccgact tcctgtccgt gttctttagc ggctacacct tcaagcacaa gatggtgtac
3540
gaggataccc tgacactgtt cccattcagc ggcgagacag tgttcatgag catggaaaac
3600
cccggcctgt ggattctggg ctgtcacaac agcgacttcc ggaacagagg catgacagcc
3660
ctgctgaagg tgtccagctg cgacaagaac accggcgact actacgagga cagctatgag
3720
gacatcagcg cctacctgct gagcaagaac aatgccatcg agcctcggag cttcagccag
3780
aatcctcctg tgctgaagcg gcaccagcgc gagatcacca gaacaaccct gcagagcgac
3840
caagaggaaa tcgattacga cgacaccatc agcgtcgaga tgaagaaaga agatttcgac
3900
atctacgacg aggacgagaa tcagagcccc agaagctttc agaaaaagac ccggcactac
3960
ttcattgccg ccgtcgagag actgtgggac tacggcatgt ctagcagccc tcacgtgctg
4020
agaaatagag cccagagcgg cagcgtgccc cagttcaaga aagtggtgtt ccaagagttc
4080
accgacggca gcttcaccca gccactgtat agaggcgagc tgaacgagca tctgggcctg
4140
ctgggccctt atatcagagc cgaagtggaa gataacatca tggtcacctt ccggaatcag
4200
gctagccggc cttacagctt ctacagctcc ctgatcagct acgaagagga ccagagacag
4260
ggcgctgagc ccagaaagaa cttcgtgaag cccaacgaga ctaagaccta cttttggaag
4320
gtgcagcacc acatggcccc tacaaaggac gagttcgact gcaaagcctg ggcctacttc
4380
tccgatgtgg atctggaaaa ggacgtgcac agcgggctca tcggaccact gcttgtgtgc
4440
cacaccaaca cactgaaccc cgctcacggc agacaagtga cagtgcaaga gttcgccctg
4500
ttcttcacca tcttcgacga aacaaagagc tggtacttca ccgagaatat ggaacggaac
4560
tgcagagccc cttgcaacat ccagatggaa gatcccacct tcaaagagaa ctaccggttc
4620
cacgccatca acggctacat catggacaca ctgcccggcc tggttatggc ccaggatcag
4680
agaatccggt ggtatctgct gtccatgggc tccaacgaga atatccacag catccacttc
4740
agcggccacg tgttcaccgt gcggaaaaaa gaagagtaca aaatggccct gtacaatctg
4800
taccctgggg tgttcgaaac cgtggaaatg ctgccttcca aggccggcat ttggagagtg
4860
gaatgtctga ttggagagca cctccacgcc ggaatgagca ccctgtttct ggtgtacagc
4920
aacaagtgtc agacccctct cggcatggcc tctggacaca tcagagactt ccagatcacc
4980
gcctctggcc agtacggaca gtgggctcct aaactggctc ggctgcacta cagcggcagc
5040
atcaatgcct ggtccaccaa agagcccttc agctggatca aggtggacct gctggctccc
5100
atgatcatcc acggaatcaa gacccagggc gccagacaga agttcagcag cctgtacatc
5160
agccagttca tcatcatgta cagcctggac ggcaagaagt ggcagaccta cagaggcaac
5220
agcaccggca cactcatggt gttcttcggc aacgtggact ccagcggcat taagcacaac
5280
atcttcaacc ctccaatcat tgcccggtac atccggctgc accccacaca ctacagcatc
5340
cggtctaccc tgagaatgga actgatgggc tgcgacctga acagctgctc tatgcccctc
5400
ggaatggaaa gcaaggccat cagcgacgcc cagatcacag ccagcagcta cttcaccaac
5460
atgttcgcca cttggagccc ctccaaggct agactgcatc tgcagggcag aagcaacgct
5520
tggaggcccc aagtgaacaa ccccaaagag tggctgcagg ttgactttca aaagaccatg
5580
aaagtgaccg gcgtgaccac acagggcgtc aagtctctgc tgacctctat gtacgtgaaa
5640
gagttcctga tctccagcag ccaggacggc catcagtgga ccctgttttt ccagaacggc
5700
aaagtgaaag tgttccaggg caatcaggac agcttcacac ccgtggtcaa ttctctggac
5760
cctccactgc tgaccagata cctgcggatt caccctcagt cttgggtgca ccagatcgct
5820
ctgcggatgg aagtgctggg ctgtgaagct caggacctct actagttaat taagagcatc
5880
ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg
5940
ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt
6000
caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc
6060
ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg
6120
ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt
6180
cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg
6240
agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc
6300
ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc
6360
tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta
6420
ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg
6480
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt
6540
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg
6600
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg
6660
atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa
6720
tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg
6780
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag
6840
tgagcgagcg agcgcgcagc tgcctgcagg ggcgcgcctc gaggcatgcg gtaccaagct
6900
tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc
6960
tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt
7020
tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt
7080
cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt
7140
atcttatcat gtctggatct gatcactgat atcgcctagg agatccgaac cagataagtg
7200
aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac
7260
ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc
7320
cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt
7380
tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc
7440
tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa
7500
tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa
7560
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc
7620
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag
7680
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca
7740
aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc
7800
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa
7860
cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct
7920
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa
7980
cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat
8040
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc
8100
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct
8160
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag
8220
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta
8280
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc
8340
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca
8400
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg
8460
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg
8520
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca
8580
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa
8640
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa
8700
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata
8760
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat
8820
ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc
8880
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata
8940
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt
9000
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga
9060
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag
9120
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa
9180
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag
9240
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg
9300
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat
9360
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta
9420
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg
9480
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc
9540
gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa
9600
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc
9660
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt
9720
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct
9780
tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc
9840
gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg
9900
agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt
9960
gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa
10020
taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa
10080
tagatctaaa ctatgacaat aaagtcttaa actagacaga atagttgtaa actgaaatca
10140
gtccagttat gctgtgaaaa agcatactgg acttttgtta tggctaaagc aaactcttca
10200
ttttctgaag tgcaaattgc ccgtcgtatt aaagaggggc gtggccaagg gcatggtaaa
10260
gactatattc gcggcgttgt gacaatttac cgaacaactc cgcggccggg aagccgatct
10320
cggcttgaac gaattgttag gtggcggtac ttgggtcgat atcaaagtgc atcacttctt
10380
cccgtatgcc caactttgta tagagagcca ctgcgggatc gtcaccgtaa tctgcttgca
10440
cgtagatcac ataagcacca agcgcgttgg cctcatgctt gaggagattg atgagcgcgg
10500
tggcaatgcc ctgcctccgg tgctcgccgg agactgcgag atcatagata tagatctcac
10560
tacgcggctg ctcaaacctg ggcagaacgt aagccgcgag agcgccaaca accgcttctt
10620
ggtcgaaggc agcaagcgcg atgaatgtct tactacggag caagttcccg aggtaatcgg
10680
agtccggctg atgttgggag taggtggcta cgtctccgaa ctcacgaccg aaaagatcaa
10740
gagcagcccg catggatttg acttggtcag ggccgagcct acatgtgcga atgatgccca
10800
tacttgagcc acctaacttt gttttagggc gactgccctg ctgcgtaaca tcgttgctgc
10860
tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta acgcgcttgc
10920
tgcttggatg cccgaggcat agactgtaca aaaaaacagt cataacaagc catgaaaacc
10980
gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt gcgtgagcgc
11040
atacgctact tgcattacag tttacgaacc gaacaggctt atgtcaactg ggttcgtgcc
11100
ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga agtcgaggca
11160
tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg tcaggcattg
11220
gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg gcttcaggag
11280
atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga tgaagtggtt
11340
cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccaggactc tagctatagt
11400
tctagtggtt ggctacgtat actccggaat attaatagat catggagata attaaaatga
11460
taaccatctc gcaaataaat aagtatttta ctgttttcgt aacagttttg taataaaaaa
11520
acctataaat attccggatt attcataccg tcccaccatc gggcgcggat ctcggtccga
11580
aaccatgtcg tactaccatc accatcacca tcacgattac gatatcccaa cgaccgaaaa
11640
cctgtatttt cagggcgcca tgggatcc
11668
<210> 207
<211> 11719
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 207
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg
240
cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt
300
ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc
360
aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag
420
acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga
480
ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac
540
ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca
600
tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat
660
ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag
720
gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa
780
gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga
840
cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc
900
caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca
960
ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt
1020
gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc
1080
tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa
1140
gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc
1200
agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt
1260
taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga
1320
ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg
1380
actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg
1440
tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt
1500
gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga
1560
tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg
1620
cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg
1680
gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc
1740
aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg
1800
gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc
1860
tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag
1920
gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat
1980
ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg
2040
gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg
2100
gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag
2160
ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct
2220
gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc
2280
ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct
2340
gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc
2400
agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc
2460
cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg
2520
aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag
2580
gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac
2640
agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac
2700
tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac
2760
aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag
2820
aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat
2880
gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc
2940
ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg
3000
cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg
3060
cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct
3120
gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc
3180
tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac
3240
cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc
3300
tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag
3360
gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc
3420
ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc
3480
cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat
3540
gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac
3600
cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc
3660
ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag
3720
gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag
3780
aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca
3840
gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag
3900
attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac
3960
gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct
4020
gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg
4080
gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc
4140
agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc
4200
tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg
4260
ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag
4320
cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac
4380
cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg
4440
gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac
4500
accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc
4560
atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc
4620
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc
4680
aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg
4740
tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat
4800
gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg
4860
gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg
4920
attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc
4980
cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc
5040
cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc
5100
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc
5160
catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc
5220
atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc
5280
accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac
5340
ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc
5400
ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag
5460
agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc
5520
acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc
5580
caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact
5640
ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg
5700
atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag
5760
gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg
5820
ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg
5880
gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca
5940
tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa
6000
caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat
6060
tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc
6120
aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt
6180
ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg
6240
ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc
6300
ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct
6360
ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg
6420
ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg
6480
gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc
6540
cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa
6600
atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg
6660
ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg
6720
gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact
6780
acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc
6840
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc
6900
gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa
6960
gtactagagg atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa
7020
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt
7080
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa
7140
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca
7200
tgtctggatc tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt
7260
tccaaactat tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc
7320
atctattttg tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt
7380
tcccaactat tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa
7440
acatcctgcc aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga
7500
atgaaaattt ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc
7560
ttatttgcag cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg
7620
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt
7680
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc
7740
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg
7800
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga
7860
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc
7920
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa
7980
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa
8040
tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa
8100
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt
8160
gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg
8220
cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag
8280
atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg
8340
agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg
8400
gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt
8460
ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga
8520
cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac
8580
ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc
8640
atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc
8700
gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac
8760
tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag
8820
gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg
8880
gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta
8940
tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg
9000
ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata
9060
tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt
9120
ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc
9180
ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct
9240
tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa
9300
ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag
9360
tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc
9420
tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg
9480
actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca
9540
cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt
9600
gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg
9660
tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc
9720
ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc
9780
ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc
9840
cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg
9900
cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga
9960
gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt
10020
cacaccgcag accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat
10080
gccctgcgta agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa
10140
actatgacaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta
10200
tgctgtgaaa aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa
10260
gtgcaaattg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt
10320
cgcggcgttg tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa
10380
cgaattgtta ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc
10440
ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca
10500
cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc
10560
cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct
10620
gctcaaacct gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg
10680
cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct
10740
gatgttggga gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc
10800
gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc
10860
cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca
10920
tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat
10980
gcccgaggca tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg
11040
ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac
11100
ttgcattaca gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt
11160
ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc
11220
tggctggcga acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg
11280
ctgttcttct acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga
11340
cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc
11400
ggttttctgg aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt
11460
tggctacgta tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct
11520
cgcaaataaa taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa
11580
tattccggat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc
11640
gtactaccat caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt
11700
tcagggcgcc atgggatcc
11719
<210> 208
<211> 11796
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 208
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg
240
cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt
300
ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc
360
aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag
420
acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga
480
ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac
540
ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca
600
tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat
660
ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag
720
gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa
780
gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga
840
cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc
900
caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca
960
ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt
1020
gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc
1080
tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa
1140
gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc
1200
agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt
1260
taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga
1320
ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg
1380
actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg
1440
tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt
1500
gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga
1560
tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg
1620
cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg
1680
gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc
1740
aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg
1800
gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc
1860
tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag
1920
gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat
1980
ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg
2040
gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg
2100
gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag
2160
ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct
2220
gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc
2280
ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct
2340
gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc
2400
agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc
2460
cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg
2520
aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag
2580
gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac
2640
agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac
2700
tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac
2760
aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag
2820
aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat
2880
gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc
2940
ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg
3000
cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg
3060
cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct
3120
gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc
3180
tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac
3240
cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc
3300
tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag
3360
gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc
3420
ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc
3480
cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat
3540
gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac
3600
cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc
3660
ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag
3720
gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag
3780
aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca
3840
gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag
3900
attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac
3960
gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct
4020
gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg
4080
gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc
4140
agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc
4200
tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg
4260
ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag
4320
cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac
4380
cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg
4440
gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac
4500
accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc
4560
atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc
4620
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc
4680
aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg
4740
tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat
4800
gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg
4860
gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg
4920
attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc
4980
cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc
5040
cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc
5100
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc
5160
catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc
5220
atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc
5280
accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac
5340
ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc
5400
ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag
5460
agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc
5520
acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc
5580
caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact
5640
ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg
5700
atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag
5760
gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg
5820
ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg
5880
gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca
5940
tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa
6000
caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat
6060
tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc
6120
aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt
6180
ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg
6240
ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc
6300
ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct
6360
ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg
6420
ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg
6480
gcactgataa ttccgtggtg ttgtctccat aaagtaggaa acactacacg attccataaa
6540
gtaggaaaca ctacatcact ccataaagta ggaaacacta catgtgcctt ctagttgcca
6600
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac
6660
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat
6720
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca
6780
tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg
6840
cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc
6900
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc
6960
ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt
7020
accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt tgtagaggtt
7080
ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca
7140
attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc
7200
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc
7260
atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag atccgaacca
7320
gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga
7380
cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca
7440
tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat ttttcttcct
7500
gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat cttcggctac
7560
tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa tgtttgtaat
7620
tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg
7680
cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc
7740
cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc
7800
ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct
7860
cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac
7920
ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac
7980
tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat
8040
ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa
8100
aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg gaacccctat
8160
ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata
8220
aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct
8280
tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa
8340
agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa
8400
cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt
8460
taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg
8520
tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca
8580
tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa
8640
cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt
8700
gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc
8760
cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa
8820
actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga
8880
ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc
8940
tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga
9000
tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga
9060
acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga
9120
ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat
9180
ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt
9240
ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct
9300
gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc
9360
ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc
9420
aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc
9480
gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc
9540
gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg
9600
aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata
9660
cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta
9720
tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc
9780
ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg
9840
atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt
9900
cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt
9960
ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga
10020
gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac
10080
gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa tcggttacgg
10140
ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact
10200
gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat agttgtaaac
10260
tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg gctaaagcaa
10320
actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt ggccaagggc
10380
atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg cggccgggaa
10440
gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat caaagtgcat
10500
cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc
10560
tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga ggagattgat
10620
gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat catagatata
10680
gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag cgccaacaac
10740
cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag
10800
gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact cacgaccgaa
10860
aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac atgtgcgaat
10920
gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaacatc
10980
gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac
11040
gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca
11100
tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc
11160
gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gtcaactggg
11220
ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc agcagcgaag
11280
tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc
11340
aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat ctgccctggc
11400
ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg
11460
aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc caggactcta
11520
gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca tggagataat
11580
taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa cagttttgta
11640
ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg gcgcggatct
11700
cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga tatcccaacg
11760
accgaaaacc tgtattttca gggcgccatg ggatcc
11796
<210> 209
<211> 10795
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 209
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600
ggtttaaacg ccgccaccat gcagatcgag ctgtctacct gcttcttcct gtgcctgctg
660
cggttctgct tcagcgccac cagaagatat tacctgggcg ccgtggaact gagctgggac
720
tacatgcagt ctgacctggg agagctgccc gtggacgcta gatttcctcc aagagtgccc
780
aagagcttcc ccttcaacac ctccgtggtg tacaagaaaa ccctgttcgt ggaattcacc
840
gaccacctgt tcaatatcgc caagcctcgg cctccttgga tgggactgct gggacctaca
900
attcaggccg aggtgtacga caccgtggtc atcaccctga agaacatggc cagccatcct
960
gtgtctctgc acgccgtggg agtgtcttat tggaaggctt ctgagggcgc cgagtacgac
1020
gatcagacaa gccagagaga gaaagaggac gacaaggttt tccctggcgg cagccacacc
1080
tatgtctggc aggtcctgaa agaaaacggc cctatggcct ccgatcctct gtgcctgaca
1140
tacagctacc tgagccacgt ggacctggtc aaggacctga attctggcct gatcggagcc
1200
ctgctcgtgt gtagagaagg cagcctggcc aaagagaaaa cccagacact gcacaagttc
1260
atcctgctgt tcgccgtgtt cgacgagggc aagagctggc acagcgagac aaagaacagc
1320
ctgatgcagg acagggatgc cgcctctgct agagcttggc ctaagatgca caccgtgaac
1380
ggctacgtga acagaagcct gcctggactg atcggctgcc acagaaagtc cgtgtactgg
1440
cacgtgatcg gcatgggcac aacacctgag gtgcacagca tctttctgga aggccacacc
1500
ttcctcgtgc ggaaccacag acaggccagc ctggaaatca gccctatcac cttcctgacc
1560
gctcagaccc tgctgatgga tctgggccag tttctgctgt tctgccacat cagctcccac
1620
cagcacgatg gcatggaagc ctacgtgaag gtggacagct gccccgaaga accccagctg
1680
cggatgaaga acaacgagga agccgaggac tacgacgacg acctgaccga ctctgagatg
1740
gacgtcgtca gattcgacga cgataacagc cccagcttca tccagatcag aagcgtggcc
1800
aagaagcacc ccaagacctg ggtgcactat atcgccgccg aggaagagga ctgggattac
1860
gctcctctgg tgctggcccc tgacgacaga agctacaaga gccagtacct gaacaacggc
1920
cctcagcgga tcggccggaa gtataagaaa gtgcggttca tggcctacac cgacgagaca
1980
ttcaagacca gagaggccat ccagcacgag agcggaattc tgggccctct gctgtatggc
2040
gaagtgggcg atacactgct gatcatcttc aagaaccagg ccagcagacc ctacaacatc
2100
taccctcacg gcatcaccga tgtgcggccc ctgtattcta gaaggctgcc caagggcgtg
2160
aagcacctga aggacttccc tatcctgcct ggcgagattt tcaagtacaa gtggaccgtg
2220
accgtggaag atggccccac caagagcgac cctagatgtc tgacacggta ctacagcagc
2280
ttcgtgaaca tggaacgcga cctggccagc ggcctgattg gacctctgct gatctgctac
2340
aaagaaagcg tggaccagcg gggcaaccag atcatgagcg acaagcggaa cgtgatcctg
2400
tttagcgtgt tcgatgagaa ccggtcctgg tatctgaccg agaacatcca gcggtttctg
2460
cccaatcctg ccggggtgca actggaagat cctgagttcc aggcaagcaa catcatgcac
2520
tccatcaatg gctatgtgtt cgacagcctg cagctgagcg tgtgcctgca cgaagtggcc
2580
tactggtaca tcctgagcat tggcgcccag accgacttcc tgtccgtgtt ctttagcggc
2640
tacaccttca agcacaagat ggtgtacgag gataccctga cactgttccc attcagcggc
2700
gagacagtgt tcatgagcat ggaaaacccc ggcctgtgga ttctgggctg tcacaacagc
2760
gacttccgga acagaggcat gacagccctg ctgaaggtgt ccagctgcga caagaacacc
2820
ggcgactact acgaggacag ctatgaggac atcagcgcct acctgctgag caagaacaat
2880
gccatcgagc ctcggagctt cagccagaat cctcctgtgc tgaagcggca ccagcgcgag
2940
atcaccagaa caaccctgca gagcgaccaa gaggaaatcg attacgacga caccatcagc
3000
gtcgagatga agaaagaaga tttcgacatc tacgacgagg acgagaatca gagccccaga
3060
agctttcaga aaaagacccg gcactacttc attgccgccg tcgagagact gtgggactac
3120
ggcatgtcta gcagccctca cgtgctgaga aatagagccc agagcggcag cgtgccccag
3180
ttcaagaaag tggtgttcca agagttcacc gacggcagct tcacccagcc actgtataga
3240
ggcgagctga acgagcatct gggcctgctg ggcccttata tcagagccga agtggaagat
3300
aacatcatgg tcaccttccg gaatcaggct agccggcctt acagcttcta cagctccctg
3360
atcagctacg aagaggacca gagacagggc gctgagccca gaaagaactt cgtgaagccc
3420
aacgagacta agacctactt ttggaaggtg cagcaccaca tggcccctac aaaggacgag
3480
ttcgactgca aagcctgggc ctacttctcc gatgtggatc tggaaaagga cgtgcacagc
3540
gggctcatcg gaccactgct tgtgtgccac accaacacac tgaaccccgc tcacggcaga
3600
caagtgacag tgcaagagtt cgccctgttc ttcaccatct tcgacgaaac aaagagctgg
3660
tacttcaccg agaatatgga acggaactgc agagcccctt gcaacatcca gatggaagat
3720
cccaccttca aagagaacta ccggttccac gccatcaacg gctacatcat ggacacactg
3780
cccggcctgg ttatggccca ggatcagaga atccggtggt atctgctgtc catgggctcc
3840
aacgagaata tccacagcat ccacttcagc ggccacgtgt tcaccgtgcg gaaaaaagaa
3900
gagtacaaaa tggccctgta caatctgtac cctggggtgt tcgaaaccgt ggaaatgctg
3960
ccttccaagg ccggcatttg gagagtggaa tgtctgattg gagagcacct ccacgccgga
4020
atgagcaccc tgtttctggt gtacagcaac aagtgtcaga cccctctcgg catggcctct
4080
ggacacatca gagacttcca gatcaccgcc tctggccagt acggacagtg ggctcctaaa
4140
ctggctcggc tgcactacag cggcagcatc aatgcctggt ccaccaaaga gcccttcagc
4200
tggatcaagg tggacctgct ggctcccatg atcatccacg gaatcaagac ccagggcgcc
4260
agacagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc
4320
aagaagtggc agacctacag aggcaacagc accggcacac tcatggtgtt cttcggcaac
4380
gtggactcca gcggcattaa gcacaacatc ttcaaccctc caatcattgc ccggtacatc
4440
cggctgcacc ccacacacta cagcatccgg tctaccctga gaatggaact gatgggctgc
4500
gacctgaaca gctgctctat gcccctcgga atggaaagca aggccatcag cgacgcccag
4560
atcacagcca gcagctactt caccaacatg ttcgccactt ggagcccctc caaggctaga
4620
ctgcatctgc agggcagaag caacgcttgg aggccccaag tgaacaaccc caaagagtgg
4680
ctgcaggttg actttcaaaa gaccatgaaa gtgaccggcg tgaccacaca gggcgtcaag
4740
tctctgctga cctctatgta cgtgaaagag ttcctgatct ccagcagcca ggacggccat
4800
cagtggaccc tgtttttcca gaacggcaaa gtgaaagtgt tccagggcaa tcaggacagc
4860
ttcacacccg tggtcaattc tctggaccct ccactgctga ccagatacct gcggattcac
4920
cctcagtctt gggtgcacca gatcgctctg cggatggaag tgctgggctg tgaagctcag
4980
gacctctact agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt
5040
ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac
5100
atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga
5160
aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg
5220
aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt
5280
tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata
5340
aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg
5400
tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac
5460
tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct
5520
gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt
5580
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc
5640
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc
5700
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt
5760
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct
5820
acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt
5880
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa
5940
ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc
6000
gcgcctcgag gcatgcggta ccaagcttgt cgagaagtac tagaggatca taatcagcca
6060
taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct
6120
gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta
6180
caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag
6240
ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgat cactgatatc
6300
gcctaggaga tccgaaccag ataagtgaaa tctagttcca aactattttg tcatttttaa
6360
ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac tcttccctaa
6420
ataatcctta aaaactccat ttccacccct cccagttccc aactattttg tccgcccaca
6480
gcggggcatt tttcttcctg ttatgttttt aatcaaacat cctgccaact ccatgtgaca
6540
aaccgtcatc ttcggctact ttttctctgt cacagaatga aaatttttct gtcatctctt
6600
cgttattaat gtttgtaatt gactgaatat caacgcttat ttgcagcctg aatggcgaat
6660
gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga
6720
ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg
6780
ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat
6840
ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg
6900
ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata
6960
gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt
7020
tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat
7080
ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa
7140
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca
7200
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc
7260
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc
7320
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt
7380
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt
7440
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg
7500
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact
7560
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg
7620
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga
7680
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg
7740
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa
7800
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac
7860
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc
7920
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca
7980
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga
8040
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta
8100
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc
8160
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc
8220
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt
8280
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac
8340
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct
8400
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact
8460
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg
8520
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata
8580
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga
8640
cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag
8700
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg
8760
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac
8820
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca
8880
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg
8940
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc
9000
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga
9060
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcagacca gccgcgtaac
9120
ctggcaaaat cggttacggt tgagtaataa atggatgccc tgcgtaagcg ggtgtgggcg
9180
gacaataaag tcttaaactg aacaaaatag atctaaacta tgacaataaa gtcttaaact
9240
agacagaata gttgtaaact gaaatcagtc cagttatgct gtgaaaaagc atactggact
9300
tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa
9360
gaggggcgtg gccaagggca tggtaaagac tatattcgcg gcgttgtgac aatttaccga
9420
acaactccgc ggccgggaag ccgatctcgg cttgaacgaa ttgttaggtg gcggtacttg
9480
ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg
9540
cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct
9600
catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga
9660
ctgcgagatc atagatatag atctcactac gcggctgctc aaacctgggc agaacgtaag
9720
ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac
9780
tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt
9840
ctccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc
9900
cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac
9960
tgccctgctg cgtaacatcg ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa
10020
catcgaccca cggcgtaacg cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa
10080
aaacagtcat aacaagccat gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc
10140
aaggttctgg accagttgcg tgagcgcata cgctacttgc attacagttt acgaaccgaa
10200
caggcttatg tcaactgggt tcgtgccttc atccgtttcc acggtgtgcg tcacccggca
10260
accttgggca gcagcgaagt cgaggcattt ctgtcctggc tggcgaacga gcgcaaggtt
10320
tcggtctcca cgcatcgtca ggcattggcg gccttgctgt tcttctacgg caaggtgctg
10380
tgcacggatc tgccctggct tcaggagatc ggaagacctc ggccgtcgcg gcgcttgccg
10440
gtggtgctga ccccggatga agtggttcgc atcctcggtt ttctggaagg cgagcatcgt
10500
ttgttcgccc aggactctag ctatagttct agtggttggc tacgtatact ccggaatatt
10560
aatagatcat ggagataatt aaaatgataa ccatctcgca aataaataag tattttactg
10620
ttttcgtaac agttttgtaa taaaaaaacc tataaatatt ccggattatt cataccgtcc
10680
caccatcggg cgcggatctc ggtccgaaac catgtcgtac taccatcacc atcaccatca
10740
cgattacgat atcccaacga ccgaaaacct gtattttcag ggcgccatgg gatcc
10795
<210> 210
<211> 10846
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 210
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600
ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg
660
aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac
720
tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc
780
aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact
840
gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc
900
atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct
960
gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat
1020
gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc
1080
tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc
1140
tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc
1200
ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc
1260
atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc
1320
ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat
1380
ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg
1440
catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc
1500
ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact
1560
gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac
1620
cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg
1680
aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg
1740
gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc
1800
aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat
1860
gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc
1920
ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc
1980
ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg
2040
gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc
2100
tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg
2160
aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg
2220
actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc
2280
tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac
2340
aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg
2400
ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg
2460
cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac
2520
agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc
2580
tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc
2640
tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg
2700
gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct
2760
gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact
2820
ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat
2880
gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc
2940
agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg
3000
accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg
3060
aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag
3120
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc
3180
agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag
3240
gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg
3300
aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg
3360
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat
3420
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc
3480
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc
3540
aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt
3600
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact
3660
gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact
3720
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc
3780
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg
3840
gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac
3900
atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag
3960
atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag
4020
gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc
4080
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc
4140
agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg
4200
ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag
4260
gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag
4320
ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg
4380
cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc
4440
tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac
4500
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac
4560
agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc
4620
agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg
4680
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg
4740
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg
4800
accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc
4860
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct
4920
gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc
4980
tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac
5040
tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt
5100
tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg
5160
gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc
5220
gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga
5280
ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc
5340
tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt
5400
tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg
5460
tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg
5520
ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc
5580
gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt
5640
ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg
5700
ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt
5760
gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca
5820
atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata
5880
agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt
5940
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg
6000
acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga
6060
ggcatgcggt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt
6120
tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa
6180
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag
6240
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt
6300
gtccaaactc atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag
6360
atccgaacca gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat
6420
tagcttacga cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt
6480
aaaaactcca tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat
6540
ttttcttcct gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat
6600
cttcggctac tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa
6660
tgtttgtaat tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc
6720
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac
6780
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg
6840
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt
6900
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc
6960
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct
7020
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga
7080
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga
7140
attttaacaa aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg
7200
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat
7260
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc
7320
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa
7380
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac
7440
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga
7500
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag
7560
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca
7620
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca
7680
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa
7740
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc
7800
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa
7860
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag
7920
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct
7980
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac
8040
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa
8100
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt
8160
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat
8220
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg
8280
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc
8340
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg
8400
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag
8460
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact
8520
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg
8580
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc
8640
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg
8700
aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg
8760
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag
8820
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc
8880
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct
8940
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc
9000
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc
9060
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt
9120
ttctccttac gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa
9180
tcggttacgg ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa
9240
gtcttaaact gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat
9300
agttgtaaac tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg
9360
gctaaagcaa actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt
9420
ggccaagggc atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg
9480
cggccgggaa gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat
9540
caaagtgcat cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt
9600
caccgtaatc tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga
9660
ggagattgat gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat
9720
catagatata gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag
9780
cgccaacaac cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca
9840
agttcccgag gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact
9900
cacgaccgaa aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac
9960
atgtgcgaat gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct
10020
gcgtaacatc gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc
10080
acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca
10140
taacaagcca tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg
10200
gaccagttgc gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat
10260
gtcaactggg ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc
10320
agcagcgaag tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc
10380
acgcatcgtc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat
10440
ctgccctggc ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg
10500
accccggatg aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc
10560
caggactcta gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca
10620
tggagataat taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa
10680
cagttttgta ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg
10740
gcgcggatct cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga
10800
tatcccaacg accgaaaacc tgtattttca gggcgccatg ggatcc
10846
<210> 211
<211> 10923
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 211
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600
ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg
660
aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac
720
tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc
780
aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact
840
gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc
900
atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct
960
gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat
1020
gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc
1080
tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc
1140
tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc
1200
ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc
1260
atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc
1320
ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat
1380
ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg
1440
catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc
1500
ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact
1560
gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac
1620
cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg
1680
aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg
1740
gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc
1800
aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat
1860
gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc
1920
ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc
1980
ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg
2040
gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc
2100
tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg
2160
aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg
2220
actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc
2280
tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac
2340
aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg
2400
ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg
2460
cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac
2520
agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc
2580
tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc
2640
tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg
2700
gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct
2760
gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact
2820
ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat
2880
gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc
2940
agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg
3000
accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg
3060
aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag
3120
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc
3180
agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag
3240
gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg
3300
aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg
3360
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat
3420
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc
3480
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc
3540
aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt
3600
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact
3660
gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact
3720
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc
3780
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg
3840
gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac
3900
atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag
3960
atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag
4020
gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc
4080
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc
4140
agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg
4200
ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag
4260
gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag
4320
ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg
4380
cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc
4440
tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac
4500
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac
4560
agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc
4620
agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg
4680
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg
4740
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg
4800
accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc
4860
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct
4920
gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc
4980
tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac
5040
tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt
5100
tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg
5160
gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc
5220
gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga
5280
ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc
5340
tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt
5400
tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg
5460
tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg
5520
ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc
5580
gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctccataaa
5640
gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca taaagtagga
5700
aacactacat gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc
5760
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc
5820
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg
5880
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga
5940
gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa
6000
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg
6060
cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct
6120
gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata
6180
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc
6240
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat
6300
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg
6360
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca
6420
ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc
6480
atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc
6540
ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc
6600
cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc
6660
atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt
6720
catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa
6780
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg
6840
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc
6900
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg
6960
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc
7020
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt
7080
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc
7140
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta
7200
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt
7260
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta
7320
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat
7380
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt
7440
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg
7500
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga
7560
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg
7620
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt
7680
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg
7740
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg
7800
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga
7860
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc
7920
tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc
7980
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc
8040
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg
8100
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac
8160
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc
8220
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt
8280
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac
8340
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa
8400
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc
8460
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt
8520
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg
8580
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc
8640
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt
8700
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga
8760
gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct
8820
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg
8880
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca
8940
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa
9000
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt
9060
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga
9120
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga
9180
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc
9240
cgcgtaacct ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg
9300
tgtgggcgga caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt
9360
cttaaactag acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat
9420
actggacttt tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc
9480
gtattaaaga ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa
9540
tttaccgaac aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc
9600
ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag
9660
agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc
9720
gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc
9780
gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag
9840
aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa
9900
tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt
9960
ggctacgtct ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg
10020
gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt
10080
agggcgactg ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata
10140
acatcaaaca tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact
10200
gtacaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc
10260
gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac
10320
gaaccgaaca ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc
10380
acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc
10440
gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca
10500
aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc
10560
gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg
10620
agcatcgttt gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc
10680
ggaatattaa tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta
10740
ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca
10800
taccgtccca ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat
10860
caccatcacg attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga
10920
tcc
10923
<210> 212
<211> 12404
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 212
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gagcggccgc tcaatattgg ccattagcca tattattcat
240
tggttatata gcataaatca atattggcta ttggccattg catacgttgt atctatatca
300
taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc attgattatt
360
gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt
420
ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc
480
attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg
540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat
600
gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca
660
gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat
720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc
780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg
840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg
900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag
960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac
1020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac
1080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt
1140
agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc
1200
tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc
1260
gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg
1320
cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc
1380
ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt
1440
gagcaggggg tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga
1500
gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc
1560
gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg
1620
gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc
1680
gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct
1740
ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg
1800
cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg
1860
tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc
1920
tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcggctct
1980
agagcctctg ctaaccatgt tttagccttc ttctttttcc tacagctcct gggcaacgtg
2040
ctggttattg tgctgtctca tcatttgtcg acagaattcc tcgaagatcc gaaggggttc
2100
aagcttggca ttccggtact gttggtaaag ccagtttaaa cgccgccacc atgcagatcg
2160
agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc accagaagat
2220
attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg ggagagctgc
2280
ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac acctccgtgg
2340
tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc gccaagcctc
2400
ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gacaccgtgg
2460
tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg ggagtgtctt
2520
attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga gagaaagagg
2580
acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg aaagaaaacg
2640
gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac gtggacctgg
2700
tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa ggcagcctgg
2760
ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ttcgacgagg
2820
gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat gccgcctctg
2880
ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc ctgcctggac
2940
tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc acaacacctg
3000
aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac agacaggcca
3060
gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg gatctgggcc
3120
agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gcctacgtga
3180
aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gaagccgagg
3240
actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gacgataaca
3300
gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc tgggtgcact
3360
atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc cctgacgaca
3420
gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg aagtataaga
3480
aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc atccagcacg
3540
agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg ctgatcatct
3600
tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc gatgtgcggc
3660
ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc cctatcctgc
3720
ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc accaagagcg
3780
accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc gacctggcca
3840
gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag cggggcaacc
3900
agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag aaccggtcct
3960
ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg caactggaag
4020
atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg ttcgacagcc
4080
tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc attggcgccc
4140
agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag atggtgtacg
4200
aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggaaaacc
4260
ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atgacagccc
4320
tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac agctatgagg
4380
acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc ttcagccaga
4440
atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg cagagcgacc
4500
aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa gatttcgaca
4560
tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc cggcactact
4620
tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cacgtgctga
4680
gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caagagttca
4740
ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat ctgggcctgc
4800
tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc cggaatcagg
4860
ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cagagacagg
4920
gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac ttttggaagg
4980
tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg gcctacttct
5040
ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg cttgtgtgcc
5100
acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag ttcgccctgt
5160
tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg gaacggaact
5220
gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac taccggttcc
5280
acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc caggatcaga
5340
gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc atccacttca
5400
gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg tacaatctgt
5460
accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tggagagtgg
5520
aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg gtgtacagca
5580
acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc cagatcaccg
5640
cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac agcggcagca
5700
tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggctccca
5760
tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc ctgtacatca
5820
gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac agaggcaaca
5880
gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt aagcacaaca
5940
tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac tacagcatcc
6000
ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct atgcccctcg
6060
gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca
6120
tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga agcaacgctt
6180
ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa aagaccatga
6240
aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg tacgtgaaag
6300
agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc cagaacggca
6360
aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat tctctggacc
6420
ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac cagatcgctc
6480
tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctagttaatt aagagcatct
6540
taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt
6600
taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc
6660
aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc
6720
tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt
6780
tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc
6840
ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga
6900
gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc
6960
cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct
7020
cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag
7080
gttgctgggc actgataatt ccgtggtgtt gtctccataa agtaggaaac actacacgat
7140
tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca tgtgccttct
7200
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc
7260
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt
7320
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat
7380
agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag
7440
tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg
7500
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac
7560
gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg
7620
catgcggtac caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg
7680
tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa
7740
tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca
7800
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt
7860
ccaaactcat caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat
7920
ccgaaccaga taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta
7980
gcttacgacg ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa
8040
aaactccatt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt
8100
ttcttcctgt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct
8160
tcggctactt tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg
8220
tttgtaattg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc
8280
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt
8340
gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc
8400
ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta
8460
cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc
8520
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg
8580
ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt
8640
ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat
8700
tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga
8760
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa
8820
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt
8880
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg
8940
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg
9000
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg
9060
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag
9120
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca
9180
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg
9240
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc
9300
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg
9360
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg
9420
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac
9480
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg
9540
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg
9600
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact
9660
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa
9720
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt
9780
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag
9840
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct
9900
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt
9960
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg
10020
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct
10080
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc
10140
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg
10200
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa
10260
ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg
10320
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg
10380
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga
10440
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt
10500
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct
10560
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga
10620
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt
10680
ctccttacgc atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc
10740
ggttacggtt gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt
10800
cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag
10860
ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc
10920
taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg
10980
ccaagggcat ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg
11040
gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca
11100
aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca
11160
ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg
11220
agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca
11280
tagatataga tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg
11340
ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag
11400
ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca
11460
cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat
11520
gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc
11580
gtaacatcgt tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac
11640
ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata
11700
acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga
11760
ccagttgcgt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt
11820
caactgggtt cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag
11880
cagcgaagtc gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac
11940
gcatcgtcag gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct
12000
gccctggctt caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac
12060
cccggatgaa gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca
12120
ggactctagc tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg
12180
gagataatta aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca
12240
gttttgtaat aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc
12300
gcggatctcg gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata
12360
tcccaacgac cgaaaacctg tattttcagg gcgccatggg atcc
12404
<210> 213
<211> 11356
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 213
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gagagtcaat gggaaaaacc cattggagcc aagtacactg
240
actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc
300
aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt
360
tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actgacatgt
420
atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt
480
gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccattg
540
ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg
600
cacatacata aggtcaatag gggtgactag tggagaagag catgcttgag ggctgagtgc
660
ccctcagtgg gcagagagca catggcccac agtccctgag aagttggggg gaggggtggg
720
caattgaact ggtgcctaga gaaggtgggg cttgggtaaa ctgggaaagt gatgtggtgt
780
actggctcca cctttttccc cagggtgggg gagaaccata tataagtgca gtagtctctg
840
tgaacattca agcttctgcc ttctccctcc tgtgagtttg gtaagtcact gactgtctat
900
gcctgggaaa gggtgggcag gagatggggc agtgcaggaa aagtggcact atgaaccctg
960
cagccctaga caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacag
1020
tagcttccgt ttaaacgccg ccaccatgca gattgagctg agcacctgct tcttcctgtg
1080
cctgctgagg ttctgcttct ctgccaccag gagatactac ctgggggctg tggagctgag
1140
ctgggactac atgcagtctg acctggggga gctgcctgtg gatgccaggt tcccccccag
1200
agtgcccaag agcttcccct tcaacacctc tgtggtgtac aagaagaccc tgtttgtgga
1260
gttcactgac cacctgttca acattgccaa gcccaggccc ccctggatgg gcctgctggg
1320
ccccaccatc caggctgagg tgtatgacac tgtggtgatc accctgaaga acatggccag
1380
ccaccctgtg agcctgcatg ctgtgggggt gagctactgg aaggcctctg agggggctga
1440
gtatgatgac cagaccagcc agagggagaa ggaggatgac aaggtgttcc ctgggggcag
1500
ccacacctat gtgtggcagg tgctgaagga gaatggcccc atggcctctg accccctgtg
1560
cctgacctac agctacctga gccatgtgga cctggtgaag gacctgaact ctggcctgat
1620
tggggccctg ctggtgtgca gggagggcag cctggccaag gagaagaccc agaccctgca
1680
caagttcatc ctgctgtttg ctgtgtttga tgagggcaag agctggcact ctgaaaccaa
1740
gaacagcctg atgcaggaca gggatgctgc ctctgccagg gcctggccca agatgcacac
1800
tgtgaatggc tatgtgaaca ggagcctgcc tggcctgatt ggctgccaca ggaagtctgt
1860
gtactggcat gtgattggca tgggcaccac ccctgaggtg cacagcatct tcctggaggg
1920
ccacaccttc ctggtcagga accacaggca ggccagcctg gagatcagcc ccatcacctt
1980
cctgactgcc cagaccctgc tgatggacct gggccagttc ctgctgttct gccacatcag
2040
cagccaccag catgatggca tggaggccta tgtgaaggtg gacagctgcc ctgaggagcc
2100
ccagctgagg atgaagaaca atgaggaggc tgaggactat gatgatgacc tgactgactc
2160
tgagatggat gtggtgaggt ttgatgatga caacagcccc agcttcatcc agatcaggtc
2220
tgtggccaag aagcacccca agacctgggt gcactacatt gctgctgagg aggaggactg
2280
ggactatgcc cccctggtgc tggcccctga tgacaggagc tacaagagcc agtacctgaa
2340
caatggcccc cagaggattg gcaggaagta caagaaggtc aggttcatgg cctacactga
2400
tgaaaccttc aagaccaggg aggccatcca gcatgagtct ggcatcctgg gccccctgct
2460
gtatggggag gtgggggaca ccctgctgat catcttcaag aaccaggcca gcaggcccta
2520
caacatctac ccccatggca tcactgatgt gaggcccctg tacagcagga ggctgcccaa
2580
gggggtgaag cacctgaagg acttccccat cctgcctggg gagatcttca agtacaagtg
2640
gactgtgact gtggaggatg gccccaccaa gtctgacccc aggtgcctga ccagatacta
2700
cagcagcttt gtgaacatgg agagggacct ggcctctggc ctgattggcc ccctgctgat
2760
ctgctacaag gagtctgtgg accagagggg caaccagatc atgtctgaca agaggaatgt
2820
gatcctgttc tctgtgtttg atgagaacag gagctggtac ctgactgaga acatccagag
2880
gttcctgccc aaccctgctg gggtgcagct ggaggaccct gagttccagg ccagcaacat
2940
catgcacagc atcaatggct atgtgtttga cagcctgcag ctgtctgtgt gcctgcatga
3000
ggtggcctac tggtacatcc tgagcattgg ggcccagact gacttcctgt ctgtgttctt
3060
ctctggctac accttcaagc acaagatggt gtatgaggac accctgaccc tgttcccctt
3120
ctctggggag actgtgttca tgagcatgga gaaccctggc ctgtggattc tgggctgcca
3180
caactctgac ttcaggaaca ggggcatgac tgccctgctg aaagtctcca gctgtgacaa
3240
gaacactggg gactactatg aggacagcta tgaggacatc tctgcctacc tgctgagcaa
3300
gaacaatgcc attgagccca ggagcttcag ccagaatgcc actaatgtgt ctaacaacag
3360
caacaccagc aatgacagca atgtgtctcc cccagtgctg aagaggcacc agagggagat
3420
caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca ccatctctgt
3480
ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga gccccaggag
3540
cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gggactatgg
3600
catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg tgccccagtt
3660
caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgtacagagg
3720
ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tggaggacaa
3780
catcatggtg accttcagga accaggccag caggccctac agcttctaca gcagcctgat
3840
cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg tgaagcccaa
3900
tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggatgagtt
3960
tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg tgcactctgg
4020
cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc atggcaggca
4080
ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca agagctggta
4140
cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga tggaggaccc
4200
caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg acaccctgcc
4260
tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca tgggcagcaa
4320
tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga agaaggagga
4380
gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agatgctgcc
4440
cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc atgctggcat
4500
gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggcctctgg
4560
ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg cccccaagct
4620
ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc ccttcagctg
4680
gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc agggggccag
4740
gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc tggatggcaa
4800
gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct ttggcaatgt
4860
ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca gatacatcag
4920
gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga tgggctgtga
4980
cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg atgcccagat
5040
cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca aggccaggct
5100
gcacctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggagtggct
5160
gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg gggtgaagag
5220
cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg atggccacca
5280
gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc aggacagctt
5340
cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga ggattcaccc
5400
ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg aggcccagga
5460
cctgtactga ttaattaaga gcatcttacc gccatttatt cccatatttg ttctgttttt
5520
cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat
5580
ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa
5640
ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa
5700
agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta
5760
tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa
5820
tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg
5880
tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc
5940
ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc
6000
cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtct
6060
ccataaagta ggaaacacta cacgattcca taaagtagga aacactacat cactccataa
6120
agtaggaaac actacatgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg
6180
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa
6240
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca
6300
gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg
6360
ctctagatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca
6420
cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct
6480
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag
6540
cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt accaagcttg tcgagaagta
6600
ctagaggatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct
6660
cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt
6720
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc
6780
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt
6840
ctggatctga tcactgatat cgcctaggag atccgaacca gataagtgaa atctagttcc
6900
aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc agttcccatc
6960
tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc tcccagttcc
7020
caactatttt gtccgcccac agcggggcat ttttcttcct gttatgtttt taatcaaaca
7080
tcctgccaac tccatgtgac aaaccgtcat cttcggctac tttttctctg tcacagaatg
7140
aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tgactgaata tcaacgctta
7200
tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg
7260
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg
7320
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg
7380
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt
7440
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt
7500
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta
7560
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa
7620
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt
7680
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac
7740
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa
7800
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat
7860
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc
7920
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga
7980
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg
8040
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc
8100
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag
8160
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc
8220
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg
8280
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg
8340
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac
8400
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac
8460
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg
8520
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg
8580
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg
8640
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac
8700
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg
8760
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg
8820
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc
8880
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc
8940
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt
9000
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc
9060
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact
9120
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac
9180
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag
9240
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg
9300
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg
9360
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga
9420
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt
9480
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct
9540
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg
9600
aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac
9660
accgcagacc agccgcgtaa cctggcaaaa tcggttacgg ttgagtaata aatggatgcc
9720
ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact gaacaaaata gatctaaact
9780
atgacaataa agtcttaaac tagacagaat agttgtaaac tgaaatcagt ccagttatgc
9840
tgtgaaaaag catactggac ttttgttatg gctaaagcaa actcttcatt ttctgaagtg
9900
caaattgccc gtcgtattaa agaggggcgt ggccaagggc atggtaaaga ctatattcgc
9960
ggcgttgtga caatttaccg aacaactccg cggccgggaa gccgatctcg gcttgaacga
10020
attgttaggt ggcggtactt gggtcgatat caaagtgcat cacttcttcc cgtatgccca
10080
actttgtata gagagccact gcgggatcgt caccgtaatc tgcttgcacg tagatcacat
10140
aagcaccaag cgcgttggcc tcatgcttga ggagattgat gagcgcggtg gcaatgccct
10200
gcctccggtg ctcgccggag actgcgagat catagatata gatctcacta cgcggctgct
10260
caaacctggg cagaacgtaa gccgcgagag cgccaacaac cgcttcttgg tcgaaggcag
10320
caagcgcgat gaatgtctta ctacggagca agttcccgag gtaatcggag tccggctgat
10380
gttgggagta ggtggctacg tctccgaact cacgaccgaa aagatcaaga gcagcccgca
10440
tggatttgac ttggtcaggg ccgagcctac atgtgcgaat gatgcccata cttgagccac
10500
ctaactttgt tttagggcga ctgccctgct gcgtaacatc gttgctgctg cgtaacatcg
10560
ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc
10620
cgaggcatag actgtacaaa aaaacagtca taacaagcca tgaaaaccgc cactgcgccg
10680
ttaccaccgc tgcgttcggt caaggttctg gaccagttgc gtgagcgcat acgctacttg
10740
cattacagtt tacgaaccga acaggcttat gtcaactggg ttcgtgcctt catccgtttc
10800
cacggtgtgc gtcacccggc aaccttgggc agcagcgaag tcgaggcatt tctgtcctgg
10860
ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc aggcattggc ggccttgctg
10920
ttcttctacg gcaaggtgct gtgcacggat ctgccctggc ttcaggagat cggaagacct
10980
cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg aagtggttcg catcctcggt
11040
tttctggaag gcgagcatcg tttgttcgcc caggactcta gctatagttc tagtggttgg
11100
ctacgtatac tccggaatat taatagatca tggagataat taaaatgata accatctcgc
11160
aaataaataa gtattttact gttttcgtaa cagttttgta ataaaaaaac ctataaatat
11220
tccggattat tcataccgtc ccaccatcgg gcgcggatct cggtccgaaa ccatgtcgta
11280
ctaccatcac catcaccatc acgattacga tatcccaacg accgaaaacc tgtattttca
11340
gggcgccatg ggatcc
11356
<210> 214
<211> 11434
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 214
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600
ggtttaaacg ccgccaccat gcaaattgag ttaagtacct gttttttcct gtgcctgttg
660
agattttgct tctctgctac cagaaggtat tacctgggag ctgtggagct gtcatgggac
720
tacatgcagt ctgacctggg agagctccct gttgatgcta ggtttccccc tagggtgcca
780
aagtcctttc cttttaacac ctcagtggtg tacaagaaga cactgtttgt ggagtttact
840
gaccacctct tcaatattgc taagccaaga cccccttgga tgggtctctt gggccctacc
900
atccaggctg aggtttatga tacagtggtg attaccctca agaatatggc ttctcatcct
960
gttagtctgc atgcagtagg ggtcagctat tggaaggcca gtgaaggagc tgagtatgat
1020
gaccagacca gccagagaga gaaagaggat gacaaggtgt tccctggggg atcacacacc
1080
tatgtgtggc aggtgttgaa ggaaaatgga cccatggcct ctgacccact ctgcctgact
1140
tactcctacc tgtctcatgt ggacctggtc aaagatctga actctggcct gattggggca
1200
ctgttggtgt gcagagaagg gtctcttgcc aaggagaaga ctcagaccct gcacaagttc
1260
atcctgctgt ttgctgtgtt tgatgaaggc aagtcttggc attctgagac taagaacagc
1320
ctgatgcaag atagagatgc tgcatctgcc agggcctggc ctaagatgca cactgtgaat
1380
ggatatgtga ataggtcctt gcctggcctg attggatgcc ataggaagtc tgtgtactgg
1440
catgtgattg gcatgggcac cacccctgag gttcactcta tttttctgga gggccatact
1500
ttccttgtga ggaatcatag acaggcctct ctggagatta gccctattac atttctgact
1560
gctcagaccc tcctcatgga cttggggcag tttctgttaa gctgccacat cagcagccat
1620
caacatgatg gtatggaagc ctatgtcaaa gtggatagct gccctgaaga accacagctt
1680
aggatgaaga acaatgagga ggcagaggac tatgatgatg atctgactga ttctgaaatg
1740
gatgtggtga gatttgatga tgataatagc ccttccttta tccagatcag gtcagtggcc
1800
aagaagcacc caaagacctg ggtgcattat attgctgctg aggaggagga ctgggactat
1860
gcccctctgg tgctggcccc tgatgataga agctataagt ctcaatactt gaataatggc
1920
ccacagagga ttgggagaaa gtacaaaaag gtgagattta tggcctacac tgatgagact
1980
ttcaagacca gagaggccat ccagcatgaa tcaggcattt tgggtcccct gctgtatgga
2040
gaggtggggg ataccctgct gatcatcttt aagaaccagg ccagcagacc ttacaacatt
2100
taccctcatg ggatcacaga tgtgaggcca ctctactcta ggagattgcc caagggagtc
2160
aagcatctta aggactttcc aatcctgcct ggggagatct tcaagtacaa atggacagtg
2220
acagttgagg atggacctac taagagtgac cccaggtgtc tgaccagata ttactctagc
2280
tttgtcaata tggaaagaga cctggcttca ggcttgatag gccctcttct catctgctac
2340
aaagagtctg tggaccagag aggaaatcag attatgtctg acaagagaaa tgttattctg
2400
ttttcagtct ttgatgagaa cagaagttgg tacttgacag agaacattca gagatttctg
2460
cctaaccctg caggagtgca gcttgaggac cctgagtttc aggcttccaa tatcatgcat
2520
tctatcaatg gctatgtgtt tgatagcctg cagctgtctg tgtgcctgca tgaggttgcc
2580
tattggtaca tcctgtctat tggggcccaa actgatttct tgtctgtgtt tttcagtgga
2640
tataccttta agcataagat ggtgtatgaa gataccttga cacttttccc tttctcagga
2700
gagactgtct tcatgtctat ggagaaccct ggactgtgga tcctgggatg ccacaactca
2760
gacttcagaa acaggggtat gacagctctg cttaaggtct cctcatgtga caaaaataca
2820
ggagactact atgaagattc ctatgaggac atctctgctt acctgctcag caaaaacaat
2880
gccattgagc ccagaagctt cagccagaat tccagacatc ccagtactag gcagaagcag
2940
tttaatgcca ccaccatccc agaaaatgac attgagaaga cagacccttg gtttgcccat
3000
agaaccccaa tgcccaagat tcagaatgtg agcagctcag acttgctgat gctgctgagg
3060
cagtctccta ctccccatgg cctgtccctc tcagatctgc aggaagccaa gtatgagaca
3120
ttttctgatg acccctcccc aggggctatt gacagtaaca acagcctgtc tgaaatgacc
3180
cacttcagac ctcagctcca ccacagtggg gatatggtgt ttaccccaga gtcaggcctg
3240
cagctgagac tgaatgagaa gctgggaacc acagctgcca cagaactgaa gaagctggat
3300
ttcaaggtga gctctacttc aaataatctg atttccacta tcccatctga caatttggca
3360
gctggcactg acaatacaag ctctctgggc ccacctagca tgccagtgca ttatgacagc
3420
cagttggaca ccactctttt tggaaagaaa tccagtcccc tgacagagtc aggaggaccc
3480
ctttctctgt ctgaggagaa caatgatagt aagcttctgg agtcaggctt gatgaactcc
3540
caggagagtt cttggggcaa gaatgtgagc tctagggaga tcaccagaac cactctgcag
3600
tctgaccaag aagagattga ttatgatgac actatctctg ttgagatgaa gaaggaggac
3660
tttgatatct atgatgagga tgagaaccag tctccaagaa gtttccagaa gaagaccagg
3720
cactacttta ttgctgctgt ggagagactg tgggactatg gaatgtcctc ctcccctcat
3780
gtcctgagaa atagagctca gtcaggatca gtgccccagt tcaagaaggt ggtgttccag
3840
gaattcacag atggaagttt tacccagcca ctgtatagag gtgaactgaa tgaacatctg
3900
ggtctgctgg ggccctatat cagggctgag gtggaggaca atattatggt gacctttaga
3960
aaccaggcct caaggcccta cagcttctac tcttccctca tttcatatga ggaagaccag
4020
agacagggag cagagcctag aaagaacttt gtcaagccca atgaaaccaa aacctatttc
4080
tggaaggtgc agcaccacat ggcacccacc aaagatgagt ttgactgcaa agcctgggcc
4140
tatttctcag atgtggatct ggagaaggat gtccattcag gtctgattgg accactcctg
4200
gtgtgccaca ccaacacact gaatccagct catggcagac aggtgacagt ccaggagttt
4260
gccctgtttt tcactatttt tgatgagacc aagagctggt attttacaga gaatatggaa
4320
agaaactgca gagccccttg taatatccag atggaggacc caacctttaa ggagaactac
4380
aggttccatg ccatcaatgg ctacattatg gataccctgc ctggcctggt tatggcccag
4440
gatcagagga tcaggtggta tctgctgtca atgggctcca atgagaacat tcatagtatt
4500
cacttttcag gacatgtgtt cacagtgaga aagaaggagg agtataagat ggccctctat
4560
aatctctacc caggggtgtt tgagacagtt gagatgctgc catctaaggc aggcatctgg
4620
agagtggaat gcctcattgg agagcacctg catgctggca tgtccaccct gtttctggtg
4680
tactccaaca aatgtcagac ccctcttggt atggcctctg gccacattag ggatttccag
4740
attactgcca gtggtcagta tgggcagtgg gcccctaagc tggccagact gcactattct
4800
gggagcatca atgcctggtc caccaaggaa cctttttctt ggattaaagt ggatctgctg
4860
gccccaatga tcatccatgg gatcaagacc cagggagcta ggcagaagtt cagcagcctg
4920
tacattagtc agttcatcat tatgtacagt ctggatggca aaaagtggca gacatacagg
4980
ggcaattcca ctggaaccct gatggtgttc tttggaaatg tggatagcag tggtatcaag
5040
cacaacattt tcaaccctcc catcattgcc aggtacatca gactgcatcc aacccactac
5100
agcattagga gcacccttag gatggagctc atggggtgtg acctgaactc ttgctctatg
5160
ccacttggaa tggagagcaa ggccatctct gatgcccaga ttactgctag ttcctacttc
5220
accaatatgt ttgccacctg gtcacccagc aaggccaggc tgcacctgca gggaaggtcc
5280
aatgcttgga ggcctcaggt gaacaatcca aaggagtggc tgcaggtgga cttccagaag
5340
actatgaagg tgacaggagt gaccactcag ggagtgaaga gcctgctgac ctccatgtat
5400
gtgaaggagt ttctgatctc cagctcccag gatggccacc agtggaccct gttctttcag
5460
aatggcaagg tgaaggtgtt tcaggggaat caggactcct tcaccccagt ggtgaattcc
5520
ctggatcccc ctctgctgac cagatacctg agaatccacc cccagtcttg ggtgcaccag
5580
attgccctta ggatggaggt gctgggctgt gaggcccagg acctgtactg attaattaag
5640
agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt
5700
taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta
5760
ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct
5820
ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta
5880
actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta
5940
ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt
6000
tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg
6060
caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt
6120
tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag
6180
gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc
6240
catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg
6300
tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc
6360
tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg
6420
ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag tagcatggcg
6480
ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg ccactccctc
6540
tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg
6600
cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg catgcggtac
6660
caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt
6720
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat
6780
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac
6840
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat
6900
caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccgaaccaga
6960
taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg
7020
ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt
7080
tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt ttcttcctgt
7140
tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct tcggctactt
7200
tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tttgtaattg
7260
actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tgtagcggcg
7320
cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc
7380
tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc
7440
gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg
7500
accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg
7560
tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg
7620
gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt
7680
cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa
7740
tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt
7800
gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa
7860
tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta
7920
ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag
7980
taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca
8040
gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta
8100
aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc
8160
gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc
8220
ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca
8280
ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc
8340
acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca
8400
taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac
8460
tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg
8520
cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg
8580
ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg
8640
gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac
8700
gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc
8760
aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct
8820
aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc
8880
actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc
8940
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg
9000
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa
9060
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc
9120
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt
9180
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa
9240
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc
9300
tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc
9360
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct
9420
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat
9480
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc
9540
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg
9600
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc
9660
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc
9720
atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ggttacggtt
9780
gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt cttaaactga
9840
acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg
9900
aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac
9960
tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ccaagggcat
10020
ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg gccgggaagc
10080
cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca aagtgcatca
10140
cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca ccgtaatctg
10200
cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg agattgatga
10260
gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca tagatataga
10320
tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg ccaacaaccg
10380
cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ttcccgaggt
10440
aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca cgaccgaaaa
10500
gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat gtgcgaatga
10560
tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtaacatcgt
10620
tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac ggcgtaacgc
10680
gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata acaagccatg
10740
aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt
10800
gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt caactgggtt
10860
cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc
10920
gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag
10980
gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt
11040
caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa
11100
gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca ggactctagc
11160
tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg gagataatta
11220
aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gttttgtaat
11280
aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gcggatctcg
11340
gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata tcccaacgac
11400
cgaaaacctg tattttcagg gcgccatggg atcc
11434
<210> 215
<211> 13477
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 215
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600
ggtttaaacg ccgccaccat gcaaatagag ctctccacct gcttctttct gtgccttttg
660
cgattctgct ttagtgccac cagaagatac tacctgggtg cagtggaact gtcatgggac
720
tatatgcaaa gtgatctcgg tgagctgcct gtggacgcaa gatttcctcc tagagtgcca
780
aaatcttttc cattcaacac ctcagtcgtg tacaaaaaga ctctgtttgt agaattcacg
840
gatcaccttt tcaacatcgc taagccaagg ccaccctgga tgggtctgct aggtcctacc
900
atccaggctg aggtttatga tacagtggtc attacactta agaacatggc ttcccatcct
960
gtcagtcttc atgctgttgg tgtatcctac tggaaagctt ctgagggagc tgaatatgat
1020
gatcagacca gtcaaaggga gaaagaagat gataaagtct tccctggtgg aagccataca
1080
tatgtctggc aggtcctgaa agagaatggt ccaatggcct ctgacccact gtgccttacc
1140
tactcatatc tttctcatgt ggacctggta aaagacttga attcaggcct cattggagcc
1200
ctactagtat gtagagaagg gagtctggcc aaggaaaaga cacagacctt gcacaaattt
1260
atactacttt ttgctgtatt tgatgaaggg aaaagttggc actcagaaac aaagaactcc
1320
ttgatgcagg atagggatgc tgcatctgct cgggcctggc ctaaaatgca cacagtcaat
1380
ggttatgtaa acaggtctct gccaggtctg attggatgcc acaggaaatc agtctattgg
1440
catgtgattg gaatgggcac cactcctgaa gtgcactcaa tattcctcga aggtcacaca
1500
tttcttgtga ggaaccatcg ccaggcgtcc ttggaaatct cgccaataac tttccttact
1560
gctcaaacac tcttgatgga ccttggacag tttctactgt tttgtcatat ctcttcccac
1620
caacatgatg gcatggaagc ttatgtcaaa gtagacagct gtccagagga accccaacta
1680
cgaatgaaaa ataatgaaga agcggaagac tatgatgatg atcttactga ttctgaaatg
1740
gatgtggtca ggtttgatga tgacaactct ccttccttta tccaaattcg ctcagttgcc
1800
aagaagcatc ctaaaacttg ggtacattac attgctgctg aagaggagga ctgggactat
1860
gctcccttag tcctcgcccc cgatgacaga agttataaaa gtcaatattt gaacaatggc
1920
cctcagcgga ttggtaggaa gtacaaaaaa gtccgattta tggcatacac agatgaaacc
1980
tttaagactc gtgaagctat tcagcatgaa tcaggaatct tgggaccttt actttatggg
2040
gaagttggag acacactgtt gattatattt aagaatcaag caagcagacc atataacatc
2100
taccctcacg gaatcactga tgtccgtcct ttgtattcaa ggagattacc aaaaggtgta
2160
aaacatttga aggattttcc aattctgcca ggagaaatat tcaaatataa atggacagtg
2220
actgtagaag atgggccaac taaatcagat cctcggtgcc tgacccgcta ttactctagt
2280
ttcgttaata tggagagaga tctagcttca ggactcattg gccctctcct catctgctac
2340
aaagaatctg tagatcaaag aggaaaccag ataatgtcag acaagaggaa tgtcatcctg
2400
ttttctgtat ttgatgagaa ccgaagctgg tacctcacag agaatataca acgctttctc
2460
cccaatccag ctggagtgca gcttgaggat ccagagttcc aagcctccaa catcatgcac
2520
agcatcaatg gctatgtttt tgatagtttg cagttgtcag tttgtttgca tgaggtggca
2580
tactggtaca ttctaagcat tggagcacag actgacttcc tttctgtctt cttctctgga
2640
tataccttca aacacaaaat ggtctatgaa gacacactca ccctattccc attctcagga
2700
gaaactgtct tcatgtcgat ggaaaaccca ggtctatgga ttctggggtg ccacaactca
2760
gactttcgga acagaggcat gaccgcctta ctgaaggttt ctagttgtga caagaacact
2820
ggtgattatt acgaggacag ttatgaagat atttcagcat acttgctgag taaaaacaat
2880
gccattgaac caagaagctt ctcccagaat tcaagacacc ctagcactag gcaaaagcaa
2940
tttaatgcca ccacaattcc agaaaatgac atagagaaga ctgacccttg gtttgcacac
3000
agaacaccta tgcctaaaat acaaaatgtc tcctctagtg atttgttgat gctcttgcga
3060
cagagtccta ctccacatgg gctatcctta tctgatctcc aagaagccaa atatgagact
3120
ttttctgatg atccatcacc tggagcaata gacagtaata acagcctgtc tgaaatgaca
3180
cacttcaggc cacagctcca tcacagtggg gacatggtat ttacccctga gtcaggcctc
3240
caattaagat taaatgagaa actggggaca actgcagcaa cagagttgaa gaaacttgat
3300
ttcaaagttt ctagtacatc aaataatctg atttcaacaa ttccatcaga caatttggca
3360
gcaggtactg ataatacaag ttccttagga cccccaagta tgccagttca ttatgatagt
3420
caattagata ccactctatt tggcaaaaag tcatctcccc ttactgagtc tggtggacct
3480
ctgagcttga gtgaagaaaa taatgattca aagttgttag aatcaggttt aatgaatagc
3540
caagaaagtt catggggaaa aaatgtatcg tcaacagaga gtggtaggtt atttaaaggg
3600
aaaagagctc atggacctgc tttgttgact aaagataatg ccttattcaa agttagcatc
3660
tctttgttaa agacaaacaa aacttccaat aattcagcaa ctaatagaaa gactcacatt
3720
gatggcccat cattattaat tgagaatagt ccatcagtct ggcaaaatat attagaaagt
3780
gacactgagt ttaaaaaagt gacacctttg attcatgaca gaatgcttat ggacaaaaat
3840
gctacagctt tgaggctaaa tcatatgtca aataaaacta cttcatcaaa aaacatggaa
3900
atggtccaac agaaaaaaga gggccccatt ccaccagatg cacaaaatcc agatatgtcg
3960
ttctttaaga tgctattctt gccagaatca gcaaggtgga tacaaaggac tcatggaaag
4020
aactctctga actctgggca aggccccagt ccaaagcaat tagtatcctt aggaccagaa
4080
aaatctgtgg aaggtcagaa tttcttgtct gagaaaaaca aagtggtagt aggaaagggt
4140
gaatttacaa aggacgtagg actcaaagag atggtttttc caagcagcag aaacctattt
4200
cttactaact tggataattt acatgaaaat aatacacaca atcaagaaaa aaaaattcag
4260
gaagaaatag aaaagaagga aacattaatc caagagaatg tagttttgcc tcagatacat
4320
acagtgactg gcactaagaa tttcatgaag aaccttttct tactgagcac taggcaaaat
4380
gtagaaggtt catatgacgg ggcatatgct ccagtacttc aagattttag gtcattaaat
4440
gattcaacaa atagaacaaa gaaacacaca gctcatttct caaaaaaagg ggaggaagaa
4500
aacttggaag gcttgggaaa tcaaaccaag caaattgtag agaaatatgc atgcaccaca
4560
aggatatctc ctaatacaag ccagcagaat tttgtcacgc aacgtagtaa gagagctttg
4620
aaacaattca gactcccact agaagaaaca gaacttgaaa aaaggataat tgtggatgac
4680
acctcaaccc agtggtccaa aaacatgaaa catttgaccc cgagcaccct cacacagata
4740
gactacaatg agaaggagaa aggggccatt actcagtctc ccttatcaga ttgccttacg
4800
aggagtcata gcatccctca agcaaataga tctccattac ccattgcaaa ggtatcatca
4860
tttccatcta ttagacctat atatctgacc agggtcctat tccaagacaa ctcttctcat
4920
cttccagcag catcttatag aaagaaagat tctggggtcc aagaaagcag tcatttctta
4980
caaggagcca aaaaaaataa cctttcttta gccattctaa ccttggagat gactggtgat
5040
caaagagagg ttggctccct ggggacaagt gccacaaatt cagtcacata caagaaagtt
5100
gagaacactg ttctcccgaa accagacttg cccaaaacat ctggcaaagt tgaattgctt
5160
ccaaaagttc acatttatca gaaggaccta ttccctacgg aaactagcaa tgggtctcct
5220
ggccatctgg atctcgtgga agggagcctt cttcagggaa cagagggagc gattaagtgg
5280
aatgaagcaa acagacctgg aaaagttccc tttctgagag tagcaacaga aagctctgca
5340
aagactccct ccaagctatt ggatcctctt gcttgggata accactatgg tactcagata
5400
ccaaaagaag agtggaaatc ccaagagaag tcaccagaaa aaacagcttt taagaaaaag
5460
gataccattt tgtccctgaa cgcttgtgaa agcaatcatg caatagcagc aataaatgag
5520
ggacaaaata agcccgaaat agaagtcacc tgggcaaagc aaggtaggac tgaaaggctg
5580
tgctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt
5640
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa
5700
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca
5760
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca
5820
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc
5880
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat
5940
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc
6000
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat
6060
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac
6120
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg
6180
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt
6240
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa
6300
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg
6360
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat
6420
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct
6480
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct
6540
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg
6600
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt
6660
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg
6720
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt
6780
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat
6840
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg
6900
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc
6960
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat
7020
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata
7080
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat
7140
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc
7200
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac
7260
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg
7320
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag
7380
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg
7440
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt
7500
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac
7560
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac
7620
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctgattaatt
7680
aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac
7740
atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa
7800
ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac
7860
gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc
7920
ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag
7980
ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc
8040
ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg
8100
acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg
8160
ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga
8220
caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc
8280
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca
8340
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta
8400
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc
8460
atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg
8520
gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc
8580
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg
8640
cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcgcctcg aggcatgcgg
8700
taccaagctt gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt
8760
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc
8820
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat
8880
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact
8940
catcaatgta tcttatcatg tctggatctg atcactgata tcgcctagga gatccgaacc
9000
agataagtga aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg
9060
acgctacacc cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc
9120
atttccaccc ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc
9180
tgttatgttt ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta
9240
ctttttctct gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa
9300
ttgactgaat atcaacgctt atttgcagcc tgaatggcga atgggacgcg ccctgtagcg
9360
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg
9420
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc
9480
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc
9540
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga
9600
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa
9660
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga
9720
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca
9780
aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta
9840
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat
9900
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc
9960
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga
10020
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca
10080
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt
10140
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg
10200
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc
10260
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata
10320
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt
10380
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag
10440
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca
10500
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg
10560
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg
10620
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag
10680
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg
10740
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag
10800
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga
10860
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt
10920
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc
10980
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc
11040
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac
11100
caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac
11160
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt
11220
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct
11280
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat
11340
acctacagcg tgagcattga gaaagcgcca cgcttcccga agggagaaag gcggacaggt
11400
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg
11460
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt
11520
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt
11580
tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg
11640
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg
11700
agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta
11760
cgcatctgtg cggtatttca caccgcagac cagccgcgta acctggcaaa atcggttacg
11820
gttgagtaat aaatggatgc cctgcgtaag cgggtgtggg cggacaataa agtcttaaac
11880
tgaacaaaat agatctaaac tatgacaata aagtcttaaa ctagacagaa tagttgtaaa
11940
ctgaaatcag tccagttatg ctgtgaaaaa gcatactgga cttttgttat ggctaaagca
12000
aactcttcat tttctgaagt gcaaattgcc cgtcgtatta aagaggggcg tggccaaggg
12060
catggtaaag actatattcg cggcgttgtg acaatttacc gaacaactcc gcggccggga
12120
agccgatctc ggcttgaacg aattgttagg tggcggtact tgggtcgata tcaaagtgca
12180
tcacttcttc ccgtatgccc aactttgtat agagagccac tgcgggatcg tcaccgtaat
12240
ctgcttgcac gtagatcaca taagcaccaa gcgcgttggc ctcatgcttg aggagattga
12300
tgagcgcggt ggcaatgccc tgcctccggt gctcgccgga gactgcgaga tcatagatat
12360
agatctcact acgcggctgc tcaaacctgg gcagaacgta agccgcgaga gcgccaacaa
12420
ccgcttcttg gtcgaaggca gcaagcgcga tgaatgtctt actacggagc aagttcccga
12480
ggtaatcgga gtccggctga tgttgggagt aggtggctac gtctccgaac tcacgaccga
12540
aaagatcaag agcagcccgc atggatttga cttggtcagg gccgagccta catgtgcgaa
12600
tgatgcccat acttgagcca cctaactttg ttttagggcg actgccctgc tgcgtaacat
12660
cgttgctgct gcgtaacatc gttgctgctc cataacatca aacatcgacc cacggcgtaa
12720
cgcgcttgct gcttggatgc ccgaggcata gactgtacaa aaaaacagtc ataacaagcc
12780
atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg tcaaggttct ggaccagttg
12840
cgtgagcgca tacgctactt gcattacagt ttacgaaccg aacaggctta tgtcaactgg
12900
gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg caaccttggg cagcagcgaa
12960
gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg tttcggtctc cacgcatcgt
13020
caggcattgg cggccttgct gttcttctac ggcaaggtgc tgtgcacgga tctgccctgg
13080
cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc cggtggtgct gaccccggat
13140
gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc gtttgttcgc ccaggactct
13200
agctatagtt ctagtggttg gctacgtata ctccggaata ttaatagatc atggagataa
13260
ttaaaatgat aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt
13320
aataaaaaaa cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc
13380
tcggtccgaa accatgtcgt actaccatca ccatcaccat cacgattacg atatcccaac
13440
gaccgaaaac ctgtattttc agggcgccat gggatcc
13477
<210> 216
<211> 11180
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 216
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240
atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt
300
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt
360
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac
420
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag
480
taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt
540
gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac
600
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag
660
cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat
720
gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc
780
cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata
840
aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat
900
agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt
960
ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag
1020
tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag
1080
tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa
1140
tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag
1200
catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag
1260
aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa
1320
ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata
1380
tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg
1440
gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa
1500
aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct
1560
cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaga tagaattatc
1620
tacttgtttt tttctttgtc tgctcaggtt ctgcttctct gctacaagga ggtattactt
1680
aggtgctgta gagttatctt gggactacat gcagtctgat cttggggagc tccctgtgga
1740
tgcaagattt ccccctagag tacctaaaag tttccctttc aacacaagtg tggtgtataa
1800
gaagactctg tttgttgagt tcacagatca ccttttcaat attgccaagc ccagaccccc
1860
ctggatgggt ctactggggc caacaattca agcagaggta tatgatacag tggtgatcac
1920
attaaagaac atggcatccc accctgtaag cctgcatgct gttggtgtgt cctattggaa
1980
agcaagtgaa ggtgctgaat atgatgatca aacatcccaa agagagaagg aagatgacaa
2040
agtcttccca ggtggctctc acacctatgt gtggcaagtg ctcaaggaaa atgggcctat
2100
ggctagtgat ccattgtgcc tcacatatag ctacctgtcc catgtggact tagttaaaga
2160
tctgaactca ggtctgattg gtgccctgct ggtctgtagg gaaggatcac tagctaaaga
2220
aaaaacccag actttacaca agttcatctt attatttgct gtttttgatg agggaaagag
2280
ctggcactca gagactaaga attcactcat gcaggataga gatgcagctt ctgctagagc
2340
atggccaaaa atgcatactg tgaatgggta tgttaacagg agtctgcctg gcctcatagg
2400
ctgccataga aaatcagtgt actggcatgt cataggtatg ggcactactc ctgaggtgca
2460
ttccattttt ttggaggggc atactttcct tgtaagaaac cacaggcagg cttcattgga
2520
aattagtcca ataacctttc tcacagccca gactctgcta atggacttgg ggcagttttt
2580
attattttgt cacattagct ctcatcagca tgatggaatg gaagcctatg ttaaggttga
2640
ttcctgccca gaagagcccc agttgagaat gaagaacaat gaggaagcag aagactatga
2700
tgatgatcta acagactcag aaatggatgt tgtgagattt gatgatgata actccccaag
2760
ttttattcag atcaggtcag tggccaagaa acatccaaaa acatgggttc attatattgc
2820
agcagaagaa gaagactggg attatgcacc cttggtatta gcccctgatg acagaagcta
2880
taagtcacaa tatctcaaca atggacccca gagaattggc agaaagtaca aaaaagtcag
2940
gtttatggct tatactgatg agactttcaa aactagagag gctattcaac atgaatctgg
3000
catcctaggt cctttgttat atggggaagt aggggacacc ttattaatta tatttaaaaa
3060
ccaggccagt aggccttaca acatttaccc ccacggtata acagatgtca gaccactgta
3120
ctcaaggagg ctaccaaaag gggtgaagca cctaaaagac ttccccatcc tacctggtga
3180
gattttcaag tataagtgga cagtgactgt agaagatggt ccaaccaaat cagatcccag
3240
atgcctgaca aggtactaca gtagctttgt aaatatggag agagacctgg cctcagggtt
3300
aatagggccc ctactgatct gctacaagga gagtgtagac caaagaggca accaaattat
3360
gtcagacaag agaaatgtca tcctctttag tgtttttgat gagaataggt cctggtacct
3420
gacagaaaat atccaaagat tccttccaaa tccagcaggg gtacaactgg aggaccctga
3480
gttccaggcc tccaatatca tgcacagcat caatggttat gtgtttgaca gtttgcaact
3540
ttcagtgtgc cttcatgagg ttgcatactg gtatatactt tctatagggg cccagacaga
3600
cttcttgtca gttttctttt caggctatac tttcaagcat aagatggtat atgaagatac
3660
cctgactctt tttcccttta gtggtgagac agttttcatg tcaatggaaa acccagggct
3720
ttggatcttg ggatgccaca actctgactt tagaaacaga ggcatgactg cccttttaaa
3780
ggtgtcctct tgtgataaga atactggaga ctactatgag gacagctatg aggacatttc
3840
agcctatctg ctgtcaaaaa ataatgctat agagccaagg tcattttctc aaaatcctcc
3900
tgtcctgaag aggcaccaaa gagagataac caggactacc ttacagtctg accaggagga
3960
aattgattat gatgacacaa taagtgtgga gatgaaaaag gaggattttg atatttatga
4020
tgaggatgaa aaccaatctc caagatcttt ccagaagaag actagacact atttcattgc
4080
tgcagtggaa agactgtggg actatggaat gtcctccagc cctcatgttc tcaggaatag
4140
ggctcaaagt ggttctgtgc cacagttcaa gaaggtggtg tttcaggaat tcacagatgg
4200
gtcctttact caaccactgt ataggggaga actcaatgaa catctaggat tactaggtcc
4260
ctacattaga gctgaggtgg aggacaatat catggtcact ttcaggaacc aggcatctag
4320
accatactct ttttacagct ccttgatatc ttatgaagag gaccagagac agggtgcaga
4380
acccaggaag aactttgtga aacccaatga gaccaaaaca tacttctgga aggtccagca
4440
tcatatggct cctaccaagg atgaatttga ctgcaaagcc tgggcttact tctcagatgt
4500
ggatttggag aaagatgtgc acagtggctt gattgggcct cttttggtat gtcataccaa
4560
caccttaaac cctgctcatg gaagacaagt aacagtgcaa gagtttgccc tctttttcac
4620
tatatttgat gagacaaaaa gttggtactt tactgagaat atggagagga actgcagggc
4680
tccctgcaat atacagatgg aggatcctac tttcaaggaa aactataggt ttcatgccat
4740
taatggctat atcatggata cattgcctgg cttagttatg gcccaggatc agagaatcag
4800
atggtacctc cttagtatgg gaagcaatga aaacatacat tctattcact tcagtggaca
4860
tgtctttact gtgagaaaaa aggaagagta caagatggca ctgtacaatc tgtaccctgg
4920
agtgtttgag acagttgaga tgctgcccag caaggctggg atctggaggg tagaatgcct
4980
gattggagaa cacttacatg caggtatgtc cactctattc ttggtctatt ccaacaagtg
5040
tcagaccccc ctaggcatgg catctggcca tattagagat ttccagataa ctgcttctgg
5100
tcagtatggc cagtgggccc ccaagcttgc tagacttcac tacagtggtt caataaatgc
5160
ctggtccacc aaggagccct tcagctggat taaagtggac ttgctagccc ccatgatcat
5220
tcatgggata aaaacacagg gtgccagaca gaaattttca tctctgtaca tcagccagtt
5280
tatcatcatg tacagtctgg atggcaaaaa atggcagacc tacagaggta actctacagg
5340
tacactaatg gtattttttg gcaatgtaga ttcatcaggt atcaagcata atatctttaa
5400
tcctcccatt attgccagat acatcaggtt gcacccaact cattacagta taagatccac
5460
tttaaggatg gagcttatgg ggtgtgacct taatagctgc agtatgccct tgggaatgga
5520
aagtaaggcc atatcagatg cccagattac tgcaagcagc tactttacaa acatgtttgc
5580
aacctggtct cctagtaaag ccaggctgca cttgcagggt aggagcaatg catggagacc
5640
ccaggtcaat aacccaaaag agtggcttca agttgacttt caaaagacaa tgaaggtaac
5700
aggggtaacc acccaagggg taaagagtct gctgacatct atgtatgtaa aagaattcct
5760
catctcaagt agtcaagatg ggcaccagtg gacactgttc ttccagaatg gaaaagttaa
5820
ggtgttccaa ggtaatcaag acagcttcac tccagtggtg aacagtctgg atccaccact
5880
cctaaccagg tacctgagga tccaccctca gtcctgggtc caccagatag ctctgagaat
5940
ggaagtgctg ggctgtgaag ctcaggacct atactgatta attaataaaa tacagcatag
6000
caaaacttta acctccaaat caagcctcta cttgaatcct tttctgaggg atgaataagg
6060
cataggcatc aggggctgtt gccaatgtgc attagctgtt tgcagcctca ccttctttca
6120
tggagtttaa gatatagtgt attttcccaa ggtttgaact agctcttcat ttctttatgt
6180
tttaaatgca ctgacctccc acattccctt tttagtaaaa tattcagaaa taatttaaat
6240
acatcattgc aatgaaaata aatgtttttt attaggcaga atccagatgc tcaaggccct
6300
tcataatatc ccccagttta gtagttggac ttagggaaca aaggaacctt taatagaaat
6360
tggacagcaa gaaagcgagc tccataaagt aggaaacact acacgattcc ataaagtagg
6420
aaacactaca tcactccata aagtaggaaa cactacacag acatgataag atacattgat
6480
gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt
6540
gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat
6600
tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa
6660
aacctctaca aatgtggtac ttaagcatgg ctacgtagat aagtagcatg gcgggttaat
6720
cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc
6780
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt
6840
gagcgagcga gcgcgcagct gcctgcaggg gcgcgccgct agcagctgat gcatagcatg
6900
cggtaccggg agatggggga ggctaactga aacacggaag gagacaatac cggaaggaac
6960
ccgcgctatg acggcaataa aaagacagaa taaaacgcac gggtgttggg tcgtttgttc
7020
ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt
7080
gggaccaata cgcccgcgtt tcttcctttt ccccacccca acccccaagt tcgggtgaag
7140
gcccagggct cgcagccaac gtcggggcgg caagccctgc catagccact acgggtacgt
7200
aggccaacca ctagaactat agctagagtc ctgggcgaac aaacgatgct cgccttccag
7260
aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc gccgcgacgg
7320
ccgaggtcta ccgatctcct gaagccaggg cagatccgtg cacagcacct tgccgtagaa
7380
gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc
7440
cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt gacgcacacc
7500
gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta
7560
atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg
7620
taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc
7680
tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag
7740
caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt
7800
taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat
7860
ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc
7920
aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc
7980
ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt
8040
ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga
8100
ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg
8160
cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa
8220
agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac
8280
aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac
8340
gccgcgaata tagtctttac catgcccttg gccacgcccc tctttaatac gacgggcaat
8400
ttgcacttca gaaaatgaag agtttgcttt agccataaca aaagtccagt atgctttttc
8460
acagcataac tggactgatt tcagtttaca actattctgt ctagtttaag actttattgt
8520
catagtttag atctattttg ttcagtttaa gactttattg tccgcccaca cccgcttacg
8580
cagggcatcc atttattact caaccgtaac cgattttgcc aggttacgcg gctggtctgc
8640
ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt
8700
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact
8760
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag
8820
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata
8880
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc
8940
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg
9000
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc
9060
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg
9120
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc
9180
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga
9240
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg
9300
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa
9360
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg
9420
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt
9480
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat
9540
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct
9600
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta
9660
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa
9720
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac
9780
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa
9840
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag
9900
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg
9960
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag
10020
ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg
10080
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc
10140
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat
10200
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata
10260
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa
10320
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca
10380
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc
10440
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc
10500
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg
10560
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac
10620
ctgaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct
10680
cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg
10740
agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact
10800
ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac
10860
cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga
10920
gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga
10980
aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca
11040
ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca ttcaggctgc
11100
aaataagcgt tgatattcag tcaattacaa acattaataa cgaagagatg acagaaaaat
11160
tttcattctg tgacagagaa
11180
<210> 217
<211> 13862
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 217
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240
atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt
300
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt
360
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac
420
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag
480
taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt
540
gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac
600
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag
660
cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat
720
gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc
780
cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata
840
aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat
900
agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt
960
ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag
1020
tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag
1080
tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa
1140
tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag
1200
catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag
1260
aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa
1320
ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata
1380
tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg
1440
gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa
1500
aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct
1560
cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaaa tagagctctc
1620
cacctgcttc tttctgtgcc ttttgcgatt ctgctttagt gccaccagaa gatactacct
1680
gggtgcagtg gaactgtcat gggactatat gcaaagtgat ctcggtgagc tgcctgtgga
1740
cgcaagattt cctcctagag tgccaaaatc ttttccattc aacacctcag tcgtgtacaa
1800
aaagactctg tttgtagaat tcacggatca ccttttcaac atcgctaagc caaggccacc
1860
ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt tatgatacag tggtcattac
1920
acttaagaac atggcttccc atcctgtcag tcttcatgct gttggtgtat cctactggaa
1980
agcttctgag ggagctgaat atgatgatca gaccagtcaa agggagaaag aagatgataa
2040
agtcttccct ggtggaagcc atacatatgt ctggcaggtc ctgaaagaga atggtccaat
2100
ggcctctgac ccactgtgcc ttacctactc atatctttct catgtggacc tggtaaaaga
2160
cttgaattca ggcctcattg gagccctact agtatgtaga gaagggagtc tggccaagga
2220
aaagacacag accttgcaca aatttatact actttttgct gtatttgatg aagggaaaag
2280
ttggcactca gaaacaaaga actccttgat gcaggatagg gatgctgcat ctgctcgggc
2340
ctggcctaaa atgcacacag tcaatggtta tgtaaacagg tctctgccag gtctgattgg
2400
atgccacagg aaatcagtct attggcatgt gattggaatg ggcaccactc ctgaagtgca
2460
ctcaatattc ctcgaaggtc acacatttct tgtgaggaac catcgccagg cgtccttgga
2520
aatctcgcca ataactttcc ttactgctca aacactcttg atggaccttg gacagtttct
2580
actgttttgt catatctctt cccaccaaca tgatggcatg gaagcttatg tcaaagtaga
2640
cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagaagcgg aagactatga
2700
tgatgatctt actgattctg aaatggatgt ggtcaggttt gatgatgaca actctccttc
2760
ctttatccaa attcgctcag ttgccaagaa gcatcctaaa acttgggtac attacattgc
2820
tgctgaagag gaggactggg actatgctcc cttagtcctc gcccccgatg acagaagtta
2880
taaaagtcaa tatttgaaca atggccctca gcggattggt aggaagtaca aaaaagtccg
2940
atttatggca tacacagatg aaacctttaa gactcgtgaa gctattcagc atgaatcagg
3000
aatcttggga cctttacttt atggggaagt tggagacaca ctgttgatta tatttaagaa
3060
tcaagcaagc agaccatata acatctaccc tcacggaatc actgatgtcc gtcctttgta
3120
ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat tttccaattc tgccaggaga
3180
aatattcaaa tataaatgga cagtgactgt agaagatggg ccaactaaat cagatcctcg
3240
gtgcctgacc cgctattact ctagtttcgt taatatggag agagatctag cttcaggact
3300
cattggccct ctcctcatct gctacaaaga atctgtagat caaagaggaa accagataat
3360
gtcagacaag aggaatgtca tcctgttttc tgtatttgat gagaaccgaa gctggtacct
3420
cacagagaat atacaacgct ttctccccaa tccagctgga gtgcagcttg aggatccaga
3480
gttccaagcc tccaacatca tgcacagcat caatggctat gtttttgata gtttgcagtt
3540
gtcagtttgt ttgcatgagg tggcatactg gtacattcta agcattggag cacagactga
3600
cttcctttct gtcttcttct ctggatatac cttcaaacac aaaatggtct atgaagacac
3660
actcacccta ttcccattct caggagaaac tgtcttcatg tcgatggaaa acccaggtct
3720
atggattctg gggtgccaca actcagactt tcggaacaga ggcatgaccg ccttactgaa
3780
ggtttctagt tgtgacaaga acactggtga ttattacgag gacagttatg aagatatttc
3840
agcatacttg ctgagtaaaa acaatgccat tgaaccaaga agcttctccc agaattcaag
3900
acaccctagc actaggcaaa agcaatttaa tgccaccaca attccagaaa atgacataga
3960
gaagactgac ccttggtttg cacacagaac acctatgcct aaaatacaaa atgtctcctc
4020
tagtgatttg ttgatgctct tgcgacagag tcctactcca catgggctat ccttatctga
4080
tctccaagaa gccaaatatg agactttttc tgatgatcca tcacctggag caatagacag
4140
taataacagc ctgtctgaaa tgacacactt caggccacag ctccatcaca gtggggacat
4200
ggtatttacc cctgagtcag gcctccaatt aagattaaat gagaaactgg ggacaactgc
4260
agcaacagag ttgaagaaac ttgatttcaa agtttctagt acatcaaata atctgatttc
4320
aacaattcca tcagacaatt tggcagcagg tactgataat acaagttcct taggaccccc
4380
aagtatgcca gttcattatg atagtcaatt agataccact ctatttggca aaaagtcatc
4440
tccccttact gagtctggtg gacctctgag cttgagtgaa gaaaataatg attcaaagtt
4500
gttagaatca ggtttaatga atagccaaga aagttcatgg ggaaaaaatg tatcgtcaac
4560
agagagtggt aggttattta aagggaaaag agctcatgga cctgctttgt tgactaaaga
4620
taatgcctta ttcaaagtta gcatctcttt gttaaagaca aacaaaactt ccaataattc
4680
agcaactaat agaaagactc acattgatgg cccatcatta ttaattgaga atagtccatc
4740
agtctggcaa aatatattag aaagtgacac tgagtttaaa aaagtgacac ctttgattca
4800
tgacagaatg cttatggaca aaaatgctac agctttgagg ctaaatcata tgtcaaataa
4860
aactacttca tcaaaaaaca tggaaatggt ccaacagaaa aaagagggcc ccattccacc
4920
agatgcacaa aatccagata tgtcgttctt taagatgcta ttcttgccag aatcagcaag
4980
gtggatacaa aggactcatg gaaagaactc tctgaactct gggcaaggcc ccagtccaaa
5040
gcaattagta tccttaggac cagaaaaatc tgtggaaggt cagaatttct tgtctgagaa
5100
aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac gtaggactca aagagatggt
5160
ttttccaagc agcagaaacc tatttcttac taacttggat aatttacatg aaaataatac
5220
acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag aaggaaacat taatccaaga
5280
gaatgtagtt ttgcctcaga tacatacagt gactggcact aagaatttca tgaagaacct
5340
tttcttactg agcactaggc aaaatgtaga aggttcatat gacggggcat atgctccagt
5400
acttcaagat tttaggtcat taaatgattc aacaaataga acaaagaaac acacagctca
5460
tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg ggaaatcaaa ccaagcaaat
5520
tgtagagaaa tatgcatgca ccacaaggat atctcctaat acaagccagc agaattttgt
5580
cacgcaacgt agtaagagag ctttgaaaca attcagactc ccactagaag aaacagaact
5640
tgaaaaaagg ataattgtgg atgacacctc aacccagtgg tccaaaaaca tgaaacattt
5700
gaccccgagc accctcacac agatagacta caatgagaag gagaaagggg ccattactca
5760
gtctccctta tcagattgcc ttacgaggag tcatagcatc cctcaagcaa atagatctcc
5820
attacccatt gcaaaggtat catcatttcc atctattaga cctatatatc tgaccagggt
5880
cctattccaa gacaactctt ctcatcttcc agcagcatct tatagaaaga aagattctgg
5940
ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa aataaccttt ctttagccat
6000
tctaaccttg gagatgactg gtgatcaaag agaggttggc tccctgggga caagtgccac
6060
aaattcagtc acatacaaga aagttgagaa cactgttctc ccgaaaccag acttgcccaa
6120
aacatctggc aaagttgaat tgcttccaaa agttcacatt tatcagaagg acctattccc
6180
tacggaaact agcaatgggt ctcctggcca tctggatctc gtggaaggga gccttcttca
6240
gggaacagag ggagcgatta agtggaatga agcaaacaga cctggaaaag ttccctttct
6300
gagagtagca acagaaagct ctgcaaagac tccctccaag ctattggatc ctcttgcttg
6360
ggataaccac tatggtactc agataccaaa agaagagtgg aaatcccaag agaagtcacc
6420
agaaaaaaca gcttttaaga aaaaggatac cattttgtcc ctgaacgctt gtgaaagcaa
6480
tcatgcaata gcagcaataa atgagggaca aaataagccc gaaatagaag tcacctgggc
6540
aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca ccagtcttga aacgccatca
6600
acgggaaata actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac
6660
catatcagtt gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag
6720
cccccgcagc tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg
6780
ggattatggg atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt
6840
ccctcagttc aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt
6900
ataccgtgga gaactaaatg aacatttggg actcctgggg ccatatataa gagcagaagt
6960
tgaagataat atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc
7020
tagccttatt tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt
7080
caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa
7140
agatgagttt gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt
7200
gcactcaggc ctgattggac cccttctggt ctgccacact aacacactga accctgctca
7260
tgggagacaa gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa
7320
aagctggtac ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat
7380
ggaagatccc acttttaaag agaattatcg cttccatgca atcaatggct acataatgga
7440
tacactacct ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat
7500
gggcagcaat gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa
7560
aaaagaggag tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga
7620
aatgttacca tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca
7680
tgctgggatg agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat
7740
ggcttctgga cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc
7800
cccaaagctg gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc
7860
cttttcttgg atcaaggtgg atctgttggc accaatgatt attcacggca tcaagaccca
7920
gggtgcccgt cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct
7980
tgatgggaag aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt
8040
tggcaatgtg gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg
8100
atacatccgt ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat
8160
gggctgtgat ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga
8220
tgcacagatt actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa
8280
agctcgactt cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa
8340
agagtggctg caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg
8400
agtaaaatct ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga
8460
tggccatcag tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca
8520
agactccttc acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg
8580
aattcacccc cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga
8640
ggcacaggac ctctactgat taattaataa aatacagcat agcaaaactt taacctccaa
8700
atcaagcctc tacttgaatc cttttctgag ggatgaataa ggcataggca tcaggggctg
8760
ttgccaatgt gcattagctg tttgcagcct caccttcttt catggagttt aagatatagt
8820
gtattttccc aaggtttgaa ctagctcttc atttctttat gttttaaatg cactgacctc
8880
ccacattccc tttttagtaa aatattcaga aataatttaa atacatcatt gcaatgaaaa
8940
taaatgtttt ttattaggca gaatccagat gctcaaggcc cttcataata tcccccagtt
9000
tagtagttgg acttagggaa caaaggaacc tttaatagaa attggacagc aagaaagcga
9060
gctccataaa gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca
9120
taaagtagga aacactacac agacatgata agatacattg atgagtttgg acaaaccaca
9180
actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt
9240
gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt
9300
caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt
9360
acttaagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag
9420
gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag
9480
gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag
9540
ctgcctgcag gggcgcgccg ctagcagctg atgcatagca tgcggtaccg ggagatgggg
9600
gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat
9660
aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt
9720
cccagggctg gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg
9780
tttcttcctt ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca
9840
acgtcggggc ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact
9900
atagctagag tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac
9960
cacttcatcc ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc
10020
ctgaagccag ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa
10080
tgcctgacga tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc
10140
ctcgacttcg ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc
10200
acgaacccag ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg
10260
ctcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt
10320
tttcatggct tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca
10380
agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca
10440
gcaacgatgt tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg
10500
gcatcattcg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg
10560
atcttttcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg
10620
attacctcgg gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag
10680
aagcggttgt tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg
10740
agatctatat ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg
10800
cgctcatcaa tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc
10860
aagcagatta cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag
10920
aagtgatgca ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga
10980
tcggcttccc ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt
11040
accatgccct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga
11100
agagtttgct ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga
11160
tttcagttta caactattct gtctagttta agactttatt gtcatagttt agatctattt
11220
tgttcagttt aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta
11280
ctcaaccgta accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca
11340
gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc
11400
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt
11460
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg
11520
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg
11580
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat
11640
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta
11700
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct
11760
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc
11820
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa
11880
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg
11940
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag
12000
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt
12060
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta
12120
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc
12180
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca
12240
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa
12300
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat
12360
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct
12420
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt
12480
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat
12540
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta
12600
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg
12660
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt
12720
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg
12780
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg
12840
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc
12900
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa
12960
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac
13020
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt
13080
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg
13140
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa
13200
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata
13260
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta
13320
atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg
13380
ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg
13440
ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa
13500
aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg
13560
ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt
13620
gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg
13680
ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta
13740
atgcgccgct acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc
13800
agtcaattac aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag
13860
aa
13862
<210> 218
<211> 2351
<212> БЕЛОК
<213> Homo sapiens
<400> 218
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe
980 985 990
Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala
995 1000 1005
Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser
1010 1015 1020
Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser
1025 1030 1035
Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu
1040 1045 1050
Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg
1055 1060 1065
Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met
1070 1075 1080
Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln
1085 1090 1095
Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met
1100 1105 1110
Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile
1115 1120 1125
Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro
1130 1135 1140
Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu
1145 1150 1155
Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys
1160 1165 1170
Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro
1175 1180 1185
Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu
1190 1195 1200
Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu
1205 1210 1215
Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile
1220 1225 1230
His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu
1235 1240 1245
Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr
1250 1255 1260
Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn
1265 1270 1275
Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu
1280 1285 1290
Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu
1295 1300 1305
Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln
1310 1315 1320
Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg
1325 1330 1335
Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp
1340 1345 1350
Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro
1355 1360 1365
Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala
1370 1375 1380
Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser
1385 1390 1395
Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser
1400 1405 1410
Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe
1415 1420 1425
Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys
1430 1435 1440
Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys
1445 1450 1455
Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly
1460 1465 1470
Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser
1475 1480 1485
Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp
1490 1495 1500
Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His
1505 1510 1515
Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser
1520 1525 1530
Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr
1535 1540 1545
Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val
1550 1555 1560
Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser
1565 1570 1575
Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln
1580 1585 1590
Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys
1595 1600 1605
Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys
1610 1615 1620
Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys
1625 1630 1635
Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg
1640 1645 1650
Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu
1655 1660 1665
Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1670 1675 1680
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile
1685 1690 1695
Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
1700 1705 1710
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
1715 1720 1725
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
1730 1735 1740
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
1745 1750 1755
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
1760 1765 1770
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
1775 1780 1785
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser
1790 1795 1800
Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly
1805 1810 1815
Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
1820 1825 1830
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu
1835 1840 1845
Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu
1850 1855 1860
Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
1865 1870 1875
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
1880 1885 1890
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp
1895 1900 1905
Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
1910 1915 1920
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His
1925 1930 1935
Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1940 1945 1950
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
1955 1960 1965
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1970 1975 1980
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1985 1990 1995
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
2000 2005 2010
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
2015 2020 2025
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
2030 2035 2040
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
2045 2050 2055
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
2060 2065 2070
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
2075 2080 2085
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
2090 2095 2100
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
2105 2110 2115
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
2120 2125 2130
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
2135 2140 2145
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
2150 2155 2160
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
2165 2170 2175
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
2180 2185 2190
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
2195 2200 2205
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
2210 2215 2220
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
2225 2230 2235
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
2240 2245 2250
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
2255 2260 2265
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
2270 2275 2280
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
2285 2290 2295
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
2300 2305 2310
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
2315 2320 2325
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
2330 2335 2340
Gly Cys Glu Ala Gln Asp Leu Tyr
2345 2350
<210> 219
<400> 219
000
<210> 220
<400> 220
000
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<400> 230
000
<210> 231
<400> 231
000
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<400> 300
000
<210> 301
<400> 301
000
<210> 302
<400> 302
000
<210> 303
<400> 303
000
<210> 304
<400> 304
000
<210> 305
<400> 305
000
<210> 306
<400> 306
000
<210> 307
<400> 307
000
<210> 308
<400> 308
000
<210> 309
<400> 309
000
<210> 310
<400> 310
000
<210> 311
<400> 311
000
<210> 312
<400> 312
000
<210> 313
<400> 313
000
<210> 314
<400> 314
000
<210> 315
<400> 315
000
<210> 316
<400> 316
000
<210> 317
<400> 317
000
<210> 318
<400> 318
000
<210> 319
<400> 319
000
<210> 320
<400> 320
000
<210> 321
<400> 321
000
<210> 322
<400> 322
000
<210> 323
<400> 323
000
<210> 324
<400> 324
000
<210> 325
<400> 325
000
<210> 326
<400> 326
000
<210> 327
<400> 327
000
<210> 328
<400> 328
000
<210> 329
<400> 329
000
<210> 330
<400> 330
000
<210> 331
<400> 331
000
<210> 332
<400> 332
000
<210> 333
<400> 333
000
<210> 334
<400> 334
000
<210> 335
<400> 335
000
<210> 336
<400> 336
000
<210> 337
<400> 337
000
<210> 338
<400> 338
000
<210> 339
<400> 339
000
<210> 340
<400> 340
000
<210> 341
<400> 341
000
<210> 342
<400> 342
000
<210> 343
<400> 343
000
<210> 344
<400> 344
000
<210> 345
<400> 345
000
<210> 346
<400> 346
000
<210> 347
<400> 347
000
<210> 348
<400> 348
000
<210> 349
<400> 349
000
<210> 350
<400> 350
000
<210> 351
<400> 351
000
<210> 352
<400> 352
000
<210> 353
<400> 353
000
<210> 354
<400> 354
000
<210> 355
<400> 355
000
<210> 356
<400> 356
000
<210> 357
<400> 357
000
<210> 358
<400> 358
000
<210> 359
<400> 359
000
<210> 360
<400> 360
000
<210> 361
<400> 361
000
<210> 362
<400> 362
000
<210> 363
<400> 363
000
<210> 364
<400> 364
000
<210> 365
<400> 365
000
<210> 366
<400> 366
000
<210> 367
<400> 367
000
<210> 368
<400> 368
000
<210> 369
<400> 369
000
<210> 370
<400> 370
000
<210> 371
<400> 371
000
<210> 372
<400> 372
000
<210> 373
<400> 373
000
<210> 374
<400> 374
000
<210> 375
<400> 375
000
<210> 376
<400> 376
000
<210> 377
<400> 377
000
<210> 378
<400> 378
000
<210> 379
<400> 379
000
<210> 380
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 380
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc
60
accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg
120
ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac
180
acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat
300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360
ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg
420
gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg
480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat
540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg
660
tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat
720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc
780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc
840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac
900
aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag
1020
gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag
1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat
1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc
1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg
1320
aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc
1380
atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg
1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact
1500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc
1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc
1620
accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg
1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag
1740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag
1800
aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg
1860
cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg
1920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
1980
attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag
2040
atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc
2100
atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc
2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac
2220
agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc
2280
ttcagccaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg
2340
cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag
2400
gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc
2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc
2520
catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc
2580
caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac
2640
ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc
2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac
2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac
2820
ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg
2880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg
2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag
3000
tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg
3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac
3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc
3180
caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc
3240
atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg
3300
tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc
3360
tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg
3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc
3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac
3540
tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
3600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc
3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac
3720
aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc
3780
aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac
3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc
3900
atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac
3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg
4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag
4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg
4140
tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc
4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac
4260
agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac
4320
cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga
4374
<210> 381
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 381
atgcagattg agctgagcac ctgcttcttc ctgtgtctgc tgaggttctg cttctctgcc
60
accaggaggt attacctggg ggctgtggag ctgagctggg actatatgca gtctgacctg
120
ggggagctgc ctgtggatgc taggttcccc cccagggtgc ccaagagctt cccctttaac
180
acttctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240
gccaagccca ggcccccctg gatggggctg ctggggccca ccatccaggc tgaggtgtat
300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360
ggggtgagct actggaaggc ttctgagggg gctgagtatg atgaccagac tagccagagg
420
gagaaggagg atgacaaggt gtttcctggg ggcagccata cctatgtgtg gcaggtgctg
480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgtctcat
540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ctctgctggt gtgtagggag
600
ggcagcctgg ctaaggaaaa gacccagacc ctgcataagt ttatcctgct gtttgctgtg
660
tttgatgagg gcaagagctg gcactctgag accaagaaca gcctgatgca ggatagggat
720
gctgcctctg ccagggcttg gcctaagatg cacactgtga atgggtatgt gaataggagc
780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tgggatgggc
840
accacccctg aggtccatag catcttcctg gagggccaca ctttcctggt gaggaaccac
900
agacaggcct ctctggagat ctctcccatc accttcctga ctgctcagac tctgctgatg
960
gacctgggcc agttcctgct gttttgccat attagcagcc accagcatga tgggatggag
1020
gcctatgtga aggtggatag ctgccctgag gagcctcagc tgaggatgaa gaacaatgag
1080
gaggctgaag actatgatga tgacctgact gattctgaga tggatgtggt gaggtttgat
1140
gatgacaata gccccagctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc
1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgctcccct ggtgctggcc
1260
cctgatgata ggtcttataa gagccagtac ctgaacaatg ggccccagag gattggcagg
1320
aagtacaaga aggtgaggtt catggcctac actgatgaaa ccttcaaaac cagggaggcc
1380
attcagcatg agtctggcat cctgggccct ctgctgtatg gggaggtggg ggacaccctg
1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctatcctca tggcatcact
1500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaagacttc
1560
cccatcctgc ctggggagat ctttaagtat aagtggactg tgactgtgga ggatggccct
1620
accaagtctg accccaggtg tctgaccagg tactattcta gctttgtgaa catggagagg
1680
gacctggcct ctggcctgat tgggcccctg ctgatctgct acaaggagtc tgtggaccag
1740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttttctgt gtttgatgag
1800
aataggagct ggtacctgac tgagaacatc cagaggtttc tgcccaatcc tgctggggtg
1860
cagctggagg atcctgagtt ccaggccagc aatatcatgc atagcatcaa tggctatgtg
1920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
1980
attggggccc agactgactt tctgtctgtg ttcttttctg gctatacctt caagcacaag
2040
atggtgtatg aggataccct gaccctgttc cccttctctg gggagactgt gttcatgagc
2100
atggagaatc ctgggctgtg gatcctgggg tgccacaact ctgattttag gaacaggggg
2160
atgactgccc tgctgaaggt gtctagctgt gataagaaca ctggggacta ctatgaggac
2220
agctatgagg acatttctgc ttatctgctg tctaagaata atgccattga gcccagaagc
2280
ttcagccaga atccccctgt gctgaagaga catcagaggg agatcaccag aactaccctg
2340
cagtctgatc aggaggagat tgactatgat gacactatct ctgtggagat gaagaaggag
2400
gactttgaca tctatgatga ggatgagaat cagtctccca ggagctttca gaagaagacc
2460
agacattact tcattgctgc tgtggagagg ctgtgggact atggcatgag ctctagccct
2520
catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc
2580
caggaattca ctgatggcag cttcacccag cccctgtaca ggggggagct gaatgagcac
2640
ctgggcctgc tggggcctta tatcagggct gaggtggagg ataatattat ggtgactttc
2700
aggaaccagg ccagcaggcc ctactctttc tatagcagcc tgatctctta tgaggaggat
2760
cagaggcagg gggctgagcc taggaagaac tttgtgaagc ccaatgagac taagacctac
2820
ttctggaagg tccagcacca catggcccct accaaggatg agtttgactg caaggcctgg
2880
gcctatttct ctgatgtgga tctggagaag gatgtccatt ctgggctgat tggccccctg
2940
ctggtgtgcc acactaacac tctgaatcct gcccatggca ggcaggtgac tgtccaggag
3000
tttgccctgt tcttcactat ctttgatgag accaagagct ggtactttac tgagaacatg
3060
gagaggaact gcagagctcc ttgcaatatt cagatggagg accccacctt caaggagaat
3120
tacaggttcc atgccattaa tgggtacatc atggacaccc tgcctggcct ggtgatggct
3180
caggaccaga ggatcaggtg gtacctgctg agcatgggct ctaatgagaa tatccacagc
3240
atccacttct ctgggcatgt gttcactgtg aggaagaagg aggagtacaa gatggctctg
3300
tataatctgt accctggggt gtttgaaact gtggagatgc tgccctctaa ggctggcatc
3360
tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg
3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc
3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactat
3540
tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
3600
ctggccccca tgatcattca tggcatcaag acccaggggg ccaggcagaa gttcagctct
3660
ctgtacatct ctcagttcat catcatgtac tctctggatg ggaagaagtg gcagacctac
3720
aggggcaaca gcactggcac cctgatggtg ttctttggga atgtggactc ttctggcatc
3780
aagcacaaca tcttcaatcc ccccatcatt gctaggtata ttaggctgca tcccacccac
3840
tacagcatca ggtctaccct gaggatggag ctgatgggct gtgacctgaa ctcttgcagc
3900
atgcccctgg gcatggagtc taaggccatc tctgatgccc agattactgc cagcagctac
3960
ttcaccaaca tgtttgccac ctggagcccc tctaaggcca ggctgcatct gcaggggagg
4020
agcaatgcct ggaggcctca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag
4080
aagaccatga aggtgactgg ggtgaccacc cagggggtca agagcctgct gaccagcatg
4140
tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac tctgttcttt
4200
cagaatggga aggtgaaggt gtttcagggc aatcaggact ctttcacccc tgtggtgaac
4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagtc ttgggtgcat
4320
cagattgccc tgaggatgga ggtgctgggc tgtgaggctc aggatctgta ctga
4374
<210> 382
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 382
atgcagatcg agctctccac ctgcttcttt ctgtgcctgt tgagattctg cttcagcgcc
60
accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg
120
ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac
180
acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat
300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360
ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg
420
gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg
480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat
540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg
660
tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat
720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc
780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc
840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac
900
aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag
1020
gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag
1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat
1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc
1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg
1320
aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc
1380
atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg
1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact
1500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc
1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc
1620
accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg
1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag
1740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag
1800
aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg
1860
cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg
1920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
1980
attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag
2040
atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc
2100
atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc
2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac
2220
agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc
2280
ttcagccaga atccacccgt ccttaagcgc catcagcgcg agatcaccag gaccaccctg
2340
cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag
2400
gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc
2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc
2520
catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc
2580
caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac
2640
ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc
2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac
2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac
2820
ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg
2880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg
2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag
3000
tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg
3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac
3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc
3180
caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc
3240
atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg
3300
tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc
3360
tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg
3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc
3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac
3540
tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
3600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc
3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac
3720
aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc
3780
aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac
3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc
3900
atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac
3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcatct gcagggcagg
4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag
4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg
4140
tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc
4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac
4260
agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac
4320
cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga
4374
<210> 383
<211> 7056
<212> ДНК
<213> Homo sapiens
<400> 383
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc
60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc
120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac
180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc
240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat
300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt
360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg
420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg
480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat
540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa
600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta
660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat
720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct
780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc
840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat
900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg
960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa
1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa
1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat
1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact
1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc
1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg
1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct
1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg
1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact
1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt
1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca
1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga
1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa
1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag
1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg
1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt
1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc
1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa
2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg
2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc
2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac
2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc
2280
ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt
2340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa
2400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat
2460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca
2520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc
2580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag
2640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca
2700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca
2760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta
2820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa
2880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga
2940
aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct
3000
gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac
3060
aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta
3120
attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa
3180
gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta
3240
aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa
3300
gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc
3360
ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg
3420
caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag
3480
aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta
3540
ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat
3600
ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag
3660
gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag
3720
aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac
3780
ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca
3840
aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga
3900
aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca
3960
agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca
4020
ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc
4080
aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag
4140
aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct
4200
caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct
4260
atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat
4320
agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat
4380
aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc
4440
ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg
4500
aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat
4560
cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg
4620
gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct
4680
ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta
4740
ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa
4800
tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg
4860
aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa
4920
atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca
4980
gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa
5040
attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat
5100
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct
5160
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg
5220
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc
5280
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca
5340
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt
5400
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa
5460
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat
5520
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt
5580
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac
5640
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc
5700
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct
5760
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc
5820
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga
5880
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat
5940
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt
6000
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt
6060
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt
6120
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga
6180
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc
6240
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt
6300
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt
6360
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga
6420
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac
6480
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact
6540
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag
6600
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc
6660
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct
6720
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca
6780
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc
6840
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag
6900
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta
6960
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg
7020
gaggttctgg gctgcgaggc acaggacctc tactga
7056
<210> 384
<211> 4425
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 384
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc
60
accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg
120
ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac
180
acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat
300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360
ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg
420
gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg
480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat
540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg
660
tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat
720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc
780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc
840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac
900
aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag
1020
gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag
1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat
1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc
1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg
1320
aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc
1380
atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg
1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact
1500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc
1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc
1620
accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg
1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag
1740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag
1800
aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg
1860
cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg
1920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
1980
attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag
2040
atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc
2100
atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc
2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac
2220
agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc
2280
ttcagccaga atgccactaa tgtgtctaac aacagcaaca ccagcaatga cagcaatgtg
2340
tctcccccag tgctgaagag gcaccagagg gagatcacca ggaccaccct gcagtctgac
2400
caggaggaga ttgactatga tgacaccatc tctgtggaga tgaagaagga ggactttgac
2460
atctacgacg aggacgagaa ccagagcccc aggagcttcc agaagaagac caggcactac
2520
ttcattgctg ctgtggagag gctgtgggac tatggcatga gcagcagccc ccatgtgctg
2580
aggaacaggg cccagtctgg ctctgtgccc cagttcaaga aggtggtgtt ccaggagttc
2640
actgatggca gcttcaccca gcccctgtac agaggggagc tgaatgagca cctgggcctg
2700
ctgggcccct acatcagggc tgaggtggag gacaacatca tggtgacctt caggaaccag
2760
gccagcaggc cctacagctt ctacagcagc ctgatcagct atgaggagga ccagaggcag
2820
ggggctgagc ccaggaagaa ctttgtgaag cccaatgaaa ccaagaccta cttctggaag
2880
gtgcagcacc acatggcccc caccaaggat gagtttgact gcaaggcctg ggcctacttc
2940
tctgatgtgg acctggagaa ggatgtgcac tctggcctga ttggccccct gctggtgtgc
3000
cacaccaaca ccctgaaccc tgcccatggc aggcaggtga ctgtgcagga gtttgccctg
3060
ttcttcacca tctttgatga aaccaagagc tggtacttca ctgagaacat ggagaggaac
3120
tgcagggccc cctgcaacat ccagatggag gaccccacct tcaaggagaa ctacaggttc
3180
catgccatca atggctacat catggacacc ctgcctggcc tggtgatggc ccaggaccag
3240
aggatcaggt ggtacctgct gagcatgggc agcaatgaga acatccacag catccacttc
3300
tctggccatg tgttcactgt gaggaagaag gaggagtaca agatggccct gtacaacctg
3360
taccctgggg tgtttgagac tgtggagatg ctgcccagca aggctggcat ctggagggtg
3420
gagtgcctga ttggggagca cctgcatgct ggcatgagca ccctgttcct ggtgtacagc
3480
aacaagtgcc agacccccct gggcatggcc tctggccaca tcagggactt ccagatcact
3540
gcctctggcc agtatggcca gtgggccccc aagctggcca ggctgcacta ctctggcagc
3600
atcaatgcct ggagcaccaa ggagcccttc agctggatca aggtggacct gctggccccc
3660
atgatcatcc atggcatcaa gacccagggg gccaggcaga agttcagcag cctgtacatc
3720
agccagttca tcatcatgta cagcctggat ggcaagaagt ggcagaccta caggggcaac
3780
agcactggca ccctgatggt gttctttggc aatgtggaca gctctggcat caagcacaac
3840
atcttcaacc cccccatcat tgccagatac atcaggctgc accccaccca ctacagcatc
3900
aggagcaccc tgaggatgga gctgatgggc tgtgacctga acagctgcag catgcccctg
3960
ggcatggaga gcaaggccat ctctgatgcc cagatcactg ccagcagcta cttcaccaac
4020
atgtttgcca cctggagccc cagcaaggcc aggctgcacc tgcagggcag gagcaatgcc
4080
tggaggcccc aggtcaacaa ccccaaggag tggctgcagg tggacttcca gaagaccatg
4140
aaggtgactg gggtgaccac ccagggggtg aagagcctgc tgaccagcat gtatgtgaag
4200
gagttcctga tcagcagcag ccaggatggc caccagtgga ccctgttctt ccagaatggc
4260
aaggtgaagg tgttccaggg caaccaggac agcttcaccc ctgtggtgaa cagcctggac
4320
ccccccctgc tgaccagata cctgaggatt cacccccaga gctgggtgca ccagattgcc
4380
ctgaggatgg aggtgctggg ctgtgaggcc caggacctgt actga
4425
<210> 385
<211> 1474
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 385
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala Thr Asn Val
755 760 765
Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser Pro Pro Val
770 775 780
Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp
785 790 795 800
Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys
805 810 815
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
820 825 830
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
835 840 845
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
850 855 860
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
865 870 875 880
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
885 890 895
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
900 905 910
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
915 920 925
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
930 935 940
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
945 950 955 960
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
965 970 975
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
980 985 990
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
995 1000 1005
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr
1010 1015 1020
Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu
1025 1030 1035
Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr
1040 1045 1050
Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met
1055 1060 1065
Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg
1070 1075 1080
Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile
1085 1090 1095
His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr
1100 1105 1110
Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val
1115 1120 1125
Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu
1130 1135 1140
Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val
1145 1150 1155
Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His
1160 1165 1170
Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp
1175 1180 1185
Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala
1190 1195 1200
Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu
1205 1210 1215
Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln
1220 1225 1230
Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser
1235 1240 1245
Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly
1250 1255 1260
Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys
1265 1270 1275
His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu
1280 1285 1290
His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu
1295 1300 1305
Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu
1310 1315 1320
Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe
1325 1330 1335
Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His
1340 1345 1350
Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro
1355 1360 1365
Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr
1370 1375 1380
Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr
1385 1390 1395
Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp
1400 1405 1410
Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn
1415 1420 1425
Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu
1430 1435 1440
Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln
1445 1450 1455
Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu
1460 1465 1470
Tyr
<210> 386
<211> 5052
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 386
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc
60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc
120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac
180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc
240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat
300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt
360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg
420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg
480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat
540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa
600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta
660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat
720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct
780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc
840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat
900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg
960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa
1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa
1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat
1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact
1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc
1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg
1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct
1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg
1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact
1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt
1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca
1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga
1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa
1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag
1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg
1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt
1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc
1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa
2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg
2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc
2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac
2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc
2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt
2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa
2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca
2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca
2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc
2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat
2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc
2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat
2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac
2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg
2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt
2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa
3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg
3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat
3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct
3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct
3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg
3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt
3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg
3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt
3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat
3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg
3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc
3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat
3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata
3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat
3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc
3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac
3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg
4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag
4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg
4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt
4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac
4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac
4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact
4380
cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc
4440
cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg
4500
gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag
4560
gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc
4620
agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc
4680
tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc
4740
cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc
4800
agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc
4860
aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc
4920
ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc
4980
tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg
5040
tctccgggta aa
5052
<210> 387
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 387
atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc
60
accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg
120
ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac
180
acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc
240
gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300
gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg
360
ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga
420
gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg
480
aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac
540
gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa
600
ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat
720
gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc
780
ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc
840
acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac
900
agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg
960
gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa
1020
gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag
1080
gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac
1140
gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc
1260
cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg
1320
aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc
1380
atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg
1440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc
1500
gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc
1560
cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc
1620
accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc
1680
gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag
1740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag
1800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg
1860
caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc
1980
attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag
2040
atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc
2100
atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc
2160
atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc
2280
ttcagccaga atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg
2340
cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa
2400
gatttcgaca tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc
2460
cggcactact tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct
2520
cacgtgctga gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc
2580
caagagttca ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat
2640
ctgggcctgc tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc
2700
cggaatcagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac
2760
cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac
2820
ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg
2880
gcctacttct ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg
2940
cttgtgtgcc acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag
3000
ttcgccctgt tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg
3060
gaacggaact gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac
3120
taccggttcc acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc
3180
caggatcaga gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc
3240
atccacttca gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg
3300
tacaatctgt accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt
3360
tggagagtgg aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg
3420
gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc
3480
cagatcaccg cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac
3540
agcggcagca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg
3600
ctggctccca tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc
3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac
3720
agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt
3780
aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac
3840
tacagcatcc ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct
3900
atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac
3960
ttcaccaaca tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga
4020
agcaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa
4080
aagaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg
4140
tacgtgaaag agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc
4200
cagaacggca aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat
4260
tctctggacc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac
4320
cagatcgctc tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctag
4374
<210> 388
<211> 4980
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 388
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc
60
acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120
ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac
180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240
gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac
300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc
420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac
720
gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc
780
ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc
840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac
900
cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag
1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac
1140
gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
1260
cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc
1320
aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc
1380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg
1440
ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc
1500
gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc
1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
1620
accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc
1680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag
1740
cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag
1800
aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg
1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc
2160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc
2280
ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc
2340
cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag
2400
atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac
2460
ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc
2520
cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg
2580
caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag
2640
aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc
2700
agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc
2760
agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg
2820
ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag
2880
aacaacgaca gcaagctgcc ccccgtgctg aagcgccacc agcgcgagat cacccgcacc
2940
accctgcaga gcgaccagga ggagatcgac tacgacgaca ccatcagcgt ggagatgaag
3000
aaggaggact tcgacatcta cgacgaggac gagaaccaga gcccccgcag cttccagaag
3060
aagacccgcc actacttcat cgccgccgtg gagcgcctgt gggactacgg catgagcagc
3120
agcccccacg tgctgcgcaa ccgcgcccag agcggcagcg tgccccagtt caagaaggtg
3180
gtgttccagg agttcaccga cggcagcttc acccagcccc tgtaccgcgg cgagctgaac
3240
gagcacctgg gcctgctggg cccctacatc cgcgccgagg tggaggacaa catcatggtg
3300
accttccgca accaggccag ccgcccctac agcttctaca gcagcctgat cagctacgag
3360
gaggaccagc gccagggcgc cgagccccgc aagaacttcg tgaagcccaa cgagaccaag
3420
acctacttct ggaaggtgca gcaccacatg gcccccacca aggacgagtt cgactgcaag
3480
gcctgggcct acttcagcga cgtggacctg gagaaggacg tgcacagcgg cctgatcggc
3540
cccctgctgg tgtgccacac caacaccctg aaccccgccc acggccgcca ggtgaccgtg
3600
caggagttcg ccctgttctt caccatcttc gacgagacca agagctggta cttcaccgag
3660
aacatggagc gcaactgccg cgccccctgc aacatccaga tggaggaccc caccttcaag
3720
gagaactacc gcttccacgc catcaacggc tacatcatgg acaccctgcc cggcctggtg
3780
atggcccagg accagcgcat ccgctggtac ctgctgagca tgggcagcaa cgagaacatc
3840
cacagcatcc acttcagcgg ccacgtgttc accgtgcgca agaaggagga gtacaagatg
3900
gccctgtaca acctgtaccc cggcgtgttc gagaccgtgg agatgctgcc cagcaaggcc
3960
ggcatctggc gcgtggagtg cctgatcggc gagcacctgc acgccggcat gagcaccctg
4020
ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggccagcgg ccacatccgc
4080
gacttccaga tcaccgccag cggccagtac ggccagtggg cccccaagct ggcccgcctg
4140
cactacagcg gcagcatcaa cgcctggagc accaaggagc ccttcagctg gatcaaggtg
4200
gacctgctgg cccccatgat catccacggc atcaagaccc agggcgcccg ccagaagttc
4260
agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggcaa gaagtggcag
4320
acctaccgcg gcaacagcac cggcaccctg atggtgttct tcggcaacgt ggacagcagc
4380
ggcatcaagc acaacatctt caaccccccc atcatcgccc gctacatccg cctgcacccc
4440
acccactaca gcatccgcag caccctgcgc atggagctga tgggctgcga cctgaacagc
4500
tgcagcatgc ccctgggcat ggagagcaag gccatcagcg acgcccagat caccgccagc
4560
agctacttca ccaacatgtt cgccacctgg agccccagca aggcccgcct gcacctgcaa
4620
ggccgcagca acgcctggcg cccccaggtg aacaacccca aggagtggct gcaggtggac
4680
ttccagaaga ccatgaaggt gaccggcgtg accacccagg gcgtgaagag cctgctgacc
4740
agcatgtacg tgaaggagtt cctgatcagc agcagccagg acggccacca gtggaccctg
4800
ttcttccaga acggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccccgtg
4860
gtgaacagcc tggacccccc cctgctgacc cgctacctgc gcatccaccc ccagagctgg
4920
gtgcaccaga tcgccctgcg catggaggtg ctgggctgcg aggcccagga cctgtactaa
4980
<210> 389
<211> 7056
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 389
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc
60
acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120
ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac
180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240
gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac
300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc
420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac
720
gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc
780
ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc
840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac
900
cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag
1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac
1140
gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
1260
cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc
1320
aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc
1380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg
1440
ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc
1500
gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc
1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
1620
accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc
1680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag
1740
cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag
1800
aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg
1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc
2160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc
2280
ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc
2340
cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag
2400
atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac
2460
ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc
2520
cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg
2580
caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag
2640
aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc
2700
agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc
2760
agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg
2820
ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag
2880
aacaacgaca gcaagctgct ggagagcggc ctgatgaaca gccaggagag cagctggggc
2940
aagaacgtga gcagcaccga gagcggcagg ctgttcaagg gcaagcgcgc ccacggcccc
3000
gccctgctga ccaaggacaa cgccctgttc aaggtgagca tcagcctgct gaagaccaac
3060
aagaccagca acaacagcgc caccaaccgc aagacccaca tcgacggccc cagcctgctg
3120
atcgagaaca gccccagcgt gtggcagaac atcctggaga gcgacaccga gttcaagaag
3180
gtgacccccc tgatccacga ccgcatgctg atggacaaga acgccaccgc cctgcgcctg
3240
aaccacatga gcaacaagac caccagcagc aagaacatgg agatggtgca gcagaagaag
3300
gagggcccca tcccccccga cgcccagaac cccgacatga gcttcttcaa gatgctgttc
3360
ctgcccgaga gcgcccgctg gatccagcgc acccacggca agaacagcct gaacagcggc
3420
cagggcccca gccccaagca gctggtgagc ctgggccccg agaagagcgt ggagggccag
3480
aacttcctga gcgagaagaa caaggtggtg gtgggcaagg gcgagttcac caaggacgtg
3540
ggcctgaagg agatggtgtt ccccagcagc cgcaacctgt tcctgaccaa cctggacaac
3600
ctgcacgaga acaacaccca caaccaggag aagaagatcc aggaggagat cgagaagaag
3660
gagaccctga tccaggagaa cgtggtgctg ccccagatcc acaccgtgac cggcaccaag
3720
aacttcatga agaacctgtt cctgctgagc acccgccaga acgtggaggg cagctacgac
3780
ggcgcctacg cccccgtgct gcaggacttc cgcagcctga acgacagcac caaccgcacc
3840
aagaagcaca ccgcccactt cagcaagaag ggcgaggagg agaacctgga gggcctgggc
3900
aaccagacca agcagatcgt ggagaagtac gcctgcacca cccgcatcag ccccaacacc
3960
agccagcaga acttcgtgac ccagcgcagc aagcgcgccc tgaagcagtt ccgcctgccc
4020
ctggaggaga ccgagctgga gaagcgcatc atcgtggacg acaccagcac ccagtggagc
4080
aagaacatga agcacctgac ccccagcacc ctgacccaga tcgactacaa cgagaaggag
4140
aagggcgcca tcacccagag ccccctgagc gactgcctga cccgcagcca cagcatcccc
4200
caggccaacc gcagccccct gcccatcgcc aaggtgagca gcttccccag catccgcccc
4260
atctacctga cccgcgtgct gttccaggac aacagcagcc acctgcccgc cgccagctac
4320
cgcaagaagg acagcggcgt gcaggagagc agccacttcc tgcaaggcgc caagaagaac
4380
aacctgagcc tggccatcct gaccctggag atgaccggcg accagcgcga ggtgggcagc
4440
ctgggcacca gcgccaccaa cagcgtgacc tacaagaagg tggagaacac cgtgctgccc
4500
aagcccgacc tgcccaagac cagcggcaag gtggagctgc tgcccaaggt gcacatctac
4560
cagaaggacc tgttccccac cgagaccagc aacggcagcc ccggccacct ggacctggtg
4620
gagggcagcc tgctgcaggg caccgagggc gccatcaagt ggaacgaggc caaccgcccc
4680
ggcaaggtgc ccttcctgcg cgtggccacc gagagcagcg ccaagacccc cagcaagctg
4740
ctggaccccc tggcctggga caaccactac ggcacccaga tccccaagga ggagtggaag
4800
agccaggaga agagccccga gaagaccgcc ttcaagaaga aggacaccat cctgagcctg
4860
aacgcctgcg agagcaacca cgccatcgcc gccatcaacg agggccagaa caagcccgag
4920
atcgaggtga cctgggccaa gcagggccgc accgagcgcc tgtgcagcca gaaccccccc
4980
gtgctgaagc gccaccagcg cgagatcacc cgcaccaccc tgcagagcga ccaggaggag
5040
atcgactacg acgacaccat cagcgtggag atgaagaagg aggacttcga catctacgac
5100
gaggacgaga accagagccc ccgcagcttc cagaagaaga cccgccacta cttcatcgcc
5160
gccgtggagc gcctgtggga ctacggcatg agcagcagcc cccacgtgct gcgcaaccgc
5220
gcccagagcg gcagcgtgcc ccagttcaag aaggtggtgt tccaggagtt caccgacggc
5280
agcttcaccc agcccctgta ccgcggcgag ctgaacgagc acctgggcct gctgggcccc
5340
tacatccgcg ccgaggtgga ggacaacatc atggtgacct tccgcaacca ggccagccgc
5400
ccctacagct tctacagcag cctgatcagc tacgaggagg accagcgcca gggcgccgag
5460
ccccgcaaga acttcgtgaa gcccaacgag accaagacct acttctggaa ggtgcagcac
5520
cacatggccc ccaccaagga cgagttcgac tgcaaggcct gggcctactt cagcgacgtg
5580
gacctggaga aggacgtgca cagcggcctg atcggccccc tgctggtgtg ccacaccaac
5640
accctgaacc ccgcccacgg ccgccaggtg accgtgcagg agttcgccct gttcttcacc
5700
atcttcgacg agaccaagag ctggtacttc accgagaaca tggagcgcaa ctgccgcgcc
5760
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actaccgctt ccacgccatc
5820
aacggctaca tcatggacac cctgcccggc ctggtgatgg cccaggacca gcgcatccgc
5880
tggtacctgc tgagcatggg cagcaacgag aacatccaca gcatccactt cagcggccac
5940
gtgttcaccg tgcgcaagaa ggaggagtac aagatggccc tgtacaacct gtaccccggc
6000
gtgttcgaga ccgtggagat gctgcccagc aaggccggca tctggcgcgt ggagtgcctg
6060
atcggcgagc acctgcacgc cggcatgagc accctgttcc tggtgtacag caacaagtgc
6120
cagacccccc tgggcatggc cagcggccac atccgcgact tccagatcac cgccagcggc
6180
cagtacggcc agtgggcccc caagctggcc cgcctgcact acagcggcag catcaacgcc
6240
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc
6300
cacggcatca agacccaggg cgcccgccag aagttcagca gcctgtacat cagccagttc
6360
atcatcatgt acagcctgga cggcaagaag tggcagacct accgcggcaa cagcaccggc
6420
accctgatgg tgttcttcgg caacgtggac agcagcggca tcaagcacaa catcttcaac
6480
ccccccatca tcgcccgcta catccgcctg caccccaccc actacagcat ccgcagcacc
6540
ctgcgcatgg agctgatggg ctgcgacctg aacagctgca gcatgcccct gggcatggag
6600
agcaaggcca tcagcgacgc ccagatcacc gccagcagct acttcaccaa catgttcgcc
6660
acctggagcc ccagcaaggc ccgcctgcac ctgcaaggcc gcagcaacgc ctggcgcccc
6720
caggtgaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgacc
6780
ggcgtgacca cccagggcgt gaagagcctg ctgaccagca tgtacgtgaa ggagttcctg
6840
atcagcagca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaggtgaag
6900
gtgttccagg gcaaccagga cagcttcacc cccgtggtga acagcctgga cccccccctg
6960
ctgacccgct acctgcgcat ccacccccag agctgggtgc accagatcgc cctgcgcatg
7020
gaggtgctgg gctgcgaggc ccaggacctg tactaa
7056
<210> 390
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 390
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc
60
acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120
ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac
180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240
gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac
300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc
420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag
600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac
720
gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc
780
ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc
840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac
900
cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag
1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac
1140
gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
1260
cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc
1320
aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc
1380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg
1440
ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc
1500
gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc
1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
1620
accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc
1680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag
1740
cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag
1800
aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg
1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc
2160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc
2280
ttcagccaga acccccccgt gctgaagcgc caccagcgcg agatcacccg caccaccctg
2340
cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag
2400
gacttcgaca tctacgacga ggacgagaac cagagccccc gcagcttcca gaagaagacc
2460
cgccactact tcatcgccgc cgtggagcgc ctgtgggact acggcatgag cagcagcccc
2520
cacgtgctgc gcaaccgcgc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc
2580
caggagttca ccgacggcag cttcacccag cccctgtacc gcggcgagct gaacgagcac
2640
ctgggcctgc tgggccccta catccgcgcc gaggtggagg acaacatcat ggtgaccttc
2700
cgcaaccagg ccagccgccc ctacagcttc tacagcagcc tgatcagcta cgaggaggac
2760
cagcgccagg gcgccgagcc ccgcaagaac ttcgtgaagc ccaacgagac caagacctac
2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg
2880
gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg
2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggcc gccaggtgac cgtgcaggag
3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg
3060
gagcgcaact gccgcgcccc ctgcaacatc cagatggagg accccacctt caaggagaac
3120
taccgcttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc
3180
caggaccagc gcatccgctg gtacctgctg agcatgggca gcaacgagaa catccacagc
3240
atccacttca gcggccacgt gttcaccgtg cgcaagaagg aggagtacaa gatggccctg
3300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc
3360
tggcgcgtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg
3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgcgacttc
3480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggcccg cctgcactac
3540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
3600
ctggccccca tgatcatcca cggcatcaag acccagggcg cccgccagaa gttcagcagc
3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac
3720
cgcggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc
3780
aagcacaaca tcttcaaccc ccccatcatc gcccgctaca tccgcctgca ccccacccac
3840
tacagcatcc gcagcaccct gcgcatggag ctgatgggct gcgacctgaa cagctgcagc
3900
atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac
3960
ttcaccaaca tgttcgccac ctggagcccc agcaaggccc gcctgcacct gcaaggccgc
4020
agcaacgcct ggcgccccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag
4080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg
4140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc
4200
cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac
4260
agcctggacc cccccctgct gacccgctac ctgcgcatcc acccccagag ctgggtgcac
4320
cagatcgccc tgcgcatgga ggtgctgggc tgcgaggccc aggacctgta ctaa
4374
<210> 391
<211> 7056
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 391
atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc
60
accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg
120
ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac
180
acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc
240
gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300
gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg
360
ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga
420
gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg
480
aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac
540
gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa
600
ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat
720
gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc
780
ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc
840
acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac
900
agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg
960
gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa
1020
gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag
1080
gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac
1140
gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc
1260
cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg
1320
aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc
1380
atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg
1440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc
1500
gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc
1560
cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc
1620
accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc
1680
gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag
1740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag
1800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg
1860
caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc
1980
attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag
2040
atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc
2100
atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc
2160
atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc
2280
ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc
2340
cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag
2400
atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac
2460
ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct
2520
cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg
2580
caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag
2640
aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc
2700
agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca
2760
tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg
2820
ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa
2880
aacaacgaca gcaagctgct ggaatccggc ctgatgaaca gccaagagtc ctcctggggc
2940
aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gaaagagagc ccacggacct
3000
gctctgctga ccaaggataa cgccctgttc aaagtgtcca tcagcctgct caagaccaac
3060
aagacctcca acaactccgc caccaacaga aagacccaca tcgacggccc tagcctgctg
3120
atcgagaata gccctagcgt ctggcagaat atcctggaaa gcgacaccga gttcaagaaa
3180
gtgacccctc tgatccacga ccggatgctc atggacaaga acgccaccgc tctgcggctg
3240
aaccacatga gcaacaagac aaccagcagc aagaatatgg aaatggtgca gcagaagaaa
3300
gagggcccca ttcctccaga cgctcagaac cccgatatga gcttcttcaa gatgctcttt
3360
ctgcccgaga gcgcccggtg gattcagaga acacacggca agaactccct gaactccggc
3420
cagggacctt ctccaaagca gctggtttcc ctgggacctg agaagtccgt ggaaggacag
3480
aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg gcgagttcac caaggatgtg
3540
ggcctgaaag agatggtctt tcccagcagc cggaacctgt tcctgaccaa cctggacaac
3600
ctgcacgaga acaacaccca caatcaagag aagaagatcc aagaggaaat cgaaaagaaa
3660
gagacactca tccaagagaa cgtggtgctg cctcagatcc acacagtgac cggcaccaag
3720
aactttatga agaatctgtt cctgctgagt acccggcaga acgtggaagg cagctacgat
3780
ggcgcttatg cccctgtgct gcaggacttc agatccctga acgactccac caatcggaca
3840
aagaagcaca cagcccactt ctccaagaag ggcgaagaag agaacctgga aggactgggc
3900
aatcagacca agcagatcgt cgagaagtac gcctgcacca ccagaatcag ccccaacaca
3960
agccagcaga acttcgtgac ccagcggagc aaaagagccc tgaagcagtt tcggctgccc
4020
ctggaagaaa ccgagctgga aaagcggatc atcgtggacg acaccagcac acagtggtcc
4080
aagaacatga agcacttgac ccctagcaca ctgacccaga tcgactacaa cgagaaagag
4140
aagggcgcta tcacacagag cccactgagc gactgtctga ccagaagcca cagcatccct
4200
caggccaaca gatcccctct gccaatcgcc aaagtgtcta gcttccccag catcagaccc
4260
atctacctga ccagagtgct gttccaggac aacagcagcc atctgccagc cgccagctac
4320
cggaagaaag attctggcgt gcaagagagc agccactttc tgcagggcgc taagaagaac
4380
aatctgagcc tggctattct gaccctggaa atgaccggcg atcagagaga agtcggctct
4440
ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg tggaaaacac cgtgctgcct
4500
aagcctgacc tgccaaagac aagcggcaag gtggaactgc tgccaaaggt gcacatctac
4560
cagaaggacc tgtttcctac cgagacaagc aacggctctc ccggccatct ggatctggtg
4620
gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ggaacgaggc caatagacct
4680
ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ccaagacacc ctctaaactg
4740
ctggaccctc tggcctggga caaccactat ggcactcaga tccccaaaga ggaatggaag
4800
tcccaagaga agtcccctga aaagaccgcc ttcaagaaga aggacaccat tctgtccctg
4860
aatgcctgcg agagcaacca cgccattgcc gccatcaatg agggccagaa caagcccgag
4920
atcgaagtga cctgggccaa gcagggaaga accgagagac tgtgtagcca gaatcctcct
4980
gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgcagagcga ccaagaagag
5040
atcgattacg acgataccat cagcgtcgag atgaagaaag aagatttcga catctacgac
5100
gaggacgaga atcagagccc tcggagcttc cagaagaaaa ccaggcacta ctttattgcc
5160
gccgtcgagc ggctgtggga ctacggaatg tctagctctc ctcacgtgct gcggaataga
5220
gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt tccaagagtt caccgacggc
5280
agcttcaccc agccactgta tagaggcgag ctgaacgagc atctgggcct gctgggccct
5340
tatatcagag ccgaagtgga agataacatc atggtcacct tccggaatca ggctagccgg
5400
ccttacagct tctacagctc cctgatctcc tacgaagagg accagagaca gggcgcagag
5460
ccccggaaga atttcgtgaa gcccaacgag actaagacct acttttggaa ggtgcagcac
5520
catatggccc ctacaaagga cgagttcgac tgcaaagcct gggcctactt ctccgatgtg
5580
gacctcgaaa aggacgtgca cagcggactc atcggcccac tgcttgtgtg ccacaccaac
5640
acactgaacc ccgctcacgg cagacaagtg acagtgcaag agttcgccct gtttttcacc
5700
atcttcgacg aaacgaagtc ctggtacttc accgaaaaca tggaaagaaa ctgcagggcc
5760
ccttgcaaca ttcagatgga agatcccacc ttcaaagaga actaccggtt ccacgccatc
5820
aacggctaca tcatggacac actgcccggc ctggttatgg cccaggatca gagaatccgg
5880
tggtatctgc tgtccatggg ctccaacgag aatatccact ccatccactt cagcggccac
5940
gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc tgtacaatct gtaccctggg
6000
gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tttggagagt ggaatgtctg
6060
attggagagc acctccacgc cgggatgagc accctgtttc tggtgtactc caacaagtgt
6120
cagacccctc tcggcatggc ctctggccac attagagact tccagatcac cgccagcgga
6180
cagtatggac agtgggcccc taaactggcc agactgcact actccggcag catcaatgcc
6240
tggtccacca aagagccttt cagctggatc aaagtggacc tgctggctcc catgatcatc
6300
cacggaatca agacccaggg cgccagacaa aagttcagca gcctgtacat cagccagttc
6360
atcatcatgt acagcctgga cggaaagaag tggcagacct accggggcaa tagcaccggc
6420
acactgatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa catcttcaac
6480
cctccaatca ttgcccggta catccggctg caccccacac actacagcat caggtctacc
6540
ctgagaatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct cggaatggaa
6600
agcaaggcca tcagcgacgc ccagatcaca gcctctagct acttcaccaa catgttcgcc
6660
acttggagcc cctctaaggc ccggcttcat ctgcaaggca gaagcaacgc ttggaggccc
6720
caagtgaaca accccaaaga atggctccag gtggactttc agaaaaccat gaaagtgaca
6780
ggcgtgacca cacagggcgt caagtccctg ctgacctcta tgtacgtgaa agagtttctg
6840
atcagctcca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaagtgaaa
6900
gtgttccagg gaaatcagga cagcttcaca cccgtggtca atagtctgga cccaccactg
6960
ctgacccgct acctgcgaat tcaccctcag tcttgggtgc accagattgc cctgcggatg
7020
gaagtgctgg gctgtgaagc tcaggacctc tactag
7056
<210> 392
<211> 4980
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 392
atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc
60
accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg
120
ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac
180
acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc
240
gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300
gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg
360
ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga
420
gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg
480
aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac
540
gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa
600
ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg
660
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat
720
gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc
780
ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc
840
acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac
900
agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg
960
gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa
1020
gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag
1080
gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac
1140
gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc
1200
tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc
1260
cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg
1320
aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc
1380
atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg
1440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc
1500
gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc
1560
cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc
1620
accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc
1680
gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag
1740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag
1800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg
1860
caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg
1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc
1980
attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag
2040
atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc
2100
atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc
2160
atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac
2220
agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc
2280
ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc
2340
cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag
2400
atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac
2460
ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct
2520
cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg
2580
caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag
2640
aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc
2700
agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca
2760
tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg
2820
ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa
2880
aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc agcgggaaat caccagaacc
2940
acactgcaga gcgaccaaga ggaaatcgat tacgacgaca ccatcagcgt cgagatgaag
3000
aaagaagatt tcgacatcta cgacgaggac gagaatcaga gccccagatc ctttcagaaa
3060
aagacccggc actacttcat tgccgccgtc gagagactgt gggactacgg catgtctagc
3120
agccctcacg tgctgagaaa tagagcccag agcggcagcg tgccccagtt caagaaagtg
3180
gtgttccaag agttcaccga cggcagcttc acccagccac tgtatagagg cgagctgaac
3240
gagcatctgg gcctgctggg cccttatatc agagccgaag tggaagataa catcatggtc
3300
accttccgga atcaggctag ccggccttac agcttctaca gctccctgat ctcctacgaa
3360
gaggaccaga gacagggcgc tgagccccgg aagaatttcg tgaagcccaa cgagactaag
3420
acctactttt ggaaggtgca gcaccacatg gcccctacaa aggacgagtt cgactgcaaa
3480
gcctgggcct acttctccga tgtggatctg gaaaaggacg tgcacagcgg gctcatcgga
3540
ccactgcttg tgtgccacac caacacactg aaccccgctc acggcagaca agtgacagtg
3600
caagagttcg ccctgttctt caccatcttc gacgaaacaa agagctggta cttcaccgag
3660
aatatggaac ggaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa
3720
gagaactacc ggttccacgc catcaacggc tacatcatgg acacactgcc cggcctggtt
3780
atggcccagg atcagagaat ccggtggtat ctgctgtcca tgggctccaa cgagaatatc
3840
cacagcatcc acttcagcgg ccacgtgttc accgtgcgga aaaaagaaga gtacaaaatg
3900
gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaatgctgcc ttccaaggcc
3960
ggcatttgga gagtggaatg tctgattgga gagcacctcc acgccggaat gagcaccctg
4020
tttctggtgt actccaacaa gtgtcagacc cctctcggca tggcctctgg acacatcaga
4080
gacttccaga tcaccgcctc tggccagtac ggacagtggg ctcctaaact ggctcggctg
4140
cactactccg gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg
4200
gacctgctgg ctcccatgat catccacgga atcaagaccc agggcgcaag acagaagttc
4260
agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggaaa gaagtggcag
4320
acctaccggg gcaatagcac cggcacactc atggtgttct tcggcaacgt ggactccagc
4380
ggcattaagc acaacatctt caaccctcca atcattgccc ggtacatccg gctgcacccc
4440
acacactaca gcatccggtc taccctgaga atggaactga tgggctgcga cctgaacagc
4500
tgctctatgc ccctcggaat ggaaagcaag gccatcagcg acgcccagat cacagccagc
4560
agctacttca ccaacatgtt cgccacttgg agcccctcca aggctagact gcatctgcag
4620
ggcagaagca acgcttggag gccccaagtg aacaacccca aagagtggct gcaggttgac
4680
tttcaaaaga ccatgaaagt gaccggcgtg accacacagg gcgtcaagtc tctgctgacc
4740
tctatgtacg tgaaagagtt cctgattagc agcagccagg acggccacca gtggaccctg
4800
tttttccaga acggcaaagt gaaagtgttc cagggcaatc aggacagctt cacacccgtg
4860
gtcaattctc tggaccctcc actgctgacc agatacctgc ggattcaccc tcagtcttgg
4920
gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg aagctcagga cctctactag
4980
<210> 393
<211> 4374
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 393
atgcagatag aattatctac ttgttttttt ctttgtctgc tcaggttctg cttctctgct
60
acaaggaggt attacttagg tgctgtagag ttatcttggg actacatgca gtctgatctt
120
ggggagctcc ctgtggatgc aagatttccc cctagagtac ctaaaagttt ccctttcaac
180
acaagtgtgg tgtataagaa gactctgttt gttgagttca cagatcacct tttcaatatt
240
gccaagccca gacccccctg gatgggtcta ctggggccaa caattcaagc agaggtatat
300
gatacagtgg tgatcacatt aaagaacatg gcatcccacc ctgtaagcct gcatgctgtt
360
ggtgtgtcct attggaaagc aagtgaaggt gctgaatatg atgatcaaac atcccaaaga
420
gagaaggaag atgacaaagt cttcccaggt ggctctcaca cctatgtgtg gcaagtgctc
480
aaggaaaatg ggcctatggc tagtgatcca ttgtgcctca catatagcta cctgtcccat
540
gtggacttag ttaaagatct gaactcaggt ctgattggtg ccctgctggt ctgtagggaa
600
ggatcactag ctaaagaaaa aacccagact ttacacaagt tcatcttatt atttgctgtt
660
tttgatgagg gaaagagctg gcactcagag actaagaatt cactcatgca ggatagagat
720
gcagcttctg ctagagcatg gccaaaaatg catactgtga atgggtatgt taacaggagt
780
ctgcctggcc tcataggctg ccatagaaaa tcagtgtact ggcatgtcat aggtatgggc
840
actactcctg aggtgcattc catttttttg gaggggcata ctttccttgt aagaaaccac
900
aggcaggctt cattggaaat tagtccaata acctttctca cagcccagac tctgctaatg
960
gacttggggc agtttttatt attttgtcac attagctctc atcagcatga tggaatggaa
1020
gcctatgtta aggttgattc ctgcccagaa gagccccagt tgagaatgaa gaacaatgag
1080
gaagcagaag actatgatga tgatctaaca gactcagaaa tggatgttgt gagatttgat
1140
gatgataact ccccaagttt tattcagatc aggtcagtgg ccaagaaaca tccaaaaaca
1200
tgggttcatt atattgcagc agaagaagaa gactgggatt atgcaccctt ggtattagcc
1260
cctgatgaca gaagctataa gtcacaatat ctcaacaatg gaccccagag aattggcaga
1320
aagtacaaaa aagtcaggtt tatggcttat actgatgaga ctttcaaaac tagagaggct
1380
attcaacatg aatctggcat cctaggtcct ttgttatatg gggaagtagg ggacacctta
1440
ttaattatat ttaaaaacca ggccagtagg ccttacaaca tttaccccca cggtataaca
1500
gatgtcagac cactgtactc aaggaggcta ccaaaagggg tgaagcacct aaaagacttc
1560
cccatcctac ctggtgagat tttcaagtat aagtggacag tgactgtaga agatggtcca
1620
accaaatcag atcccagatg cctgacaagg tactacagta gctttgtaaa tatggagaga
1680
gacctggcct cagggttaat agggccccta ctgatctgct acaaggagag tgtagaccaa
1740
agaggcaacc aaattatgtc agacaagaga aatgtcatcc tctttagtgt ttttgatgag
1800
aataggtcct ggtacctgac agaaaatatc caaagattcc ttccaaatcc agcaggggta
1860
caactggagg accctgagtt ccaggcctcc aatatcatgc acagcatcaa tggttatgtg
1920
tttgacagtt tgcaactttc agtgtgcctt catgaggttg catactggta tatactttct
1980
ataggggccc agacagactt cttgtcagtt ttcttttcag gctatacttt caagcataag
2040
atggtatatg aagataccct gactcttttt ccctttagtg gtgagacagt tttcatgtca
2100
atggaaaacc cagggctttg gatcttggga tgccacaact ctgactttag aaacagaggc
2160
atgactgccc ttttaaaggt gtcctcttgt gataagaata ctggagacta ctatgaggac
2220
agctatgagg acatttcagc ctatctgctg tcaaaaaata atgctataga gccaaggtca
2280
ttttctcaaa atcctcctgt cctgaagagg caccaaagag agataaccag gactacctta
2340
cagtctgacc aggaggaaat tgattatgat gacacaataa gtgtggagat gaaaaaggag
2400
gattttgata tttatgatga ggatgaaaac caatctccaa gatctttcca gaagaagact
2460
agacactatt tcattgctgc agtggaaaga ctgtgggact atggaatgtc ctccagccct
2520
catgttctca ggaatagggc tcaaagtggt tctgtgccac agttcaagaa ggtggtgttt
2580
caggaattca cagatgggtc ctttactcaa ccactgtata ggggagaact caatgaacat
2640
ctaggattac taggtcccta cattagagct gaggtggagg acaatatcat ggtcactttc
2700
aggaaccagg catctagacc atactctttt tacagctcct tgatatctta tgaagaggac
2760
cagagacagg gtgcagaacc caggaagaac tttgtgaaac ccaatgagac caaaacatac
2820
ttctggaagg tccagcatca tatggctcct accaaggatg aatttgactg caaagcctgg
2880
gcttacttct cagatgtgga tttggagaaa gatgtgcaca gtggcttgat tgggcctctt
2940
ttggtatgtc ataccaacac cttaaaccct gctcatggaa gacaagtaac agtgcaagag
3000
tttgccctct ttttcactat atttgatgag acaaaaagtt ggtactttac tgagaatatg
3060
gagaggaact gcagggctcc ctgcaatata cagatggagg atcctacttt caaggaaaac
3120
tataggtttc atgccattaa tggctatatc atggatacat tgcctggctt agttatggcc
3180
caggatcaga gaatcagatg gtacctcctt agtatgggaa gcaatgaaaa catacattct
3240
attcacttca gtggacatgt ctttactgtg agaaaaaagg aagagtacaa gatggcactg
3300
tacaatctgt accctggagt gtttgagaca gttgagatgc tgcccagcaa ggctgggatc
3360
tggagggtag aatgcctgat tggagaacac ttacatgcag gtatgtccac tctattcttg
3420
gtctattcca acaagtgtca gaccccccta ggcatggcat ctggccatat tagagatttc
3480
cagataactg cttctggtca gtatggccag tgggccccca agcttgctag acttcactac
3540
agtggttcaa taaatgcctg gtccaccaag gagcccttca gctggattaa agtggacttg
3600
ctagccccca tgatcattca tgggataaaa acacagggtg ccagacagaa attttcatct
3660
ctgtacatca gccagtttat catcatgtac agtctggatg gcaaaaaatg gcagacctac
3720
agaggtaact ctacaggtac actaatggta ttttttggca atgtagattc atcaggtatc
3780
aagcataata tctttaatcc tcccattatt gccagataca tcaggttgca cccaactcat
3840
tacagtataa gatccacttt aaggatggag cttatggggt gtgaccttaa tagctgcagt
3900
atgcccttgg gaatggaaag taaggccata tcagatgccc agattactgc aagcagctac
3960
tttacaaaca tgtttgcaac ctggtctcct agtaaagcca ggctgcactt gcagggtagg
4020
agcaatgcat ggagacccca ggtcaataac ccaaaagagt ggcttcaagt tgactttcaa
4080
aagacaatga aggtaacagg ggtaaccacc caaggggtaa agagtctgct gacatctatg
4140
tatgtaaaag aattcctcat ctcaagtagt caagatgggc accagtggac actgttcttc
4200
cagaatggaa aagttaaggt gttccaaggt aatcaagaca gcttcactcc agtggtgaac
4260
agtctggatc caccactcct aaccaggtac ctgaggatcc accctcagtc ctgggtccac
4320
cagatagctc tgagaatgga agtgctgggc tgtgaagctc aggacctata ctga
4374
<210> 394
<211> 7056
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 394
atgcaaattg aattgagtac ctgttttttc ctctgtctat taaggttttg tttcagtgca
60
acaagaaggt attatctggg agctgttgag ttatcctggg actacatgca gtctgacctg
120
ggagagctcc cagtggatgc taggtttccc ccaagagtac ccaaaagctt ccctttcaac
180
acttctgttg tctataaaaa gactctgttt gtagaattca cagatcatct gtttaacatt
240
gccaagccta gacctccatg gatggggctg ctgggaccaa ctattcaggc agaggtttat
300
gacactgtgg tgattacact taagaatatg gcatcccacc cagtgagcct gcatgctgtt
360
ggggtttcct actggaaggc aagtgaagga gctgagtatg atgaccagac tagccaaaga
420
gagaaggagg atgacaaggt ctttccaggt ggcagccaca cctatgtctg gcaggtgctg
480
aaggagaatg gccctatggc ctctgatcct ttgtgtctaa cctacagtta tttgtctcat
540
gtggacctgg tgaaggacct taactcaggg ctgatagggg ccttgctggt gtgtagggag
600
ggaagcctgg ctaaggaaaa gacacagact ctgcataagt ttattctctt gtttgcagtg
660
tttgatgagg gtaaaagctg gcactctgaa acaaaaaaca gcttgatgca ggacagggat
720
gctgccagtg ctagggcttg gcctaagatg cacacagtca atggctatgt taacagatca
780
ctgcctggtt tgattggctg ccacagaaag tctgtttact ggcatgtaat tgggatgggg
840
acaaccccag aagttcactc tatcttcctg gaagggcaca ccttcctggt tagaaatcat
900
agacaggcat ccttagagat ttctcctatt acattcctga ctgcccagac cctcctcatg
960
gacctgggtc agttcctgct tttttgccac atttcctccc accagcatga tggcatggag
1020
gcctatgtga aagttgattc ttgccctgag gagcctcagc ttaggatgaa gaacaatgaa
1080
gaggctgagg actatgatga tgacctaaca gacagtgaga tggatgttgt gaggtttgat
1140
gatgacaatt cacctagttt catccagatt aggtctgtgg ctaagaaaca tccaaagacc
1200
tgggttcact acattgcagc agaggaggag gactgggatt atgcccccct ggttctggca
1260
cctgatgaca gaagctataa gtcccagtat ctcaacaatg gcccccagag gattggaaga
1320
aaatacaaaa aagtcagatt tatggcctat acagatgaga cttttaaaac tagggaagct
1380
attcagcatg agtcagggat cctgggacct cttctttatg gagaggtggg ggacactctt
1440
ctgataattt ttaaaaatca ggcaagtaga ccttataaca tctaccccca tgggatcact
1500
gatgtcaggc ctctgtactc aagaaggctg cccaagggtg tcaaacacct caaggatttc
1560
cctattcttc ctggggagat cttcaaatac aagtggacag ttactgtgga ggatggcccc
1620
accaaatctg acccaaggtg cctcaccaga tattacagct cctttgtgaa tatggaaaga
1680
gacctagcta gtggtctcat tggcccactg ctcatctgtt acaaggagtc agtggaccag
1740
agagggaatc aaattatgtc tgacaagaga aatgtgatcc ttttctcagt gtttgatgag
1800
aacagaagct ggtatctgac agagaacatt caaaggtttc tgccaaaccc agctggagtt
1860
cagctggagg accctgaatt ccaggcatct aatattatgc attctatcaa tggatatgtg
1920
tttgatagtc tgcagctgtc tgtgtgcctg catgaagtgg cctactggta tatcctctct
1980
attggtgccc agacagattt cttgtctgtg tttttcagtg gttacacatt taaacataaa
2040
atggtgtatg aggacacact tacattattc ccttttagtg gagagacagt gtttatgtcc
2100
atggagaatc caggcctgtg gatcttgggg tgtcataata gtgactttag gaatagaggt
2160
atgacagctc tgctcaaagt gtcttcctgt gacaagaaca caggggacta ttatgaggac
2220
tcttatgagg acatttcagc ctatttactg tccaagaaca atgccattga accaagatct
2280
ttctctcaga actcaagaca ccccagcacc aggcagaagc agttcaatgc aaccaccatc
2340
ccagagaatg atattgaaaa aactgaccct tggtttgccc acaggactcc catgcctaag
2400
attcagaatg tatcttcatc agacttgctg atgctcctga gacagagccc aactcctcat
2460
ggcctgagct taagtgacct ccaggaggct aagtatgaaa ctttctcaga tgatcccagt
2520
cctggtgcca ttgattctaa taattccctg tctgagatga cacacttcag accccagctc
2580
caccactctg gagatatggt ctttactcct gaatcaggcc tgcagctgag gctgaatgaa
2640
aagcttggca ccacagcagc tactgaactg aaaaagctgg attttaaagt gagctccaca
2700
tccaacaacc tgatttccac tatcccctca gataacttgg cagcagggac tgataacaca
2760
agctcactgg gtcccccttc catgcctgtc cattatgata gtcagctgga tactactctg
2820
tttggtaaga aatcctctcc cctgactgaa agtggaggcc ctctttccct gtcagaggag
2880
aacaatgaca gcaaactgtt agagtctgga ctcatgaact cacaggaaag ttcttggggc
2940
aagaatgtgt ctagcactga gtctgggaga ctgtttaagg gcaagagggc ccatggacca
3000
gccctgctga caaaggataa tgcactgttt aaggtctcaa tcagcctgtt gaagaccaac
3060
aaaaccagta ataattctgc aacaaacagg aagacccaca ttgatggacc ctctcttctc
3120
attgagaatt ccccttctgt ctggcagaac atcttggaat cagatacaga gttcaagaag
3180
gtgactcccc tgatccatga taggatgctc atggataaga atgccacagc actcaggctc
3240
aatcacatga gcaacaagac tacctcctcc aaaaatatgg agatggtgca gcagaagaag
3300
gaaggtccca ttccccctga tgcacagaat ccagatatga gcttctttaa gatgctgttt
3360
ttgcctgagt ctgccaggtg gattcagagg acacatggga agaactcact taactctggc
3420
caaggtccca gtcctaagca gttggtgagc ttggggcctg agaaaagtgt ggagggacag
3480
aatttcctgt ctgaaaagaa caaagtggtt gtgggcaaag gagagttcac taaagatgtg
3540
ggactgaagg agatggtgtt tcctagttca agaaatctct ttcttaccaa tcttgataac
3600
ctgcatgaga acaacaccca caatcaggaa aagaagatcc aggaggaaat tgagaagaag
3660
gaaaccctga tccaggaaaa tgttgtgctg ccacagatcc acactgttac tgggaccaaa
3720
aatttcatga aaaacctgtt tctcctgtct accagacaga atgtagaggg aagctatgat
3780
ggggcctatg cccctgttct ccaggacttc agatccctga atgactccac caacaggact
3840
aagaaacata ctgcacactt tagtaagaag ggggaggagg agaacctgga gggattggga
3900
aaccagacca agcagattgt ggagaaatat gcttgcacca ctagaatctc acctaacaca
3960
agccagcaga actttgtgac ccagaggtct aagagggccc tcaaacagtt tagattgcct
4020
ttggaggaga ctgagctgga aaagaggatt attgtggatg acacctctac ccagtggagc
4080
aagaatatga agcacctgac cccaagcacc cttactcaga ttgattacaa tgaaaaagaa
4140
aagggtgcca tcacccagag ccccttgagt gactgtttga caaggtccca cagtatccca
4200
caggctaaca gatctcctct gcctattgcc aaggtcagct ccttcccttc catcagaccc
4260
atctatctga ccagagtgct gttccaggac aactcctctc atctgccagc tgcctcctat
4320
aggaagaagg atagtggtgt gcaggaatca tctcactttc tgcagggagc caagaagaac
4380
aatctgagcc tggcaattct cacacttgag atgacaggag accagaggga agtgggaagt
4440
ctgggcactt ctgctaccaa ttctgtcacc tacaagaaag tggagaatac agttctgccc
4500
aagccagacc tgcctaaaac atctggaaag gttgagctgc tgcctaaggt gcacatatac
4560
cagaaggacc tattccctac agagacatcc aatggctccc caggccacct ggacttggta
4620
gaggggtctc tcctgcaggg cactgaaggt gctatcaagt ggaatgaggc taatagacct
4680
gggaaggtgc catttctgag ggtggccaca gagagctcag ctaagacacc cagcaagctg
4740
cttgatcccc tggcctggga caatcactat ggaacccaga ttcctaagga ggagtggaag
4800
tcccaggaga agtccccaga gaagactgct ttcaagaaga aggacactat cctctccctg
4860
aatgcctgtg agtctaacca tgctattgct gccatcaatg aaggccagaa caagcctgaa
4920
attgaggtga catgggccaa gcagggcaga acagagaggc tgtgcagcca gaacccacct
4980
gtgctcaaga ggcaccagag agagatcact agaaccactc tgcagtcaga ccaggaagag
5040
attgactatg atgacaccat ctcagttgag atgaaaaagg aggattttga tatttatgat
5100
gaggatgaga atcaatcccc aagatctttt cagaagaaga caagacatta cttcattgct
5160
gcagtggaga gactgtggga ttatggcatg tcctcctcac ctcatgtgct gagaaataga
5220
gcccagtctg gctctgtgcc ccagttcaaa aaagtggtgt ttcaggagtt cacagatggt
5280
tccttcacac agcccctgta caggggtgag ctgaatgagc acctggggtt gctgggcccc
5340
tacatcagag ctgaagttga ggataatatt atggtgacct tcaggaatca ggccagtagg
5400
ccttactctt tctactccag cctgatctca tatgaggagg accagagaca gggggctgaa
5460
cctaggaaga attttgtgaa gcccaatgaa acaaagacat acttctggaa ggtgcagcac
5520
cacatggctc ctaccaagga tgaatttgat tgcaaggctt gggcctattt ttctgatgtg
5580
gacctggaga aggatgtgca ttctggcctc attggccctc tcttggtgtg tcacaccaat
5640
accttgaatc cagcccatgg cagacaggtg actgttcagg agtttgctct gtttttcacc
5700
atctttgatg agacaaagtc ctggtatttt acagagaata tggagaggaa ttgcagggcc
5760
ccctgcaaca tccagatgga agacccaacc ttcaaggaga actacagatt ccatgcaatc
5820
aatggatata tcatggacac cctgcctggc ctggttatgg ctcaggatca gagaatcagg
5880
tggtatctgc tgtctatggg gtcaaatgag aacatccata gtatccactt ctctggccat
5940
gtgtttacag tgagaaagaa ggaagaatat aagatggccc tgtacaacct ctaccctgga
6000
gtgtttgaaa ctgttgaaat gctgccttca aaggctggaa tctggagggt ggaatgcctg
6060
attggagagc accttcatgc tggcatgtcc accctgtttc tggtgtacag caataagtgt
6120
cagactcctc tgggtatggc ttcaggccac atcagggact tccagatcac tgcctcagga
6180
cagtatggac agtgggctcc caaactggca aggctccact actcaggcag cattaatgcc
6240
tggtccacca aagagccttt cagctggatt aaggtggatc tcctggcacc tatgatcatc
6300
catgggatca agactcaggg agctaggcag aagtttagca gcctgtacat ttctcagttt
6360
atcattatgt acagcctgga tggaaaaaag tggcagacct atagaggaaa ctccactgga
6420
acactgatgg tgttttttgg caatgtggac tcaagtggga tcaagcacaa tatcttcaac
6480
ccccctatca ttgccagata catcaggctc caccctacac actactctat cagatctaca
6540
cttaggatgg agctgatggg atgtgatctg aactcttgca gtatgcctct gggtatggag
6600
tccaaggcca tctctgatgc tcagatcaca gccagctctt actttactaa tatgtttgct
6660
acctggtccc caagcaaggc aagactgcac ctgcagggca gatccaatgc ttggagaccc
6720
caggtgaata acccaaaaga gtggcttcag gtggacttcc agaagactat gaaggtgact
6780
ggagtgacca cccagggggt gaagtcactg ctgacctcca tgtatgtgaa ggagttcctg
6840
atctccagct cccaggatgg ccaccagtgg accctgttct tccagaatgg aaaggtgaag
6900
gtgttccagg gaaaccagga ctcctttacc cctgtggtga actccctgga ccccccactg
6960
ctgaccagat acctgagaat ccatccccag agctgggtgc accagattgc ccttaggatg
7020
gaggtgctgg gatgtgaagc ccaggacctg tactaa
7056
<210> 395
<211> 5013
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 395
atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct
60
accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg
120
ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac
180
acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt
240
gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat
300
gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta
360
ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga
420
gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg
480
aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat
540
gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa
600
gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg
660
tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat
720
gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc
780
ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc
840
accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat
900
agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg
960
gacttggggc agtttctgtt attctgccac atcagcagcc atcaacatga tggtatggaa
1020
gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag
1080
gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat
1140
gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc
1200
tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc
1260
cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga
1320
aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc
1380
atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg
1440
ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca
1500
gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt
1560
ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct
1620
actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga
1680
gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag
1740
agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag
1800
aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg
1860
cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg
1920
tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct
1980
attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag
2040
atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct
2100
atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt
2160
atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat
2220
tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc
2280
ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc
2340
ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag
2400
attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat
2460
ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc
2520
ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc
2580
caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag
2640
aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact
2700
tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca
2760
agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt
2820
tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag
2880
aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc
2940
aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt
3000
gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag
3060
gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct
3120
gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct
3180
cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt
3240
tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat
3300
atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc
3360
tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct
3420
agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac
3480
atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat
3540
ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca
3600
ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt
3660
tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct
3720
tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat
3780
ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg
3840
tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg
3900
ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg
3960
tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt
4020
ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag
4080
acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag
4140
tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg
4200
tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat
4260
gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc
4320
attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc
4380
ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct
4440
cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt
4500
aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc
4560
aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc
4620
tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag
4680
gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga
4740
gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc
4800
tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg
4860
tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg
4920
accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag
4980
gtgctgggct gtgaggccca ggacctgtac tga
5013
<210> 396
<211> 5013
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 396
atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct
60
accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg
120
ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac
180
acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt
240
gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat
300
gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta
360
ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga
420
gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg
480
aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat
540
gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa
600
gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg
660
tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat
720
gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc
780
ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc
840
accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat
900
agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg
960
gacttggggc agtttctgtt aagctgccac atcagcagcc atcaacatga tggtatggaa
1020
gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag
1080
gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat
1140
gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc
1200
tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc
1260
cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga
1320
aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc
1380
atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg
1440
ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca
1500
gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt
1560
ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct
1620
actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga
1680
gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag
1740
agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag
1800
aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg
1860
cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg
1920
tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct
1980
attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag
2040
atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct
2100
atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt
2160
atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat
2220
tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc
2280
ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc
2340
ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag
2400
attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat
2460
ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc
2520
ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc
2580
caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag
2640
aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact
2700
tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca
2760
agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt
2820
tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag
2880
aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc
2940
aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt
3000
gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag
3060
gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct
3120
gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct
3180
cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt
3240
tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat
3300
atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc
3360
tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct
3420
agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac
3480
atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat
3540
ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca
3600
ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt
3660
tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct
3720
tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat
3780
ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg
3840
tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg
3900
ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg
3960
tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt
4020
ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag
4080
acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag
4140
tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg
4200
tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat
4260
gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc
4320
attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc
4380
ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct
4440
cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt
4500
aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc
4560
aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc
4620
tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag
4680
gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga
4740
gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc
4800
tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg
4860
tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg
4920
accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag
4980
gtgctgggct gtgaggccca ggacctgtac tga
5013
<210> 397
<211> 1670
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 397
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Arg Glu Ile Thr Arg Thr Thr
980 985 990
Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val
995 1000 1005
Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn
1010 1015 1020
Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile
1025 1030 1035
Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro
1040 1045 1050
His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe
1055 1060 1065
Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln
1070 1075 1080
Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly
1085 1090 1095
Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe
1100 1105 1110
Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
1115 1120 1125
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn
1130 1135 1140
Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln
1145 1150 1155
His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
1160 1165 1170
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
1175 1180 1185
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro
1190 1195 1200
Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe
1205 1210 1215
Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met
1220 1225 1230
Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro
1235 1240 1245
Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile
1250 1255 1260
Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile
1265 1270 1275
Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser
1280 1285 1290
Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu
1295 1300 1305
Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr
1310 1315 1320
Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys
1325 1330 1335
Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu
1340 1345 1350
Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly
1355 1360 1365
His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln
1370 1375 1380
Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn
1385 1390 1395
Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu
1400 1405 1410
Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg
1415 1420 1425
Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr
1430 1435 1440
Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr
1445 1450 1455
Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile
1460 1465 1470
Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg
1475 1480 1485
Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu
1490 1495 1500
Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met
1505 1510 1515
Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr
1520 1525 1530
Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu
1535 1540 1545
His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn
1550 1555 1560
Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val
1565 1570 1575
Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met
1580 1585 1590
Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln
1595 1600 1605
Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly
1610 1615 1620
Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro
1625 1630 1635
Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His
1640 1645 1650
Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp
1655 1660 1665
Leu Tyr
1670
<210> 398
<211> 31
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 398
Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser
1 5 10 15
Asn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln Arg
20 25 30
<---
название | год | авторы | номер документа |
---|---|---|---|
МОДУЛЯЦИЯ АКТИВНОСТИ REP БЕЛКА ПРИ ПОЛУЧЕНИИ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (ЗКДНК) | 2020 |
|
RU2812850C2 |
МОЛЕКУЛЫ НУКЛЕИНОВОЙ КИСЛОТЫ И ПУТИ ИХ ПРИМЕНЕНИЯ | 2018 |
|
RU2819144C2 |
ГЕННАЯ ТЕРАПИЯ ДЛЯ ЛЕЧЕНИЯ ГЕМОФИЛИИ A | 2017 |
|
RU2762257C2 |
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение | 2022 |
|
RU2818229C2 |
Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови VIII c делетированным B доменом, и ее применение | 2022 |
|
RU2808564C2 |
УЛУЧШЕНИЕ КЛИНИЧЕСКИХ ПАРАМЕТРОВ ПОСРЕДСТВОМ ЭКСПРЕССИИ ФАКТОРА VIII | 2019 |
|
RU2799048C2 |
АНТИТЕЛО, КОТОРОЕ ОБЛАДАЕТ СПОСОБНОСТЬЮ НЕЙТРАЛИЗОВАТЬ СУБСТАНЦИЮ, ОБЛАДАЮЩУЮ АКТИВНОСТЬЮ, АЛЬТЕРНАТИВНОЙ ФУНКЦИИ ФАКТОРА СВЕРТЫВАНИЯ VIII (FVIII) | 2015 |
|
RU2737145C2 |
СПОСОБ ИЗМЕРЕНИЯ РЕАКТИВНОСТИ FVIII | 2015 |
|
RU2752595C2 |
ВЫСОКОГЛИКОЗИЛИРОВАННЫЙ СЛИТЫЙ БЕЛОК НА ОСНОВЕ ФАКТОРА СВЕРТЫВАНИЯ КРОВИ ЧЕЛОВЕКА VIII, СПОСОБ ЕГО ПОЛУЧЕНИЯ И ЕГО ПРИМЕНЕНИЕ | 2016 |
|
RU2722374C1 |
Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2 | 2020 |
|
RU2760301C1 |
Изобретение относится к области биотехнологии. Описана группа изобретений, включающая бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК) для экспрессии белка фактора VIII (FVIII), способ экспрессии белка FVIII в клетке, фармацевтическую композицию для генной терапии, способ лечения субъекта, страдающего гемофилией А, клетку для продуцирования белка FVIII, композицию для доставки зкДНК-вектора и набор для доставки зкДНК-вектора. В одном из вариантов реализации бескапсидный вектор содержит по меньшей мере одну последовательность нуклеиновой кислоты, расположенную между фланкирующими инвертированными концевыми повторами (ITR), причем указанная по меньшей мере одна последовательность нуклеиновой кислоты кодирует по меньшей мере один белок фактора VIII (FVIII) и оптимизирована по кодонам для экспрессии в клетке. Изобретение расширяет арсенал средств для экспрессии белка фактора VIII (FVIII). 7 н. и 46 з.п. ф-лы, 16 ил., 15 табл., 14 пр.
1. Бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК) для экспрессии белка фактора VIII (FVIII), содержащий:
по меньшей мере одну последовательность нуклеиновой кислоты, расположенную между фланкирующими инвертированными концевыми повторами (ITR), причем указанная по меньшей мере одна последовательность нуклеиновой кислоты кодирует по меньшей мере один белок фактора VIII (FVIII), и оптимизирована по кодонам для экспрессии в клетке, при этом указанная по меньшей мере одна последовательность нуклеиновой кислоты, кодирующая указанный по меньшей мере один белок FVIII, имеет по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.
2. ЗкДНК-вектор по п. 1, отличающийся тем, что указанный по меньшей мере один белок FVIII имеет по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из SEQ IS NO: 380, 387 и 393.
3. ЗкДНК-вектор по п. 1, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 192-217.
4. ЗкДНК-вектор по п. 1 или 3, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210.
5. ЗкДНК-вектор по п. 1 или 3, отличающийся тем, что указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214.
6. ЗкДНК-вектор по любому из пп. 1-5, отличающийся тем, что указанный зкДНК-вектор содержит промотор, функционально связанный по меньшей мере с указанной одной последовательностью нуклеиновой кислоты, которая кодирует указанный по меньшей мере один белок FVIII.
7. ЗкДНК-вектор по любому из пп. 1-6, отличающийся тем, что указанный зкДНК-вектор содержит энхансер.
8. ЗкДНК-вектор по любому из пп. 1-7, отличающийся тем, что указанный зкДНК-вектор содержит последовательность 5'-UTR и/или интрона.
9. ЗкДНК-вектор по любому из пп. 1-8, отличающийся тем, что указанный зкДНК-вектор содержит последовательность 3'-UTR.
10. ЗкДНК-вектор по любому из пп. 1-9, отличающийся тем, что указанный зкДНК-вектор содержит по меньшей мере одну последовательность поли-(А).
11. ЗкДНК-вектор по любому из пп. 1-10, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой кДНК.
12. ЗкДНК-вектор по любому из пп. 1-11, отличающийся тем, что по меньшей мере один из указанных фланкирующих ITR содержит функциональный сайт концевого разрешения и сайт связывания репликационного белка (Rep).
13. ЗкДНК-вектор по любому из пп. 1-12, отличающийся тем, что один или оба из указанных фланкирующих ITR происходят из вируса, выбранного из группы, состоящей из парвовируса, депендовируса и аденоассоциированного вируса (ААВ).
14. ЗкДНК-вектор по любому из пп. 1-13, отличающийся тем, что указанные фланкирующие ITR являются симметричными или асимметричными.
] 5. ЗкДНК-вектор по п. 14, отличающийся тем, что указанные фланкирующие ITR являются симметричными или по существу симметричными.
16. ЗкДНК-вектор по п. 14, отличающийся тем, что указанные фланкирующие ITR являются асимметричными.
17. ЗкДНК-вектор по любому из пп. 1-16, отличающийся тем, что один из указанных ITR относится к дикому типу, или оба из указанных ITR являются ITR дикого типа.
18. ЗкДНК-вектор по любому из пп. 1-17, отличающийся тем, что указанные фланкирующие ITR происходят из различных вирусных серотипов.
19. ЗкДНК-вектор по любому из пп. 1-18, отличающийся тем, что указанные фланкирующие ITR происходят из пары вирусных серотипов, выбранных из группы, состоящей из пар вирусных серотипов ААВ1, ААВ1; ААВ2, ААВ2; ААВ3, ААВ3; ААВ4, ААВ4; ААВ5, ААВ5; ААВ1, ААВ2; ААВ2, ААВ3; ААВ3, ААВ4; ААВ4, ААВ5; ААВ5, ААВ6; ААВ1, ААВ3; ААВ2, ААВ4; ААВ3, ААВ5; ААВ4, ААВ6; ААВ5, ААВ7; ААВ1, ААВ4; ААВ2, ААВ5; ААВ3, ААВ6; ААВ4, ААВ7; ААВ5, ААВ8; ААВ1, ААВ5; ААВ2, ААВ6; ААВ3, ААВ7; ААВ4, ААВ8; ААВ5, ААВ9; ААВ1, ААВ6; ААВ2, ААВ7; ААВ3, ААВ8; ААВ4, ААВ9; ААВ5, ААВ10; ААВ1, ААВ7; ААВ2, ААВ8; ААВ3, ААВ9; ААВ4, ААВ10; ААВ5, ААВ11; ААВ1, ААВ8; ААВ2, ААВ9; ААВ3, ААВ10; ААВ4, ААВН; ААВ5, ААВ12; ААВ1, ААВ9; ААВ2, ААВ10; ААВ3, ААВ11; ААВ4, ААВ12; ААВ5, AABRH8; ААВ1, ААВ10; ААВ2, ААВ11; ААВ3, ААВ12; ААВ4, AABRH8; ААВ5, AABRH10; ААВ1, ААВ11; ААВ2, ААВ12; ААВ3, AABRH8; ААВ4, AABRH10; ААВ5, ААВ13; ААВ1, ААВ12; ААВ2, AABRH8; ААВ3, AABRH10; ААВ4, ААВ13; ААВ5, AABDJ; ААВ1, AABRH8; ААВ2, AABRH10; ААВ3, ААВ13; ААВ4, AABDJ; ААВ5, AABDJ8; ААВ1, AABRH10; AAB2, AAB13; ААВ3, AABDJ; AAB4, AABDJ8; AAB5, птичий; AAB1, ААВ13; AAB2, AABDJ; ААВ3, AABDJ8; AAB4, птичий; AAB5, бычий; ААВ1, AABDJ; AAB2, AABDJ8; ААВ3, птичий; ААВ4, бычий; ААВ5, собачий; ААВ1, AABDJ8; ААВ2, птичий; ААВ3, бычий; ААВ4, собачий; ААВ5, лошадиный; ААВ1, птичий; ААВ2, бычий; ААВ3, собачий; ААВ4, лошадиный; ААВ5, козий; ААВ1, бычий; ААВ2, собачий; ААВ3, лошадиный; ААВ4, козий; ААВ5, креветки; ААВ1, собачий; ААВ2, лошадиный; ААВ3, козий; ААВ4, креветки; ААВ5, свиной; ААВ1, лошадиный; ААВ2, козий; ААВ3, креветки; ААВ4, свиной; ААВ5, насекомых; ААВ1, козий; ААВ2, креветки; ААВ3, свиной; ААВ4, насекомых; ААВ5, овечий; ААВ1, креветки; ААВ2, свиной; ААВ3, насекомых; ААВ4, овечий; ААВ5, В19; ААВ1, свиной; ААВ2, насекомых; ААВ3, овечий; ААВ4, В19; ААВ5, MVM; ААВ1, насекомых; ААВ2, овечий; ААВ3, В19; ААВ4, MVM; ААВ5, гусиный; ААВ1, овечий; ААВ2, В19; ААВ3, MVM; ААВ4, гусиный; ААВ5, змеиный; ААВ1, В19; ААВ2, MVM; ААВ3, гусиный; ААВ4, змеиный; ААВ1, MVM; ААВ2, гусиный; ААВ3, змеиный; ААВ1, гусиный; ААВ2, змеиный; ААВ1, змеиный; ААВ6, ААВ6; ААВ7, ААВ7; ААВ8, ААВ8; ААВ9, ААВ9; ААВ10, ААВ10; ААВ6, ААВ7; ААВ7, ААВ8; ААВ8, ААВ9; ААВ9, ААВ10; ААВ10, ААВ11; ААВ6, ААВ8; ААВ7, ААВ9; ААВ8, ААВ10; ААВ9, ААВ11; ААВ10, ААВ12; ААВ6, ААВ9; ААВ7, ААВ10; ААВ8, ААВ11; ААВ9, ААВ12; ААВ10, AABRH8; ААВ6, ААВ10; ААВ7, ААВ11; ААВ8, ААВ12; ААВ9, AABRH8; ААВ10, AABRH10; ААВ6, ААВ11; ААВ7, ААВ12; ААВ8, AABRH8; ААВ9, AABRH10; ААВ10, ААВ13; ААВ6, ААВ12; ААВ7, AABRH8; ААВ8, AABRH10; ААВ9, ААВ13; ААВ10, AABDJ; ААВ6, AABRH8; ААВ7, AABRH10; ААВ8, ААВ13; ААВ9, AABDJ; ААВ10, AABDJ8; ААВ6, AABRH10; ААВ7, ААВ13; ААВ8, AABDJ; ААВ9, AABDJ8; ААВ10, птичий; ААВ6, ААВ13; ААВ7, AABDJ; ААВ8, AABDJ8; ААВ9, птичий; ААВ10, бычий; ААВ6, AABDJ;
ААВ7, AABDJ8; ААВ8, птичий; ААВ9, бычий; ААВ10, собачий; ААВ6, AABDJ8; ААВ7, птичий; ААВ8, бычий; ААВ9, собачий; ААВ10, лошадиный; ААВ6, птичий; ААВ7, бычий; ААВ8, собачий; ААВ9, лошадиный; ААВ10, козий; ААВ6, бычий; ААВ7, собачий; ААВ8, лошадиный; ААВ9, козий; ААВ10, креветки; ААВ6, собачий; ААВ7, лошадиный; ААВ8, козий; ААВ9, креветки; ААВ10, свиной; ААВ6, лошадиный; ААВ7, козий; ААВ8, креветки; ААВ9, свиной; ААВ10, насекомых; ААВ6, козий; ААВ7, креветки; ААВ8, свиной; ААВ9, насекомых; ААВ10, овечий; ААВ6, креветки; ААВ7, свиной; ААВ8, насекомых; ААВ9, овечий; ААВ10, В19; ААВ6, свиной; ААВ7, насекомых; ААВ8, овечий; ААВ9, В19; ААВ10, MVM; ААВ6, насекомых; ААВ7, овечий; ААВ8, В19; ААВ9, MVM; ААВ10, гусиный; ААВ6, овечий; ААВ7, В19; ААВ8, MVM; ААВ9, гусиный; ААВ10, змеиный; ААВ6, В19; ААВ7, MVM; ААВ8, гусиный; ААВ9, змеиный; ААВ6, MVM; ААВ7, гусиный; ААВ8, змеиный; ААВ6, гусиный; ААВ7, змеиный; ААВ6, змеиный; ААВ11, ААВ11; ААВ12, ААВ12; AABRH8, AABRH8; AABRH10, AABRH10; ААВ13, ААВ13; ААВ11, ААВ12; ААВ12, AABRH8; AABRH8, AABRH10; AABRH10, ААВ13; ААВ13, AABDJ; ААВ11, AABRH8; ААВ12, AABRH10; AABRH8, ААВ13; AABRH10, AABDJ; ААВ13, AABDJ8; ААВ11, AABRH10; ААВ12, ААВ13; AABRH8, AABDJ; AABRH10, AABDJ8; ААВ13, птичий; ААВ11, ААВ13; ААВ12, AABDJ; AABRH8, AABDJ8; AABRH10, птичий; ААВ13, бычий; ААВ11, AABDJ; ААВ12, AABDJ8; AABRH8, птичий; AABRH10, бычий;ААВ13, собачий; ААВ11, AABDJ8; АВ12, птичий; AABRH8, бычий; AABRH10, собачий; ААВ13, лошадиный; ААВ11, птичий; ААВ12, бычий; AABRH8, собачий; AABRH10, лошадиный; ААВ13, козий; ААВ11, бычий; ААВ12, собачий; AABRH8, лошадиный; AABRH10, козий; ААВ13, креветки; ААВ11, собачий; ААВ12, лошадиный; AABRH8, козий; AABRH10, креветки; ААВ13, свиной; ААВ11, лошадиный; ААВ12, козий; AABRH8, креветки; AABRH10, свиной; ААВ13, насекомых; ААВ11, козий; ААВ12, креветки; AABRH8, свиной; AABRH10, насекомых; ААВ13, овечий; ААВ11, креветки; ААВ12, свиной; AABRH8, насекомых; AABRH10, овечий; ААВ13, В19; ААВ11, свиной; ААВ12, насекомых; AABRH8, овечий; AABRH10, В19; ААВ13, MVM; ААВ11, насекомых; ААВ12, овечий; AABRH8, В19; AABRH10, MVM; ААВ13, гусиный; ААВ11, овечий; ААВ12, В19; AABRH8, MVM; AABRH10, гусиный; ААВ13, змеиный; ААВ11, В19; ААВ12, MVM; AABRH8, гусиный; AABRH10, змеиный; ААВ11, MVM; ААВ12, гусиный; AABRH8, змеиный; ААВ11, гусиный; ААВ12, змеиный; ААВ11, змеиный; AABDJ, AABDJ; AABDJ8, AVVDJ8; птичий, птичий; бычий, бычий; собачий, собачий; AABDJ, AABDJ8; AABDJ8, птичий; птичий, бычий; бычий, собачий; собачий, лошадиный; AABDJ, птичий; AABDJ8, бычий; птичий, собачий; бычий, лошадиный; собачий, козий; AABDJ, бычий; AABDJ8, собачий; птичий, лошадиный; бычий, козий; собачий, креветки; AABDJ, собачий; AABDJ8, лошадиный; птичий, козий; бычий, креветки; собачий, свиной; AABDJ, лошадиный; AABDJ8, козий; птичий, креветки; бычий, свиной; собачий, насекомых; AABDJ, козий; AABDJ8, креветки; птичий, свиной; бычий, насекомых; собачий, овечий; AABDJ, креветки; AABDJ8, свиной; птичий, насекомых; бычий, овечий; собачий, В19; AABDJ, свиной; AABDJ8, насекомых; птичий, овечий; бычий, В19; собачий, MVM; AABDJ, насекомых; AABDJ8, овечий; птичий, В19; бычий, MVM; собачий, гусиный; AABDJ, овечий; AABDJ8, В19; птичий, MVM; бычий, гусиный; собачий, змеиный; AABDJ, В19; AABDJ8, MVM; птичий, гусиный; бычий, змеиный; AABDJ, MVM; AABDJ8, гусиный; птичий, змеиный; AABDJ, гусиный; AABDJ8, змеиный; AABDJ, змеиный; лошадиный, лошадиный; козий, козий; креветки, креветки; свиной, свиной; насекомых, насекомых; лошадиный, козий; козий, креветки; креветки, свиной; свиной, насекомых; насекомых, овечий; лошадиный, креветки; козий, свиной; креветки, насекомых; свиной, овечий; насекомых, В19; лошадиный, свиной; козий, насекомых; креветки, овечий; свиной, В19; насекомых, MVM; лошадиный, насекомых; козий, овечий; креветки, В19; свиной, MVM; насекомых, гусиный; лошадиный, овечий; козий, В19; креветки, MVM; свиной, гусиный; насекомых, змеиный; лошадиный, В19; козий, MVM; креветки, гусиный; свиной, змеиный; лошадиный, MVM; козий, гусиный; креветки, змеиный; лошадиный, гусиный; козий, змеиный; лошадиный, змеиный; овечий, овечий; В19, В19; MVM, MVM; гусиный, гусиный; змеиный, змеиный; овечий, В19; В19, MVM; MVM, гусиный; гусиный, змеиный; овечий, MVM; В19, гусиный; MVM, змеиный; овечий, гусиный; В19, змеиный; овечий, змеиный.
20. ЗкДНК-вектор по любому из пп. 1-19, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-2, 5-48.
21. ЗкДНК-вектор по любому из пп. 1-20, отличающийся тем, что по меньшей мере один из указанных фланкирующих ITR изменен относительно последовательности ITR дикого типа ААВ путем делеции, добавления или замены, которые влияют на общую трехмерную конформацию указанного ITR.
22. ЗкДНК-вектор по любому из пп. 1-21, отличающийся тем, что один или оба из указанных фланкирующих ITR происходят из серотипа ААВ, выбранного из группы, состоящей из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11 и ААВ12.
23. ЗкДНК-вектор по любому из пп. 1-22, отличающийся тем, что один или оба из указанных фланкирующих ITR являются синтетическими.
24. ЗкДНК-вектор по любому из пп. 1-23, отличающийся тем, что один из указанных фланкирующих ITR не является ITR дикого типа, или оба из указанных фланкирующих ITR не являются ITR дикого типа.
25. ЗкДНК-вектор по любому из пп. 1-24, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены по меньшей мере в одной из областей указанных ITR, выбранных из группы, состоящей из А, А', В, В', С, С', D и D'.
26. ЗкДНК-вектор по п. 25, отличающийся тем, что указанная делеция, вставка и/или замена приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями А, А', В, В', С или С'.
27. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями В и В'.
28. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями С и С'.
29. ЗкДНК-вектор по любому из пп. 1-26, отличающийся тем, что один или оба из указанных фланкирующих ITR модифицированы путем делеции, вставки и/или замены, которая приводит к делеции всей или части структуры стебель-петля, образуемой указанными областями В и В', и/или всей или части структуры стебель-петля, образуемой указанными областями С и С'.
30. ЗкДНК-вектор по любому из пп. 1-29, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат одну структуру стебель-петля в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.
31. ЗкДНК-вектор по любому из пп. 1-30, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат один стебель и две петли в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.
32. ЗкДНК-вектор по любому из пп. 1-31, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат один стебель и одну петлю в области, которая, в ITR дикого типа, содержит первую структуру стебель-петля, образуемую указанными областями В и В', и вторую структуру стебель-петля, образуемую указанными областями С и С'.
33. ЗкДНК-вектор по любому из пп. 1-32, отличающийся тем, что оба фланкирующих ITR изменяют таким образом, что это приводит к общей трехмерной симметрии, при которой указанные ITR инвертированы по отношению друг к другу.
34. ЗкДНК-вектор по любому из пп. 1-33, отличающийся тем, что один или оба из указанных фланкирующих ITR содержат последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-2, 5-48.
35. ЗкДНК-вектор по любому из пп. 1-34, отличающийся тем, что указанный зкДНК-вектор включает по меньшей мере один регуляторный переключатель.
36. ЗкДНК-вектор по п. 35, отличающийся тем, что указанный по меньшей мере один регуляторный переключатель выбран из группы, состоящей из бинарного регуляторного переключателя, низкомолекулярного регуляторного переключателя, регуляторного переключателя «с кодом доступа», регуляторного переключателя на основе нуклеиновой кислоты, посттранскрипционного регуляторного переключателя, контролируемого излучением или контролируемого ультразвуком регуляторного переключателя, опосредуемого гипоксией регуляторного переключателя, регуляторного переключателя воспалительного ответа, активируемого сдвигом регуляторного переключателя и аварийного выключателя («kill switch»).
37. Способ экспрессии белка FVIII в клетке, включающий приведение указанной клетки в контакт с зкДНК-вектором по любому из пп. 1-36.
38. Способ по п. 37, отличающийся тем, что указанная клетка представляет собой клетку печени.
39. Способ по п. 37 или 38, отличающийся тем, что указанная клетка находится в условиях in vitro или in vivo.
40. Способ по любому из пп. 37-39, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой последовательность, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.
41. Способ лечения субъекта, страдающего гемофилией А, включающий введение указанному субъекту зкДНК-вектора по любому из пп. 1-36, отличающийся тем, что по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII.
42. Способ по п. 41, отличающийся тем, что уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем.
43. Способ по п. 42, отличающийся тем, что указанное повышение уровней FVIII составляет более примерно 40% по сравнению с контролем.
44. Способ по п. 41, отличающийся тем, что указанная по меньшей мере одна последовательность нуклеиновой кислоты представляет собой последовательность, имеющую по меньшей мере 85% идентичности с последовательностью, выбранной из группы, состоящей из последовательностей SEQ ID NO: 380-397.
45. Способ по любому из пп. 41-44, отличающийся тем, что указанный зкДНК-вектор вводят в клетку печени.
46. Способ по любому из пп. 41-45, отличающийся тем, что указанный зкДНК-вектор экспрессирует указанный белок FVIII в клетке печени.
47. Способ по любому из пп. 41-46, отличающийся тем, что указанный зкДНК-вектор вводят с помощью любого одного или более из путей, выбранных из группы, состоящей из: внутривенная инъекция, внутримышечная инъекция и инфузия.
48. Фармацевтическая композиция для генной терапии, содержащая зкДНК-вектор по любому из пп. 1-36.
49. Клетка для продуцирования белка FVIII, содержащая зкДНК-вектор по любому из пп. 1-36.
50. Клетка по п. 49, отличающаяся тем, что указанная клетка представляет собой клетку печени.
51. Композиция для доставки зкДНК-вектора, содержащая зкДНК-вектор по любому из пп. 1-36 и липид.
52. Композиция по п. 51, отличающаяся тем, что указанный липид представляет собой липидную наночастицу (ЛНЧ).
53. Набор для доставки зкДНК-вектора, содержащий зкДНК-вектор по любому из пп. 1-36, фармацевтическую композицию по п. 48, клетку по п. 49 или 50, или композицию по п. 51 или 52 и инструкции по применению.
US 20190032083 A1, 31.01.2019 | |||
WO 2017075619 A1, 04.05.2017 | |||
WO 2019051255 A1, 14.03.2019 | |||
WO 2019032898 A1, 14.02.2019 | |||
КОМПОЗИЦИИ ВЕКТОРА AAV И СПОСОБЫ ПЕРЕНОСА ГЕНОВ В КЛЕТКИ, ОРГАНЫ И ТКАНИ | 2013 |
|
RU2653444C2 |
Авторы
Даты
2024-02-02—Публикация
2020-03-13—Подача