ГРЫЗУНЫ, ХАРАКТЕРИЗУЮЩИЕСЯ ГУМАНИЗИРОВАННЫМ ГЕНОМ TMPRSS Российский патент 2021 года по МПК A01K67/27 C12N15/63 

Описание патента на изобретение RU2749715C2

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ

[001] Настоящая заявка испрашивает приоритет предварительной заявки на патент США № 62/301023, поданной 29 февраля 2016 г., полное содержание которой включено в данный документ посредством ссылки.

ВКЛЮЧЕНИЕ ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ПОСРЕДСТВОМ ССЫЛКИ

[002] Перечень последовательностей в виде текстового файла ASCII размером 275 Кб под названием 33093_10234US01_SequenceListing.txt, созданный 13 февраля 2017 г. и поданный в Ведомство по патентам и товарным знакам США через EFS-Web, включен в данный документ посредством ссылки.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

[003] Трансмембранные сериновые протеазы II типа представляют собой семейство протеаз, характеризующихся N-концевым трансмембранным доменом (Bugge et al., J. Biol. Chem. 284 (35): 23177-23181, 2009; Hooper et al., J. Biol. Chem. 272(2): 857-860, 2001). Все члены данного семейство экспрессируются в виде одноцепочечных зимогенов и протеолитически активируются посредством расщепления в высококонсервативном мотиве R/(IV)VGG. Было показано, что один член семейства, трансмембранная протеаза 4 серинового типа (TMPRSS4), активирует эпителиальный натриевый канал (ENaC), регулирующий прохождение натрия и воды через эпителий (Guipponi et al. 2002 Hum. Mol. Genet. 11:2829; Vuagniaux et al. 2002 J. Gen. Physiol. 120:191). Протеолитические активаторы TMPRSS4 неизвестны; однако данные, доступные на сегодняшний день, позволяют предположить, что белок является самоактивируемым. В активированном состоянии каталитический домен TMPRSS4 сохраняет связь с N-концом белка посредством дисульфидной связи. Было показано, что TMPRSS4, TMPRSS2 и TMPRSS11D (или трипсиноподобная протеаза респираторного тракта человека; «HAT») расщепляют in vitro гемагглютинин вируса гриппа A (HA), который представляет собой первую необходимую стадию в жизненном цикле вируса. Данное расщепление является необходимым для активности HA, поскольку белок синтезируется в виде белка-предшественника (HA0) и требует расщепления до HA1 и HA2 для получения активности. Нокдаун TMPRSS4 посредством RNAi в клетках Caco-2 приводил к уменьшению распространения вируса. Кроме того, было показано, что в легких мышей, зараженных гриппом, сильно повышена экспрессия TMPRSS4 (Böttcher et al. 2006 J. Virol. 80:9896; Böttcher et al. 2009 Vaccine 27: 6324; Böttcher-Friebershäusser et al. 2010 J. Virol. 84: 5604; Bertam et al. 2010 J. Virol. 84:10016; Bertam et al. 2010 J. Virol. 84:10016; Böttcher-Friebershäusser et al. 2011 J. Virol. 85: 1554; Bahgat et al. 2011 Virol. J. 8:27).

[004] Разработка системы in vivo, например, модели инфекции на грызунах, необходима для того, чтобы определить и тестировать соединения, включая антитела, которые специфически целенаправленно воздействуют на трансмембранные сериновые протеазы человека II типа для лечения и предупреждения вирусной инфекции и других заболеваний.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[005] Настоящее изобретение охватывает понимание того, что для обеспечения систем in vivo для идентификации и разработки новых терапевтических средств необходимо получение с помощью генной инженерии животных, относящихся к грызунам. Например, настоящее изобретение охватывает понимание того, что грызуны, характеризующиеся гуманизированным геном Tmprss, необходимы для применения в идентификации и разработке терапевтических средств для лечения и предупреждения вирусных инфекций.

[006] В одном аспекте настоящего изобретения предусмотрен грызун, геном которого содержит гуманизированный ген Tmprss, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где гуманизированный ген Tmprss находится под контролем регуляторной 5'-последовательности (регуляторных последовательностей), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss грызуна.

[007] В некоторых вариантах осуществления гуманизированный ген Tmprss у грызунов, раскрытых в данном документе, кодирует гуманизированный белок Tmprss, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS человека. В некоторых вариантах осуществления гуманизированный белок Tmprss содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны по последовательности) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна.

[008] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность родственного гена TMPRSS человека кодирует полипептид, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека. В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность эндогенного гена Tmprss грызуна кодирует полипептид, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна.

[009] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss, расположенный в эндогенном локусе Tmprss грызуна, что является результатом замены непрерывной геномной последовательности эндогенного гена Tmprss грызуна непрерывной геномной последовательностью родственного гена TMPRSS человека. В конкретных вариантах осуществления непрерывная геномная последовательность родственного гена TMPRSS человека, которая является вставленной, содержит последовательности экзонов, кодирующих эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека. В некоторых вариантах осуществления непрерывная геномная последовательность родственного гена TMPRSS человека также содержит 3'-UTR родственного гена TMPRSS человека.

[0010] В некоторых вариантах осуществления грызун, раскрытый в данном документе, является гетерозиготным по гуманизированному гену Tmprss в эндогенном локусе Tmprss грызуна. В других вариантах осуществления грызун является гомозиготным по гуманизированному гену Tmprss в эндогенном локусе Tmprss грызуна.

[0011] В дополнительных вариантах осуществления грызун содержит два или более гуманизированных генов Tmprss в различных эндогенных локусах Tmprss грызуна, причем каждый эндогенный локус Tmprss грызуна гуманизирован с помощью соответствующего родственного гена TMPRSS человека; например, два или более гуманизированных генов Tmprss2, гуманизированных генов Tmprss4 и гуманизированных генов Tmprss11d.

[0012] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss2, который содержит нуклеотидную последовательность эндогенного гена Tmprss2 грызуна и нуклеотидную последовательность гена TMPRSS2 человека, где гуманизированный ген Tmprss2 находится под контролем промотора эндогенного гена Tmprss2 грызуна.

[0013] В некоторых вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека, применяемым в гуманизации. Белок TMPRSS2 человека содержит, в некоторых вариантах осуществления, аминокислотную последовательность, по меньшей мере на 85% идентичную (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичную) аминокислотной последовательности, изложенной под SEQ ID NO: 4. В некоторых вариантах осуществления гуманизированный белок Tmprss2 содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный) аминокислотной последовательности, состоящей из остатков W106 - G492 или C-концевых 387 аминокислот белка TMPRSS2 человека, изложенного под, например, SEQ ID NO: 4. В некоторых вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна, который подлежит гуманизации. Иллюстративный эндогенный белок Tmprss2 грызуна изложен под SEQ ID NO: 2.

[0014] В некоторых вариантах осуществления грызун содержит гуманизированный ген Tmprss2, который содержит нуклеотидную последовательность эндогенного гена Tmprss2 грызуна и нуклеотидную последовательность гена TMPRSS2 человека, где нуклеотидная последовательность гена TMPRSS2 человека кодирует эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека. В конкретных вариантах осуществления нуклеотидная последовательность гена TMPRSS2 человека представляет собой непрерывную геномную последовательность гена TMPRSS2 человека, содержащую область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека дополнительно содержит 3'-UTR гена TMPRSS2 человека. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss2 грызуна, включенная в гуманизированный ген Tmprss2, кодирует цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна.

[0015] В конкретных вариантах осуществления гуманизированный ген Tmprss2 содержит кодирующие экзоны 1-2 эндогенного гена Tmprss2 грызуна и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, где гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна, и эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека. Гуманизированный ген Tmprss2 содержит экзон 3, который, в некоторых вариантах осуществления, представляет собой кодирующий экзон 3 гена TMPRSS2 человека и, в других вариантах осуществления, представляет собой кодирующий экзон 3 эндогенного гена Tmprss2 грызуна. В некоторых вариантах осуществления гуманизированный ген Tmprss2 содержит экзон 3, который содержит 5'-участок кодирующего экзона 3 эндогенного гена Tmprss2 грызуна и 3'-участок кодирующего экзона 3 гена TMPRSS2 человека.

[0016] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss4, который содержит нуклеотидную последовательность эндогенного гена Tmprss4 грызуна и нуклеотидную последовательность гена TMPRSS4 человека, где гуманизированный ген Tmprss4 находится под контролем промотора эндогенного гена Tmprss4 грызуна.

[0017] В некоторых вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS4 человека, кодируемого геном TMPRSS4 человека, применяемым в гуманизации. Белок TMPRSS4 человека содержит, в некоторых вариантах осуществления, аминокислотную последовательность, по меньшей мере на 85% идентичную (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичную) аминокислотной последовательности, изложенной под SEQ ID NO: 11. В некоторых вариантах осуществления гуманизированный белок Tmprss4 содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный) аминокислотной последовательности, состоящей из остатков K54 - L437 или C-концевых 384 аминокислот белка TMPRSS4 человека, изложенного под, например, SEQ ID NO: 11. В некоторых вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам белка Tmprss4 грызуна, кодируемого эндогенным геном Tmprss4 грызуна, который подлежит гуманизации. Иллюстративный эндогенный белок Tmprss4 грызуна изложен под SEQ ID NO: 9.

[0018] В некоторых вариантах осуществления грызун содержит гуманизированный ген Tmprss4, который содержит нуклеотидную последовательность эндогенного гена Tmprss4 грызуна и нуклеотидную последовательность гена TMPRSS4 человека, где нуклеотидная последовательность гена TMPRSS4 человека кодирует эктодомен, практически идентичный эктодомену белка TMPRSS4 человека, кодируемого геном TMPRSS4 человека. В конкретных вариантах осуществления нуклеотидная последовательность гена TMPRSS4 человека представляет собой непрерывную геномную последовательность, содержащую область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss4 грызуна, включенная в гуманизированный ген Tmprss4, кодирует цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss4 грызуна, кодируемого эндогенным геном Tmprss4 грызуна.

[0019] В конкретных вариантах осуществления гуманизированный ген Tmprss4 содержит область от кодирующего экзона 1 до кодирующего экзона 3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.

[0020] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss11d, который содержит нуклеотидную последовательность эндогенного гена Tmprss11d грызуна и нуклеотидную последовательность гена TMPRSS11D человека, где гуманизированный ген Tmprss11d находится под контролем промотора эндогенного гена Tmprss11d грызуна.

[0021] В некоторых вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека, применяемым в гуманизации. Белок TMPRSS11D человека содержит, в некоторых вариантах осуществления, аминокислотную последовательность, по меньшей мере на 85% идентичную (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичную) аминокислотной последовательности, изложенной под SEQ ID NO: 18. В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит эктодомен, практически идентичный (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичный) аминокислотной последовательности, состоящей из остатков A42-I418 или 377 C-концевых аминокислот белка TMPRSS11D человека, изложенного в, например, SEQ ID NO: 18. В некоторых вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны (например, по меньшей мере на 85%, 90%, 95%, 98%, 99% или 100% идентичны) цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss11d грызуна, кодируемого эндогенным геном Tmprss11d грызуна, который подлежит гуманизации. Иллюстративный эндогенный белок Tmprss11d грызуна изложен под SEQ ID NO: 16.

[0022] В некоторых вариантах осуществления грызун содержит гуманизированный ген Tmprss11d, который содержит нуклеотидную последовательность эндогенного гена Tmprss11d грызуна и нуклеотидную последовательность гена TMPRSS11D человека, где нуклеотидная последовательность гена TMPRSS11D человека кодирует эктодомен, практически идентичный эктодомену белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека. В конкретных вариантах осуществления нуклеотидная последовательность гена TMPRSS11d человека представляет собой непрерывную геномную последовательность, содержащую область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека дополнительно содержит 3'-UTR гена TMPRSS11D человека. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss11d грызуна, включенная в гуманизированный ген Tmprss11d, кодирует цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss11d грызуна, кодируемого эндогенным геном Tmprss11d грызуна.

[0023] В конкретных вариантах осуществления гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 13 гена TMPRSS11D человека.

[0024] В другом аспекте настоящее изобретение предусматривает выделенные клетку или ткань грызуна, в геноме которых содержится гуманизированный ген Tmprss, как описано в данном документе. В конкретных вариантах осуществления гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.

[0025] В еще другом аспекте настоящего изобретения предусмотрена эмбриональная стволовая клетка грызуна, в геноме которой содержится гуманизированный ген Tmprss, как описано в данном документе. В конкретных вариантах осуществления гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.

[0026] В другом аспекте также предусмотрен эмбрион грызуна, полученный с помощью эмбриональной стволовой клетки грызуна, раскрытой в данном документе.

[0027] В одном аспекте настоящего изобретения предусмотрен вектор на основе нуклеиновой кислоты, подходящий для применения в гуманизации эндогенного гена Tmprss у грызуна. В некоторых вариантах осуществления вектор на основе нуклеиновой кислоты содержит последовательность нуклеиновой кислоты Tmprss человека (например, геномную ДНК человека, кодирующую эктодомен белка TMPRSS человека), фланкированную гомологичным 5'-участком и гомологичным 3'-участком. Гомологичные 5'- и 3'-участки представляют собой последовательности нуклеиновой кислоты, которые находятся в положениях 5' и 3' соответственно в отношении последовательности нуклеиновой кислоты Tmprss человека и являются гомологичными последовательностям геномной ДНК в эндогенном локусе Tmprss у грызуна, которые фланкируют геномную ДНК грызуна, кодирующую эктодомен родственного белка Tmprss грызуна. Таким образом, 5'- и 3'-гомологичные участки способны опосредовать гомологичную рекомбинацию и замену геномной ДНК грызуна, кодирующей эктодомен родственного белка Tmprss грызуна, последовательностью нуклеиновой кислоты Tmprss человека с образованием гуманизированного гена Tmprss, как описано в данном документе.

[0028] В дополнительном аспекте настоящее изобретение направлено на способ получения грызуна, в геноме которого содержится гуманизированный ген Tmprss. Способ включает модифицирование генома грызуна с заменой геномной последовательности эндогенного гена Tmprss грызуна на геномную последовательность родственного гена TMPRSS человека с образованием гуманизированного гена Tmprss.

[0029] В некоторых вариантах осуществления настоящего изобретения предусмотрен способ получения грызуна (такого, как мышь или крыса), характеризующегося гуманизированным геном Tmprss, при этом способ включает стадии (a) вставки геномного фрагмента в эндогенный локус Tmprss грызуна в эмбриональной стволовой клетке грызуна, где геномный фрагмент содержит нуклеотидную последовательность родственного гена TMPRSS человека, за счет чего обеспечивается образование гуманизированного гена Tmprss (такого, как описанный в данном документе); (b) получения эмбриональной стволовой клетки грызуна, содержащей гуманизированный ген Tmprss (a); и (c) получения грызуна с применением эмбриональной стволовой клетки грызуна из (b).

[0030] В некоторых вариантах осуществления гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d. В различных вариантах осуществления гуманизированный ген Tmprss кодирует гуманизированный белок Tmprss, который содержит эктодомен, практически идентичный (например, по меньшей мере на 90%, 95%, 98%, 99% или 100% идентичный по последовательности) эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека, применяемым для гуманизации. В конкретных вариантах осуществления гуманизированный белок Tmprss содержит эктодомен белка TMPRSS человека, выбранного из группы, состоящей из белка TMPRSS2 человека, белка TMPRSS4 человека и белка TMPRSS11D человека. В конкретных вариантах осуществления гуманизированный белок Tmprss дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, который подлежит гуманизации.

[0031] В другом аспекте настоящего изобретения предусмотрен способ применения грызуна, раскрытого в данном документе, для оценки терапевтической эффективности соединения (например, кандидатных ингибиторов, которые специфически целенаправленно воздействуют на белок TMPRSS человека) в лечении вирусной инфекции гриппа. Способ может включать стадии получения грызуна, описанного в данном документе, введения грызуну вируса гриппа и кандидатного соединения и мониторинга наличия и тяжести инфекции, вызванной вирусом гриппа, у грызуна для определения терапевтической эффективности кандидатного лекарственного средства.

[0032] В некоторых вариантах осуществления вирус гриппа вводят грызуну до введения соединения. В других вариантах осуществления вирус гриппа вводят грызуну после введения соединения.

[0033] В некоторых вариантах осуществления кандидатное соединение представляет собой антитело или его антигенсвязывающий фрагмент, специфичный в отношении белка TMPRSS человека. В конкретных вариантах осуществления кандидатное соединение представляет собой антитело или его антигенсвязывающий фрагмент, специфичный в отношении белка TMPRSS человека, выбранного из группы, состоящей из белка TMPRSS2 человека, белка TMPRSS4 человека и белка TMPRSS11D человека.

[0034] Другие признаки, цели и преимущества настоящего изобретения очевидны из нижеследующего подробного описания. Следует, однако, понимать, что подробное описание, хоть и указывает на варианты осуществления настоящего изобретения, приведено только в целях иллюстрации, а не ограничения. Различные изменения и модификации в пределах объема настоящего изобретения станут очевидными специалистам в данной области из подробного описания.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[0035] Графические материалы, включенные в данный документ, которые содержат следующие фигуры, приведены только в иллюстративных целях, а не для ограничения.

[0036] Фигуры 1A-1D. Иллюстративная стратегия гуманизации Tmprss2 мыши.

[0037] На фигуре 1A без соблюдения масштаба показана схема геномной организации генов Tmprss2 мыши и TMPRSS2 человека. Экзоны представлены тонкими полосами, расположенными поперек геномных последовательностей, причем первый кодирующий экзон для обоих генов обозначен старт-кодоном «ATG» над экзоном и последний кодирующий экзон обозначен кодоном «Стоп» над экзоном. Указаны геномный фрагмент мыши размером приблизительно 25291 п. о., который должен быть удален, и геномный фрагмент человека размером 25091 п. о., который должен быть вставлен. Указаны местоположения зондов, использованных в анализе, описанном в примере 1. TM: трансмембранный домен; SRCR: домен, подобный богатому цистеином домену фагоцитарных рецепторов; LDLRa: рецептор липопротеинов низкой плотности класса А.

[0038] На фигуре 1B без соблюдения масштаба проиллюстрирован иллюстративный модифицированный BAC-вектор для гуманизации эндогенного гена Tmprss2 мыши вместе с соединительными последовательностями (SEQ ID NO: 22, 23 и 24).

[0039] На фигуре 1C проиллюстрирована без соблюдения масштаба гуманизированная аллель Tmprss2 после удаления кассеты устойчивости к неомицину вместе с соединительными последовательностями (SEQ ID NO: 22 и 25).

[0040] На фигуре 1D представлено выравнивание последовательностей белка TMPRSS2 человека (SEQ ID NO: 4), белка Tmprss2 мыши (SEQ ID NO: 2) и гуманизированного белка Tmprss2 («мутантного белка 7010») (SEQ ID NO: 7).

[0041] Фигуры 2A-2D. Иллюстративная стратегия гуманизации Tmprss4 мыши.

[0042] На фигуре 2A без соблюдения масштаба показана схема геномной организации генов Tmprss4 мыши и TMPRSS4 человека. Экзоны представлены тонкими полосами, расположенными поперек геномных последовательностей, причем первый экзон (также первый кодирующий экзон) для обоих генов обозначен старт-кодоном «ATG» над экзоном и последний кодирующий экзон обозначен кодоном «Стоп» над экзоном. Указаны геномный фрагмент мыши размером приблизительно 11074 п. о., который должен быть удален, и геномный фрагмент человека размером 14963 п. о., который должен быть вставлен. Указаны местоположения зондов, использованных в анализе, описанном в примере 2. TM: трансмембранный домен; SRCR: домен, подобный богатому цистеином домену фагоцитарных рецепторов; LDLRa: рецептор липопротеинов низкой плотности класса А.

[0043] На фигуре 2B без соблюдения масштаба проиллюстрирован иллюстративный модифицированный BAC-вектор для гуманизации эндогенного гена Tmprss4 мыши вместе с соединительными последовательностями (SEQ ID NO: 38, 39 и 40).

[0044] На фигуре 2C проиллюстрирована без соблюдения масштаба гуманизированная аллель Tmprss4 после удаления кассеты устойчивости к неомицину вместе с соединительными последовательностями (SEQ ID NO: 41 и 40).

[0045] На фигуре 2D представлено выравнивание последовательностей белка TMPRSS4 человека (SEQ ID NO: 11), белка Tmprss4 мыши (SEQ ID NO: 9) и гуманизированного белка Tmprss4 («мутантного белка 7224») (SEQ ID NO: 14).

[0046] Фигуры 3A-3D. Иллюстративная стратегия гуманизации Tmprss11d мыши.

[0047] На фигуре 3A без соблюдения масштаба показана схема геномной организации генов Tmprss11d мыши и TMPRSS11D человека. Экзоны представлены тонкими полосами, расположенными поперек геномных последовательностей, причем первый экзон (также первый кодонный экзон) для обоих генов обозначен старт-кодоном «ATG» над экзоном и последний кодирующий экзон обозначен кодоном «Стоп» над экзоном. Указаны геномный фрагмент мыши размером приблизительно 35667 п. о., который должен быть удален, и геномный фрагмент человека размером 33927 п. о., который должен быть вставлен. Указаны местоположения зондов, использованных в анализе, описанном в примере 3. TM: трансмембранный домен; SEA: домен, находящийся в белке спермы морского ежа, энтерокиназе и агрине.

[0048] На фигуре 3B без соблюдения масштаба проиллюстрирован иллюстративный модифицированный BAC-вектор для гуманизации эндогенного гена Tmprss11d мыши вместе с соединительными последовательностями (SEQ ID NO: 57, 58 и 59).

[0049] На фигуре 3C проиллюстрирована без соблюдения масштаба гуманизированная аллель Tmprss11 после удаления кассеты устойчивости к неомицину вместе с соединительными последовательностями (SEQ ID NO: 57 и 60).

[0050] На фигуре 3D представлено выравнивание последовательностей белка TMPRSS11D человека (SEQ ID NO: 18), белка Tmprss11d мыши (SEQ ID NO: 16) и гуманизированного белка Tmprss11d («мутантного белка 7226») (SEQ ID NO: 21).

[0051] На фигуре 4 показаны результаты эксперимента, демонстрирующие, что мыши MAID7225 HumInTMPRSS4 не отличались в своей восприимчивости к заражению высокими дозами тяжелого гриппа A H1N1 или тяжелого, адаптированного для мышей H3N2. Мыши MAID7225 HumIn TMRPSS4, которых заражали A/Puerto Rico/08/1934 (H1N1) (светло-серые круги, пунктирная линия), демонстрировали сходный уровень выживаемости при сравнении с мышами дикого типа (светло-серые квадраты, пунктирная линия). Аналогичным образом мыши MAID7225 HumIn TMRPSS4, которых заражали A/Aichi/02/1968-X31 (H3N2) (темно-серые треугольники, пунктирная линия), демонстрировали сходный уровень выживаемости при сравнении с мышами дикого типа (светло-серые перевернутые треугольники, пунктирная линия). Мышей инфицировали IN в 0 день или с помощью 1150 PFU A/Puerto Rico/08/1934 (H1N1), или с помощью 10000 PFU A/Aichi/02/1968-X31 (H3N2). Контрольная группа включала неинфицированных мышей MAID7225 HumIn TMPRSS4, и дикого типа в качестве отрицательного контроля (черные ромбы, жирная линия).

ПОДРОБНОЕ ОПИСАНИЕ КОНКРЕТНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0052] Настоящее изобретение относится к генетически модифицированным грызунам (например, мышам и крысам), характеризующимся гуманизированным геном, кодирующим трансмембранные сериновые протеазы II типа (или «Tmprss» для трансмембранной протеазы/серина). Генетически модифицированные грызуны подходят для применения в скрининге кандидатных соединений, которые специфически целенаправленно воздействуют на молекулу TMPRSS человека для лечения и предупреждения заболеваний, таких как инфекция, вызванная вирусом гриппа. Соответственно, в настоящем изобретении предусмотрены генетически модифицированные грызуны, характеризующиеся гуманизированным геном Tmprss, клетки и ткани, выделенные из генетически модифицированных грызунов, способы и композиции для получения генетически модифицированных грызунов и применение генетически модифицированных грызунов для скрининга и тестирования терапевтических соединений. Различные варианты осуществления настоящего изобретения дополнительно описаны ниже.

Трансмембранные сериновые протеазы II типа («Tmprss»)

[0053] Трансмембранные сериновые протеазы II типа, также называемые в данном документе «Tmprss» в отношении молекул, отличных от молекул человека, или «TMPRSS» в отношении молекул человека («трансмембранные протеазы/серин»), представляют собой семейство белков, характеризующихся N-концевым трансмембранным доменом и C-концевым внеклеточным доменом сериновой протеазы. Были идентифицированы по меньшей мере 18 членов в семействе, которое распределено на четыре подсемейства (Bugge et al. (2009), выше). Все члены разделяют несколько общих структурных признаков, которые определяют семейство, включая (i) короткий N-концевой цитоплазматический домен, (ii) трансмембранный домен и (iii) эктодомен, который содержит домен протеазы и стеблевую область, которая связывает трансмембранный домен с доменом протеазы. Стеблевая область содержит комбинацию модульных структурных доменов шести разных типов: SEA-домен (белок спермы морского ежа/энтеропептидаза/агрин), домен фагоцитарных рецепторов группы A, LDLA-домен (рецептор липопротеинов низкой плотности класса A), CUB-домен (Cls/Clr эмбриональный фактор роста морских ежей, костный морфогенетический белок 1), MAM-домен (меприн/A5 антиген/рецепторная протеинфосфатаза мю) и Frizzled-домен. См. обзор Bugge et al. (2009), выше. Например, TMPRSS2 и TMPRSS4, оба из которых принадлежат к подсемейству гепсина/TMPRSS, характеризуются доменом фагоцитарных рецепторов группы A c предшествующим одним LDLA-доменом в стеблевой области. TMPRSS11D, также известный как «HAT» в отношении трипсиноподобной протеазы дыхательных путей человека, которая принадлежит к подсемейству HAT/DESC, характеризуется одним SEA-доменом. См. фигуру 1 Bugge et al. (2009), выше.

[0054] Трансмембранные сериновые протеазы II типа изначально продуцируются в виде неактивных проферментов, которым необходима активация посредством расщепления последующего основного аминокислотного остатка в консенсусном активационном мотиве, предшествующем домену протеазы. Некоторые из активированных протеаз остаются мембраносвязанными в результате дисульфидной связи между продоменом и доменом протеазы. Внеклеточные домены считаются критически важными для клеточной локализации, активации, ингибирования и/или субстратной специфичности таких протеаз (Bugge et al. (2009), выше; Szabo et al., Int. J. Biochem. Cell Biol. 40: 1297-1316 (2008)).

[0055] Была задокументирована различная биохимическая и патофизиологическая информация в отношении членов трансмембранных сериновых протеаз II типа. Было показано, что TMPRSS2, TMPRSS4 и TMPRSS11D расщепляют in vitro гемагглютинин вируса гриппа A (HA), который представляет собой первую необходимую стадию в жизненном цикле вируса. Предусмотрены генетически модифицированные животные, относящиеся к грызунам, характеризующиеся гуманизированным геном Tmprss, раскрытым в данном документе, пригодные для систем in vivo, которые обеспечивают обстоятельное понимание биологических функций молекул TMPRSS, а также скрининг терапевтических соединений, которые специфически целенаправленно воздействуют на молекулы TMPRSS человека.

[0056] Иллюстративные последовательности Tmprss, включая мышиные, человеческие и гуманизированные последовательности нуклеиновой кислоты и последовательности белка Tmprss, предусмотрены в настоящей заявке и обобщены в следующей таблице. Последовательности праймеров и зондов, применяемых в анализах, описанных в разделе примеров, и вставные соединительные последовательности иллюстративных гуманизированных аллелей Tmprss также включены в таблицу.

Краткое описание последовательностей

SEQ ID NO Описание Признаки 1 Tmprss2 Mus musculus, mRNA, NM_015775.2 Длина: 3175 п. о.
CDS: 231-1703
Экзоны: 1-177; 178-245 (второй экзон и первый кодирующий экзон); 246-465; 466-552; 553-672; 673-799; 800-910; 911-954; 955-1123; 1124-1299; 1300-1395; 1396-1538; 1539-1691; 1692-3161.
2 Tmprss2 Mus musculus, белок Длина: 490 ак 3 TMPRSS2 Homo sapiens, вариант транскрипта 2, mRNA, NM_005656.3 Длина: 3212 п. о.
CDS: 135-1613
Экзоны: 1-78; 79-149 (второй экзон и первый кодирующий экзон); 150-372; 373-459; 460-579; 580-706; 707-817; 818-861; 862-1033; 1034-1209; 1210-1305; 1306-1448; 1449-1601; 1602-3204.
4 TMPRSS2 Homo sapiens, вариант транскрипта 2, белок Длина: 492 ак
Эктодомен: начинается с W106.
5 Геномный фрагмент Tmprss2 для гуманизации Длина: 27947 п. о.
1-84: последовательность мыши
85-25175: последовательность человека (всего 25091 п. о.)
25176-27866: XhoI-LoxP-Cassette-loxP-ICeUI-NheI (всего 2691 п. о.)
27867-27947: последовательность мыши
6 Геномный фрагмент Tmprss2 для гуманизации с удаленной кассетой Длина: 25333 п. о.
1-84: последовательность мыши
85-25175: последовательность человека (всего 25091 п. о.)
25176-25252: XhoI-loxP-ICeUI-NheI (77 п. о.)
25253-25333: последовательность мыши
7 Гуманизированный белок Tmprss2 Длина: 491 aк 8 Tmprss4 Mus musculus, mRNA, NM_145403.2 Длина: 2267 п. о.
CDS: 289-1596
Экзоны: 1-291 (первый экзон и первый кодирующий экзон); 292-325; 326-439; 440-592; 593-722; 723-824; 825-865; 866-1025; 1026-1192; 1193-1291; 1292-1434; 1435-1584; 1585-2267.
9 Tmprss4 Mus musculus, белок Длина: 435 ак 10 TMPRSS4 Homo sapiens, вариант транскрипта 4, mRNA, NM_001173551.1 Длина: 3543 п. о.
CDS: 292-1599
Экзоны: 1-294 (первый экзон и первый кодирующий экзон); 295-328; 329-442; 443-595; 596-725; 726-827; 828-868; 869-1028; 1029-1195; 1196-1294; 1295-1437; 1438-1587; 1588-3529.
11 TMPRSS4 Homo sapiens, вариант транскрипта 4, белок Длина: 437 aк
Эктодомен: начинается с K54.
12 Геномный фрагмент Tmprss4 для гуманизации, содержащий кассету Длина: 20078 п. о.
1-18: последовательность мыши
19-5014: SalI/XhoI-LoxP-hUbi-EM7-Neo-Pm-Cre-loxP-ICeuI-NheI (всего 4996 п. о.)
5015-19977: Последовательность человека (всего 14963 п. о.)
19978-20078: последовательность мыши
13 Геномный фрагмент Tmprss4 для гуманизации с удаленной кассетой Длина: 15159 п. о.
1-18: последовательность мыши
19-95: SalI/XhoI-LoxP-ICeuI-NheI (всего 77 п. о.)
96-15058: Последовательность человека (всего 14963 п. о.)
15059-15159: последовательность мыши
14 Гуманизированный белок Tmprss4 Длина: 435 aк 15 Tmprss11d Mus musculus, mRNA, NM_145561.2 Длина: 2046 п. о.
CDS: 36-1289
Экзоны: 1-43 (первый экзон и первый кодирующий экзон), 44-165, 166-284; 285-352; 353-507;508-546; 547-724; 725-984; 985-1127; 1128-2046.
16 Tmprss11d Mus musculus, белок Длина: 417 aк 17 TMPRSS11D Homo sapiens, mRNA, NM_004262.2 Длина: 2800 п. о.
CDS: 66-1322
Экзоны: 1-73 (первый экзон и первый кодирующий экзон); 74-195; 196-314; 315-382; 383-540; 541-579; 580-757; 758-1017; 1018-1160; 1161-2783.
18 TMPRSS11D Homo sapiens, белок Длина: 418 aк
Эктодомен: начинается с A42.
19 Геномный фрагмент Tmprss11d для гуманизации, содержащий кассету Длина: 38992
1-19: последовательность мыши
20-33946: Последовательность ЧЕЛОВЕКА (всего 33927 п. о.)
33947-38942: XhoI-LoxP-hUbi-EM7-Neo-Pm-Cre-loxP-ICeuI-NheI (всего 4996 п. о.)
38943-38992: последовательность мыши
20 Геномный фрагмент Tmprss11d для гуманизации с удаленной кассетой Длина: 34073 п. о.
1-19: последовательность мыши
20-33946: Последовательность человека (всего 33927 п. о.)
33947-34023: XhoI-LoxP-ICeuI-NheI (77 п. о.)
34024-34073: последовательность мыши
21 Гуманизированный белок Tmprss11d 418 aк 22 Соединительная 5'-последовательность мыши/5'-последовательность человека для гуманизации Tmprss2 5'-Последовательность мыши//5'-последовательность человека 23 Соединительная 3'-последовательность человека/последовательность кассеты для гуманизации Tmprss2 Последовательность человека//XhoI//кассета loxP 24 Соединительная последовательность кассеты/3'-последовательность мыши для гуманизации Tmprss2 Кассета (loxP)/ICEUI//NheI//мыши 25 Соединительная 3'-последовательность человека/loxP/3'-последовательность мыши для гуманизации Tmprss2 3'-Последовательность человека//XhoI//(loxP)/ICEUI//NheI//3'-последовательность мыши 26-37 Праймеры и зонды для анализов с приобретением аллели или потерей аллели для гуманизации Tmprss2 Таблица 1 38 Соединительная 5'-последовательность мыши/последовательность кассеты для гуманизации Tmprss4 5'-Последовательность мыши//SalI-XhoI// кассета (loxP) 39 Соединительная последовательность кассеты/5'-последовательность человека для гуманизации Tmprss4 Кассета (loxP)/ICEUI//NheI//5'-последовательность человека 40 Соединительная 3'-последовательность человека/3'-последовательность мыши для гуманизации Tmprss4 3'-последовательность человека/3'-последовательность мыши 41 Соединительная 5'-последовательность мыши/loxP/5'-последовательность человека для гуманизации Tmprss4 5'-последовательность мыши//SalI/XhoI//(loxP)/ICEUI//NheI//5'-последовательность человека 42-56 Праймеры и зонды для анализов с приобретением аллели или потерей аллели для гуманизации Tmprss4 Таблица 2 57 Соединительная 5'-последовательность мыши/5'-последовательность человека для гуманизации Tmprss11d 5'-последовательность мыши//5'-последовательность человека 58 Соединительная 3'-последовательность человека/последовательность кассеты для гуманизации Tmprss11d 3'-последовательность человека//XhoI//кассета (loxP) 59 Соединительная последовательность кассеты/3'-последовательность мыши для гуманизации Tmprss11d Кассета (loxP)/ICEUI//NheI//3'-мыши 60 Соединительная 3'-последовательность человека/loxP/3'-последовательность мыши для гуманизации Tmprss11d 3'-Последовательность человека//XhoI//(loxP)/ICEUI//NheI//3'-последовательность мыши 61-72 Праймеры и зонды для анализов с приобретением аллели или потерей аллели для гуманизации Tmprss11d Таблица 3

Гуманизированные животные Tmprss, относящиеся к грызунам

[0057] В одном аспекте настоящего изобретения предусмотрены животные, относящиеся к грызунам, которые содержат в зародышевой линии гуманизированный ген Tmprss, кодирующий белок Tmprss человека.

[0058] Термин «гуманизированный», применяемый в контексте нуклеиновых кислот или белков, относится к нуклеиновым кислотам или белкам, чьи структуры (т.е. нуклеотидные или аминокислотные последовательности) содержат части, практически соответствующие или идентичные структурам конкретного гена или белка, обнаруженных в природе у животного, относящегося к грызунам, а также содержат части, отличающиеся от обнаруженных в релевантных гене или белке грызуна, и вместо этого более близко соответствующие или идентичные структурам, обнаруженным в соответствующем гене или белке человека. Грызун, содержащий гуманизированный ген или экспрессирующий гуманизированный белок, является «гуманизированным» грызуном.

[0059] В некоторых вариантах осуществления грызун по настоящему изобретению выбран из мыши, крысы и хомяка. В некоторых вариантах осуществления грызун по настоящему изобретению выбран из надсемейства Muroidea. В некоторых вариантах осуществления генетически модифицированный грызун по настоящему изобретению принадлежит к семейству, выбранному из Calomyscidae (например, мышевидные хомячки), Cricetidae (например, хомяки, крысы и мыши Нового света, полевки), Muridae (настоящие мыши и крысы, песчанки, иглистые мыши, косматые хомяки), Nesomyidae (лазающие мыши, скальные мыши, белохвостые крысы, малагасийские крысы и мыши), Platacanthomyidae (например, колючие соневидные хомяки) и Spalacidae (например, слепыши, бамбуковые крысы и цокоры). В некоторых определенных вариантах осуществления генетически модифицированный грызун по настоящему изобретению выбран из настоящей мыши или крысы (семейство Muridae), песчанки, иглистой мыши и косматого хомяка. В некоторых определенных вариантах осуществления генетически модифицированная мышь по настоящему изобретению является представителем семейства Muridae.

[0060] В некоторых вариантах осуществления грызун, раскрытый в данном документе, содержит гуманизированный ген Tmprss в геноме, который содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность гена TMPRSS человека, где нуклеотидная последовательность эндогенного гена Tmprss грызуна и нуклеотидная последовательность гена TMPRSS человека функционально связаны друг с другом так, что гуманизированный ген Tmprss кодирует белок Tmprss и находится под контролем 5'-регуляторного элемента(регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss грызуна.

[0061] Настоящее изобретение, в частности, направлено на гуманизацию с использованием схожей последовательности; другими словами, нуклеотидная последовательность эндогенного гена Tmprss грызуна функционально связана с нуклеотидной последовательностью родственного гена TMPRSS человека с образованием гуманизированного гена. Например, в некоторых вариантах осуществления, нуклеотидная последовательность эндогенного гена Tmprss2 грызуна функционально связана с нуклеотидной последовательностью гена TMPRSS2 человека с образованием гуманизированного гена Tmprss2. В других вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss4 грызуна функционально связана с нуклеотидной последовательностью гена TMPRSS4 человека с образованием гуманизированного гена Tmprss4. В еще других вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss11d грызуна функционально связана с нуклеотидной последовательностью гена TMPRSS11D человека с образованием гуманизированного гена Tmprss11d.

[0062] В некоторых вариантах осуществления генетически модифицированный грызун по настоящему изобретению содержит гуманизированный ген Tmprss в своем геноме, где гуманизированный ген Tmprss кодирует гуманизированный белок Tmprss, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека. Термин «эктодомен» относится к участку трансмембранного белка, который распространяется за пределы клеточной мембраны, т.е. к внеклеточному участку трансмембранного белка. Эктодомен молекулы TMPRSS содержит домен протеазы и стеблевую область, которая связывает трансмембранный домен с доменом протеазы. Под эктодоменом или полипептидом, который является «практически идентичным эктодомену белка TMPRSS человека», в некоторых вариантах осуществления подразумевается полипептид, который по меньшей мере на 85%, 90%, 95%, 95%, 99% или 100% идентичен по последовательности эктодомену белка TMPRSS человека; в некоторых вариантах осуществления полипептид, который отличается от эктодомена белка TMPRSS человека не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); в некоторых вариантах осуществления полипептид, который отличается от эктодомена белка TMPRSS человека только на N- или C- конце эктодомена, например, отсутствием аминокислот или наличием дополнительных аминокислот на N- или C-конце эктодомена; и в некоторых вариантах осуществления полипептид практически идентичен эктодомену белка TMPRSS человека. Под «по сути эктодоменом» белка TMPRSS человека подразумевают полипептид, который идентичен эктодомену или отличается от эктодомена отсутствием 1-5 (т.е. 1, 2, 3, 4 или 5) аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.

[0063] В некоторых вариантах осуществления гуманизированный ген Tmprss кодирует гуманизированный белок Tmprss, который дополнительно содержит цитоплазматический и трансмембранный участки, которые являются практически идентичными цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна. Под цитоплазматическим и трансмембранным участками или полипептидами, которые «практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна» в некоторых вариантах осуществления подразумевают полипептид, который по меньшей мере на 85%, 90%, 95%, 95%, 99% или 100% идентичен по последовательности цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна; в некоторых вариантах осуществления - полипептид, который отличается от цитоплазматического и трансмембранного участков эндогенного белка Tmprss грызуна не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); в некоторых вариантах осуществления - полипептид, который отличается от цитоплазматического и трансмембранного участков эндогенного белка Tmprss грызуна только на C- конце, например, отсутствием аминокислот или наличием дополнительных аминокислот на C-конце трансмембранного домена; и в некоторых вариантах осуществления - полипептид, состоящий из цитоплазматического домена и по сути из трансмембранного домена эндогенного белка Tmprss грызуна. Под «по сути трансмембранным доменом» эндогенного белка Tmprss грызуна подразумевают полипептид, который идентичен трансмембранному домену или отличается от трансмембранного домена отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на C-конце.

[0064] В некоторых вариантах осуществления гуманизированный ген Tmprss в геноме генетически модифицированного грызуна содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность родственного гена TMPRSS человека кодирует полипептид, практически идентичный эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека. В определенных вариантах осуществления нуклеотидная последовательность родственного гена TMPRSS человека в гуманизированном гене Tmprss кодирует эктодомен белка TMPRSS человека, кодируемого геном TMPRSS человека.

[0065] В некоторых вариантах осуществления гуманизированный ген Tmprss в геноме генетически модифицированного грызуна содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека, где нуклеотидная последовательность эндогенного гена Tmprss грызуна кодирует полипептид, практически идентичный цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого геном Tmprss грызуна. В конкретных вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss грызуна, присутствующая в гуманизированном гене Tmprss, кодирует цитоплазматические и трансмембранные домены эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна.

[0066] В некоторых вариантах осуществления гуманизированный ген Tmprss образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss грызуна в эндогенном локусе Tmprss грызуна нуклеотидной последовательностью родственного гена TMPRSS человека.

[0067] В некоторых вариантах осуществления непрерывная геномная последовательность гена Tmprss грызуна в эндогенном локусе Tmprss грызуна была замещена непрерывной геномной последовательностью родственного гена TMPRSS человека с образованием гуманизированного гена Tmprss.

[0068] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS человека, вставленная в эндогенный ген Tmprss грызуна, содержит экзоны, полностью или частично, гена TMPRSS человека, который кодирует эктодомен, который практически идентичен эктодомену белка TMPRSS человека, кодируемого геном TMPRSS человека.

[0069] В определенных вариантах осуществления геномная последовательность эндогенного гена Tmprss грызуна, которая остается в эндогенном локусе Tmprss грызуна после замены для гуманизации, функционально связана со вставленной непрерывной геномной последовательностью TMPRSS человека и кодирует цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна.

[0070] В случаях, когда эндогенный белок Tmprss и белок TMPRSS человека делят общие аминокислоты около точки соединения между трансмембранным доменом и эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS человека, которая точно кодирует эктодомен белка TMPRSS человека. Можно вставить немного более длинную или более короткую геномную последовательность гена TMPRSS человека, которая кодирует по сути эктодомен белка TMPRSS человека, в функциональную связь с геномной последовательностью эндогенного гена Tmprss грызуна, которая кодирует цитоплазматический домен и по сути трансмембранный домен эндогенного белка Tmprss грызуна, таким образом, что гуманизированный белок Tmprss, кодируемый образованным в результате гуманизированным геном Tmprss, содержит эктодомен, который идентичен эктодомену белка TMPRSS человека, и трансмембранный домен, который идентичен трансмембранному домену эндогенного белка Tmprss грызуна.

[0071] В некоторых вариантах осуществления нуклеотидная последовательность гена TMPRSS человека, включенная в гуманизированный ген Tmprss, также содержит нетранслируемую 3'-область («UTR») гена TMPRSS человека. В определенных вариантах осуществления, кроме 3'-UTR гена TMPRSS человека, гуманизированный ген Tmprss также содержит дополнительную геномную последовательность человека из локуса гена TMPRSS человека, следующего за 3'-UTR TMPRSS человека. Дополнительная геномная последовательность человека может состоять по меньшей мере из 10-200 п. о., например, 50 п. о., 75 п. о., 100 п. о., 125 п. о., 150 п. о., 175 п. о., 200 п. о. или больше, находящихся в локусе гена TMPRSS человека непосредственно после 3'-UTR гена TMPRSS человека. В других вариантах осуществления нуклеотидная последовательность гена TMPRSS человека, присутствующая в гуманизированном гене Tmprss, не содержит 3'-UTR человека; вместо этого включена 3'-UTR эндогенного гена Tmprss грызуна и следует непосредственно за стоп-кодоном гуманизированного гена Tmprss. Например, гуманизированный ген Tmprss может содержать нуклеотидную последовательность эндогенного гена Tmprss грызуна, содержащую последовательности экзонов, кодирующие цитоплазматические и трансмембранные домены эндогенного белка Tmprss грызуна, за которой следует нуклеотидная последовательность гена TMPRSS человека, содержащая область от последовательностей экзонов, кодирующих эктодомен, до стоп-кодона белка TMPRSS человека с 3'-UTR эндогенного гена Tmprss грызуна, следующей непосредственно после стоп-кодона.

[0072] В некоторых вариантах осуществления гуманизированный ген Tmprss приводит к экспрессии кодируемого гуманизированного белка Tmprss у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss). В некоторых вариантах осуществления гуманизированный белок Tmprss экспрессируется на уровне, сравнимом с уровнем соответствующего белка Tmprss грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss). В определенных вариантах осуществления гуманизированный белок Tmprss экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления гуманизированный белок Tmprss или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss грызуна или его растворимой формы или практически таком же, у контрольного грызуна. В контексте сравнения гуманизированного гена или белка у гуманизированного грызуна с эндогенным геном или белком грызуна у контрольного грызуна термин «сравнимый» означает, что сравниваемые молекулы или уровни могут не являться идентичными друг другу, но являться достаточно сходными для обеспечения возможности их сравнения, чтобы можно было сделать обоснованные выводы на основании наблюдаемых различий или сходств; и термин «практически такой же» в отношении уровней экспрессии означает, что сравниваемые уровни не отличаются друг от друга более чем на 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% или 1%.

[0073] В некоторых вариантах осуществления настоящее изобретение дополнительно предусматривает выделенную клетку или ткань животного, относящегося к грызунам, описанного в данном документе. В некоторых вариантах осуществления клетка выбрана из дендритной клетки, лимфоцита (например, B- или T-клетки), макрофага и моноцита. В некоторых вариантах осуществления ткань выбрана из жировой ткани, ткани мочевого пузыря, головного мозга, молочной железы, костного мозга, глаза, сердца, кишечника, почки, печени, легкого, лимфатического узла, мышцы, поджелудочной железы, плазмы крови, сыворотки крови, кожи, селезенки, желудка, вилочковой железы, яичка, яйцеклетки и их комбинации.

[0074] В некоторых вариантах осуществления настоящего изобретения предусмотрена эмбриональная стволовая клетка грызуна, геном которой содержит гуманизированный ген Tmprss, описанный в данном документе. В некоторых вариантах осуществления эмбриональная стволовая клетка грызуна представляет собой эмбриональную стволовую клетку мыши. В других вариантах осуществления эмбриональная стволовая клетка грызуна представляет собой эмбриональную стволовую клетку крысы. Эмбриональную стволовую клетку грызуна, содержащую гуманизированный ген Tmprss в своем геноме, можно применять для получения гуманизированного животного, относящегося к грызунам, дополнительно описанного ниже в данном документе.

[0075] В некоторых вариантах осуществления грызун, предусмотренный в данном документе, является гетерозиготным по гуманизированному гену Tmprss в своем геноме. В других вариантах осуществления грызун, предусмотренный в данном документе, является гомозиготным по гуманизированному гену Tmprss в своем геноме.

[0076] В определенных вариантах осуществления грызун содержит множество, т.е. два или более гуманизированных генов Tmprss в своем геноме. Другими словами, два или более разных эндогенных локусов Tmprss у грызуна были гуманизированы с применением нуклеотидных последовательностей родственных генов TMPRSS человека. Например, грызун был гуманизирован в двух или более локусов генов, выбранных из: Tmprss2, Tmprss4 и Tmprss11d.

[0077] Иллюстративные гуманизированные грызуны Tmprss2 (такие, как мыши), гуманизированные грызуны Tmprss4 (такие, как мыши) и гуманизированные грызуны Tmprss11d (такие, как мыши) дополнительно описаны ниже.

Гуманизированные грызуны Tmprss2

[0078] В некоторых вариантах осуществления настоящего изобретения предусмотрен грызун, геном которого содержит гуманизированный ген Tmprss2, который содержит нуклеотидную последовательность эндогенного гена Tmprss2 грызуна и нуклеотидную последовательность гена TMPRSS2 человека, и который находится под контролем регуляторного 5'-элемента(регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss2 грызуна. Примеры грызунов включают мышей и крыс.

[0079] В некоторых вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS2 человека.

[0080] В конкретных вариантах осуществления белок TMPRSS2 человека имеет аминокислотную последовательность, характеризующуюся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, изложенной под SEQ ID NO: 4.

[0081] В некоторых вариантах осуществления гуманизированный белок Tmprss2 содержит 387 C-концевых аминокислот белка TMPRSS2 человека, например, аминокислоты 106-492 белка TMPRSS2 человека. В некоторых вариантах осуществления гуманизированный белок Tmprss2 содержит эктодомен, который практически идентичен аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4. В конкретных вариантах осуществления гуманизированный белок Tmprss2 содержит эктодомен, характеризующийся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4; эктодомен, который отличается от аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4, не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); или эктодомен, который отличается от аминокислотной последовательности, состоящей из W106-G492 под SEQ ID NO: 4, только на N- или C-конце эктодомена, например, отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.

[0082] В некоторых вариантах осуществления гуманизированный белок Tmprss2 дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss2 грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss2 дополнительно содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss2 грызуна.

[0083] В конкретных вариантах осуществления гуманизированный белок Tmprss2 содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss2 грызуна и эктодомен белка TMPRSS2 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 7.

[0084] В некоторых вариантах осуществления гуманизированный ген Tmprss2 образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss2 грызуна в эндогенном локусе Tmprss2 грызуна нуклеотидной последовательностью гена TMPRSS2 человека.

[0085] В некоторых вариантах осуществления непрерывная геномная последовательность эндогенного гена Tmprss2 грызуна в эндогенном локусе Tmprss2 грызуна была замещена непрерывной геномной последовательностью гена TMPRSS2 человека с образованием гуманизированного гена Tmprss2.

[0086] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставленная в эндогенный ген Tmprss2 грызуна, содержит последовательности экзонов, т.е., экзоны, полностью или частично, гена TMPRSS2 человека, который кодируют эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека, кодируемым геном TMPRSS2 человека. В случаях, когда эндогенный белок Tmprss2 и белок TMPRSS2 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS2 человека, которая точно кодирует эктодомен белка TMPRSS2 человека, при этом можно применять немного более длинную или более короткую геномную последовательность TMPRSS2 человека, которая кодирует по сути эктодомен белка TMPRSS2 человека, чтобы получить гуманизированный белок Tmprss2, характеризующийся эктодоменом, который идентичен эктодомену белка TMPRSS2 человека.

[0087] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss2 грызуна, содержит по меньшей мере область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека.

[0088] В определенных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss2 грызуна, содержит интрон 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss 2 грызуна, содержит 3'-часть кодирующего экзона 3, интрон 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека. В конкретных вариантах осуществления 3'-часть кодирующего экзона 3 гена TMPRSS2 человека, применяемая в гуманизации, составляет приблизительно 5-10 пар оснований в длину, т.е. приблизительно 5, 6, 7, 8, 9 или 10 пар оснований 3'-конца кодирующего экзона 3.

[0089] В некоторых вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека, вставляемая в эндогенный ген Tmprss2 грызуна, также содержит 3'-UTR гена TMPRSS2 человека. В конкретных вариантах осуществления полный кодирующий экзон 13 гена TMPRSS2 человека включен в непрерывную геномную последовательность TMPRSS2 человека для гуманизации, которая содержит 3'-UTR гена TMPRSS2 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS2 человека содержит дополнительную геномную последовательность человека после 3'-UTR гена TMPRSS2 человека. Дополнительная геномная последовательность человека может представлять собой последовательность по меньшей мере из 10-200 п. о. или по меньшей мере из 10, 20, 30, 40, 50, 75, 100, 125, 150, 175 или 200 п. о., которая находится непосредственно после 3'-UTR гена TMPRSS2 человека в локусе TMPRSS2 человека.

[0090] В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss2 грызуна, остающаяся в локусе гуманизированного Tmprss2, кодирует полипептид, который практически идентичен цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss2 грызуна. В случаях, когда эндогенный белок Tmprss2 и белок TMPRSS2 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно сохранять эндогенную геномную последовательность Tmprss2 грызуна, которая точно кодирует трансмембранный домен эндогенного белка Tmprss2 грызуна, и можно сохранить немного более длинную или более короткую геномную последовательность Tmprss2 грызуна, которая кодирует по сути трансмембранный домен эндогенного белка Tmprss2 грызуна при замене для гуманизации, чтобы кодировать гуманизированный белок Tmprss2, характеризующийся трансмембранным доменом, который идентичен трансмембранному эндогенного белка Tmprss2 грызуна. В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss2 грызуна, остающаяся в локусе гуманизированного Tmprss2, содержит экзоны 1-2 и 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна, где 5'-часть кодирующего экзона 3 представляет собой существенную часть экзона 3, состоящего из кодонов, например, полный кодирующий экзон 3, за исключением 5-10 пар оснований на 3'-конце кодирующего экзона 3.

[0091] В конкретных вариантах осуществления гуманизированный ген Tmprss2 содержит кодирующие экзоны 1-2, и 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна, и 3'-часть кодирующего экзона 3 и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, где гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, и эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека. В определенных вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический домен и трансмембранный домены белка Tmprss2 грызуна, кодируемого эндогенным геном Tmprss2 грызуна, и эктодомен белка TMPRSS2 человека, кодируемого геном TMPRSS2 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 7.

[0092] В некоторых вариантах осуществления экзоны и интроны гена TMPRSS2 человека и гена Tmprss2 грызуна, применяемых в гуманизации, представляют собой находящиеся в SEQ ID NO: 1, 3 и 5-6.

[0093] В некоторых вариантах осуществления гуманизированный ген Tmprss2 приводит к экспрессии кодируемого гуманизированного белка Tmprss2 у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss2 экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss2 грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss2). В некоторых вариантах осуществления гуманизированный белок Tmprss2 экспрессируется на уровне, сравнимом с соответствующим белком Tmprss2 грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss2). В определенных вариантах осуществления белок Tmprss2 человека экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления белок Tmprss2 человека или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss2 грызуна или его растворимой формы или практически таком же, у контрольного грызуна.

Гуманизированные грызуны Tmprss4

[0094] В некоторых вариантах осуществления настоящего изобретения предусмотрен грызун, в геноме которого содержится гуманизированный ген Tmprss4, который содержит нуклеотидную последовательность эндогенного гена Tmprss4 грызуна и нуклеотидную последовательность гена TMPRSS4 человека, и который находится под контролем регуляторного 5'-элемента(регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss4 грызуна. Примеры грызунов включают мышей и крыс.

[0095] В некоторых вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS4 человека. В конкретных вариантах осуществления белок TMPRSS4 человека имеет аминокислотную последовательность, характеризующуюся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, изложенной под SEQ ID NO: 11.

[0096] В некоторых вариантах осуществления гуманизированный белок Tmprss4 содержит 384 C-концевых аминокислот белка TMPRSS4 человека, например аминокислоты 54-437 белка TMPRSS4 человека. В некоторых вариантах осуществления гуманизированный белок Tmprss4 содержит эктодомен, который практически идентичен аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11. В конкретных вариантах осуществления гуманизированный белок Tmprss4 содержит эктодомен, характеризующийся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11; эктодомен, который отличается от аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11, не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту(аминокислот); или эктодомен, который отличается от аминокислотной последовательности, состоящей из K54-L437 под SEQ ID NO: 11, только на N- или C-конце эктодомена, например, отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.

[0097] В некоторых вариантах осуществления гуманизированный белок Tmprss4 дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss4 грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss4 дополнительно содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss4 грызуна.

[0098] В конкретных вариантах осуществления гуманизированный белок Tmprss4 содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss4 грызуна и эктодомен белка TMPRSS4 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 14.

[0099] В некоторых вариантах осуществления гуманизированный ген Tmprss4 образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss4 грызуна в эндогенном локусе Tmprss4 грызуна нуклеотидной последовательностью гена TMPRSS4 человека.

[00100] В некоторых вариантах осуществления непрерывная геномная последовательность эндогенного гена Tmprss4 грызуна в эндогенном локусе Tmprss4 грызуна была замещена непрерывной геномной последовательностью гена TMPRSS4 человека с образованием гуманизированного гена Tmprss4.

[00101] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставленная в эндогенный ген Tmprss4 грызуна, содержит последовательности экзонов, т.е. экзоны, полностью или частично, гена TMPRSS4 человека, которые кодируют эктодомен, который практически идентичен эктодомену белка TMPRSS4 человека, кодируемому геном TMPRSS4 человека. В случаях, когда эндогенный белок Tmprss4 и белок TMPRSS4 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS4 человека, которая точно кодирует эктодомен белка TMPRSS4 человека, при этом можно применять немного более длинную или более короткую геномную последовательность TMPRSS4 человека, которая кодирует по сути эктодомен белка TMPRSS4 человека, чтобы получить гуманизированный белок Tmprss4, характеризующийся эктодоменом, который идентичен эктодомену белка TMPRSS4 человека.

[00102] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, содержит по меньшей мере область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.

[00103] В определенных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, содержит 3'-часть интрона 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека. В конкретных вариантах осуществления 3'-часть интрона 3 гена TMPRSS4 человека, применяемая в гуманизации, составляет приблизительно 140-160 пар оснований в длину, т.е. приблизительно 140, 145, 150, 155, 160 пар оснований 3'-конца интрона 3.

[00104] В некоторых вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, содержит 3'-UTR гена TMPRSS4 человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS4 человека, вставляемая в эндогенный ген Tmprss4 грызуна, не содержит 3'-UTR гена TMPRSS4 человека и 3'-UTR эндогенного гена Tmprss4 грызуна, следующего непосредственно после стоп-кодона в гуманизированном гене Tmprss4.

[00105] В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss4 грызуна, остающаяся в локусе гуманизированного Tmprss4, кодирует полипептид, который практически идентичен цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss4 грызуна. В случаях, когда эндогенный белок Tmprss4 и белок TMPRSS4 человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно сохранять эндогенную геномную последовательность Tmprss4 грызуна, которая точно кодирует трансмембранный домен эндогенного белка Tmprss4 грызуна, и можно сохранить немного более длинную или более короткую геномную последовательность Tmprss4 грызуна, которая кодирует по сути трансмембранный домен эндогенного белка Tmprss4 грызуна при замене для гуманизации, чтобы кодировать гуманизированный белок Tmprss4, характеризующийся трансмембранным доменом, который идентичен трансмембранному эндогенного белка Tmprss4 грызуна.

[00106] В конкретных вариантах осуществления гуманизированный ген Tmprss4 содержит кодирующие экзоны 1-3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона кодирующего экзона 13 гена TMPRSS4 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss4 содержит кодирующие экзоны 1-3 и 5'-часть интрона 3 эндогенного гена Tmprss4 грызуна и 3'-часть интрона 3 и область от кодирующего экзона 4 до стоп-кодона кодирующего экзона 13 гена TMPRSS4 человека. В определенных вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, который содержит цитоплазматический домен и трансмембранный домен белка Tmprss4 грызуна, кодирумого эндогенным геном Tmprss4 грызуна, и эктодомен белка TMPRSS4 человека, кодируемого геном TMPRSS4 человека. В конкретных вариантах осуществления гуманизированный ген Tmprss4 кодирует гуманизированный белок Tmprss4, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 14.

[00107] В некоторых вариантах осуществления экзоны и интроны гена TMPRSS4 человека и гена Tmprss4 грызуна, применяемые в гуманизации, представляют собой находящиеся в SEQ ID NO: 8, 10 и 12-13.

[00108] В некоторых вариантах осуществления гуманизированный ген Tmprss4 приводит к экспрессии кодируемого белка Tmprss4 человека у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss4 экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss4 грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss4, кодирующего гуманизированный белок Tmprss4). В некоторых вариантах осуществления гуманизированный белок Tmprss4 экспрессируется на уровне, сравнимом с соответствующим белком Tmprss4 грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss4, кодирующего гуманизированный белок Tmprss4). В определенных вариантах осуществления белок Tmprss4 человека экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления гуманизированный белок Tmprss4 или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss4 грызуна или растворимой формы или практически таком же, у контрольного грызуна.

Гуманизированные грызуны Tmprss11d

[00109] В некоторых вариантах осуществления настоящего изобретения предусмотрен грызун, геном которого содержит гуманизированный ген Tmprss11d, который содержит нуклеотидную последовательность эндогенного гена Tmprss11d грызуна и нуклеотидную последовательность гена TMPRSS11D человека, и который находится под контролем регуляторного 5'-элемента (регуляторных элементов), таких как промотор и/или энхансер(энхансеры) эндогенного гена Tmprss11d грызуна. Примеры грызунов включают мышей и крыс.

[00110] В некоторых вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который содержит эктодомен, практически идентичный эктодомену белка TMPRSS11D человека.

[00111] В конкретных вариантах осуществления белок TMPRSS11D человека имеет аминокислотную последовательность, характеризующуюся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, изложенной под SEQ ID NO: 18.

[00112] В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит 377 C-концевых аминокислот белка TMPRSS11D человека, например, аминокислоты 42-418 белка TMPRSS11D человека. В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит эктодомен, который практически идентичен аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18. В конкретных вариантах осуществления гуманизированный белок Tmprss11d содержит эктодомен, характеризующийся по меньшей мере 85%, 90%, 95%, 98%, 99% или 100% идентичностью аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18; эктодомен, который отличается от аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18, не более чем на 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 аминокислоту (аминокислот); или эктодомен, который отличается от аминокислотной последовательности, состоящей из A42-I418 SEQ ID NO: 18, только на N- или C-конце, например, отсутствием 1-5 аминокислот или наличием дополнительных 1-5 аминокислот на N- или C-конце.

[00113] В некоторых вариантах осуществления гуманизированный белок Tmprss11d дополнительно содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss11d грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss11d содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss11d грызуна.

[00114] В конкретных вариантах осуществления гуманизированный белок Tmprss11d содержит трансмембранный домен и цитоплазматический домен эндогенного белка Tmprss11d грызуна и эктодомен белка TMPRSS11D человека. В конкретных вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 21.

[00115] В некоторых вариантах осуществления гуманизированный ген Tmprss11d образован в результате замены нуклеотидной последовательности эндогенного гена Tmprss11d грызуна в эндогенном локусе Tmprss11d грызуна нуклеотидной последовательностью гена TMPRSS11D человека.

[00116] В некоторых вариантах осуществления непрерывная геномная последовательность эндогенного гена Tmprss11d грызуна в эндогенном локусе Tmprss11d грызуна была замещена непрерывной геномной последовательностью гена TMPRSS11D человека с образованием гуманизированного гена Tmprss11d. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставленная в эндогенный ген Tmprss11d грызуна и содержит последовательности экзонов, т.е. экзоны, полностью или частично, гена TMPRSS11D человека, которые кодируют эктодомен, который практически идентичен эктодомену белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека. В случаях, когда эндогенный белок Tmprss11d и белок TMPRSS11D человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно вставлять геномную последовательность TMPRSS11D человека, которая точно кодирует эктодомен белка TMPRSS11D человека, при этом можно применять немного более длинную или более короткую геномную последовательность TMPRSS11D человека, которая кодирует по сути эктодомен белка TMPRSS11D человека, чтобы получить гуманизированный белок Tmprss11d, характеризующийся эктодоменом, который идентичен эктодомену белка TMPRSS11D человека.

[00117] В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставленная в эндогенный ген Tmprss11d грызуна, содержит область по меньшей мере от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека.

[00118] В определенных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставляемая в эндогенный ген Tmprss11d грызуна, содержит по меньшей мере 3'-часть интрона 2 и область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека. В конкретных вариантах осуществления 3'-часть интрона 2 гена TMPRSS2 человека, применяемая в гуманизации, состоит из приблизительно 444 пар оснований в длину.

[00119] В некоторых вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека, вставляемая в эндогенный ген Tmprss11d грызуна, содержит 3'-UTR гена TMPRSS11D человека. В конкретных вариантах осуществления полный кодирующий экзон 10 гена TMPRSS11D человека включен в непрерывную геномную последовательность TMPRSS11D человека для гуманизации, которая содержит 3'-UTR гена TMPRSS11D человека. В конкретных вариантах осуществления непрерывная геномная последовательность гена TMPRSS11D человека содержит дополнительную геномную последовательность человека после 3'-UTR гена TMPRSS11D человека. Дополнительная геномная последовательность человека может представлять собой последовательность из 10-200 п. о., 50-200 п. о. или приблизительно из 150, 160, 170, 180 п. о., которая находится непосредственно после 3'-UTR гена TMPRSS11D человека в локусе TMPRSS11D человека.

[00120] В некоторых вариантах осуществления нуклеотидная последовательность эндогенного гена Tmprss11d грызуна, остающаяся в гуманизированном локусе Tmprss11d, кодирует полипептид, который практически идентичен цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss11d грызуна, кодируемого эндогенным геном Tmprss11d грызуна. В случаях, когда эндогенный белок Tmprss11d и белок TMPRSS11D человека делят общие аминокислоты около точки соединения трансмембранного домена с эктодоменом, можно необязательно сохранять эндогенную геномную последовательность Tmprss11d грызуна, которая точно кодирует трансмембранный домен эндогенного белка Tmprss11d грызуна, и можно сохранить немного более длинную или более короткую геномную последовательность Tmprss11d грызуна, которая кодирует по сути трансмембранный домен эндогенного белка Tmprss11d грызуна при замене для гуманизации, чтобы кодировать гуманизированный белок Tmprss11d, характеризующийся трансмембранным доменом, который идентичен трансмембранному эндогенного белка Tmprss11d грызуна.

[00121] В конкретных вариантах осуществления гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека. В определенных вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, который содержит цитоплазматический домен и трансмембранный домен белка Tmprss11d грызуна, кодируемый эндогенным геном Tmprss11d грызуна, и эктодомен белка TMPRSS11D человека, кодируемого геном TMPRSS11D человека. В конкретных вариантах осуществления гуманизированный ген Tmprss11d кодирует гуманизированный белок Tmprss11d, характеризующийся аминокислотной последовательностью, изложенной под SEQ ID NO: 21.

[00122] В некоторых вариантах осуществления экзоны и интроны гена TMPRSS11D человека и гена Tmprss11d грызуна, применяемые в гуманизации, представляют собой находящиеся в SEQ ID NO: 15, 17 и 19-20.

[00123] В некоторых вариантах осуществления гуманизированный ген Tmprss11D приводит к экспрессии кодируемого гуманизированного белка Tmprss11d у грызуна. В некоторых вариантах осуществления гуманизированный белок Tmprss11d экспрессируется по паттерну, сравнимому с соответствующим белком Tmprss11d грызуна или практически такому же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss11d, кодирующего гуманизированный белок Tmprss11d). В некоторых вариантах осуществления гуманизированный белок Tmprss11d экспрессируется на уровне, сравнимом с соответствующим белком Tmprss11d грызуна или практически таком же, у контрольного грызуна (например, грызуна без гуманизированного гена Tmprss11d, кодирующего гуманизированный белок Tmprss11d). В определенных вариантах осуществления белок Tmprss11d человека экспрессируется и выявляется на клеточной поверхности. В определенных вариантах осуществления гуманизированный белок Tmprss11d или растворимая форма (например, форма белка, характеризующаяся отсеченным эктодоменом) экспрессируется и выявляется в сыворотке крови грызуна, например, на уровне, сравнимом с уровнем соответствующего белка Tmprss11d грызуна или растворимой формы или практически таком же, у контрольного грызуна.

Способы получения гуманизированных животных Tmprss, относящихся к грызунам

[00124] Дополнительные аспекты настоящего изобретения направлены на способы получения гуманизированных грызунов Tmprss, описанных выше, а также векторов на основе нуклеиновой кислоты и эмбриональных стволовых клеток, отличных от человеческих, подходящих для применения в получении гуманизированного грызуна Tmprss.

[00125] Грызунов, предусмотренных в данном документе, можно получать с применением способов, известных из уровня техники. В иллюстративных вариантах осуществления клон бактериальной искусственной хромосомы (BAC), несущий ген Tmprss грызуна, можно модифицировать с применением бактериальной гомологичной рекомбинации и технологии VELOCIGENE® (см., например, U.S. 6586251 и Valenzuela et al. (2003), High-throughput engineering of the mouse genome coupled with high-resolution expression analysis, Nature Biotech. 21(6):652-659). В результате нуклеотидная последовательность Tmprss грызуна была удалена из исходного клона BAC и была вставлена нуклеотидная последовательность Tmprss человека, что привело к образованию модифицированного клона BAC, несущего гуманизированный ген Tmprss, фланкированный гомологичными 5'-и 3'-участками грызуна. Модифицированный клон BAC при достижении линеаризации можно вводить в эмбриональную стволовую клетку (ES) грызуна посредством, например, электропорации. Как клетки ES мыши, так и клетки ES крысы были описаны в уровне техники. См., например, US 7576259, 7659442, 7294754 и 2008-0078000 A1 (которые включены в данный документ посредством ссылки), в которых описаны клетки ES мыши и способ VELOCIMOUSE® для получения генетически модифицированной мыши; US 2014/0235933 A1, US 2014/0310828 A1, Tong et al. (2010) Nature 467:211-215, and Tong et al. (2011) Nat Protoc. 6(6): doi:10.1038/nprot.2011.338 (которые включены в данный документ посредством ссылки), где описаны клетки ES крысы и способы получения генетически модифицированной крысы.

[00126] Можно выбрать клетки ES, характеризующиеся гуманизированным геном Tmprss интегрированным в геном. В некоторых вариантах осуществления клетки ES, характеризующиеся гуманизированным геном Tmprss, интегрированным в эндогенный локус Tmprss грызуна, можно выбрать на основании результатов анализов потери аллели грызуна и/или приобретения аллели человека. Выбранные клетки ES затем применяют в качестве донорных клеток ES для инъекции в эмбрион на стадии развития, предшествующей моруле (например, эмбрион на стадии 8 клеток) путем применения способа VELOCIMOUSE® (см., например, US 7576259, US 7659442, US 7294754 и US 2008-0078000 A1), или способов, описанных в US 2014/0235933 A1 и US 2014/0310828 A1. Эмбрион, содержащий донорные клетки ES, инкубируют до стадии бластоцисты и затем имплантируют суррогатной матери, чтобы получить грызуна F0, полностью полученного из донорных клеток ES. Детенышей грызунов, несущих гуманизированный ген Tmprss, можно идентифицировать посредством генотипирования ДНК, выделенной из отрезанных фрагментов хвостов потери аллели грызуна и/или приобретения аллели человека.

[00127] Грызунов, гетерозиготных по гуманизированному гену Tmprss, можно скрещивать с получением гомозиготных грызунов. Грызунов, содержащих один гуманизированный ген Tmprss, можно скрещивать с грызунами, содержащими другой гуманизированный ген Tmprss, с получением грызунов, содержащих множество гуманизированных генов Tmprss. Например, грызунов, содержащих гуманизированный ген Tmprss2, можно скрещивать с грызунами, содержащими гуманизированный ген Tmprss4, с получением грызунов, содержащих гуманизированный ген Tmprss2 и гуманизированный ген Tmprss4.

Способы применения грызунов, характеризующихся гуманизированными генами Tmprss

[00128] Грызуны, раскрытые в данном документе, обеспечивают применимую систему in vivo и источник биологических материалов (например, клеток), экспрессирующих гуманизированные белки Tmprss человека для идентификации и тестирования соединений, которые специфически целенаправленно воздействуют на белки TMPRSS человека.

[00129] В одном аспекте грызуна, раскрытого в данном документе, применяют для определения способности кандидатного соединения, такого как ингибитор белка TMPRSS человека, лечить и/или предупреждать инфекцию, вызванную вирусом гриппа.

[00130] В некоторых вариантах осуществления грызуну, содержащему гуманизированный ген Tmprss и экспрессирующему белок Tmprss человека, раскрытые в данном документе, вводят кандидатное соединение перед экспериментальной инфекцией вирусом гриппа. Профилактическую эффективность соединения можно оценивать путем определения, демонстрирует ли грызун меньшее количество симптомов инфекции, вызванной вирусом гриппа, и/или их меньшую тяжесть и/или улучшенную жизнеспособность по сравнению с контрольным грызуном (контрольными грызунами).

[00131] В других вариантах осуществления грызуну, содержащему гуманизированный ген Tmprss и экспрессирующему белок Tmprss человека, содержащий эктодомен белка TMPRSS человека, вводят кандидатный ингибитор этого белка TMPRSS человека после экспериментальной инфекции вирусом гриппа. Эффективность лечения с помощью кандидатного ингибитора можно оценивать путем определения, демонстрирует ли грызун меньшее количество симптомов инфекции, вызванной вирусом гриппа, и/или их меньшую тяжесть и/или улучшенную жизнеспособность по сравнению с контрольным грызуном (контрольными грызунами).

[00132] Подходящие контрольные грызуны включают, например, грызунов, содержащих гуманизированный ген Tmprss, не подвергавшихся экспериментальной инфекции; и грызунов, содержащих гуманизированный ген Tmprss, подвергавшихся экспериментальной инфекции без введения какого-либо соединения; и грызунов, содержащих гуманизированный ген Tmprss, подвергавшихся экспериментальной инфекции и введению соединения, известного как терапевтически эффективное.

[00133] Соединения, которые можно оценивать с помощью способов по настоящему изобретению, включают кандидатные ингибиторы TMPRSS, например низмолекулярный ингибитор протеазы, ингибитор на основе нуклеиновых кислот (например, siRNA, рибозим, антисмысловая конструкция и т.д.), антигенсвязывающий белок (например, антитело или его антигенсвязывающий фрагмент) или блокирующий пептид/пептидный ингибитор. Ингибитор TMPRSS может функционировать путем ингибирования или снижения способности белка TMPRSS протеолитически расщеплять белок-предшественник гемагглютинина (HA0) на субъединицы HA1 и HA2.

[00134] В некоторых вариантах осуществления кандидатный ингибитор представляет собой антитело или его антигенсвязывающий фрагмент. Как моноклональные, так и поликлональные антитела подходят для целей настоящего изобретения. В конкретных вариантах осуществления антитело специфически связывает белок TMPRSS и ингибирует протеазную активность данного белка TMPRSS и практически не ингибирует протеазную активность другого белка TMPRSS. Например, ингибитор, представляющий собой антитело к TMPRSS2, специфически связывает белок TMPRSS2 и ингибирует протеазную активность белка TMPRSS2 и не оказывает эффекта на протеолитическую активность TMPRSS4 или TMPRSS11D, или снижает протеолитическую активность TMPRSS4 или TMPRSS11D не более чем на 25% (например, на 20%, 15%, 10%, 5% или меньше) по сравнению с неингибиторной контрольной молекулой, протестированной в идентичных или практически идентичных условиях эксперимента.

[00135] В некоторых вариантах осуществления ингибитор представляет собой антитело к TMPRSS2 или его антигенсвязывающий фрагмент. В некоторых вариантах осуществления ингибитор представляет собой антитело к TMPRSS4 или его антигенсвязывающий фрагмент. В других вариантах осуществления ингибитор представляет собой антитело к TMPRSS11D или его антигенсвязывающий фрагмент.

[00136] Экспериментальную инфекцию, вызванную вирусом гриппа, можно индуцировать и контролировать, следуя известным протоколам. См., например, US 2013/0273070 A1. Например, животным, относящимся к грызунам, вирус гриппа можно ввести интраназально. Инфицированных животных можно оценивать с помощью определения симптомов и тяжести инфекции. Например, животных можно анализировать по (1) изменению массы тела и выживаемости, (2) клеточным изменениям посредством проточной цитометрии, (3) иммунохимии, окрашиваний PAS и H&E целых легких и (4) уровням цитокинов в сыворотке крови. Контрольные животные, про которых известно, что они восприимчивы к вирусу, демонстрируют существенное увеличение уровня дендритных клеток, грипп-позитивных альвеолярных макрофагов, нейтрофилов или эпителиальных клеток в легких и уровней IFNγ по сравнению с неинфицированными животными.

ПРИМЕРЫ

[00137] Следующие примеры приведены для того, чтобы обеспечить специалистов в данной области описанием того, как создавать и применять способы и композиции по настоящему изобретению, и не предназначены для ограничения объема того, что авторы настоящего изобретения рассматривают в качестве своего изобретения. Если не указано иное, температура указана по Цельсию, а давление является атмосферным или близким к нему.

Пример 1. Гуманизация эндогенного гена Tmprss2

[00138] В данном примере показаны иллюстративные способы гуманизации эндогенного гена, кодирующего Tmprss2 у грызуна (например, мыши). Способы, описанные в данном примере, при необходимости можно применять для гуманизации эндогенного гена Tmprss2 грызуна с применением любой последовательности человека или комбинации последовательностей человека (или фрагментов последовательностей).

[00139] Нацеливающий вектор для гуманизации эндогенного гена Tmprss2 конструировали с применением клонов бактериальной искусственной хромосомы (BAC) и технологии VELOCIGENE® (см., например, патент США № 6586251 и Valenzuela et al. (2003) High-throughput engineering of the mouse genome coupled with high-resolution expression analysis, Nature Biotech. 21(6):652-659; включенные в данный документ посредством ссылки).

[00140] Вкратце, клон бактериальной искусственной хромосомы (BAC) мыши bMQ-264A15, содержащий ген Tmprss2 мыши, применяли и модифицировали следующим образом. Получали фрагмент ДНК, содержащий гомологичную нуклеотидную 5'-последовательность мыши, геномную ДНК TMPRSS2 человека, состоящую из приблизительно 25091 п. о. (содержащую последние 7 п. о. кодирующего экзона 3, интрон 3 и область от кодирующего экзон 4 до кодирующего экзона 13 (включая 3'-UTR, которая представляет собой часть кодирующего экзона 13) гена TMPRSS2 человека), самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 2691 п. о., и гомологичную 3'-последовательность мыши. Данный фрагмент ДНК применяли для модификации клона BAC bMQ-264A15 посредством гомологичной рекомбинации в бактериальных клетках. В результате геномный фрагмент Tmprss2 мыши (состоящий из приблизительно 25291 п. о.), кодирующий эктодомен в клоне BAC, замещали геномным фрагментом TMPRSS2 человека, состоящим из приблизительно 25091 п. о., после которого расположена самоудаляющаяся кассета устойчивости к неомицину, состоящая из приблизительно 2691 п. о. В частности, геномный фрагмент Tmprss2 мыши, который замещали, содержал последние 7 п. о. кодирующего экзона 3, интрон 3 и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена Tmprss2 мыши (фигуры 1A-1B). Геномный фрагмент TMPRSS2 человека, который вставляли, содержал последние 7 п. о. кодирующего экзона 3, интрон 3 и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека (включая 3'-UTR TMPRSS2 человека) и геномную 3'-последовательность человека, состоящую из 131 п. о., после 3'-UTR TMPRSS2 человека (фигуры 1A-1B). Полученный модифицированный клон BAC содержал в направлении от 5’ до 3' (i) гомологичный 5'-участок, содержащий приблизительно 12 т. о. геномной ДНК мыши, содержащей 5'-UTR Tmprss2 мыши, экзон 1 Tmprss2 мыши (некодирующий), кодирующие экзоны 1-3 (за исключением последних 7 п. о. кодирующего экзона 3); (ii) геномный фрагмент TMPRSS2 человека, состоящий из приблизительно 25091 п. о., содержащий последние 7 п. о. кодирующего экзона 3 человека, интрон 3, область от кодирующего экзона 4 до 13 человека (в том числе 3'-UTR TMPRSS2 человека) и геномную 3'-последовательность человека; (iii) самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 2691 п. о., после которой расположен (iv) гомологичный 3'-участок мыши, составляющий 45 т. о., содержащий 3'-UTR Tmprss2 мыши, и остающуюся геномную ДНК в исходном клоне BAC. (См. фигуры 1A-1B.) Соединительные последовательности также изложены в нижней части фигуры 1B. Часть модифицированного клона BAC, содержащая геномный фрагмент TMPRSS2 человека и кассету устойчивости к неомицину, а также расположенные до и после соединительные вставки, изложена под SEQ ID NO: 5. Аминокислотная последовательность белка, кодируемого гуманизированным геном Tmprss2, изложена под SEQ ID NO: 7. Выравнивание данного гуманизированного белка Tmprss2 («мутантного белка 7010»), белка Tmprss2 мыши (SEQ ID NO: 2) и белка TMPRSS2 человека (SEQ ID NO: 4) показано на фигуре 1D.

[00141] Модифицированный клон BAC, содержащий гуманизированный ген Tmprss2, описанный выше, применяли для электропорации эмбриональных стволовых клеток (ES) мыши для создания модифицированных клеток ES, содержащих гуманизированный ген Tmprss2. Подвергнутые положительному целенаправленному воздействию клетки ES, содержащие гуманизированный ген Tmprss2, идентифицировали с помощью анализа (Valenzuela et al., выше), в котором выявляли наличие последовательностей TMPRSS2 человека (например, кодирующих экзонов 4-13 TMPRSS2 человека) и подтверждали потерю и/или сохранение последовательностей Tmprss2 мыши (например, потерю кодирующих экзонов 4-13 Tmprss2 мыши). В таблице 1 представлены праймеры и зонды, которые применяли для подтверждения гуманизации эндогенного гена Tmprss2, описанного выше (фигуры 1A-1B). Как только правильно подвергнутый целенаправленному воздействию клон клеток ES был выбран, селективную кассету устойчивости к неомицину можно вырезать путем введения рекомбиназы Cre, например, посредством электропорации. В качестве альтернативы селективную кассету устойчивости к неомицину можно удалять путем скрещивания потомства, полученного от клона ES, с делеторным грызуном, относящемуся к породе, которая экспрессирует рекомбиназу Cre. На фигуре 1C изображен гуманизированный локус Tmprss2 после делеции кассеты с соединительными последовательностями, показанными в нижней части фигуры 1C.

[00142] Выбранные клоны клеток ES (с кассетой или без нее) применяли для имплантации самкам мышей с применением способа VELOCIMOUSE® (см., например, патент США № 7294754 и Poueymirou et al., F0 generation mice that are essentially fully derived from the donor gene-targeted ES cells allowing immediate phenotypic analyses, 2007, Nature Biotech. 25(1):91-99) для получения выводка детенышей, содержащих в геноме гуманизированную аллель Tmprss2. Для мышей, несущих гуманизированную аллель Tmprss2, можно вновь проводить подтверждение и идентификацию путем генотипирования ДНК, выделенной из отрезанных фрагментов хвостов, с применением модификации анализа аллели (Valenzuela et al., выше), в котором выявляют наличие последовательностей гена TMPRSS2 человека. Детенышей генотипировали и отбирали когорты животных, гетерозиготных по гуманизированному локусу Tmprss2, для определения характеристик. Животных, гомозиготных по гуманизированному локусу Tmprss2, получали путем скрещивания гетерозиготных животных.

ТАБЛИЦА 1 Название Праймер Последовательность (5'–3') SEQ ID NO 7010U Прямой GCCGTGACTGTGACCTTCTC (SEQ ID NO:26) Зонд (BHQ) TGGAGGAGCCACCTGATGCCTC (SEQ ID NO:27) Обратный GCCTTGCCCTCAATGGAAAC (SEQ ID NO:28) 7010D Прямой GGTTGCACAGCAAGGAAGAAG (SEQ ID NO:29) Зонд (BHQ) CCAGGAGTTCCTGTGAGCCTACCC (SEQ ID NO:30) Обратный TGGAATGGAAGGAGCTGGAG (SEQ ID NO:31) 7010hU Прямой GTCCCACCTCCTGCAACTG (SEQ ID NO:32) Зонд (BHQ) TGAGCCTTCCCATCAGCCTGGG (SEQ ID NO:33) Обратный CCACAATGGCACATGGGTCTG (SEQ ID NO:34) 7010hTD Прямой GGTGCTTGCTCCCCAAGA (SEQ ID NO:35) Зонд (BHQ) CCTAAAAGGTGTTGTAATGG (SEQ ID NO:36) Обратный GGCAATAAAGAAGGAAGACGTTTT (SEQ ID NO:37)

Пример 2. Гуманизация эндогенного гена Tmprss4

[00143] В данном примере показаны иллюстративные способы гуманизации эндогенного гена, кодирующего Tmprss4 у грызуна (например, мыши). Способы, описанные в данном примере, при необходимости можно применять для гуманизации эндогенного гена Tmprss4 грызуна с применением любой последовательности человека или комбинации последовательностей человека (или фрагментов последовательностей).

[00144] Нацеливающий вектор для гуманизации эндогенного гена Tmprss4 конструировали с применением клонов бактериальной искусственной хромосомы (BAC) и технологии VELOCIGENE® (см., например, патент США № 6586251 и Valenzuela et al. (2003), выше).

[00145] Вкратце, клон бактериальной искусственной хромосомы (BAC) мыши RP23-71M15, содержащий ген Tmprss4 мыши, применяли и модифицировали следующим образом. Получали фрагмент ДНК, содержащий гомологичную нуклеотидную 5'-последовательность мыши, самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., геномную ДНК человека, состоящую из приблизительно 14963 п. о. (содержащую область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека) и гомологичную 3'-последовательность мыши. Данный фрагмент ДНК применяли для модификации клона BAC RP23-71M15 путем гомологичной рекомбинации в бактериальных клетках. В результате геномный фрагмент (состоящий из приблизительно 11074 п. о.), кодирующий эктодомен, в клоне BAC замещали самоудаляющейся кассетой устойчивости к неомицину, состоящей из приблизительно 4996 п. о., после которой расположена геномная ДНК, состоящая из приблизительно 14963 п. о. В частности, геномный фрагмент мыши, который удаляли и замещали, содержал 130 п. о. 3'-части интрона 3 мыши, область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена Tmprss4 мыши (фигуры 2A-2B). Геномный фрагмент человека, который вставляли, содержал 3'-часть интрона 3 TMPRSS4 человека, состоящую из приблизительно 150 п. о., и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека (фигуры 2A-2B). Полученный модифицированный клон BAC содержит в направлении от 5’ до 3' гомологичный 5'-участок мыши, содержащий приблизительно 44,8 т. о. геномной ДНК мыши (в том числе 5'-UTR Tmprss4 мыши, область от кодирующего экзона 1 до кодирующего экзона 3 Tmprss4 мыши, частично интрон 3 Tmprss4 мыши (без 130 п. о. 3'-части), самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., 3'-часть интрона 3 TMPRSS4 человека, состоящую из приблизительно 150 п. о., область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 TMPRSS4 человека, после которой непосредственно расположена 3'-UTR Tmprss4 мыши и остающаяся геномная ДНК мыши в исходном клоне BAC (гомологичный 3'-участок мыши, состоящий в общем из приблизительно 118 т. о.). (См. фигуры 2A-2B.) Соединительные последовательности также изложены в нижней части фигуры 2B. Часть модифицированного клона BAC, содержащая кассету устойчивости к неомицину, геномный фрагмент TMPRSS4 человека, а также расположенные до и после соединительные вставки, изложена под SEQ ID NO: 12. Аминокислотная последовательность белка, кодируемого гуманизированным геном Tmprss4, изложена под SEQ ID NO: 14. Выравнивание данного гуманизированного белка Tmprss4 («мутантного белка 7224»), белка Tmprss4 мыши (SEQ ID NO: 9) и белка TMPRSS4 человека (SEQ ID NO: 11) показано на фигуре 2D.

[00146] Модифицированный клон BAC, содержащий гуманизированный ген Tmprss4, описанный выше, применяли для электропорации эмбриональных стволовых клеток (ES) мыши для получения модифицированных клеток ES, содержащих гуманизированный ген Tmprss4. Подвергнутые положительному целенаправленному воздействию клетки ES, содержащие гуманизированный ген Tmprss4, идентифицировали с помощью анализа (Valenzuela et al., выше), в котором выявляли наличие последовательностей TMPRSS4 человека (например, кодирующих экзонов 4-13 TMPRSS4 человека) и подтверждали потерю и/или сохранение последовательностей Tmprss4 мыши (например, потерю кодирующих экзонов 4-13 Tmprss4 мыши). В таблице 2 представлены праймеры и зонды, которые применяли для подтверждения гуманизации эндогенного гена Tmprss4, описанного выше (фигуры 2A-2B). Как только правильно подвергнутый целенаправленному воздействию клон клеток ES был выбран, селективную кассету устойчивости к неомицину можно вырезать путем введения рекомбиназы Cre, например, посредством электропорации. В качестве альтернативы селективную кассету устойчивости к неомицину можно удалять путем скрещивания потомства, полученного от клона ES, с делеторным грызуном, относящемуся к породе, которая экспрессирует рекомбиназу Cre. На фигуре 2C изображен гуманизированный локус Tmprss4 после делеции кассеты с соединительными последовательностями, показанными в нижней части фигуры 2C.

[00147] Выбранные клоны клеток ES (с кассетой устойчивости или без нее) применяли для имплантации самкам мышей с применением способа VELOCIMOUSE® (см., например, патент США № 7294754 и Poueymirou et al. (2007), выше) для создания выводка детенышей, содержащих в геноме гуманизированную аллель Tmprss4. Для мышей, несущих гуманизированную аллель Tmprss4, вновь проводили подтверждение и идентификацию путем генотипирования ДНК, выделенной из отрезанных фрагментов хвостов, с применением модификации анализа аллели (Valenzuela et al., выше), в котором выявляют наличие последовательностей гена TMPRSS4 человека. Детенышей генотипировали и отбирали когорты животных, гетерозиготных по гуманизированному локусу Tmprss4, для определения характеристик. Животных, гомозиготных по гуманизированному локусу Tmprss4, получали путем скрещивания гетерозиготных животных.

ТАБЛИЦА 2 Название Праймер Последовательность (5'–3') SEQ ID NO

7224mTU Прямой GAGCAGGGCCATGACACAT (SEQ ID NO:42)

Зонд (BHQ) ACCATTAGATCCCAGCACTGGACA (SEQ ID NO:43)

Обратный AAACCCTTCCCGAGAGAGAA (SEQ ID NO:44)

7224mTU2 Прямой GAGGAACACTGTGTCAAGGACTT (SEQ ID NO:45) Зонд (BHQ) CCTGAAAAGCCCGGAGTGGCAG (SEQ ID NO:46) Обратный GGGCAGAGACCACATCTGA (SEQ ID NO:47) 7224mTD Прямой GGAAGCCCTCTCTCGATACTTG (SEQ ID NO:48) Зонд (BHQ) TTCTACCCTGAGGGCATGCAGC (SEQ ID NO:49) Обратный TGGGATGTAGAAGGTTGTCAGA (SEQ ID NO:50) 7224hTU Прямой CTGAGCCTGGAACTCACACATG (SEQ ID NO:51) Зонд (BHQ) TCTGAGAGCCCAGCACTATCGCC (SEQ ID NO:52) Обратный GCTGAGGGTCAGGCTTGAG (SEQ ID NO:53) 7224hTD Прямой TCTGCAGGGTAGGGAGAGAAG (SEQ ID NO:54) Зонд (BHQ) TGTTTCAGAAAAGGAAGACTCACGTTACA (SEQ ID NO:55) Обратный GAGACCGATGAAGAGAAAGTCAGA (SEQ ID NO:56)

Пример 3. Гуманизация эндогенного гена Tmprss11d

[00148] В данном примере показаны иллюстративные способы гуманизации эндогенного гена, кодирующего Tmprss11d у грызуна (например, мыши). Способы, описанные в данном примере, при необходимости можно применять для гуманизации эндогенного гена Tmprss11d грызуна с применением любой последовательности человека или комбинации последовательностей человека (или фрагментов последовательностей).

[00149] Нацеливающий вектор для гуманизации эндогенного гена Tmprss11d конструировали с применением клонов бактериальной искусственной хромосомы (BAC) и технологии VELOCIGENE® (см., например, патент США № 6586251 и Valenzuela et al. (2003), выше).

[00150] Вкратце, клон бактериальной искусственной хромосомы (BAC) мыши RP23-95N22, содержащий ген Tmprss11d мыши, применяли и модифицировали следующим образом. Получали фрагмент ДНК, содержащий гомологичную нуклеотидную 5'-последовательность мыши, геномную ДНК TMPRSS11D человека, состоящую из приблизительно 33927 п. о. (содержащую 444 п. о. на 3'-конце интрона 2 и область от кодирующего экзона 3 до кодирующего экзона 10 (в том числе 3'-UTR, которая представляет собой часть кодирующего экзона 10) гена TMPRSS11D человека), самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., и гомологичную 3'-последовательность мыши. Данный фрагмент ДНК применяли для модификации клона BAC RP23-95N22 путем гомологичной рекомбинации в бактериальных клетках. В результате геномный фрагмент Tmprss11d мыши (состоящий из приблизительно 35667 п. о.), кодирующий эктодомен в клоне BAC, замещали геномным фрагментом TMPRSS11D человека, состоящим из приблизительно 33927 п. о., после которого расположена самоудаляющаяся кассета устойчивости к неомицину, состоящая из приблизительно 4996 п. о. В частности, геномный фрагмент Tmprss11d мыши, который замещали, содержал 3'-часть интрона 2 и область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена Tmprss11d мыши (фигуры 3A-3B). Геномный фрагмент TMPRSS11D человека, который вставляли, содержал 444 п. о. на 3'-конце интрона 2 и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека (в том числе 3'-UTR TMPRSS11D человека) и геномную 3'-последовательность человека, состоящую из приблизительно 172 п. о., после 3'-UTR TMPRSS11D человека (фигуры 3A-3B). Полученный модифицированный клон BAC содержал в направлении от 5' до 3' (i) гомологичный 5'-участок мыши, содержащий приблизительно 143 т. о. геномной ДНК мыши, в том числе 5'-UTR Tmprss11d мыши, кодирующие экзоны 1-2 и 5'-часть интрона 2 Tmprss11d мыши; (ii) геномный фрагмент TMPRSS11D человека, содержащий 3'-часть интрона 2 и область от кодирующего экзона 3 до кодирующего экзона 10 (в том числе 3'-UTR) TMPRSS11D человека, и геномную 3'-последовательность человека; (iii) самоудаляющуюся кассету устойчивости к неомицину, состоящую из приблизительно 4996 п. о., после которой расположен (iv) гомологичный 3'-участок мыши, составляющий 10 т. о., содержащий 3'-UTR Tmprss11d мыши и остающуюся геномную ДНК мыши в исходном клоне BAC. (См. фигуры 3A-3B.) Соединительные последовательности также изложены в нижней части фигуры 3B. Часть модифицированного клона BAC, содержащая геномный фрагмент TMPRSS11D человека и кассету устойчивости к неомицину, а также расположенные до и после соединительные вставки, изложена под SEQ ID NO: 19. Аминокислотная последовательность белка, кодируемого гуманизированным геном Tmprss11d, изложена под SEQ ID NO: 21. Выравнивание данного гуманизированного белка Tmprss11d («мутантного белка 7226»), белка Tmprss11d мыши (SEQ ID NO: 16) и белка TMPRSS11D человека (SEQ ID NO: 18) показано на фигуре 3D.

[00151] Модифицированный клон BAC, содержащий гуманизированный ген Tmprss11d, описанный выше, применяли для электропорации эмбриональных стволовых клеток (ES) мыши для получения модифицированных клеток ES, содержащих гуманизированный ген Tmprss11d. Подвергнутые положительному целенаправленному воздействию клетки ES, содержащие гуманизированный ген Tmprss11d, идентифицировали с помощью анализа (Valenzuela et al., выше), в котором выявляли наличие последовательностей TMPRSS11D человека (например, кодирующих экзонов 3-10 TMPRSS11D человека) и подтверждали потерю и/или сохранение последовательностей Tmprss11d мыши (например, потерю кодирующих экзонов 3-10 Tmprss11d мыши). В таблице 3 представлены праймеры и зонды, которые применяли для подтверждения гуманизации эндогенного гена Tmprss11d, описанного выше (фигуры 3A-3B). Как только правильно подвергнутый целенаправленному воздействию клон клеток ES был выбран, селективную кассету устойчивости к неомицину можно вырезать путем введения рекомбиназы Cre, например, посредством электропорации. В качестве альтернативы селективную кассету устойчивости к неомицину можно удалять путем скрещивания потомства, полученного от клона ES, с делеторным грызуном, относящемуся к породе, которая экспрессирует рекомбиназу Cre. На фигуре 3C изображен гуманизированный локус Tmprss11d после делеции кассеты с соединительными последовательностями, показанными в нижней части фигуры 3C.

[00152] Выбранные клоны клеток ES (с кассетой или без нее) применяли для имплантации самкам мышей с применением способа VELOCIMOUSE® (см., например, патент США № 7294754 и Poueymirou et al. (2007), выше) для создания выводка детенышей, содержащих в геноме гуманизированную аллель Tmprss11d. Для мышей, несущих гуманизированную аллель Tmprss11d, вновь проводили подтверждение и идентификацию путем генотипирования ДНК, выделенной из отрезанных фрагментов хвостов, с применением модификации анализа аллели (Valenzuela et al., выше), в котором выявляют наличие последовательностей гена TMPRSS11D человека. Детенышей генотипировали и отбирали когорты животных, гетерозиготных по гуманизированному локусу Tmprss11d, для определения характеристик. Животных, гомозиготных по гуманизированному локусу Tmprss11d, получали путем скрещивания гетерозиготных животных.

ТАБЛИЦА 3 Название Праймер Последовательность (5'–3') SEQ ID NO 7226mTU Прямой TCCTCTCCAGACAAGAAAGCT (SEQ ID NO:61) Зонд (BHQ) TCATAGCAGCTTTCAAATCCTAAACGTTGA (SEQ ID NO:62) Обратный TCGTGTGTAGCTGGTGAGTT (SEQ ID NO:63) 7226mTD Прямой CATGCGATCACAGGAGGAGATC (SEQ ID NO:64) Зонд (BHQ) AATTGGGCCCGAAGCCAGATGC (SEQ ID NO:65) Обратный CGGAAGGCTTCTGTGACTTC (SEQ ID NO:66) 7226hTU Прямой GTCTCCCACTTCTGACATAATGAAC (SEQ ID NO:67) Зонд (BHQ) CCCAGTGTTAACCCTACATCTGGTTCC (SEQ ID NO:68) Обратный TGGGAAGAGACTCTTGGACA (SEQ ID NO:69) 7226hTD Прямой ATGAGCTCCTAGTACAGCTAAAGTT (SEQ ID NO:70) Зонд (MGB) ATGCATGATCATCTATGCGTCAGAGC (SEQ ID NO:71) Обратный TGCCCAGATGCAGGGAGTTAG (SEQ ID NO:72)

Пример 4. Оценка группы 1 и группы 2 заражения вирусами гриппа A мышей Tmprss4 MAID7225 HumIn по сравнению с мышами дикого типа

[00153] Чтобы подтвердить применение гуманизированных грызунов Tmprss в качестве модели инфекции на животных, проводили эксперименты с оценкой выживаемости мышей MAID7225 HumIn TMPRSS4 по сравнению с мышами дикого типа (WT) из одного помета в группе 1 и группе 2 гриппа A в модели тяжелой инфекции гриппа.

[00154] Мыши MAID7225 HumIn TMPRSS4 являлись гомозиготными по гуманизированному гену Tmprss4 в их геноме, и их получали, как описано в примере 2. Вирусные штаммы, которые применяли в данных исследованиях, включали изолят исторического вируса гриппа A группы 1 A/Puerto Rico/08/1934 (H1N1) и изолят собственного адаптированного для мышей вируса гриппа A группы 2 A/Aichi/02/1968 (HA, NA) X-31 (H3N2). Все эксперименты выполняли на самцах и самках мышей MAID7225 HumIn TMPRSS4 или мышах WT из одного помета возрастом 6-8 недель. Мышей заражали с помощью 1150 бляшкообразующих единиц (PFU) A/Puerto Rico/08/1934 (H1N1) или 10000 PFU A/Aichi/02/1968-X31 (H3N2). В данных моделях выживаемости мышей заражали интраназально (IN) в день 0 после инфицирования (p.i.). Мышей взвешивали и наблюдали ежедневно до дня 14 p.i., и умерщвляли, когда они теряли 20% их первоначального веса. Результаты представляли в виде процента выживаемости (таблица 4).

Таблица 4

ID группы Количество мышей в группе Процент выживаемости (к-во выживших мышей/общее к-во мышей в группе) Неинфицированный контроль (2 HumIn, 2 мыши WT) 4 100 (4/4) TMPRSS4 WT; инфицированные H1_PR34 10 20 (2/10) TMPRSS4 HumIn; инфицированные H1_PR34 8 25 (2/8) TMPRSS4 WT; инфицированные H3_X31 9 11.1 (1/9) TMPRSS4 HumIn; инфицированные H3_X31 8 25 (2/8)

[00155] Выживаемость мышей, характеризующихся TMPRSS4 MAID7225 HumIn, сравнивали с мышами WT одного помета после заражения как вирусом тяжелого гриппа A группы 1 [A/Puerto Rico/08/1934 (H1N1)], так и адаптированным для мышей вируса тяжелого гриппа A группы 2 [A/Aichi/02/1968-X31 (H3N2)] (фигура 4). Выживаемость мышей, характеризующихся MAID7225 HumIn TMPRSS4, не отличались от мышей дикого типа, которых заражали либо H1N1 (25%; n=8 и 20%; n=10 соответственно), либо H3N2 (25%; n=8 и 11,1%; n=9 соответственно).

[00156] Публикации, веб-сайты и другие справочные материалы, упоминаемые в данном документе для описания предпосылок настоящего изобретения и для предоставления дополнительных подробностей, относящихся к его практическому осуществлению, включены в данный документ посредством ссылки.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> РЕДЖЕНЕРОН ФАРМАСЬИТИКАЛЗ, ИНК.

<120> ГРЫЗУНЫ, ХАРАКТЕРИЗУЮЩИЕСЯ ГУМАНИЗИРОВАННЫМ ГЕНОМ TMPRSS

<130> 33093PCT (10234WO01)

<150> 62/301023

<151> 29.02.2016

<160> 72

<170> PatentIn версия 3.5

<210> 1

<211> 3175

<212> ДНК

<213> Mus musculus

<400> 1

gcctttcctg gccgttccct ccttctggcc gaggtgcctg cgtttagggg tgtcaccctg 60

gctcccggga cgccgcctcc ggagatttaa gcgagaactg gagtaggtcg tgtacttgga 120

gcggacgagg aagccaagag ctcggacaga ggcggagagg ggcgggaagc gcaacaggtc 180

acctggagga agccccatac tgacctcctc atgctgctga cacaggcagg atggcattga 240

actcagggtc acctccagga atcggacctt gctatgagaa ccacgggtat cagtctgagc 300

acatctgtcc tccgagacca ccagtggctc ccaatggcta caacttgtat ccagcccagt 360

actacccatc tccagtgcct cagtatgctc cgaggattac aacgcaagcc tcaacatctg 420

tcatccacac acatcccaag tcctcaggag cactgtgcac ctcaaagtct aagaaatcgc 480

tgtgtttagc cctcgccctg ggcactgtcc tcacgggagc tgctgtggct gctgtcttgc 540

tttggaggtt ctgggacagc aactgttcta cgtctgagat ggagtgtggg tcttcaggca 600

catgcatcag ctcttctctc tggtgtgacg gggtagcaca ttgtcccaac ggagaagatg 660

agaaccgttg tgttcgtctc tacggacaaa gcttcatcct ccaggtttac tcatctcaga 720

ggaaagcctg gtatcccgtg tgccaggatg attggagtga gagctacggg agagcagcat 780

gtaaagacat gggatacaag aacaattttt attctagcca agggatacca gaccagagcg 840

gggcaacgag ctttatgaag ctgaatgtga gctcaggcaa cgttgacctc tataaaaaac 900

tctaccacag tgactcatgt tcatcccgca tggtggtttc tttgcgctgt atagaatgcg 960

gggttcgctc agtgaaacgc cagagcagga ttgtgggtgg attgaatgcc tcaccaggag 1020

actggccctg gcaggtcagc ctgcacgtcc aaggcgtcca cgtctgcgga ggctccatca 1080

tcacccccga gtggattgtg acggccgccc actgtgtgga agaacccctc agcagcccga 1140

ggtactggac ggcatttgcg ggaattctga gacagtctct catgttctat ggaagtagac 1200

accaggtaga aaaagtaatt tcccatccaa attacgactc taagaccaag aataacgaca 1260

ttgctctcat gaagctgcag acacctttgg cttttaatga tctagtgaag ccagtgtgtc 1320

tgccgaaccc aggcatgatg ctagacctag accaggaatg ctggatttcg gggtgggggg 1380

ccacctatga gaaagggaag acctcggacg tgttgaatgc tgccatggta cccttgatcg 1440

agccctccaa atgtaatagt aaatacatat acaacaacct aatcacacca gccatgatct 1500

gtgccggctt cctccagggg tctgtcgact cttgccaggg agacagtgga gggccgctgg 1560

ttactttgaa gaatgggatc tggtggctga ttggggacac gagctggggc tcgggctgtg 1620

ccaaggcact cagacctgga gtatacggga acgtgacggt atttacagat tggatctacc 1680

agcaaatgag ggcgaacagc taatccacgt ggctttgtcc cagacttcct ttgtcttcaa 1740

caaccttctg caagaaaacc aagggcctga attttaactt cctgtgcaca atgtaccttt 1800

tgagatgatt cgaagggcct ttcactttta ttaaacagtg acttgtttga ctgtgctccc 1860

tggtcctgtg agggcttcag tgccccaccc ctgggccact tctgcagctc ccaccagaat 1920

ggatgaccag attctgttgg gtttgggcac atagggccaa aggcagagga gggtggcact 1980

ctcatgttgg aacttctttt gggctcatgc tcaggccttt tttggatcac taaggactat 2040

gacctctgag taacctgatg acctgagaaa gagtaaggag gccaggcagg gccttgggcc 2100

caggaacagg taccttgaga gtgagagcta cccattgcct gtggcctaaa tctgctgtgc 2160

aggttgggct ggtcatactg tcatgatttc attaacagcc tgggtgaaca tggctgggag 2220

taaagggctt gctctcctgc atgttgacat gacggccctt tccaagggtg atggaggctt 2280

tcccaagcta agggcctagg cagatctctc agagcaagaa gctaatgccg gcatgtccct 2340

tgggtgagct ctacatggtg ttattcagtc tggttcttgg ctccccacta ctgtttctct 2400

cagcctctca gagcctgaaa cttacctctt agctttggct acaggcatgg cctagtacct 2460

gatggagcct gtatagctca gctaatcaaa tggaggctca ggtccatcag aatcagggac 2520

ttgtgatttc agtcaccttg cttctgggtt gtgtttcttc tcttactacc tcactgcacc 2580

tggacactag agtggatgaa tgtctggagt tcacctgcat ttggactgtg tgattgtgcc 2640

tcagacacta gacctcttcc agatggttag gttgttctgt agactggcaa tgagattaga 2700

agttcctagc ttcagataaa gatgaaagag aggagatcat tgtcttctgt cttcttctgg 2760

ccctgggttt ataccaggaa agccatgcca gaattaccaa atatgaagta tgaatgtctt 2820

acccacggtg aggctctgcc tccttctctc tgcctggttc ttcagaaggc agtgaatggg 2880

tcataactgg gactccatct ttgctgggga aagtctccca cctagggaat ggttaccact 2940

ccatgtaaag aaaactccct catgcgtcct ctgggacctt cttagatgct gtaaggtacc 3000

tacatacaga ctaaatgtgc aagcaccttg aagtgtgaga acctgtcccc tccttagctc 3060

tccttgtctt tgctgttggt tggttatttc ctgctttgtg tctgttctga gctgtgagat 3120

tccactgtga aatatatgaa taaagtatat aattctttta aaaaaaaaaa aaaaa 3175

<210> 2

<211> 490

<212> БЕЛОК

<213> Mus musculus

<400> 2

Met Ala Leu Asn Ser Gly Ser Pro Pro Gly Ile Gly Pro Cys Tyr Glu

1 5 10 15

Asn His Gly Tyr Gln Ser Glu His Ile Cys Pro Pro Arg Pro Pro Val

20 25 30

Ala Pro Asn Gly Tyr Asn Leu Tyr Pro Ala Gln Tyr Tyr Pro Ser Pro

35 40 45

Val Pro Gln Tyr Ala Pro Arg Ile Thr Thr Gln Ala Ser Thr Ser Val

50 55 60

Ile His Thr His Pro Lys Ser Ser Gly Ala Leu Cys Thr Ser Lys Ser

65 70 75 80

Lys Lys Ser Leu Cys Leu Ala Leu Ala Leu Gly Thr Val Leu Thr Gly

85 90 95

Ala Ala Val Ala Ala Val Leu Leu Trp Arg Phe Trp Asp Ser Asn Cys

100 105 110

Ser Thr Ser Glu Met Glu Cys Gly Ser Ser Gly Thr Cys Ile Ser Ser

115 120 125

Ser Leu Trp Cys Asp Gly Val Ala His Cys Pro Asn Gly Glu Asp Glu

130 135 140

Asn Arg Cys Val Arg Leu Tyr Gly Gln Ser Phe Ile Leu Gln Val Tyr

145 150 155 160

Ser Ser Gln Arg Lys Ala Trp Tyr Pro Val Cys Gln Asp Asp Trp Ser

165 170 175

Glu Ser Tyr Gly Arg Ala Ala Cys Lys Asp Met Gly Tyr Lys Asn Asn

180 185 190

Phe Tyr Ser Ser Gln Gly Ile Pro Asp Gln Ser Gly Ala Thr Ser Phe

195 200 205

Met Lys Leu Asn Val Ser Ser Gly Asn Val Asp Leu Tyr Lys Lys Leu

210 215 220

Tyr His Ser Asp Ser Cys Ser Ser Arg Met Val Val Ser Leu Arg Cys

225 230 235 240

Ile Glu Cys Gly Val Arg Ser Val Lys Arg Gln Ser Arg Ile Val Gly

245 250 255

Gly Leu Asn Ala Ser Pro Gly Asp Trp Pro Trp Gln Val Ser Leu His

260 265 270

Val Gln Gly Val His Val Cys Gly Gly Ser Ile Ile Thr Pro Glu Trp

275 280 285

Ile Val Thr Ala Ala His Cys Val Glu Glu Pro Leu Ser Ser Pro Arg

290 295 300

Tyr Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Leu Met Phe Tyr

305 310 315 320

Gly Ser Arg His Gln Val Glu Lys Val Ile Ser His Pro Asn Tyr Asp

325 330 335

Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln Thr Pro

340 345 350

Leu Ala Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn Pro Gly

355 360 365

Met Met Leu Asp Leu Asp Gln Glu Cys Trp Ile Ser Gly Trp Gly Ala

370 375 380

Thr Tyr Glu Lys Gly Lys Thr Ser Asp Val Leu Asn Ala Ala Met Val

385 390 395 400

Pro Leu Ile Glu Pro Ser Lys Cys Asn Ser Lys Tyr Ile Tyr Asn Asn

405 410 415

Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly Ser Val

420 425 430

Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Leu Lys Asn

435 440 445

Gly Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly Cys Ala

450 455 460

Lys Ala Leu Arg Pro Gly Val Tyr Gly Asn Val Thr Val Phe Thr Asp

465 470 475 480

Trp Ile Tyr Gln Gln Met Arg Ala Asn Ser

485 490

<210> 3

<211> 3212

<212> ДНК

<213> Homo sapiens

<400> 3

gagtaggcgc gagctaagca ggaggcggag gcggaggcgg agggcgaggg gcggggagcg 60

ccgcctggag cgcggcaggt catattgaac attccagata cctatcatta ctcgatgctg 120

ttgataacag caagatggct ttgaactcag ggtcaccacc agctattgga ccttactatg 180

aaaaccatgg ataccaaccg gaaaacccct atcccgcaca gcccactgtg gtccccactg 240

tctacgaggt gcatccggct cagtactacc cgtcccccgt gccccagtac gccccgaggg 300

tcctgacgca ggcttccaac cccgtcgtct gcacgcagcc caaatcccca tccgggacag 360

tgtgcacctc aaagactaag aaagcactgt gcatcacctt gaccctgggg accttcctcg 420

tgggagctgc gctggccgct ggcctactct ggaagttcat gggcagcaag tgctccaact 480

ctgggataga gtgcgactcc tcaggtacct gcatcaaccc ctctaactgg tgtgatggcg 540

tgtcacactg ccccggcggg gaggacgaga atcggtgtgt tcgcctctac ggaccaaact 600

tcatccttca ggtgtactca tctcagagga agtcctggca ccctgtgtgc caagacgact 660

ggaacgagaa ctacgggcgg gcggcctgca gggacatggg ctataagaat aatttttact 720

ctagccaagg aatagtggat gacagcggat ccaccagctt tatgaaactg aacacaagtg 780

ccggcaatgt cgatatctat aaaaaactgt accacagtga tgcctgttct tcaaaagcag 840

tggtttcttt acgctgtata gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 900

ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 960

agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 1020

actgcgtgga aaaacctctt aacaatccat ggcattggac ggcatttgcg gggattttga 1080

gacaatcttt catgttctat ggagccggat accaagtaga aaaagtgatt tctcatccaa 1140

attatgactc caagaccaag aacaatgaca ttgcgctgat gaagctgcag aagcctctga 1200

ctttcaacga cctagtgaaa ccagtgtgtc tgcccaaccc aggcatgatg ctgcagccag 1260

aacagctctg ctggatttcc gggtgggggg ccaccgagga gaaagggaag acctcagaag 1320

tgctgaacgc tgccaaggtg cttctcattg agacacagag atgcaacagc agatatgtct 1380

atgacaacct gatcacacca gccatgatct gtgccggctt cctgcagggg aacgtcgatt 1440

cttgccaggg tgacagtgga gggcctctgg tcacttcgaa gaacaatatc tggtggctga 1500

taggggatac aagctggggt tctggctgtg ccaaagctta cagaccagga gtgtacggga 1560

atgtgatggt attcacggac tggatttatc gacaaatgag ggcagacggc taatccacat 1620

ggtcttcgtc cttgacgtcg ttttacaaga aaacaatggg gctggttttg cttccccgtg 1680

catgatttac tcttagagat gattcagagg tcacttcatt tttattaaac agtgaacttg 1740

tctggctttg gcactctctg ccattctgtg caggctgcag tggctcccct gcccagcctg 1800

ctctccctaa ccccttgtcc gcaaggggtg atggccggct ggttgtgggc actggcggtc 1860

aagtgtggag gagaggggtg gaggctgccc cattgagatc ttcctgctga gtcctttcca 1920

ggggccaatt ttggatgagc atggagctgt cacctctcag ctgctggatg acttgagatg 1980

aaaaaggaga gacatggaaa gggagacagc caggtggcac ctgcagcggc tgccctctgg 2040

ggccacttgg tagtgtcccc agcctacctc tccacaaggg gattttgctg atgggttctt 2100

agagccttag cagccctgga tggtggccag aaataaaggg accagccctt catgggtggt 2160

gacgtggtag tcacttgtaa ggggaacaga aacatttttg ttcttatggg gtgagaatat 2220

agacagtgcc cttggtgcga gggaagcaat tgaaaaggaa cttgccctga gcactcctgg 2280

tgcaggtctc cacctgcaca ttgggtgggg ctcctgggag ggagactcag ccttcctcct 2340

catcctccct gaccctgctc ctagcaccct ggagagtgca catgcccctt ggtcctggca 2400

gggcgccaag tctggcacca tgttggcctc ttcaggcctg ctagtcactg gaaattgagg 2460

tccatggggg aaatcaagga tgctcagttt aaggtacact gtttccatgt tatgtttcta 2520

cacattgcta cctcagtgct cctggaaact tagcttttga tgtctccaag tagtccacct 2580

tcatttaact ctttgaaact gtatcatctt tgccaagtaa gagtggtggc ctatttcagc 2640

tgctttgaca aaatgactgg ctcctgactt aacgttctat aaatgaatgt gctgaagcaa 2700

agtgcccatg gtggcggcga agaagagaaa gatgtgtttt gttttggact ctctgtggtc 2760

ccttccaatg ctgtgggttt ccaaccaggg gaagggtccc ttttgcattg ccaagtgcca 2820

taaccatgag cactactcta ccatggttct gcctcctggc caagcaggct ggtttgcaag 2880

aatgaaatga atgattctac agctaggact taaccttgaa atggaaagtc atgcaatccc 2940

atttgcagga tctgtctgtg cacatgcctc tgtagagagc agcattccca gggaccttgg 3000

aaacagttgg cactgtaagg tgcttgctcc ccaagacaca tcctaaaagg tgttgtaatg 3060

gtgaaaacgt cttccttctt tattgcccct tcttatttat gtgaacaact gtttgtcttt 3120

ttttgtatct tttttaaact gtaaagttca attgtgaaaa tgaatatcat gcaaataaat 3180

tatgcaattt ttttttcaaa gtaaaaaaaa aa 3212

<210> 4

<211> 492

<212> БЕЛОК

<213> Homo sapiens

<400> 4

Met Ala Leu Asn Ser Gly Ser Pro Pro Ala Ile Gly Pro Tyr Tyr Glu

1 5 10 15

Asn His Gly Tyr Gln Pro Glu Asn Pro Tyr Pro Ala Gln Pro Thr Val

20 25 30

Val Pro Thr Val Tyr Glu Val His Pro Ala Gln Tyr Tyr Pro Ser Pro

35 40 45

Val Pro Gln Tyr Ala Pro Arg Val Leu Thr Gln Ala Ser Asn Pro Val

50 55 60

Val Cys Thr Gln Pro Lys Ser Pro Ser Gly Thr Val Cys Thr Ser Lys

65 70 75 80

Thr Lys Lys Ala Leu Cys Ile Thr Leu Thr Leu Gly Thr Phe Leu Val

85 90 95

Gly Ala Ala Leu Ala Ala Gly Leu Leu Trp Lys Phe Met Gly Ser Lys

100 105 110

Cys Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn

115 120 125

Pro Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp

130 135 140

Glu Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val

145 150 155 160

Tyr Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp

165 170 175

Asn Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn

180 185 190

Asn Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser

195 200 205

Phe Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys

210 215 220

Leu Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg

225 230 235 240

Cys Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile

245 250 255

Val Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser

260 265 270

Leu His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro

275 280 285

Glu Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn

290 295 300

Pro Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met

305 310 315 320

Phe Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn

325 330 335

Tyr Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln

340 345 350

Lys Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn

355 360 365

Pro Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp

370 375 380

Gly Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala

385 390 395 400

Lys Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr

405 410 415

Asp Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly

420 425 430

Asn Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser

435 440 445

Lys Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly

450 455 460

Cys Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe

465 470 475 480

Thr Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly

485 490

<210> 5

<211> 27947

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный полинуклеотид

<400> 5

gcagagtcta agaaatcgct gtgtttagcc ctcgccctgg gcactgtcct cacgggagct 60

gctgtggctg ctgtcttgct ttggaagttc agtaagtgca gggagcctcg atcccaccat 120

gtgctcctgc agtccccagt gctctgagcc agaccctgct ctctgggcta ttgagacctc 180

tggaggccct ccgtgaggtt cctctcttac ataacgaggc tgtctctctt cccttctctt 240

gtttagctat gagattgaca catcatgggg aaagcattta gaatgtaccc agtgctttgg 300

ggtgcttggt gccacccagc actgtgagca caggttcttc taccttgggg ccacacccag 360

ttacctgtat ctcactgcac agcagtggct gttggggacc aggcccaccc ctccatgtcc 420

cacctcctgc aactgcagcc tgagccttcc catcagcctg gggtggtgca gacccatgtg 480

ccattgtgga tccttcaagt tacctgtgtg gcagagagga cgtgtgagtg ccgtccaaac 540

ccaaacactg agagggtcct tcccattgcc cccacggaag taaggtgccc cagtgctaat 600

tccacttata cttgctggtg gcaaggacac ttctcctcct tattaaagtg ggggattggc 660

tgggtgaggt ggctcacgcc tgttatccca gcactttaag aggccaaggc aggtggacca 720

cctgaggtca ggagtttgag accacaagcc tggccaacat gttgaaactc catctctact 780

aaaaatacaa aaattagtca ggcgtggtgg cgtgcacctg taatcccagc tacttaggag 840

gctggggcag gaggatcact tgaacccagg agttggaggt tgcagtgagc caagattgtg 900

cccctgcact ccagcctggg tgacagaatg agacttcatc tcaaaaacaa aacaaaacaa 960

aacacagtgg ggccaggagt tggaggctgc agcgagctac agtaatgcca cggtgttcct 1020

cactccatga ggctcattgc gtttctcagc ctgaagggca cctctcttct gttttctctg 1080

caagtgggca gcaagtgctc caactctggg atagagtgcg actcctcagg tacctgcatc 1140

aacccctcta actggtgtga tggcgtgtca cactgccccg gcggggagga cgagaatcgg 1200

tgtggtgagt cagccttgac cttgggaagg gactcctctg ctcaccttgg agacagcagc 1260

cgggtccagg ggcctttggg tgactgggcc tggcgtgcgt ccagtacgct gacacatgat 1320

gtcattgaat ccctgctcca ggctgagccc tggggctcag agaggttgtg tttccggccc 1380

aacctcaccc agcaggtggg agatgacagg gccaccgagg actgtgtcat tggaaccaca 1440

cgtgctctga actgccacag gaagtcagtt aagatgagca aactgtttat aaagttggag 1500

atgcaggcta ggaacggtgg ctcatgcctg taatcccagc actttgggag gccgaggcag 1560

atggatcacc tgaggtcagg agtttgagac cagcctgacc aatatggtga aaccttatct 1620

ccactaaaaa tacaaaaatt agccaagcgc ggtggcgggt gcctgtaatt ccagctattc 1680

aggaggctga ggcaggagaa tcacttgaac ctgggaggcg gaggttgcag tgagctgaga 1740

tcacgccact gcattccagc ctgggagaca gagctggctc aaaaaataaa ttaattaatt 1800

aaaaacaaaa ttggagatgc actatgttat tttcaaaaca agctgccttt aaagatctat 1860

ctgttgtcac agggtgggct catctgtttc attttatttt ctgtggttta tctatttatt 1920

cattttaatg aactaggaag cattgctcct atttatggca taccacatga tgtttggata 1980

cgtgtatgcc tgtggcatgg ctaagtcaag ctagaacatg ggccttacct catatacgtg 2040

tcttattaag aacacataaa acctactctt gtagtgattt tcaaatatgc aacatatagt 2100

ttattaactg cagtcactat gatgtacaat agattgctcg aacttattcc tcctgtctaa 2160

ctaagatttt gtgacctctg accaacatct ccccagtgtt gtcacccccc gcccccagcc 2220

tctgatagct gcctttctac tctctgcttc tgtgagtttg atgtttatac attccacatg 2280

taagtggcct catgcagtgt ttctgtctct gtgtctggct tgttcactta gcgtaatgtc 2340

ctccagcttc atctatgttg ttggaaatga caggatttcc ttctttcttg tggctgaata 2400

gtattgcctt gtgcatatac accacatttt ctttatccct tcattcactg atggactctt 2460

aggttgatgt catgtcttgg ctgttgtgaa aaatgccgca gtgagcgtgg gcgtgcaggt 2520

ccctcttcaa cacacggatt tcctttcctt tggatataaa cccagcagtg agattgctgg 2580

atcacatggc agttctgttt ctcacctttt gaggaaactc catactgttt tccataatgg 2640

ctgtagcaac ttccactccc acccccacgg tgcaaagtct ccatttctct tctacaacct 2700

caccaactcc tgttattttc catctttctg atagtagcca tttgaagagg tatgagatga 2760

tacctcattg tggttttcat ttgcattttt atttgtattt ttcatgaatt tttgagggtg 2820

atttcaaggg tagttagtga ctcgaacagg gaaacgatcc tgagtatgag ggttgtgcta 2880

atcatccccc tcctgccagc tgcgtacgga atggggctct gcagatggca gggagctggc 2940

tcgtttctct ttaagagctg ccttttactt ttcttcctct tcctttaaaa cttatttcct 3000

ggccggacgc agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcgga 3060

tcacgaggtc aggaattcca gaccagcctg gccaacatgg tgaaaccccg tctctactaa 3120

aaatacaaaa attagccaga cgtggtggtg cgggcctata gtcccagcta ctcgggaggc 3180

tgaggcagga gaatcacttg aacctgggag gagggggttg cagtgagccg agattgcgcc 3240

actgcactcc agcctgggcg acagagccag actccatctc aaaaaacaaa aaaaagttat 3300

ttcccaagca cagccatgta ttccaggctt gtggatcagc gttggtggtg gtgtgtgctc 3360

tcatatctta gttccagcta agcacactct gacatgttta cactagaacc atttgttttt 3420

tctagaaata gaaatttcag aattgtagag tcagaggact taccagaaat ctcttaggta 3480

gttctcctcc cctccctcaa gtgcagtcct aacctcctgg agttttctgt agaaaccaca 3540

agcctcagag ctggccgaga attctagcca aagatttttc catgccaaag taatcccccc 3600

tctcctaagg gccatccttg gtggggactg gtttcctgtt aagccctcgc tgtcagtcct 3660

ggctgtggaa tttcctggtg aggagcactg gcccgtggag ctcggccctc gtgccggcct 3720

tgagcaggcc caagtgttcc gtgttcttga tacctttcct ccagcacagt cttgcttccc 3780

agaaaaaggt ttgcacttga aaatgatgca tttgctgatt aaacatagtt cttttgcttt 3840

atttggtttc taaaataaag tgggagtttt tgagattgag taacgtgagg ttaagatagc 3900

acgtggaatg gctttttctt ttctttctat tttttttttt tttttcctgg agacagggtt 3960

tcactctgtt gcccaggctg gagtgcagag gcatgaccat ggctcactgc aacttcgatg 4020

tcctggggtt aagcgatccc ccagcctcag ccccccaagt ggctgggact acaggtgctc 4080

gccaccacac ctggctaatt tttgtatttt ttgtagaaaa tgggtttcat caatgttgtc 4140

cagactggtc tcgaactcct gacctcaagc aattctcctg cctcagcctc ccagactgct 4200

gggattacag gcgtgaacta ccacgcctgg cctggaatgg cttttgatgt tctcctatgt 4260

gcacatgtgg gtgaataaac accaacaaag tccttatgtt acctgaagag ttgctctctt 4320

cttaatattt aagtcgtatt tatttaaata ctttaatagt tgtacactat taaagtatta 4380

ttaggtcaaa atcaaggaag tacaaaaggg tatgctgtga aaaatctctt cttccttgct 4440

ctgcttactt acctaccccg catcccccca tacaccccag acacacacac acacacacac 4500

acacacacac acacacgcat cactcccata catgcccacc tgtttaccag ccaatcacat 4560

ttcttggggc aactcatctg agttgcttct ctttccagag agtttttgca taaagaagca 4620

caggtatttc tgcgttacca tgaccctatt tcccagtggt tcctagccag ttgactctcc 4680

tgcactggat accatcctgg acagcattcc ttagggaaat gagccccctg ttttttccca 4740

ccatggcaca gttggtcctt tgcatggacg caccattatt gcccctgtct cttcttggtg 4800

gaccttaagg ttttctccat ccttttgctg taacacacac tgctccaagt gtgtgagcat 4860

atcagtagga aacgcttcca ggagtagaac tgctaggtca gagggcgtgt ggatctgtaa 4920

cctgacagac ctagaccggc ttcagtttgg ttttatccag tttccatatt gattattcat 4980

ataaaaggaa acagacaaac ataacgctgt gcatgtattc tctcttagac cagaacaggc 5040

atagggtgca cttttaattt gtccatttcg tagagtagaa attgtttttg ctgaaatgaa 5100

caccttagga tgctgaagaa tatgacccgt cccatggaaa acattcaaaa atgtgtgtag 5160

cgctttcttc ccaagggtgt gtgtgcgcat attttaacac taattcactt tctacttccg 5220

ttgctatcct ttctgtgagt ctttctcaga atctcagaaa agaaactaaa ttgttcactc 5280

tagttatcaa tgctgtactc tatacctgga atttgctaaa agggcagatt ttaagtattc 5340

tcaccacaga aaagagaaaa gaaaatggta attatgtgac gtggtggaca tgttaactag 5400

ctttattatg gtgagcattt cacagcggat atccagtcat cacgctgtac acattaaaca 5460

tgtacaattg ggtttttttg agacaaggtc tccttctgtc acccagtctg gagtgcagtg 5520

gctcagtcat ggctcattgc agcctcgacc tcctgggctc aatccatcct tccccctcag 5580

cctcctgaaa agctggggcc acaggcatgt accatcatgc caggctaatg catatatatt 5640

tatatttttt ggtggagatg gggttggtct cgaactctgg gctcaagtga tcctcccgcc 5700

ttgcccttcc aaagtgctga gattacaggc atgaaccaca gcaccaggcc tacatgtaaa 5760

atttttattt gtcaactata ctttgacaaa gctgagaaaa aaaatcctaa tatttaaaaa 5820

aaaaaaaaaa aggactagct tgagaccttt tccagctctc tggcttatca gctgccgtct 5880

cttccgggtg cagatagctg gaagggaaag aaaatcccta aaattaccca caagccaaga 5940

atgaagtgtc tccctttgag ccacagtggc agttttgttt ttaatcatag aagtgtattt 6000

tgagccgggt gtgctggctc acgcctgtaa tccccgcact ttgggaggcc gaggtggggg 6060

gcggaggggg tggggatcgc ctgaggtcag gagttcgaga ccagcctgac caacatggag 6120

aaaccccgtc tctactaaaa atacaaaatt agccggcgtg gtggtgcatg cctgtaatcc 6180

cagctactca tgaggctgag tcaggagaat ctcttgaacc caggaggtgg aggttgcggt 6240

gagctgagat catgccattg cactccagcc tgggaacaag aaaaaaaaag aagaagaaga 6300

agaagtgtat tcatttcagt tacttttaaa aaagtgaaca gactttatat tttagagcgg 6360

ttttaggttt acagaaaatg aaacagacag ggcagcgagc tccttgtact cctccccagc 6420

acacagttgc cctgttatga acatcccaca tcagtgctgt gcgttcatta acaccgatga 6480

acctgatgca tacattatga tgaactgaag tcctggactt caccctttct cttgtacagt 6540

tctgtgggat ttgacaaatg cataatgctg tacagccaca atgatagtat cgtccagagt 6600

agttctcctg ccttaaaacc tcttttgctg cacctgtttc tctctcccca ctcaccccag 6660

ctatctgatc ttcttagtgc ctccgaagtt ttggtctttt caggatgttg tagcgttgga 6720

atcatggagt atgtagcctt caccacatac accttccttc actttgttgg cttcctttac 6780

ttagtaatat gcattcaagt ttcctccatg ccttttcatg gcttgatagc tcatttcttt 6840

ttagcaccaa ataatattcc gttgtccaga tgtagcacaa tgtttatcca ttcatgtaac 6900

ctgtgaccga ctcacagata ggatgtggaa tcactcacca cagaggcatt agacaataat 6960

cagacccaag tcatttcatg ggggaacaag cccacaggta ccagactgtc cagtgagtca 7020

gggccactcg taggaagtaa gaagagaggc tagagcatag ccaggtcctc actttatact 7080

ttaagcccat gtgtatttct cccaaaccac acagcattgt ttccatgctt tcagctttgc 7140

atgaataacg tgatacttga acgcatcatt tatcacttgc tctctttccc acagcgctgt 7200

tttcaagctt cttcctgttc atgatgctct gcttaaccct taagctgcat gggattctgt 7260

tctgtgaata cgcccacccc atgtattatc ctgcccagca aaaagtcccc aaaactctgg 7320

atggtggtta cctctaggga gggagagaag agattgggaa tagggagcga cttcaacggt 7380

gtttgtaatg ttttgtttct ttaaataaaa gagctgagat catttcagca gaatgttgat 7440

ttagagtctc ctggacaatt tgttgctcaa agtgctctct taaagagcac tttaaaaaaa 7500

aaaacctttt atcttattat ttatttattt atttattgag acggagtttt gctctgtcac 7560

ccaggctgga gtggagtggt gtgatctcag ctcactgcaa cctttacctc ctgggttcaa 7620

gcaattcccc tgcctcagcc tcccaagtag gtgggattac agatgcgtgc caccacactt 7680

ggctaatttt tgcattttag tagagatcgg tttctccatg ttggccaggc tgatctcaaa 7740

cgcctgacct caggtgatct gcccgccttg gcctcccaaa gtgctggtat tacaggcgtg 7800

agctaccatg cctggcttat cttatatatt tttaaaaaca gcttattgag atctaattta 7860

tgtaccataa aattcaagta tataattcag tgcttttata tataaaacat atatatgaaa 7920

tagcttattg agatataatt ttttatataa aacagcttat tgatatgtaa tgtatgtacc 7980

ataaaattta aatatataat tcactggctt ttatatattc acgaatatgt gcaactatca 8040

ccacagtcaa ttttagcata ttttcatcag ctcataaaga aaccccaagc ccttgaacta 8100

tcaccccata tccctcctcc cagcccgtcc ctcctactca taagcaacca ctaatctact 8160

tagtgtctat agatttccta ctctaggcat tccatgtgag cgggatcatg caatacgtgg 8220

gctcacacaa tataagtggc attccatgtg agtcggctca tgcagtatgt ccggctcctt 8280

tcactgagca taaggtcttc agcactcatc caggttgcag cctgtgtctg aatttcattc 8340

cctcttctgg ctgaatcgta ttccattgtg tatcttggac atatcctatt ctgctcaccc 8400

agccgttggt gggcgtttgg agtgttttcg cctttcagct gttttaagag ggttgcagtg 8460

aacatttgta caagttttgg acccaatgcc tgttttcaat tctcttgtgt agagagcact 8520

ttttagcaga aaaagaatag atttgtggcc tccctttgtg tgcggtcagt gccttgagaa 8580

gagtgaactg tgctgccacc tccggagccg tggagagcgc ggggcttggg tagcagctag 8640

gacgatacaa gttgggacaa ggccaggtgc aatggctcac gcctgtaatt ccaacacttt 8700

gggagaccga ggcaggggga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8760

ggtgaaaccc catctctaat aaaacagaaa aattaactgg acggggtggt ggacgcctgt 8820

aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggcggaggct 8880

gcagtgagtg gagatcagac cactgcactt cagcctaggt gacagagcga gactccgtct 8940

caaaaaaaag aaaaaaaaag aaagaaactc atggataatc ctccctctcg tgcagttcgc 9000

ctctacggac caaacttcat ccttcaggtg tactcatctc agaggaagtc ctggcaccct 9060

gtgtgccaag acgactggaa cgagaactac gggcgggcgg cctgcaggga catgggctat 9120

aagtgagtat ggggcagcac ccgccgagtg acagtaacag acagcagaaa cacgagaaga 9180

ccctctctct gcctccctgt gaaagcaccg gcacatgagt gctggggaca attgtcacct 9240

tccaaaagct gagccctata accagcaggt ggaatttgtc ctgctagggc tgtgcccagc 9300

acacagacct tggctcactg ccaccttgcc ctgcctcctc cttggcctct atagactcct 9360

ggttgctcgg gagtgcccag tgctgtggtc atctggtcag aggggtaggc tgagggcgtt 9420

aggtgcctct ttttccaagg tgcctctcag ccagggtcca ttcacctccc tgggtagagg 9480

ttggaccaga acagctggcg aggagggttg ggctggggag agcagcagag acaaatcctg 9540

tgccagtttc acttcattcg ggagccatgg aagccttttg agctggggag agaatcaatc 9600

aatcagactg atacttaaaa aatgtcattc ctgctcgtag ctctgaggga aggtgggaag 9660

gcttaacagg gtgtgtgtcg cctgacagtg attcctaacg ggggtggggc ggtggttacc 9720

atttaccagc actgcctggg gagatgcggc agccctcagg catcggggga gagggtggta 9780

ggatgctact gccactttgt tttccatggg agggtcccca ggtgatttct atgcaacttt 9840

agggtattca atatgccagt tttcagaatg aattaccact cggtgagaaa gttggcatct 9900

tagctagtca ctgtgacatc cctaaacagc aggggtgaat tacacagcaa agccccccca 9960

tcacagtcca ggaacctggt ggaattgata actggggcca tgttaacatc tgtacctttt 10020

attagattaa atgtgtgtat gattatacaa tcctatgtcc ttctcatagt ttcttgatcc 10080

taacctggat aagaaacacg accaatgaag gaattttgtc tgacacttta gggttattga 10140

atcgaaaaat cgttacaata ttctagcact tggttagaac gtgtgatttt ttttcctaaa 10200

tgctaaggtt tttccctctt attctgaatg tcgtatgagc ggtattatga catagtatag 10260

gatttgtgtt tgcttatgcc ttaaccatta tcacaaataa ggttttcttt tttaggaata 10320

atttttactc tagccaagga atagtggatg acagcggatc caccagcttt atgaaactga 10380

acacaagtgc cggcaatgtc gatatctata aaaaactgta ccacaggtat gcagcaattt 10440

cttcttgaaa aattttggaa tgaaatcaac taggagacac catggggaat cgttgtcctg 10500

agtctgattt ctctgagctg caatactcgg tctggatggg ttttgcattg ggaggagatt 10560

agagtctgac caggcctggt tactctaagc agcccttggt ttattcatag gaagtggctg 10620

aggtttctct gctatttcat tttcagcctc taccgtctgc ccttgttggt agcggctcac 10680

acttgcaaca tcgacattca actctattta gttttctttc ctcttcagac atttagaggt 10740

gtacctattt tgtcagggcg tggttctagg aatccaagat aatgtctcag tgtcccagcc 10800

agggtgaccg gctcattcca gtttgccagg gacttcactg gcttgagcaa gggaagtcct 10860

gctccattcc aggcagctgg gctggctggt cccgttagcc ccaaccccgg gacagcagtg 10920

ccagagggtg ctctgtgagg gatgggcagc attctggcgg cctgggaatg agttgtggtg 10980

tttccagggg gtagaagtgg gtacaagcca caggtcacat gatgagtggc tgacctggct 11040

gggagggcag aagaggggat ggacttaggc tcttcctttt gctttgcaca tatttaggat 11100

gtttgcagac ttgctatgat tgttgctgtt atgtgttttc tgatgtgaaa gatacacagt 11160

gtcctttgcc catgagctct ccttgcctcc caggtcccca gggcttatgc ctggtgtcta 11220

ggcatcacct ccctgcctgc caggtgccag gtgctgcatt tcgggggagg atgaactaat 11280

caccccgcgc cacctttcct ctgagtggga gcctggggca ggtttgcatt cctggaggcc 11340

gctggtggag gggtctgggg gcctgacttc cactgcagcc tgctgtcctg gggaatgtgg 11400

cagggcaagc ccagtgggga gggctgtgca cggccaggtg cacccatcaa aacagcaggg 11460

ctgcggtttg tccctgtgga gaagctaaac acagctgcct gggcactttg taaatgctga 11520

gtggttcttt gtctttctgg gttacacacg gaatcaggga gccaagtcca gccgggcagg 11580

gacgggggga ggggaggagg tgctgccgtc ccttggcaag agccttggga actcacaagg 11640

aggctggagg gcttggaaga aagaagagaa ggccattgtc tggtaggctc tattctatct 11700

cggtggtggt ggtgggggga ggcgcacttc ttttcctctt tctgtgcagc agttgccctt 11760

tgatgcctga gttcttggct tgttttctgt cgggcttctg tgaataacca catgtgccct 11820

ggcgctgtga ccacacaggg ctatccctac cgaccttagg attcttagga aatgtcttct 11880

cttaaagggg acatgtcttc acttggccgt gtcagtgccc cagagccaga gtccacctgg 11940

aatgcacctg tagtcactga gaacccgggg ggtgtgcctt agtaagaagg tgtcaggaag 12000

gacctattat tgtagggcct gggctcctgc aaggtggttt gggggtggtt ggaggaagca 12060

gagatttgct ctggattgga tgctgtcagg aagcaggggt aattctgtga ggctgcttta 12120

ttattttttt tctaggagga ggttggaatg aggctaggct aaagctgtga ttggtaaaga 12180

aacgtccgtc gctcaagtta gccaggacag gaggagacat cagatcgtga ttttgtggtt 12240

gtgagcacaa ggttcctgtt ctgtctgttc agacatcatt tcggaggagg ctccttgtgt 12300

cttgccccat ctcaggcatg gaggggccta gtccgatatt gacgctcagt gaaataattc 12360

aggttccgca gagcacacgg cccagctatc agggcgggcc agctctgcat gccaggggcc 12420

gcgtcttccc ttctcagcat agcctgggaa attcactgca ggacaaaatg catcagttac 12480

ttcctcttca tccataacct gggatgtttg actcccaaat gagtaactct tacgtttctt 12540

ctaatcctag ggaaactatt ggttatattg ctttcaacac tacaaattta aagcagttat 12600

aggagcccag aggtttccaa atggcttcct taaaaattag aagatgattt taaattccaa 12660

gaggaaaaac aaaactagca ttattgtata cttaccctca caaccgtcct aggagctggt 12720

acaattttaa gagaggttaa gtaacttgcc caaggtcaca ctgtggggat gtgagccgcg 12780

taccttggct cagtgtctgg tctttgccac tgtccctata tggatttact taccttattg 12840

gagttgtaac tagcagaccc ttctatgtct cagaagacag gagagggaac atcggaagaa 12900

atgactgatt tctaagcatg tgagaggcag gtgactccgc actatcgtga ccagaatttc 12960

ccctgttctt tttgcagtga tgcctgttct tcaaaagcag tggtttcttt acgctgtata 13020

ggtaagttca tctggagtcc cccttttgat acttctaact aggaaaagct ctctactttc 13080

agaacagtac tccctgtgtc tctgggggcg tgggagggaa gaaggtgggg tcacgggttg 13140

gaatgtgccc agcggcgtct cgctctttcc aaggagctcc tggtttagat ttccatggcc 13200

tgtagacacc ttcagccttg ggtccaaggg acaccccctg agatcaggca cgctcaagaa 13260

gctgacaaag ccctacactt tatgccaccc atgagctgga ggcccggcag gtctctttct 13320

ccagaaagca aaggggggtg gcgttagtga gccctggcag ccacctaacg tggacttgga 13380

gcatctgcgg ggctgtggtc cagcaccacc gtgtggccac caggtgctca tcagccagtg 13440

ggacccggga ggagggacaa gaccagagaa caacagtgct cttgcctctt ctctcctgaa 13500

ttttggacgg tggcttagac ttgggtgtcc ccatctctgt gtttagagtg cttacagttt 13560

ccaaactgtt tgcaaatgtg gaagccaccg tccctctcct ctgggatggc ccagtgctgt 13620

cgtggggccg tggtcctgag ctcagctttt catttgaaga ggtggaagga gctgacaccg 13680

tcccatcccg gcagggctgg ctcaggtctt ctttaggtcc tgagtggggg tccagcacag 13740

ccccaagggt gcgtggcacc cgccctgccc tctgcccatg cactcatctc ctggtggaga 13800

agacactcac acacaggaag cagggaaggc agcagacctc actcacccct caccccctca 13860

ctcaccccct actcaccccc tcaacctctc attcaccacc caccccctcg ccccctcact 13920

caccccctca ctccctcaac cctcactcac ctcctcactc cctcaaccct cactcacctc 13980

ctcacctcct cactctcccc ctcatccctc cctcacccca ccccgtcacc tcctcactca 14040

cctcctcacc ccctcactca cccttcaccc cctcactcac cacctcacct cctcactcac 14100

cccctactca acccctcatt cacccctcac cccctcactc acccctgcac cccctcactc 14160

accccttcat ccactcaccc acctgctcac ctcctcactc aacccctcac cccctcacta 14220

atccctcact ccctcacccc ctcacgccct cactcacacc ttcacctcct cactcacccc 14280

ctcaccccct caacccctta cttaccccct cactcatccc ttcacccctc actcaccccc 14340

tctctcaccc attcaccccc tcactcatgc cttcaccccc tcactcacct cctcactcac 14400

accttcaccc ctcagtcacc ccctcactca ccccttcacc ccctcaatca tgccttcact 14460

ccctcactca ccccttcacc ctctgaatta ctccctcatc ccctcactca ccccctcact 14520

caccccttca ccccctcacc caccacctca cccacccctc acccaccccc tcacctcctt 14580

acccctcacc cccctcactc acccctcacc ccctcactca ccacctcacc cacccctcac 14640

ccaccccctc actcactccc tcatcccctc actcaccccc tcaccccctc actcaccccc 14700

tcacccaccc ctcacccacc ccctcacccc ctcactcacc ccttcacccc ctcactcacc 14760

ccctcactca ccccttcacc ccctcactca ccacctcacc cacccctcac ccaccccctc 14820

actcactccc tcaccccctc actcaccccc tcaccccctc actcaccccc tcatctcctc 14880

actcaccccc tcacctcctc actcacccgc tcacctcctc actcaccccc tcgccccctc 14940

actcacccct caccccctca ccccctcact cacccctcac cccctcgccc cctcactcac 15000

cccctcgccc cctcactcac ccctcacccc ctcaccccct cactcatccc ctcacctcct 15060

cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15120

cacccacccc ctcactcact ccctcacccc ctcaccccct cactcacccc ctcacctcct 15180

cactcacccc ctcacctcct cacccacccc ctcactcact ccctcacccc ctcaccccct 15240

cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15300

cactcatgcc ctcaccccct cactcaccct ttcacctcct tgctcatccc ctcacttacc 15360

ccctcacttc gtcaatcacc cccccacctc gtcaatcacc ccctcacctt ttcactcacc 15420

ccctcactca cccccttact tcctcactta cctcctcacc ccccactcac cccctcaccc 15480

cccactcacc ccctcacccc acactcaccc cctcaccccc cactcacccc ctcacccctc 15540

tcacctcctc actcaccccc tcacctcctc acttatcccc tcaccccctc aattaccccc 15600

tcaccccctc aattactccc tcatcctttc aattacccac tcaccccctc acctcctcac 15660

tcctcactca ctccctcact caccccttca ccttctcact cacctcctcg tctcctcacc 15720

ccctcactca cttccagccc tgcccctccc atcttccttt tctttgtgtg agaatctggg 15780

gtccctgagt ggtgtcagtc cctccaagac tcaaggagtc cccagggcct tgttatccag 15840

aacaccccca cctgggtccc gggagacccc atgggatcac aggagtgttc agggaagtgg 15900

tgcttcctgg gtctgggtgg gctggagggg catcctccct tccccaagag gagaccccca 15960

ggagccccct aagtccatcc ccagcagtgg tgcccctgcc ctgtccttgc agcctgggag 16020

acccttggga ggggcgggcg ctgggtggct gggcggcttc tgctggtctc accccactgg 16080

cctcctgttt gtcatcctca gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 16140

ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 16200

agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 16260

actgcgtgga aaagtatgcc aggggcggcg cgggccgggt gggggctcag ggctggccta 16320

cagccaccct gtgaccttga gcaggtctca acccttgcag ccccggcatc cttgtgttta 16380

aatggggaga gtattgcacc tgcttcctag ggctgtgaga catcaagtgc gctcatgcca 16440

ggcagtgcat ggctgtatgc actgagtgtc ccctgcacgc agggcacagg gtgcaggtgg 16500

aacattctcc acgatgtcgc cgtgaccagc gttccttcca gccactgtcc tctgagctct 16560

gtcctgccct tgagcaaagc ccctgccccc tgaggtatcc tgtctccggg acgctagtcc 16620

caggagaggg cacactcaga caggcttcag gctgccctgc tggaaggtcc ctggggttaa 16680

gcgttcttgg ccacagcatt gctcatgcag agggttaggt aggggtgagg ctagccgtga 16740

cagtattagc atttatggac gctaccaccc cctccccttt tccttaaaca catagtgctt 16800

ttggtcacat gctgctttgg aggaggcctc acttggcgga tgtatttttc tgccttagag 16860

agaggctgaa ctgggtttga ctgttggccc agccctctct tgctgcgtgc ccttagacga 16920

ttcactcaac gtctctgatc catggcatgt acaactataa gatgggcatg cccttctcct 16980

ctcgggctgt tatgaaggtc aaggaagcaa gggctgttac ccaagggtgc tcccttctct 17040

ccccctcttc acacccccag gtgctctggg ccctctagga actgggtttc tctcaagggc 17100

tgttacccaa gggtgctccc ttctctcccc ctcttcacac cactgggtgc tctgggccca 17160

ctaggagctg ggattctctt aagagggaaa ctcttggata aaggaaatgg tttgattgat 17220

atcggacaag tctgttcatt agtatccatt tattaagcac ctaccatgtg ccaggaaatg 17280

ctttggcgta caaaggaaaa taagggccag tcctgctaga aatggccttg aaaccccagg 17340

gagggatgtc ggcccattgt gggtgctgca gattccttga aggtgatgca agagccagaa 17400

agaaggatga tgtggggggc tgaggcaggg agtcggggtt gggggagtgt gggggagaag 17460

gggagaccga gcacctcttc cactatctcc ctgtgtggtt tttggtgaac catcctgcct 17520

ctgggtgtct tgcctccagc ttctgacgtt ggaagttcat ccactgagag ctctgtgttt 17580

atggctctga gatactgagt ccttcttctc tcccagacct cttaacaatc catggcattg 17640

gacggcattt gcggggattt tgagacaatc tttcatgttc tatggagccg gataccaagt 17700

agaaaaagtg atttctcatc caaattatga ctccaagacc aagaacaatg acattgcgct 17760

gatgaagctg cagaagcctc tgactttcaa cggtacgtgt ggctcaggct tggcaagcag 17820

gttggcagaa tcttaaagag atgttgattg gaaatgacac ttgtgctatg ccaaatggaa 17880

gggaggcatt tgcgttgagc gagggtagcg tgcagcgggt ggccaatggg agaggctcac 17940

agaggctaag agcacctgcc gcattttggg ggaggcagca gccaccacat ctgttctgta 18000

ctgtactgag tggtggtgat tcaagccagg catggaaaag gctagaacag ggctttccca 18060

ctgcagcacc cttgacatct gggtggttct ctgttgtagg gctctcttgt gccttgtagg 18120

atgtttaaca gcgtccccag cctctaccca ctggaggcca gtagctacca agctgtgaca 18180

accagtgttg cctgctgaca ttgccaaaca tccgctttga ggcaaagtca cttccagttg 18240

agaactactg gcctaaaatg tgtaaagatc cttgattttt aaagatacat tctaaaacca 18300

agttgcttaa ttcaggacaa acatgctttc tcttagcctc ttattcggtc ccactctggt 18360

ccatccaagg gtctggaatg ttctagcccc atgtggatac agaagaagca aaacctcagc 18420

cctccctaca gcatgtctgt attcacattg ggaaatggtt cacatataga agagcgaatg 18480

cctgagcaat ggcgtggtgc ctctggggcg aaagctgact ccattgactc catcggcttt 18540

ttggctgttg cctcctgtgt gtctttcccg tcttgatcac ctggagatat gtaattttgg 18600

aagcagagct agcaaataat tcctcttata agcagagcta gcaaataatt ctacttataa 18660

gtagcataac gtcttgcctg ccagaaggag aggtctggca gggggagaaa gtgagaatgt 18720

gggacttgtt gggatgcagg gtcctctggg cagggtggcc agggtgccag gcccagcagc 18780

ctgcatgtgg gaaggccagg tggagacata ggtgataccc gcctggctca ctgtgttttc 18840

tcttcttgaa acagacctag tgaaaccagt gtgtctgccc aacccaggca tgatgctgca 18900

gccagaacag ctctgctgga tttccgggtg gggggccacc gaggagaaag gtgaggctgc 18960

tcctgggcac acaggactgc agggcccaca gatggagcat tgggttcgga agtgggaggt 19020

ccaggtttta atcccagttc tactactcaa tgactggatg actttggttg attcccccag 19080

tccttgtgcc tcagtttctc catctgctaa gtgggagaaa tcctgcccag cctacctaat 19140

acactgtgtt cttatcgtga tcacacagag cagcatgtgg aatggctttt gaagtatctg 19200

ggccatacga gtttagaggt gcaggatctc ctgtgttgca ctcattgtga gtttagagct 19260

gccctggaga tcccaccaag gcctgcgtgg ctgagtgaca gggggcttgg tgaggacggg 19320

catcctggac ccatggtggc cacatctaag cctgtcctct gccctgataa ccacagagag 19380

aggctctctc cacccacttc ctttgcaatc tgcatttctc tctgacagtc tttcaaatga 19440

agggagcctg gctgcttcat ttttatggag ggttggaagt gcttagtggc aggcacaaag 19500

gttcatttta catattgttt atatccttct caaaagcgtc taggccatac agacaacaaa 19560

tcctttcaaa caaggggaaa agtacaaagg ttgggtgatt tctggggagc gtcagggaag 19620

gtagtggggg gcatcctggc tcctcatcag cagaaactta ctacagtaga gccacaggct 19680

gggcaaaaga cctcatggaa tccaagatga agggaatatc gacaaatatt tgtgcgcacc 19740

tgcacctagt acaggctggg tgctactcag gtgctgggaa tgcagaagtg aacagagtaa 19800

gacaaatgtc tctgctgtca ggagctttac ctctcttctg gatgtcggtg gtggggacgg 19860

ggcaggtgtg gtcagacaga tgggagacaa acaactgagc gaggtacttc caaacatctg 19920

agggtgggga tcacaaggtc ccggctattt tgaaggggtg gtcaggaaag gcttctcgga 19980

agaggtggca tttgagctga gactcaaatg gcaaaaatgt gtacacatca aaaaggctag 20040

tgcatgtatc ttcaggtgtg gtcaaggggc caaggaggtg ggctggggcc agattgcata 20100

ggtccttgtg gattatggtg aagacaccag cttctcatct gcttgaggtg gggagatcgt 20160

gagccgggga gtgccatgat ctggcagctg cgtggggagt ggggatgaat ggatggagac 20220

gaggatgatg gtgacaagtc cattgctgtg gttccttgag acaggaagcc agctcatagc 20280

agagtgcggg cgtggatgtg aagagatgag ggtacactag ggctagagcc accagactta 20340

ctgatgggtt gcatgtctgt gggagagaga gtgagaagtc agggacgatg gctttccact 20400

ctgtggctga agccccaggg tggcgggtgg tgccattttt caagccagga aatattggtt 20460

ggtgagaatt tggggtggga gaaggtgtga cggagggttc tggttttgca cactaagccc 20520

acggtgccca gaagatgccc gaggggaggc agcaaagcga gagtgggaaa tgcagaggtg 20580

gcaagtgcag gccgtgtctt gagaagctct aatgtgcagg ggagccgaga agcaggcggc 20640

ctagggaggg tcacgtgtgc tccagaagag tgtgtgcatg ccagagggga aacaggcgcc 20700

tgtgtgtcct gggtggggtt cagtgaggag tgggaaattg gttcagcaga accaagccgt 20760

tgggtgaata agagggggat tccatggcac tgatagagcc ctatagtttc agagctggga 20820

atttctttcc ctgaagctga actccagagc tgcattcagc acaggcaccg ccagttgtaa 20880

ggagaatcca ggtttcccag gagaggggtt ggtgctggga tgagctgacc ggggcagggc 20940

tggaaaatag ggctgtgacc atctgtgtag tgcgtgtgga ggtctcaggg agggaagtgt 21000

gctctccctg cgagagctgc aggcaacact gggagctcaa caagtctccc tgtccttagg 21060

gaagacctca gaagtgctga acgctgccaa ggtgcttctc attgagacac agagatgcaa 21120

cagcagatat gtctatgaca acctgatcac accagccatg atctgtgccg gcttcctgca 21180

ggggaacgtc gattcttgcc aggtaattca acatttttat tctacctttg gtccttacca 21240

gatcctactg aaccccccat gagagagagg gcattcttgg ggtcagcaga gcctcctcag 21300

tgacacggag ccagctcggg gcagtcatgg gaagtgacgg ccacaaacag tgcgaacgct 21360

tctggtggca gaaggaagta cagtcaacaa atcacacaca ccctctgaaa aaccggtatt 21420

tggtaaaagt gccagtggaa cagaaacaag tatttagact attttaaatt atgaacggca 21480

atttatttag taacttttag cttgaacaga ttaaaattca ggatgggggc tatctctttg 21540

ggggttacat ctctgttacc atcacccctt gatggtggag attcgaagcc cacacagtca 21600

ctcgtaactc acactgcgac ccccgccccc caactcctct aggcctggtc agtggtgtgc 21660

ggcagattgt gacttgattt tctgctctct gtaccttgct gtgtcccaca gggtgacagt 21720

ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga tacaagctgg 21780

ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat ggtattcacg 21840

gactggattt atcgacaaat gagggtaact atcctgtcct ccttctgact gtgttctccg 21900

attcctcgag ccaaagccag acatctgtta ggcgtggttc tgctgctgga agctgactgg 21960

tgaccactgg tcagcatgaa gcaaactctg cttcctccag ccacagcccc atccccccag 22020

tgtccaccca ttgcccattg cctctcactg gcttcacttg catatttccc ctggtgtttg 22080

gatgaaaagc gctggggctc agcttgtgtg aaattccttg gtgctctgcc aaccacactt 22140

cgttctggct cagctgactc agctgttcca cccaggccac ctcacatcaa actttttttt 22200

tttttttttg agatggagtc tcactgtgtc gcccaggctg gagtgcagtg gcacaatctc 22260

gactcactgc aacctttgcc tcctgggttc aagtgattct cctgcctcag cctcccaagt 22320

agctgggact acaggcatgc gccaccacgc ccagctactt tttgtatttt tagtagagat 22380

ggggtttctc catgttggcc aggctggtct cgaagccctg acctcaggtg attcacccac 22440

ctcagcctcc cacagtgctg ggattacaag tgtgaaccac ggtgcccggc ctcacatgaa 22500

acttttgatt tatagagagc agagggaaga gccggctgtg cccatccttt tctggggcca 22560

tcgagtggct cctgggcagc ccccaaggtt aggaagggca ggagcagcca gggttctctg 22620

atgccccaga ctcaagcacg agggaaggtc tcaggggttc catgtgagcc tcatggatgt 22680

ctctgcttag cagagccctg gctttgggca ttgtccagat agggggtgag aaccagatct 22740

tctcatctcc aggacctcag acgtatagtt ttctcagatt tctgtgcttt ctggggctgg 22800

gctactagtg gaagaaagca gtctattctg tcttctccca aatctcccag atgcccagtc 22860

tgttgaagga ggagcagaac cagggggcct ttcccgctga ggcccgacct gtgtctcctt 22920

caaatgacac gcgggactca gggccttccc atgaccatgg ggcccagggg gcgtcacctg 22980

gcccagggcc cagtgctaga aacagatgac cccaggagga ggaggcaggg caggagggaa 23040

gctggcaggg ctgggatggt cagccaggct gaggggcgga ctcgcaccag gatggagcta 23100

ggaaatgatc caggtgtgtt tggcggctgc aggtgggtcc gcatggctgt gcagggaggg 23160

aagggctgcg tggcaggaga gcagccgggg gaggcccaga ctctgctgaa gagatgcctg 23220

ttgtgccggc ctccacatcc gctgcccgct ccttccggag ctcctgcccc gccatgctca 23280

gcctgactct gaccaacacg ttggagagaa gaatgatccc tttgtgctat taagcttgct 23340

tatttggttt ctaagtgctt catgcgaacc tagaggaaaa aattattttc cacctttgtt 23400

tgtcttaaga aaataacaca cttttttttt tcctatttga acaggcagac ggctaatcca 23460

catggtcttc gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc 23520

gtgcatgatt tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac 23580

ttgtctggct ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc 23640

ctgctctccc taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg 23700

gtcaagtgtg gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt 23760

ccaggggcca attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag 23820

atgaaaaagg agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc 23880

tggggccact tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt 23940

cttagagcct tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt 24000

ggtgacgtgg tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa 24060

tatagacagt gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc 24120

tggtgcaggt ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct 24180

cctcatcctc cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg 24240

gcagggcgcc aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg 24300

aggtccatgg gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt 24360

ctacacattg ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca 24420

ccttcattta actctttgaa actgtatcat ctttgccaag taagagtggt ggcctatttc 24480

agctgctttg acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag 24540

caaagtgccc atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg 24600

gtcccttcca atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg 24660

ccataaccat gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc 24720

aagaatgaaa tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcatgcaat 24780

cccatttgca ggatctgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct 24840

tggaaacagt tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta 24900

atggtgaaaa cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc 24960

tttttttgta tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata 25020

aattatgcaa tttttttttc aaagtaacta ctgcatcttt gaagttctgc ctggtgagta 25080

ggaccagcct ccatttcctt ataagggggt gatgttgagg ctgctggtca gaggaccaaa 25140

ggtgaggcaa ggccagactt ggtgctcctg tggttctcga gataacttcg tataatgtat 25200

gctatacgaa gttatatgca tggcctccgc gccgggtttt ggcgcctccc gcgggcgccc 25260

ccctcctcac ggcgagcgct gccacgtcag acgaagggcg cagcgagcgt cctgatcctt 25320

ccgcccggac gctcaggaca gcggcccgct gctcataaga ctcggcctta gaaccccagt 25380

atcagcagaa ggacatttta ggacgggact tgggtgactc tagggcactg gttttctttc 25440

cagagagcgg aacaggcgag gaaaagtagt cccttctcgg cgattctgcg gagggatctc 25500

cgtggggcgg tgaacgccga tgattatata aggacgcgcc gggtgtggca cagctagttc 25560

cgtcgcagcc gggatttggg tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg 25620

tgagtagcgg gctgctgggc tggccggggc tttcgtggcc gccgggccgc tcggtgggac 25680

ggaagcgtgt ggagagaccg ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg 25740

aactgggggt tggggggagc gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga 25800

cgcttgtgag gcgggctgtg aggtcgttga aacaaggtgg ggggcatggt gggcggcaag 25860

aacccaaggt cttgaggcct tcgctaatgc gggaaagctc ttattcgggt gagatgggct 25920

ggggcaccat ctggggaccc tgacgtgaag tttgtcactg actggagaac tcggtttgtc 25980

gtctgttgcg ggggcggcag ttatggcggt gccgttgggc agtgcacccg tacctttggg 26040

agcgcgcgcc ctcgtcgtgt cgtgacgtca cccgttctgt tggcttataa tgcagggtgg 26100

ggccacctgc cggtaggtgt gcggtaggct tttctccgtc gcaggacgca gggttcgggc 26160

ctagggtagg ctctcctgaa tcgacaggcg ccggacctct ggtgagggga gggataagtg 26220

aggcgtcagt ttctttggtc ggttttatgt acctatcttc ttaagtagct gaagctccgg 26280

ttttgaacta tgcgctcggg gttggcgagt gtgttttgtg aagtttttta ggcacctttt 26340

gaaatgtaat catttgggtc aatatgtaat tttcagtgtt agactagtaa attgtccgct 26400

aaattctggc cgtttttggc ttttttgtta gacgtgttga caattaatca tcggcatagt 26460

atatcggcat agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac 26520

aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 26580

gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 26640

gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 26700

cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 26760

tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 26820

catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 26880

atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 26940

cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 27000

ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc 27060

tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 27120

ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 27180

ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 27240

acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 27300

tctgagggga tccgctgtaa gtctgcagaa attgatgatc tattaaacaa taaagatgtc 27360

cactaaaatg gaagtttttc ctgtcatact ttgttaagaa gggtgagaac agagtaccta 27420

cattttgaat ggaaggattg gagctacggg ggtgggggtg gggtgggatt agataaatgc 27480

ctgctcttta ctgaaggctc tttactattg ctttatgata atgtttcata gttggatatc 27540

ataatttaaa caagcaaaac caaattaagg gccagctcat tcctcccact catgatctat 27600

agatctatag atctctcgtg ggatcattgt ttttctcttg attcccactt tgtggttcta 27660

agtactgtgg tttccaaatg tgtcagtttc atagcctgaa gaacgagatc agcagcctct 27720

gttccacata cacttcattc tcagtattgt tttgccaagt tctaattcca tcagacctcg 27780

acctgcagcc cctagataac ttcgtataat gtatgctata cgaagttatg ctagtaacta 27840

taacggtcct aaggtagcga gctagctcca cgtggctttg tcccagactt cctttgtctt 27900

caacaacctt ctgcaagaaa accaagggcc tgaattttaa cttcctg 27947

<210> 6

<211> 25333

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный полинуклеотид

<400> 6

gcagagtcta agaaatcgct gtgtttagcc ctcgccctgg gcactgtcct cacgggagct 60

gctgtggctg ctgtcttgct ttggaagttc agtaagtgca gggagcctcg atcccaccat 120

gtgctcctgc agtccccagt gctctgagcc agaccctgct ctctgggcta ttgagacctc 180

tggaggccct ccgtgaggtt cctctcttac ataacgaggc tgtctctctt cccttctctt 240

gtttagctat gagattgaca catcatgggg aaagcattta gaatgtaccc agtgctttgg 300

ggtgcttggt gccacccagc actgtgagca caggttcttc taccttgggg ccacacccag 360

ttacctgtat ctcactgcac agcagtggct gttggggacc aggcccaccc ctccatgtcc 420

cacctcctgc aactgcagcc tgagccttcc catcagcctg gggtggtgca gacccatgtg 480

ccattgtgga tccttcaagt tacctgtgtg gcagagagga cgtgtgagtg ccgtccaaac 540

ccaaacactg agagggtcct tcccattgcc cccacggaag taaggtgccc cagtgctaat 600

tccacttata cttgctggtg gcaaggacac ttctcctcct tattaaagtg ggggattggc 660

tgggtgaggt ggctcacgcc tgttatccca gcactttaag aggccaaggc aggtggacca 720

cctgaggtca ggagtttgag accacaagcc tggccaacat gttgaaactc catctctact 780

aaaaatacaa aaattagtca ggcgtggtgg cgtgcacctg taatcccagc tacttaggag 840

gctggggcag gaggatcact tgaacccagg agttggaggt tgcagtgagc caagattgtg 900

cccctgcact ccagcctggg tgacagaatg agacttcatc tcaaaaacaa aacaaaacaa 960

aacacagtgg ggccaggagt tggaggctgc agcgagctac agtaatgcca cggtgttcct 1020

cactccatga ggctcattgc gtttctcagc ctgaagggca cctctcttct gttttctctg 1080

caagtgggca gcaagtgctc caactctggg atagagtgcg actcctcagg tacctgcatc 1140

aacccctcta actggtgtga tggcgtgtca cactgccccg gcggggagga cgagaatcgg 1200

tgtggtgagt cagccttgac cttgggaagg gactcctctg ctcaccttgg agacagcagc 1260

cgggtccagg ggcctttggg tgactgggcc tggcgtgcgt ccagtacgct gacacatgat 1320

gtcattgaat ccctgctcca ggctgagccc tggggctcag agaggttgtg tttccggccc 1380

aacctcaccc agcaggtggg agatgacagg gccaccgagg actgtgtcat tggaaccaca 1440

cgtgctctga actgccacag gaagtcagtt aagatgagca aactgtttat aaagttggag 1500

atgcaggcta ggaacggtgg ctcatgcctg taatcccagc actttgggag gccgaggcag 1560

atggatcacc tgaggtcagg agtttgagac cagcctgacc aatatggtga aaccttatct 1620

ccactaaaaa tacaaaaatt agccaagcgc ggtggcgggt gcctgtaatt ccagctattc 1680

aggaggctga ggcaggagaa tcacttgaac ctgggaggcg gaggttgcag tgagctgaga 1740

tcacgccact gcattccagc ctgggagaca gagctggctc aaaaaataaa ttaattaatt 1800

aaaaacaaaa ttggagatgc actatgttat tttcaaaaca agctgccttt aaagatctat 1860

ctgttgtcac agggtgggct catctgtttc attttatttt ctgtggttta tctatttatt 1920

cattttaatg aactaggaag cattgctcct atttatggca taccacatga tgtttggata 1980

cgtgtatgcc tgtggcatgg ctaagtcaag ctagaacatg ggccttacct catatacgtg 2040

tcttattaag aacacataaa acctactctt gtagtgattt tcaaatatgc aacatatagt 2100

ttattaactg cagtcactat gatgtacaat agattgctcg aacttattcc tcctgtctaa 2160

ctaagatttt gtgacctctg accaacatct ccccagtgtt gtcacccccc gcccccagcc 2220

tctgatagct gcctttctac tctctgcttc tgtgagtttg atgtttatac attccacatg 2280

taagtggcct catgcagtgt ttctgtctct gtgtctggct tgttcactta gcgtaatgtc 2340

ctccagcttc atctatgttg ttggaaatga caggatttcc ttctttcttg tggctgaata 2400

gtattgcctt gtgcatatac accacatttt ctttatccct tcattcactg atggactctt 2460

aggttgatgt catgtcttgg ctgttgtgaa aaatgccgca gtgagcgtgg gcgtgcaggt 2520

ccctcttcaa cacacggatt tcctttcctt tggatataaa cccagcagtg agattgctgg 2580

atcacatggc agttctgttt ctcacctttt gaggaaactc catactgttt tccataatgg 2640

ctgtagcaac ttccactccc acccccacgg tgcaaagtct ccatttctct tctacaacct 2700

caccaactcc tgttattttc catctttctg atagtagcca tttgaagagg tatgagatga 2760

tacctcattg tggttttcat ttgcattttt atttgtattt ttcatgaatt tttgagggtg 2820

atttcaaggg tagttagtga ctcgaacagg gaaacgatcc tgagtatgag ggttgtgcta 2880

atcatccccc tcctgccagc tgcgtacgga atggggctct gcagatggca gggagctggc 2940

tcgtttctct ttaagagctg ccttttactt ttcttcctct tcctttaaaa cttatttcct 3000

ggccggacgc agtggctcat gcctgtaatc ccagcacttt gggaggccga ggtgggcgga 3060

tcacgaggtc aggaattcca gaccagcctg gccaacatgg tgaaaccccg tctctactaa 3120

aaatacaaaa attagccaga cgtggtggtg cgggcctata gtcccagcta ctcgggaggc 3180

tgaggcagga gaatcacttg aacctgggag gagggggttg cagtgagccg agattgcgcc 3240

actgcactcc agcctgggcg acagagccag actccatctc aaaaaacaaa aaaaagttat 3300

ttcccaagca cagccatgta ttccaggctt gtggatcagc gttggtggtg gtgtgtgctc 3360

tcatatctta gttccagcta agcacactct gacatgttta cactagaacc atttgttttt 3420

tctagaaata gaaatttcag aattgtagag tcagaggact taccagaaat ctcttaggta 3480

gttctcctcc cctccctcaa gtgcagtcct aacctcctgg agttttctgt agaaaccaca 3540

agcctcagag ctggccgaga attctagcca aagatttttc catgccaaag taatcccccc 3600

tctcctaagg gccatccttg gtggggactg gtttcctgtt aagccctcgc tgtcagtcct 3660

ggctgtggaa tttcctggtg aggagcactg gcccgtggag ctcggccctc gtgccggcct 3720

tgagcaggcc caagtgttcc gtgttcttga tacctttcct ccagcacagt cttgcttccc 3780

agaaaaaggt ttgcacttga aaatgatgca tttgctgatt aaacatagtt cttttgcttt 3840

atttggtttc taaaataaag tgggagtttt tgagattgag taacgtgagg ttaagatagc 3900

acgtggaatg gctttttctt ttctttctat tttttttttt tttttcctgg agacagggtt 3960

tcactctgtt gcccaggctg gagtgcagag gcatgaccat ggctcactgc aacttcgatg 4020

tcctggggtt aagcgatccc ccagcctcag ccccccaagt ggctgggact acaggtgctc 4080

gccaccacac ctggctaatt tttgtatttt ttgtagaaaa tgggtttcat caatgttgtc 4140

cagactggtc tcgaactcct gacctcaagc aattctcctg cctcagcctc ccagactgct 4200

gggattacag gcgtgaacta ccacgcctgg cctggaatgg cttttgatgt tctcctatgt 4260

gcacatgtgg gtgaataaac accaacaaag tccttatgtt acctgaagag ttgctctctt 4320

cttaatattt aagtcgtatt tatttaaata ctttaatagt tgtacactat taaagtatta 4380

ttaggtcaaa atcaaggaag tacaaaaggg tatgctgtga aaaatctctt cttccttgct 4440

ctgcttactt acctaccccg catcccccca tacaccccag acacacacac acacacacac 4500

acacacacac acacacgcat cactcccata catgcccacc tgtttaccag ccaatcacat 4560

ttcttggggc aactcatctg agttgcttct ctttccagag agtttttgca taaagaagca 4620

caggtatttc tgcgttacca tgaccctatt tcccagtggt tcctagccag ttgactctcc 4680

tgcactggat accatcctgg acagcattcc ttagggaaat gagccccctg ttttttccca 4740

ccatggcaca gttggtcctt tgcatggacg caccattatt gcccctgtct cttcttggtg 4800

gaccttaagg ttttctccat ccttttgctg taacacacac tgctccaagt gtgtgagcat 4860

atcagtagga aacgcttcca ggagtagaac tgctaggtca gagggcgtgt ggatctgtaa 4920

cctgacagac ctagaccggc ttcagtttgg ttttatccag tttccatatt gattattcat 4980

ataaaaggaa acagacaaac ataacgctgt gcatgtattc tctcttagac cagaacaggc 5040

atagggtgca cttttaattt gtccatttcg tagagtagaa attgtttttg ctgaaatgaa 5100

caccttagga tgctgaagaa tatgacccgt cccatggaaa acattcaaaa atgtgtgtag 5160

cgctttcttc ccaagggtgt gtgtgcgcat attttaacac taattcactt tctacttccg 5220

ttgctatcct ttctgtgagt ctttctcaga atctcagaaa agaaactaaa ttgttcactc 5280

tagttatcaa tgctgtactc tatacctgga atttgctaaa agggcagatt ttaagtattc 5340

tcaccacaga aaagagaaaa gaaaatggta attatgtgac gtggtggaca tgttaactag 5400

ctttattatg gtgagcattt cacagcggat atccagtcat cacgctgtac acattaaaca 5460

tgtacaattg ggtttttttg agacaaggtc tccttctgtc acccagtctg gagtgcagtg 5520

gctcagtcat ggctcattgc agcctcgacc tcctgggctc aatccatcct tccccctcag 5580

cctcctgaaa agctggggcc acaggcatgt accatcatgc caggctaatg catatatatt 5640

tatatttttt ggtggagatg gggttggtct cgaactctgg gctcaagtga tcctcccgcc 5700

ttgcccttcc aaagtgctga gattacaggc atgaaccaca gcaccaggcc tacatgtaaa 5760

atttttattt gtcaactata ctttgacaaa gctgagaaaa aaaatcctaa tatttaaaaa 5820

aaaaaaaaaa aggactagct tgagaccttt tccagctctc tggcttatca gctgccgtct 5880

cttccgggtg cagatagctg gaagggaaag aaaatcccta aaattaccca caagccaaga 5940

atgaagtgtc tccctttgag ccacagtggc agttttgttt ttaatcatag aagtgtattt 6000

tgagccgggt gtgctggctc acgcctgtaa tccccgcact ttgggaggcc gaggtggggg 6060

gcggaggggg tggggatcgc ctgaggtcag gagttcgaga ccagcctgac caacatggag 6120

aaaccccgtc tctactaaaa atacaaaatt agccggcgtg gtggtgcatg cctgtaatcc 6180

cagctactca tgaggctgag tcaggagaat ctcttgaacc caggaggtgg aggttgcggt 6240

gagctgagat catgccattg cactccagcc tgggaacaag aaaaaaaaag aagaagaaga 6300

agaagtgtat tcatttcagt tacttttaaa aaagtgaaca gactttatat tttagagcgg 6360

ttttaggttt acagaaaatg aaacagacag ggcagcgagc tccttgtact cctccccagc 6420

acacagttgc cctgttatga acatcccaca tcagtgctgt gcgttcatta acaccgatga 6480

acctgatgca tacattatga tgaactgaag tcctggactt caccctttct cttgtacagt 6540

tctgtgggat ttgacaaatg cataatgctg tacagccaca atgatagtat cgtccagagt 6600

agttctcctg ccttaaaacc tcttttgctg cacctgtttc tctctcccca ctcaccccag 6660

ctatctgatc ttcttagtgc ctccgaagtt ttggtctttt caggatgttg tagcgttgga 6720

atcatggagt atgtagcctt caccacatac accttccttc actttgttgg cttcctttac 6780

ttagtaatat gcattcaagt ttcctccatg ccttttcatg gcttgatagc tcatttcttt 6840

ttagcaccaa ataatattcc gttgtccaga tgtagcacaa tgtttatcca ttcatgtaac 6900

ctgtgaccga ctcacagata ggatgtggaa tcactcacca cagaggcatt agacaataat 6960

cagacccaag tcatttcatg ggggaacaag cccacaggta ccagactgtc cagtgagtca 7020

gggccactcg taggaagtaa gaagagaggc tagagcatag ccaggtcctc actttatact 7080

ttaagcccat gtgtatttct cccaaaccac acagcattgt ttccatgctt tcagctttgc 7140

atgaataacg tgatacttga acgcatcatt tatcacttgc tctctttccc acagcgctgt 7200

tttcaagctt cttcctgttc atgatgctct gcttaaccct taagctgcat gggattctgt 7260

tctgtgaata cgcccacccc atgtattatc ctgcccagca aaaagtcccc aaaactctgg 7320

atggtggtta cctctaggga gggagagaag agattgggaa tagggagcga cttcaacggt 7380

gtttgtaatg ttttgtttct ttaaataaaa gagctgagat catttcagca gaatgttgat 7440

ttagagtctc ctggacaatt tgttgctcaa agtgctctct taaagagcac tttaaaaaaa 7500

aaaacctttt atcttattat ttatttattt atttattgag acggagtttt gctctgtcac 7560

ccaggctgga gtggagtggt gtgatctcag ctcactgcaa cctttacctc ctgggttcaa 7620

gcaattcccc tgcctcagcc tcccaagtag gtgggattac agatgcgtgc caccacactt 7680

ggctaatttt tgcattttag tagagatcgg tttctccatg ttggccaggc tgatctcaaa 7740

cgcctgacct caggtgatct gcccgccttg gcctcccaaa gtgctggtat tacaggcgtg 7800

agctaccatg cctggcttat cttatatatt tttaaaaaca gcttattgag atctaattta 7860

tgtaccataa aattcaagta tataattcag tgcttttata tataaaacat atatatgaaa 7920

tagcttattg agatataatt ttttatataa aacagcttat tgatatgtaa tgtatgtacc 7980

ataaaattta aatatataat tcactggctt ttatatattc acgaatatgt gcaactatca 8040

ccacagtcaa ttttagcata ttttcatcag ctcataaaga aaccccaagc ccttgaacta 8100

tcaccccata tccctcctcc cagcccgtcc ctcctactca taagcaacca ctaatctact 8160

tagtgtctat agatttccta ctctaggcat tccatgtgag cgggatcatg caatacgtgg 8220

gctcacacaa tataagtggc attccatgtg agtcggctca tgcagtatgt ccggctcctt 8280

tcactgagca taaggtcttc agcactcatc caggttgcag cctgtgtctg aatttcattc 8340

cctcttctgg ctgaatcgta ttccattgtg tatcttggac atatcctatt ctgctcaccc 8400

agccgttggt gggcgtttgg agtgttttcg cctttcagct gttttaagag ggttgcagtg 8460

aacatttgta caagttttgg acccaatgcc tgttttcaat tctcttgtgt agagagcact 8520

ttttagcaga aaaagaatag atttgtggcc tccctttgtg tgcggtcagt gccttgagaa 8580

gagtgaactg tgctgccacc tccggagccg tggagagcgc ggggcttggg tagcagctag 8640

gacgatacaa gttgggacaa ggccaggtgc aatggctcac gcctgtaatt ccaacacttt 8700

gggagaccga ggcaggggga tcacctgagg tcaggagttc aagaccagcc tggccaacat 8760

ggtgaaaccc catctctaat aaaacagaaa aattaactgg acggggtggt ggacgcctgt 8820

aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggcggaggct 8880

gcagtgagtg gagatcagac cactgcactt cagcctaggt gacagagcga gactccgtct 8940

caaaaaaaag aaaaaaaaag aaagaaactc atggataatc ctccctctcg tgcagttcgc 9000

ctctacggac caaacttcat ccttcaggtg tactcatctc agaggaagtc ctggcaccct 9060

gtgtgccaag acgactggaa cgagaactac gggcgggcgg cctgcaggga catgggctat 9120

aagtgagtat ggggcagcac ccgccgagtg acagtaacag acagcagaaa cacgagaaga 9180

ccctctctct gcctccctgt gaaagcaccg gcacatgagt gctggggaca attgtcacct 9240

tccaaaagct gagccctata accagcaggt ggaatttgtc ctgctagggc tgtgcccagc 9300

acacagacct tggctcactg ccaccttgcc ctgcctcctc cttggcctct atagactcct 9360

ggttgctcgg gagtgcccag tgctgtggtc atctggtcag aggggtaggc tgagggcgtt 9420

aggtgcctct ttttccaagg tgcctctcag ccagggtcca ttcacctccc tgggtagagg 9480

ttggaccaga acagctggcg aggagggttg ggctggggag agcagcagag acaaatcctg 9540

tgccagtttc acttcattcg ggagccatgg aagccttttg agctggggag agaatcaatc 9600

aatcagactg atacttaaaa aatgtcattc ctgctcgtag ctctgaggga aggtgggaag 9660

gcttaacagg gtgtgtgtcg cctgacagtg attcctaacg ggggtggggc ggtggttacc 9720

atttaccagc actgcctggg gagatgcggc agccctcagg catcggggga gagggtggta 9780

ggatgctact gccactttgt tttccatggg agggtcccca ggtgatttct atgcaacttt 9840

agggtattca atatgccagt tttcagaatg aattaccact cggtgagaaa gttggcatct 9900

tagctagtca ctgtgacatc cctaaacagc aggggtgaat tacacagcaa agccccccca 9960

tcacagtcca ggaacctggt ggaattgata actggggcca tgttaacatc tgtacctttt 10020

attagattaa atgtgtgtat gattatacaa tcctatgtcc ttctcatagt ttcttgatcc 10080

taacctggat aagaaacacg accaatgaag gaattttgtc tgacacttta gggttattga 10140

atcgaaaaat cgttacaata ttctagcact tggttagaac gtgtgatttt ttttcctaaa 10200

tgctaaggtt tttccctctt attctgaatg tcgtatgagc ggtattatga catagtatag 10260

gatttgtgtt tgcttatgcc ttaaccatta tcacaaataa ggttttcttt tttaggaata 10320

atttttactc tagccaagga atagtggatg acagcggatc caccagcttt atgaaactga 10380

acacaagtgc cggcaatgtc gatatctata aaaaactgta ccacaggtat gcagcaattt 10440

cttcttgaaa aattttggaa tgaaatcaac taggagacac catggggaat cgttgtcctg 10500

agtctgattt ctctgagctg caatactcgg tctggatggg ttttgcattg ggaggagatt 10560

agagtctgac caggcctggt tactctaagc agcccttggt ttattcatag gaagtggctg 10620

aggtttctct gctatttcat tttcagcctc taccgtctgc ccttgttggt agcggctcac 10680

acttgcaaca tcgacattca actctattta gttttctttc ctcttcagac atttagaggt 10740

gtacctattt tgtcagggcg tggttctagg aatccaagat aatgtctcag tgtcccagcc 10800

agggtgaccg gctcattcca gtttgccagg gacttcactg gcttgagcaa gggaagtcct 10860

gctccattcc aggcagctgg gctggctggt cccgttagcc ccaaccccgg gacagcagtg 10920

ccagagggtg ctctgtgagg gatgggcagc attctggcgg cctgggaatg agttgtggtg 10980

tttccagggg gtagaagtgg gtacaagcca caggtcacat gatgagtggc tgacctggct 11040

gggagggcag aagaggggat ggacttaggc tcttcctttt gctttgcaca tatttaggat 11100

gtttgcagac ttgctatgat tgttgctgtt atgtgttttc tgatgtgaaa gatacacagt 11160

gtcctttgcc catgagctct ccttgcctcc caggtcccca gggcttatgc ctggtgtcta 11220

ggcatcacct ccctgcctgc caggtgccag gtgctgcatt tcgggggagg atgaactaat 11280

caccccgcgc cacctttcct ctgagtggga gcctggggca ggtttgcatt cctggaggcc 11340

gctggtggag gggtctgggg gcctgacttc cactgcagcc tgctgtcctg gggaatgtgg 11400

cagggcaagc ccagtgggga gggctgtgca cggccaggtg cacccatcaa aacagcaggg 11460

ctgcggtttg tccctgtgga gaagctaaac acagctgcct gggcactttg taaatgctga 11520

gtggttcttt gtctttctgg gttacacacg gaatcaggga gccaagtcca gccgggcagg 11580

gacgggggga ggggaggagg tgctgccgtc ccttggcaag agccttggga actcacaagg 11640

aggctggagg gcttggaaga aagaagagaa ggccattgtc tggtaggctc tattctatct 11700

cggtggtggt ggtgggggga ggcgcacttc ttttcctctt tctgtgcagc agttgccctt 11760

tgatgcctga gttcttggct tgttttctgt cgggcttctg tgaataacca catgtgccct 11820

ggcgctgtga ccacacaggg ctatccctac cgaccttagg attcttagga aatgtcttct 11880

cttaaagggg acatgtcttc acttggccgt gtcagtgccc cagagccaga gtccacctgg 11940

aatgcacctg tagtcactga gaacccgggg ggtgtgcctt agtaagaagg tgtcaggaag 12000

gacctattat tgtagggcct gggctcctgc aaggtggttt gggggtggtt ggaggaagca 12060

gagatttgct ctggattgga tgctgtcagg aagcaggggt aattctgtga ggctgcttta 12120

ttattttttt tctaggagga ggttggaatg aggctaggct aaagctgtga ttggtaaaga 12180

aacgtccgtc gctcaagtta gccaggacag gaggagacat cagatcgtga ttttgtggtt 12240

gtgagcacaa ggttcctgtt ctgtctgttc agacatcatt tcggaggagg ctccttgtgt 12300

cttgccccat ctcaggcatg gaggggccta gtccgatatt gacgctcagt gaaataattc 12360

aggttccgca gagcacacgg cccagctatc agggcgggcc agctctgcat gccaggggcc 12420

gcgtcttccc ttctcagcat agcctgggaa attcactgca ggacaaaatg catcagttac 12480

ttcctcttca tccataacct gggatgtttg actcccaaat gagtaactct tacgtttctt 12540

ctaatcctag ggaaactatt ggttatattg ctttcaacac tacaaattta aagcagttat 12600

aggagcccag aggtttccaa atggcttcct taaaaattag aagatgattt taaattccaa 12660

gaggaaaaac aaaactagca ttattgtata cttaccctca caaccgtcct aggagctggt 12720

acaattttaa gagaggttaa gtaacttgcc caaggtcaca ctgtggggat gtgagccgcg 12780

taccttggct cagtgtctgg tctttgccac tgtccctata tggatttact taccttattg 12840

gagttgtaac tagcagaccc ttctatgtct cagaagacag gagagggaac atcggaagaa 12900

atgactgatt tctaagcatg tgagaggcag gtgactccgc actatcgtga ccagaatttc 12960

ccctgttctt tttgcagtga tgcctgttct tcaaaagcag tggtttcttt acgctgtata 13020

ggtaagttca tctggagtcc cccttttgat acttctaact aggaaaagct ctctactttc 13080

agaacagtac tccctgtgtc tctgggggcg tgggagggaa gaaggtgggg tcacgggttg 13140

gaatgtgccc agcggcgtct cgctctttcc aaggagctcc tggtttagat ttccatggcc 13200

tgtagacacc ttcagccttg ggtccaaggg acaccccctg agatcaggca cgctcaagaa 13260

gctgacaaag ccctacactt tatgccaccc atgagctgga ggcccggcag gtctctttct 13320

ccagaaagca aaggggggtg gcgttagtga gccctggcag ccacctaacg tggacttgga 13380

gcatctgcgg ggctgtggtc cagcaccacc gtgtggccac caggtgctca tcagccagtg 13440

ggacccggga ggagggacaa gaccagagaa caacagtgct cttgcctctt ctctcctgaa 13500

ttttggacgg tggcttagac ttgggtgtcc ccatctctgt gtttagagtg cttacagttt 13560

ccaaactgtt tgcaaatgtg gaagccaccg tccctctcct ctgggatggc ccagtgctgt 13620

cgtggggccg tggtcctgag ctcagctttt catttgaaga ggtggaagga gctgacaccg 13680

tcccatcccg gcagggctgg ctcaggtctt ctttaggtcc tgagtggggg tccagcacag 13740

ccccaagggt gcgtggcacc cgccctgccc tctgcccatg cactcatctc ctggtggaga 13800

agacactcac acacaggaag cagggaaggc agcagacctc actcacccct caccccctca 13860

ctcaccccct actcaccccc tcaacctctc attcaccacc caccccctcg ccccctcact 13920

caccccctca ctccctcaac cctcactcac ctcctcactc cctcaaccct cactcacctc 13980

ctcacctcct cactctcccc ctcatccctc cctcacccca ccccgtcacc tcctcactca 14040

cctcctcacc ccctcactca cccttcaccc cctcactcac cacctcacct cctcactcac 14100

cccctactca acccctcatt cacccctcac cccctcactc acccctgcac cccctcactc 14160

accccttcat ccactcaccc acctgctcac ctcctcactc aacccctcac cccctcacta 14220

atccctcact ccctcacccc ctcacgccct cactcacacc ttcacctcct cactcacccc 14280

ctcaccccct caacccctta cttaccccct cactcatccc ttcacccctc actcaccccc 14340

tctctcaccc attcaccccc tcactcatgc cttcaccccc tcactcacct cctcactcac 14400

accttcaccc ctcagtcacc ccctcactca ccccttcacc ccctcaatca tgccttcact 14460

ccctcactca ccccttcacc ctctgaatta ctccctcatc ccctcactca ccccctcact 14520

caccccttca ccccctcacc caccacctca cccacccctc acccaccccc tcacctcctt 14580

acccctcacc cccctcactc acccctcacc ccctcactca ccacctcacc cacccctcac 14640

ccaccccctc actcactccc tcatcccctc actcaccccc tcaccccctc actcaccccc 14700

tcacccaccc ctcacccacc ccctcacccc ctcactcacc ccttcacccc ctcactcacc 14760

ccctcactca ccccttcacc ccctcactca ccacctcacc cacccctcac ccaccccctc 14820

actcactccc tcaccccctc actcaccccc tcaccccctc actcaccccc tcatctcctc 14880

actcaccccc tcacctcctc actcacccgc tcacctcctc actcaccccc tcgccccctc 14940

actcacccct caccccctca ccccctcact cacccctcac cccctcgccc cctcactcac 15000

cccctcgccc cctcactcac ccctcacccc ctcaccccct cactcatccc ctcacctcct 15060

cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15120

cacccacccc ctcactcact ccctcacccc ctcaccccct cactcacccc ctcacctcct 15180

cactcacccc ctcacctcct cacccacccc ctcactcact ccctcacccc ctcaccccct 15240

cactcacccc ctcacctcct cactcacccc ctcacctcct cactcacccc ctcacctcct 15300

cactcatgcc ctcaccccct cactcaccct ttcacctcct tgctcatccc ctcacttacc 15360

ccctcacttc gtcaatcacc cccccacctc gtcaatcacc ccctcacctt ttcactcacc 15420

ccctcactca cccccttact tcctcactta cctcctcacc ccccactcac cccctcaccc 15480

cccactcacc ccctcacccc acactcaccc cctcaccccc cactcacccc ctcacccctc 15540

tcacctcctc actcaccccc tcacctcctc acttatcccc tcaccccctc aattaccccc 15600

tcaccccctc aattactccc tcatcctttc aattacccac tcaccccctc acctcctcac 15660

tcctcactca ctccctcact caccccttca ccttctcact cacctcctcg tctcctcacc 15720

ccctcactca cttccagccc tgcccctccc atcttccttt tctttgtgtg agaatctggg 15780

gtccctgagt ggtgtcagtc cctccaagac tcaaggagtc cccagggcct tgttatccag 15840

aacaccccca cctgggtccc gggagacccc atgggatcac aggagtgttc agggaagtgg 15900

tgcttcctgg gtctgggtgg gctggagggg catcctccct tccccaagag gagaccccca 15960

ggagccccct aagtccatcc ccagcagtgg tgcccctgcc ctgtccttgc agcctgggag 16020

acccttggga ggggcgggcg ctgggtggct gggcggcttc tgctggtctc accccactgg 16080

cctcctgttt gtcatcctca gcctgcgggg tcaacttgaa ctcaagccgc cagagcagga 16140

ttgtgggcgg cgagagcgcg ctcccggggg cctggccctg gcaggtcagc ctgcacgtcc 16200

agaacgtcca cgtgtgcgga ggctccatca tcacccccga gtggatcgtg acagccgccc 16260

actgcgtgga aaagtatgcc aggggcggcg cgggccgggt gggggctcag ggctggccta 16320

cagccaccct gtgaccttga gcaggtctca acccttgcag ccccggcatc cttgtgttta 16380

aatggggaga gtattgcacc tgcttcctag ggctgtgaga catcaagtgc gctcatgcca 16440

ggcagtgcat ggctgtatgc actgagtgtc ccctgcacgc agggcacagg gtgcaggtgg 16500

aacattctcc acgatgtcgc cgtgaccagc gttccttcca gccactgtcc tctgagctct 16560

gtcctgccct tgagcaaagc ccctgccccc tgaggtatcc tgtctccggg acgctagtcc 16620

caggagaggg cacactcaga caggcttcag gctgccctgc tggaaggtcc ctggggttaa 16680

gcgttcttgg ccacagcatt gctcatgcag agggttaggt aggggtgagg ctagccgtga 16740

cagtattagc atttatggac gctaccaccc cctccccttt tccttaaaca catagtgctt 16800

ttggtcacat gctgctttgg aggaggcctc acttggcgga tgtatttttc tgccttagag 16860

agaggctgaa ctgggtttga ctgttggccc agccctctct tgctgcgtgc ccttagacga 16920

ttcactcaac gtctctgatc catggcatgt acaactataa gatgggcatg cccttctcct 16980

ctcgggctgt tatgaaggtc aaggaagcaa gggctgttac ccaagggtgc tcccttctct 17040

ccccctcttc acacccccag gtgctctggg ccctctagga actgggtttc tctcaagggc 17100

tgttacccaa gggtgctccc ttctctcccc ctcttcacac cactgggtgc tctgggccca 17160

ctaggagctg ggattctctt aagagggaaa ctcttggata aaggaaatgg tttgattgat 17220

atcggacaag tctgttcatt agtatccatt tattaagcac ctaccatgtg ccaggaaatg 17280

ctttggcgta caaaggaaaa taagggccag tcctgctaga aatggccttg aaaccccagg 17340

gagggatgtc ggcccattgt gggtgctgca gattccttga aggtgatgca agagccagaa 17400

agaaggatga tgtggggggc tgaggcaggg agtcggggtt gggggagtgt gggggagaag 17460

gggagaccga gcacctcttc cactatctcc ctgtgtggtt tttggtgaac catcctgcct 17520

ctgggtgtct tgcctccagc ttctgacgtt ggaagttcat ccactgagag ctctgtgttt 17580

atggctctga gatactgagt ccttcttctc tcccagacct cttaacaatc catggcattg 17640

gacggcattt gcggggattt tgagacaatc tttcatgttc tatggagccg gataccaagt 17700

agaaaaagtg atttctcatc caaattatga ctccaagacc aagaacaatg acattgcgct 17760

gatgaagctg cagaagcctc tgactttcaa cggtacgtgt ggctcaggct tggcaagcag 17820

gttggcagaa tcttaaagag atgttgattg gaaatgacac ttgtgctatg ccaaatggaa 17880

gggaggcatt tgcgttgagc gagggtagcg tgcagcgggt ggccaatggg agaggctcac 17940

agaggctaag agcacctgcc gcattttggg ggaggcagca gccaccacat ctgttctgta 18000

ctgtactgag tggtggtgat tcaagccagg catggaaaag gctagaacag ggctttccca 18060

ctgcagcacc cttgacatct gggtggttct ctgttgtagg gctctcttgt gccttgtagg 18120

atgtttaaca gcgtccccag cctctaccca ctggaggcca gtagctacca agctgtgaca 18180

accagtgttg cctgctgaca ttgccaaaca tccgctttga ggcaaagtca cttccagttg 18240

agaactactg gcctaaaatg tgtaaagatc cttgattttt aaagatacat tctaaaacca 18300

agttgcttaa ttcaggacaa acatgctttc tcttagcctc ttattcggtc ccactctggt 18360

ccatccaagg gtctggaatg ttctagcccc atgtggatac agaagaagca aaacctcagc 18420

cctccctaca gcatgtctgt attcacattg ggaaatggtt cacatataga agagcgaatg 18480

cctgagcaat ggcgtggtgc ctctggggcg aaagctgact ccattgactc catcggcttt 18540

ttggctgttg cctcctgtgt gtctttcccg tcttgatcac ctggagatat gtaattttgg 18600

aagcagagct agcaaataat tcctcttata agcagagcta gcaaataatt ctacttataa 18660

gtagcataac gtcttgcctg ccagaaggag aggtctggca gggggagaaa gtgagaatgt 18720

gggacttgtt gggatgcagg gtcctctggg cagggtggcc agggtgccag gcccagcagc 18780

ctgcatgtgg gaaggccagg tggagacata ggtgataccc gcctggctca ctgtgttttc 18840

tcttcttgaa acagacctag tgaaaccagt gtgtctgccc aacccaggca tgatgctgca 18900

gccagaacag ctctgctgga tttccgggtg gggggccacc gaggagaaag gtgaggctgc 18960

tcctgggcac acaggactgc agggcccaca gatggagcat tgggttcgga agtgggaggt 19020

ccaggtttta atcccagttc tactactcaa tgactggatg actttggttg attcccccag 19080

tccttgtgcc tcagtttctc catctgctaa gtgggagaaa tcctgcccag cctacctaat 19140

acactgtgtt cttatcgtga tcacacagag cagcatgtgg aatggctttt gaagtatctg 19200

ggccatacga gtttagaggt gcaggatctc ctgtgttgca ctcattgtga gtttagagct 19260

gccctggaga tcccaccaag gcctgcgtgg ctgagtgaca gggggcttgg tgaggacggg 19320

catcctggac ccatggtggc cacatctaag cctgtcctct gccctgataa ccacagagag 19380

aggctctctc cacccacttc ctttgcaatc tgcatttctc tctgacagtc tttcaaatga 19440

agggagcctg gctgcttcat ttttatggag ggttggaagt gcttagtggc aggcacaaag 19500

gttcatttta catattgttt atatccttct caaaagcgtc taggccatac agacaacaaa 19560

tcctttcaaa caaggggaaa agtacaaagg ttgggtgatt tctggggagc gtcagggaag 19620

gtagtggggg gcatcctggc tcctcatcag cagaaactta ctacagtaga gccacaggct 19680

gggcaaaaga cctcatggaa tccaagatga agggaatatc gacaaatatt tgtgcgcacc 19740

tgcacctagt acaggctggg tgctactcag gtgctgggaa tgcagaagtg aacagagtaa 19800

gacaaatgtc tctgctgtca ggagctttac ctctcttctg gatgtcggtg gtggggacgg 19860

ggcaggtgtg gtcagacaga tgggagacaa acaactgagc gaggtacttc caaacatctg 19920

agggtgggga tcacaaggtc ccggctattt tgaaggggtg gtcaggaaag gcttctcgga 19980

agaggtggca tttgagctga gactcaaatg gcaaaaatgt gtacacatca aaaaggctag 20040

tgcatgtatc ttcaggtgtg gtcaaggggc caaggaggtg ggctggggcc agattgcata 20100

ggtccttgtg gattatggtg aagacaccag cttctcatct gcttgaggtg gggagatcgt 20160

gagccgggga gtgccatgat ctggcagctg cgtggggagt ggggatgaat ggatggagac 20220

gaggatgatg gtgacaagtc cattgctgtg gttccttgag acaggaagcc agctcatagc 20280

agagtgcggg cgtggatgtg aagagatgag ggtacactag ggctagagcc accagactta 20340

ctgatgggtt gcatgtctgt gggagagaga gtgagaagtc agggacgatg gctttccact 20400

ctgtggctga agccccaggg tggcgggtgg tgccattttt caagccagga aatattggtt 20460

ggtgagaatt tggggtggga gaaggtgtga cggagggttc tggttttgca cactaagccc 20520

acggtgccca gaagatgccc gaggggaggc agcaaagcga gagtgggaaa tgcagaggtg 20580

gcaagtgcag gccgtgtctt gagaagctct aatgtgcagg ggagccgaga agcaggcggc 20640

ctagggaggg tcacgtgtgc tccagaagag tgtgtgcatg ccagagggga aacaggcgcc 20700

tgtgtgtcct gggtggggtt cagtgaggag tgggaaattg gttcagcaga accaagccgt 20760

tgggtgaata agagggggat tccatggcac tgatagagcc ctatagtttc agagctggga 20820

atttctttcc ctgaagctga actccagagc tgcattcagc acaggcaccg ccagttgtaa 20880

ggagaatcca ggtttcccag gagaggggtt ggtgctggga tgagctgacc ggggcagggc 20940

tggaaaatag ggctgtgacc atctgtgtag tgcgtgtgga ggtctcaggg agggaagtgt 21000

gctctccctg cgagagctgc aggcaacact gggagctcaa caagtctccc tgtccttagg 21060

gaagacctca gaagtgctga acgctgccaa ggtgcttctc attgagacac agagatgcaa 21120

cagcagatat gtctatgaca acctgatcac accagccatg atctgtgccg gcttcctgca 21180

ggggaacgtc gattcttgcc aggtaattca acatttttat tctacctttg gtccttacca 21240

gatcctactg aaccccccat gagagagagg gcattcttgg ggtcagcaga gcctcctcag 21300

tgacacggag ccagctcggg gcagtcatgg gaagtgacgg ccacaaacag tgcgaacgct 21360

tctggtggca gaaggaagta cagtcaacaa atcacacaca ccctctgaaa aaccggtatt 21420

tggtaaaagt gccagtggaa cagaaacaag tatttagact attttaaatt atgaacggca 21480

atttatttag taacttttag cttgaacaga ttaaaattca ggatgggggc tatctctttg 21540

ggggttacat ctctgttacc atcacccctt gatggtggag attcgaagcc cacacagtca 21600

ctcgtaactc acactgcgac ccccgccccc caactcctct aggcctggtc agtggtgtgc 21660

ggcagattgt gacttgattt tctgctctct gtaccttgct gtgtcccaca gggtgacagt 21720

ggagggcctc tggtcacttc gaagaacaat atctggtggc tgatagggga tacaagctgg 21780

ggttctggct gtgccaaagc ttacagacca ggagtgtacg ggaatgtgat ggtattcacg 21840

gactggattt atcgacaaat gagggtaact atcctgtcct ccttctgact gtgttctccg 21900

attcctcgag ccaaagccag acatctgtta ggcgtggttc tgctgctgga agctgactgg 21960

tgaccactgg tcagcatgaa gcaaactctg cttcctccag ccacagcccc atccccccag 22020

tgtccaccca ttgcccattg cctctcactg gcttcacttg catatttccc ctggtgtttg 22080

gatgaaaagc gctggggctc agcttgtgtg aaattccttg gtgctctgcc aaccacactt 22140

cgttctggct cagctgactc agctgttcca cccaggccac ctcacatcaa actttttttt 22200

tttttttttg agatggagtc tcactgtgtc gcccaggctg gagtgcagtg gcacaatctc 22260

gactcactgc aacctttgcc tcctgggttc aagtgattct cctgcctcag cctcccaagt 22320

agctgggact acaggcatgc gccaccacgc ccagctactt tttgtatttt tagtagagat 22380

ggggtttctc catgttggcc aggctggtct cgaagccctg acctcaggtg attcacccac 22440

ctcagcctcc cacagtgctg ggattacaag tgtgaaccac ggtgcccggc ctcacatgaa 22500

acttttgatt tatagagagc agagggaaga gccggctgtg cccatccttt tctggggcca 22560

tcgagtggct cctgggcagc ccccaaggtt aggaagggca ggagcagcca gggttctctg 22620

atgccccaga ctcaagcacg agggaaggtc tcaggggttc catgtgagcc tcatggatgt 22680

ctctgcttag cagagccctg gctttgggca ttgtccagat agggggtgag aaccagatct 22740

tctcatctcc aggacctcag acgtatagtt ttctcagatt tctgtgcttt ctggggctgg 22800

gctactagtg gaagaaagca gtctattctg tcttctccca aatctcccag atgcccagtc 22860

tgttgaagga ggagcagaac cagggggcct ttcccgctga ggcccgacct gtgtctcctt 22920

caaatgacac gcgggactca gggccttccc atgaccatgg ggcccagggg gcgtcacctg 22980

gcccagggcc cagtgctaga aacagatgac cccaggagga ggaggcaggg caggagggaa 23040

gctggcaggg ctgggatggt cagccaggct gaggggcgga ctcgcaccag gatggagcta 23100

ggaaatgatc caggtgtgtt tggcggctgc aggtgggtcc gcatggctgt gcagggaggg 23160

aagggctgcg tggcaggaga gcagccgggg gaggcccaga ctctgctgaa gagatgcctg 23220

ttgtgccggc ctccacatcc gctgcccgct ccttccggag ctcctgcccc gccatgctca 23280

gcctgactct gaccaacacg ttggagagaa gaatgatccc tttgtgctat taagcttgct 23340

tatttggttt ctaagtgctt catgcgaacc tagaggaaaa aattattttc cacctttgtt 23400

tgtcttaaga aaataacaca cttttttttt tcctatttga acaggcagac ggctaatcca 23460

catggtcttc gtccttgacg tcgttttaca agaaaacaat ggggctggtt ttgcttcccc 23520

gtgcatgatt tactcttaga gatgattcag aggtcacttc atttttatta aacagtgaac 23580

ttgtctggct ttggcactct ctgccattct gtgcaggctg cagtggctcc cctgcccagc 23640

ctgctctccc taaccccttg tccgcaaggg gtgatggccg gctggttgtg ggcactggcg 23700

gtcaagtgtg gaggagaggg gtggaggctg ccccattgag atcttcctgc tgagtccttt 23760

ccaggggcca attttggatg agcatggagc tgtcacctct cagctgctgg atgacttgag 23820

atgaaaaagg agagacatgg aaagggagac agccaggtgg cacctgcagc ggctgccctc 23880

tggggccact tggtagtgtc cccagcctac ctctccacaa ggggattttg ctgatgggtt 23940

cttagagcct tagcagccct ggatggtggc cagaaataaa gggaccagcc cttcatgggt 24000

ggtgacgtgg tagtcacttg taaggggaac agaaacattt ttgttcttat ggggtgagaa 24060

tatagacagt gcccttggtg cgagggaagc aattgaaaag gaacttgccc tgagcactcc 24120

tggtgcaggt ctccacctgc acattgggtg gggctcctgg gagggagact cagccttcct 24180

cctcatcctc cctgaccctg ctcctagcac cctggagagt gcacatgccc cttggtcctg 24240

gcagggcgcc aagtctggca ccatgttggc ctcttcaggc ctgctagtca ctggaaattg 24300

aggtccatgg gggaaatcaa ggatgctcag tttaaggtac actgtttcca tgttatgttt 24360

ctacacattg ctacctcagt gctcctggaa acttagcttt tgatgtctcc aagtagtcca 24420

ccttcattta actctttgaa actgtatcat ctttgccaag taagagtggt ggcctatttc 24480

agctgctttg acaaaatgac tggctcctga cttaacgttc tataaatgaa tgtgctgaag 24540

caaagtgccc atggtggcgg cgaagaagag aaagatgtgt tttgttttgg actctctgtg 24600

gtcccttcca atgctgtggg tttccaacca ggggaagggt cccttttgca ttgccaagtg 24660

ccataaccat gagcactact ctaccatggt tctgcctcct ggccaagcag gctggtttgc 24720

aagaatgaaa tgaatgattc tacagctagg acttaacctt gaaatggaaa gtcatgcaat 24780

cccatttgca ggatctgtct gtgcacatgc ctctgtagag agcagcattc ccagggacct 24840

tggaaacagt tggcactgta aggtgcttgc tccccaagac acatcctaaa aggtgttgta 24900

atggtgaaaa cgtcttcctt ctttattgcc ccttcttatt tatgtgaaca actgtttgtc 24960

tttttttgta tcttttttaa actgtaaagt tcaattgtga aaatgaatat catgcaaata 25020

aattatgcaa tttttttttc aaagtaacta ctgcatcttt gaagttctgc ctggtgagta 25080

ggaccagcct ccatttcctt ataagggggt gatgttgagg ctgctggtca gaggaccaaa 25140

ggtgaggcaa ggccagactt ggtgctcctg tggttctcga gataacttcg tataatgtat 25200

gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta gctccacgtg 25260

gctttgtccc agacttcctt tgtcttcaac aaccttctgc aagaaaacca agggcctgaa 25320

ttttaacttc ctg 25333

<210> 7

<211> 491

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный белок

<400> 7

Met Ala Leu Asn Ser Gly Ser Pro Pro Gly Ile Gly Pro Cys Tyr Glu

1 5 10 15

Asn His Gly Tyr Gln Ser Glu His Ile Cys Pro Pro Arg Pro Pro Val

20 25 30

Ala Pro Asn Gly Tyr Asn Leu Tyr Pro Ala Gln Tyr Tyr Pro Ser Pro

35 40 45

Val Pro Gln Tyr Ala Pro Arg Ile Thr Thr Gln Ala Ser Thr Ser Val

50 55 60

Ile His Thr His Pro Lys Ser Ser Gly Ala Leu Cys Thr Ser Lys Ser

65 70 75 80

Lys Lys Ser Leu Cys Leu Ala Leu Ala Leu Gly Thr Val Leu Thr Gly

85 90 95

Ala Ala Val Ala Ala Val Leu Leu Trp Lys Phe Met Gly Ser Lys Cys

100 105 110

Ser Asn Ser Gly Ile Glu Cys Asp Ser Ser Gly Thr Cys Ile Asn Pro

115 120 125

Ser Asn Trp Cys Asp Gly Val Ser His Cys Pro Gly Gly Glu Asp Glu

130 135 140

Asn Arg Cys Val Arg Leu Tyr Gly Pro Asn Phe Ile Leu Gln Val Tyr

145 150 155 160

Ser Ser Gln Arg Lys Ser Trp His Pro Val Cys Gln Asp Asp Trp Asn

165 170 175

Glu Asn Tyr Gly Arg Ala Ala Cys Arg Asp Met Gly Tyr Lys Asn Asn

180 185 190

Phe Tyr Ser Ser Gln Gly Ile Val Asp Asp Ser Gly Ser Thr Ser Phe

195 200 205

Met Lys Leu Asn Thr Ser Ala Gly Asn Val Asp Ile Tyr Lys Lys Leu

210 215 220

Tyr His Ser Asp Ala Cys Ser Ser Lys Ala Val Val Ser Leu Arg Cys

225 230 235 240

Ile Ala Cys Gly Val Asn Leu Asn Ser Ser Arg Gln Ser Arg Ile Val

245 250 255

Gly Gly Glu Ser Ala Leu Pro Gly Ala Trp Pro Trp Gln Val Ser Leu

260 265 270

His Val Gln Asn Val His Val Cys Gly Gly Ser Ile Ile Thr Pro Glu

275 280 285

Trp Ile Val Thr Ala Ala His Cys Val Glu Lys Pro Leu Asn Asn Pro

290 295 300

Trp His Trp Thr Ala Phe Ala Gly Ile Leu Arg Gln Ser Phe Met Phe

305 310 315 320

Tyr Gly Ala Gly Tyr Gln Val Glu Lys Val Ile Ser His Pro Asn Tyr

325 330 335

Asp Ser Lys Thr Lys Asn Asn Asp Ile Ala Leu Met Lys Leu Gln Lys

340 345 350

Pro Leu Thr Phe Asn Asp Leu Val Lys Pro Val Cys Leu Pro Asn Pro

355 360 365

Gly Met Met Leu Gln Pro Glu Gln Leu Cys Trp Ile Ser Gly Trp Gly

370 375 380

Ala Thr Glu Glu Lys Gly Lys Thr Ser Glu Val Leu Asn Ala Ala Lys

385 390 395 400

Val Leu Leu Ile Glu Thr Gln Arg Cys Asn Ser Arg Tyr Val Tyr Asp

405 410 415

Asn Leu Ile Thr Pro Ala Met Ile Cys Ala Gly Phe Leu Gln Gly Asn

420 425 430

Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Thr Ser Lys

435 440 445

Asn Asn Ile Trp Trp Leu Ile Gly Asp Thr Ser Trp Gly Ser Gly Cys

450 455 460

Ala Lys Ala Tyr Arg Pro Gly Val Tyr Gly Asn Val Met Val Phe Thr

465 470 475 480

Asp Trp Ile Tyr Arg Gln Met Arg Ala Asp Gly

485 490

<210> 8

<211> 2267

<212> ДНК

<213> Mus musculus

<400> 8

ccggttgtgt tataggactt gaccagcccc aatagtcctc aagtcactcc tagatacagt 60

ggcaggtggt agctggcttg cggaaggaag aggaagaaga gaatgtgggc catcaaggag 120

caaggccagc cttgcacttg ggccccctct gctcagtgct gaccagggct ttctgagccg 180

cttcctaatg aggctcattt gaagaccccc ccccaccccc ctcctgctgt cttgggtggc 240

agagctagct ccaggctgta agaaaattag gaggattacc aaagcagtat ggagtcagac 300

agtggccaac ccctcaacaa ccgtgatatt gttccctttc gcaaaccccg aaggccccag 360

gagaccttca aaaaggtggg gatccccatc attgcagtgc tgctgagcct gatagccctc 420

gtgattgtgg cccttctcat caaggtgatt ctggataaat actacttcat ctgcggcagt 480

cccctgacct tcattcagag gggccagttg tgtgacggcc accttgactg cgcctcaggg 540

gaggatgagg aacactgtgt caaggacttc cctgaaaagc ccggagtggc agtccggctc 600

tccaaggaca gatccaccct gcaggtgctg gatgcagcca cagggacctg ggcctcagtc 660

tgtttcgaca acttcacaga agcactggcc aagacagcct gcagacagat gggctatgac 720

agccagcccg ctttcagagc agtggagatc cgtccagatc agaacctccc tgttgctcaa 780

gtcacaggaa acagccagga acttcaggtg cagaatggaa gcagatcctg cctctcaggc 840

tccctggttt ccttgcgctg ccttgactgt ggaaagagcc tgaagactcc tcgtgtggtg 900

ggtggggtgg aggcccctgt ggattcttgg ccgtggcagg tcagcatcca gtacaacaag 960

cagcatgtct gtggtgggag catcctggat ccccactgga tcctcacagc agcccactgc 1020

ttcaggaagt atcttgatgt gtcaagctgg aaggtcaggg caggctcaaa catactgggt 1080

aactctccat ccttgcctgt ggccaagatc ttcatcgctg aacccaatcc tctgtacccc 1140

aaagagaagg acattgccct tgttaagctg cagatgccac tcacattctc aggctcagtc 1200

aggcccatct gcctgccctt ctctgatgag gtgcttgtcc cagccacacc agtctgggtc 1260

attggatggg gctttacaga agaaaacgga ggaaagatgt ctgacatgct actgcaggca 1320

tcagtccagg tcattgacag cacacggtgc aatgcagagg atgcctacga aggggaagtg 1380

accgctgaga tgctgtgtgc aggtacccca cagggtggca aggacacctg ccagggtgac 1440

agtggtgggc ctttgatgta ccattctgac aagtggcagg tagtaggcat cgtgagctgg 1500

ggccatggat gcggcggccc aagtactcct ggagtgtata ccaaggtcac tgcctatctc 1560

aactggatct acaatgttcg gaagtctgag atgtaacgct gccgtccccc acatccagaa 1620

gctgcttccc ttcagaccta cctacggcat gacccctcaa agtcagatat gggacaagag 1680

cctccttgaa caaactctgg tatccctgca gcaagcaagg atacattgca gaggtgcccg 1740

gagtggagtc agatgggcta gctcagccac ccctgcatct cccaaaccct gggagacatg 1800

tggcccatgg gagtaaatcc aggacattga ctcaactctc agaagtgtta ttcagtcaag 1860

gaggctctcc cttccactga aggaaggaaa gtcagctctc tcctgaaagg ccagatcact 1920

ggctgagtag atgagacaag ggtatgaaag gcctttgcca tcttctttgc ccagtcctga 1980

aagcactgac gtaagagacc agtcagttct aatgtaaggt gtatatttta gtgtcagggt 2040

attgcaattg tcacctctgt ggtcaatatc attaaacagg tatgagaatt cgctggcata 2100

gacttcctgg tctgcttaat aagaatccaa ctaaggatgt cacatgacag tttcccagaa 2160

aatgtgaaca agtgtccatc tgacacacgg caccaatgac aaaccaaaga agttattctg 2220

cctgagtctc agttgctgaa ctaataaatt agctgcggtt tcttgca 2267

<210> 9

<211> 435

<212> БЕЛОК

<213> Mus musculus

<400> 9

Met Glu Ser Asp Ser Gly Gln Pro Leu Asn Asn Arg Asp Ile Val Pro

1 5 10 15

Phe Arg Lys Pro Arg Arg Pro Gln Glu Thr Phe Lys Lys Val Gly Ile

20 25 30

Pro Ile Ile Ala Val Leu Leu Ser Leu Ile Ala Leu Val Ile Val Ala

35 40 45

Leu Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Ile Cys Gly Ser

50 55 60

Pro Leu Thr Phe Ile Gln Arg Gly Gln Leu Cys Asp Gly His Leu Asp

65 70 75 80

Cys Ala Ser Gly Glu Asp Glu Glu His Cys Val Lys Asp Phe Pro Glu

85 90 95

Lys Pro Gly Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr Leu Gln

100 105 110

Val Leu Asp Ala Ala Thr Gly Thr Trp Ala Ser Val Cys Phe Asp Asn

115 120 125

Phe Thr Glu Ala Leu Ala Lys Thr Ala Cys Arg Gln Met Gly Tyr Asp

130 135 140

Ser Gln Pro Ala Phe Arg Ala Val Glu Ile Arg Pro Asp Gln Asn Leu

145 150 155 160

Pro Val Ala Gln Val Thr Gly Asn Ser Gln Glu Leu Gln Val Gln Asn

165 170 175

Gly Ser Arg Ser Cys Leu Ser Gly Ser Leu Val Ser Leu Arg Cys Leu

180 185 190

Asp Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Gly Val Glu

195 200 205

Ala Pro Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr Asn Lys

210 215 220

Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Ile Leu Thr

225 230 235 240

Ala Ala His Cys Phe Arg Lys Tyr Leu Asp Val Ser Ser Trp Lys Val

245 250 255

Arg Ala Gly Ser Asn Ile Leu Gly Asn Ser Pro Ser Leu Pro Val Ala

260 265 270

Lys Ile Phe Ile Ala Glu Pro Asn Pro Leu Tyr Pro Lys Glu Lys Asp

275 280 285

Ile Ala Leu Val Lys Leu Gln Met Pro Leu Thr Phe Ser Gly Ser Val

290 295 300

Arg Pro Ile Cys Leu Pro Phe Ser Asp Glu Val Leu Val Pro Ala Thr

305 310 315 320

Pro Val Trp Val Ile Gly Trp Gly Phe Thr Glu Glu Asn Gly Gly Lys

325 330 335

Met Ser Asp Met Leu Leu Gln Ala Ser Val Gln Val Ile Asp Ser Thr

340 345 350

Arg Cys Asn Ala Glu Asp Ala Tyr Glu Gly Glu Val Thr Ala Glu Met

355 360 365

Leu Cys Ala Gly Thr Pro Gln Gly Gly Lys Asp Thr Cys Gln Gly Asp

370 375 380

Ser Gly Gly Pro Leu Met Tyr His Ser Asp Lys Trp Gln Val Val Gly

385 390 395 400

Ile Val Ser Trp Gly His Gly Cys Gly Gly Pro Ser Thr Pro Gly Val

405 410 415

Tyr Thr Lys Val Thr Ala Tyr Leu Asn Trp Ile Tyr Asn Val Arg Lys

420 425 430

Ser Glu Met

435

<210> 10

<211> 3543

<212> ДНК

<213> Homo sapiens

<400> 10

atcattccag tttggcaact tcacttgtag ggctgtttta atcaagctgc ccaaagtccc 60

ccaatcactc ctggaataca cagagagagg cagcagcttg ctcagcggac aaggatgctg 120

ggcgtgaggg accaaggcct gccctgcact cgggcctcct ccagccagtg ctgaccaggg 180

acttctgacc tgctggccag ccaggacctg tgtggggagg ccctcctgct gccttggggt 240

gacaatctca gctccaggct acagggagac cgggaggatc acagagccag catggatcct 300

gacagtgatc aacctctgaa cagcctcgat gtcaaacccc tgcgcaaacc ccgtatcccc 360

atggagacct tcagaaaggt ggggatcccc atcatcatag cactactgag cctggcgagt 420

atcatcattg tggttgtcct catcaaggtg attctggata aatactactt cctctgcggg 480

cagcctctcc acttcatccc gaggaagcag ctgtgtgacg gagagctgga ctgtcccttg 540

ggggaggacg aggagcactg tgtcaagagc ttccccgaag ggcctgcagt ggcagtccgc 600

ctctccaagg accgatccac actgcaggtg ctggactcgg ccacagggaa ctggttctct 660

gcctgtttcg acaacttcac agaagctctc gctgagacag cctgtaggca gatgggctac 720

agcagcaaac ccactttcag agctgtggag attggcccag accaggatct ggatgttgtt 780

gaaatcacag aaaacagcca ggagcttcgc atgcggaact caagtgggcc ctgtctctca 840

ggctccctgg tctccctgca ctgtcttgcc tgtgggaaga gcctgaagac cccccgtgtg 900

gtgggtgggg aggaggcctc tgtggattct tggccttggc aggtcagcat ccagtacgac 960

aaacagcacg tctgtggagg gagcatcctg gacccccact gggtcctcac ggcagcccac 1020

tgcttcagga aacataccga tgtgttcaac tggaaggtgc gggcaggctc agacaaactg 1080

ggcagcttcc catccctggc tgtggccaag atcatcatca ttgaattcaa ccccatgtac 1140

cccaaagaca atgacatcgc cctcatgaag ctgcagttcc cactcacttt ctcaggcaca 1200

gtcaggccca tctgtctgcc cttctttgat gaggagctca ctccagccac cccactctgg 1260

atcattggat ggggctttac gaagcagaat ggagggaaga tgtctgacat actgctgcag 1320

gcgtcagtcc aggtcattga cagcacacgg tgcaatgcag acgatgcgta ccagggggaa 1380

gtcaccgaga agatgatgtg tgcaggcatc ccggaagggg gtgtggacac ctgccagggt 1440

gacagtggtg ggcccctgat gtaccaatct gaccagtggc atgtggtggg catcgttagt 1500

tggggctatg gctgcggggg cccgagcacc ccaggagtat acaccaaggt ctcagcctat 1560

ctcaactgga tctacaatgt ctggaaggct gagctgtaat gctgctgccc ctttgcagtg 1620

ctgggagccg cttccttcct gccctgccca cctggggatc ccccaaagtc agacacagag 1680

caagagtccc cttgggtaca cccctctgcc cacagcctca gcatttcttg gagcagcaaa 1740

gggcctcaat tcctataaga gaccctcgca gcccagaggc gcccagagga agtcagcagc 1800

cctagctcgg ccacacttgg tgctcccagc atcccaggga gagacacagc ccactgaaca 1860

aggtctcagg ggtattgcta agccaagaag gaactttccc acactactga atggaagcag 1920

gctgtcttgt aaaagcccag atcactgtgg gctggagagg agaaggaaag ggtctgcgcc 1980

agccctgtcc gtcttcaccc atccccaagc ctactagagc aagaaaccag ttgtaatata 2040

aaatgcactg ccctactgtt ggtatgacta ccgttaccta ctgttgtcat tgttattaca 2100

gctatggcca ctattattaa agagctgtgt aacatctctg gcataggcta gctggaatgc 2160

ttgataagaa ctgagctggg atgattgaac tttcattctt tggcttgggg agaaaagaag 2220

tcctggggaa gcaattgagt ctcaaagtag aggcagggga aaaaagagtt agggagacca 2280

gatctgctga gtggcagcaa gagtgagctg cagattacag aaaccagggt gagcaagttt 2340

gagtcccaca cagggccttc tccctttgcc tctttccctc cctccctgcc tgtgataatc 2400

agccaggagc cagggataac ctatgacttg ggaaagagat gagttaggca gtcaagggtg 2460

acattcaatc agggatccac aagtggctgg aaagaaatgc tggtcctgtg tcctaacttt 2520

ttccgcctgg agagccctca gtgtggcttc ttacatttaa aaaacaaaaa ggatcagctg 2580

ccaggtgtga ggcagtcccc aagctgagtt gtgaggatgt aagcatgaat aagtccctgc 2640

actcaaaatg gtcaaagaat taaaccccat ggactttttt ggcatctgta tgaaagcttg 2700

ggttttctga ggactgtctt gctatagtta agtcagatcc tagatgaaat atacttgttc 2760

atactgtact aggttcttag gaaacaacag aattcctcaa atgccaaaaa caaagaaaat 2820

agaaacccag aaaacaaaac aaaataaaac aaaaccatca gaactgtgag tggaaactaa 2880

ggtgatgatc tgggagcaat acactaaaat cttgggtcga gacctatatg aaggctggca 2940

gtggagctaa acctggacac actgaagaca agggagctga accagggctc ctacatgaag 3000

cagggataac tgatggcagt aaatgtggtc tcaaattgca gatggtctgg aggaaaattt 3060

cccaaattta gagcctcagg attcccaaag atcctccaaa tatgagctca caatcaaaga 3120

tcagagacgt tgaaaaataa aaaacacctt aagtgggcag cataaaaaac agctaattta 3180

gaaccccaaa ggcttcagat gtcagaatat tagagactta tgataataag caatatttgc 3240

agagtatttg tatgtgccag acactattgt aagtgcttca tcatgtactg attcatttaa 3300

tactcacaga aatctgtgag atgggtatta ttcttatcct cactctatgg attaaaaaaa 3360

ctaaggcaca aagtggttaa gctccttgcc tgagattata gactgtaagt tgaacgtgag 3420

cacttggaat acagagttca tgctgtaaac taccacacta tagggcctcc aatatgataa 3480

tttataaaat atttgaataa aaaatgaata ctagttccac attttaaaaa aaaaaaaaaa 3540

aaa 3543

<210> 11

<211> 437

<212> БЕЛОК

<213> Homo sapiens

<400> 11

Met Leu Gln Asp Pro Asp Ser Asp Gln Pro Leu Asn Ser Leu Asp Val

1 5 10 15

Lys Pro Leu Arg Lys Pro Arg Ile Pro Met Glu Thr Phe Arg Lys Val

20 25 30

Gly Ile Pro Ile Ile Ile Ala Leu Leu Ser Leu Ala Ser Ile Ile Ile

35 40 45

Val Val Val Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Leu Cys

50 55 60

Gly Gln Pro Leu His Phe Ile Pro Arg Lys Gln Leu Cys Asp Gly Glu

65 70 75 80

Leu Asp Cys Pro Leu Gly Glu Asp Glu Glu His Cys Val Lys Ser Phe

85 90 95

Pro Glu Gly Pro Ala Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr

100 105 110

Leu Gln Val Leu Asp Ser Ala Thr Gly Asn Trp Phe Ser Ala Cys Phe

115 120 125

Asp Asn Phe Thr Glu Ala Leu Ala Glu Thr Ala Cys Arg Gln Met Gly

130 135 140

Tyr Ser Ser Lys Pro Thr Phe Arg Ala Val Glu Ile Gly Pro Asp Gln

145 150 155 160

Asp Leu Asp Val Val Glu Ile Thr Glu Asn Ser Gln Glu Leu Arg Met

165 170 175

Arg Asn Ser Ser Gly Pro Cys Leu Ser Gly Ser Leu Val Ser Leu His

180 185 190

Cys Leu Ala Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Gly

195 200 205

Glu Glu Ala Ser Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr

210 215 220

Asp Lys Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Val

225 230 235 240

Leu Thr Ala Ala His Cys Phe Arg Lys His Thr Asp Val Phe Asn Trp

245 250 255

Lys Val Arg Ala Gly Ser Asp Lys Leu Gly Ser Phe Pro Ser Leu Ala

260 265 270

Val Ala Lys Ile Ile Ile Ile Glu Phe Asn Pro Met Tyr Pro Lys Asp

275 280 285

Asn Asp Ile Ala Leu Met Lys Leu Gln Phe Pro Leu Thr Phe Ser Gly

290 295 300

Thr Val Arg Pro Ile Cys Leu Pro Phe Phe Asp Glu Glu Leu Thr Pro

305 310 315 320

Ala Thr Pro Leu Trp Ile Ile Gly Trp Gly Phe Thr Lys Gln Asn Gly

325 330 335

Gly Lys Met Ser Asp Ile Leu Leu Gln Ala Ser Val Gln Val Ile Asp

340 345 350

Ser Thr Arg Cys Asn Ala Asp Asp Ala Tyr Gln Gly Glu Val Thr Glu

355 360 365

Lys Met Met Cys Ala Gly Ile Pro Glu Gly Gly Val Asp Thr Cys Gln

370 375 380

Gly Asp Ser Gly Gly Pro Leu Met Tyr Gln Ser Asp Gln Trp His Val

385 390 395 400

Val Gly Ile Val Ser Trp Gly Tyr Gly Cys Gly Gly Pro Ser Thr Pro

405 410 415

Gly Val Tyr Thr Lys Val Ser Ala Tyr Leu Asn Trp Ile Tyr Asn Val

420 425 430

Trp Lys Ala Glu Leu

435

<210> 12

<211> 20078

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный полинуклеотид

<400> 12

ccacccgcac acactacagt cgagataact tcgtataatg tatgctatac gaagttatat 60

gcatggcctc cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc 120

gctgccacgt cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg 180

acagcggccc gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt 240

ttaggacggg acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc 300

gaggaaaagt agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc 360

cgatgattat ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt 420

gggtcgcggt tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg 480

ggctggccgg ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga 540

ccgccaaggg ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg 600

agcgcagcaa aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct 660

gtgaggtcgt tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg 720

ccttcgctaa tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga 780

ccctgacgtg aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg 840

cagttatggc ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg 900

tgtcgtgacg tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg 960

tgtgcggtag gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct 1020

gaatcgacag gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg 1080

gtcggtttta tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc 1140

ggggttggcg agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg 1200

gtcaatatgt aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt 1260

ggcttttttg ttagacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa 1320

tacgacaagg tgaggaacta aaccatggga tcggccattg aacaagatgg attgcacgca 1380

ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 1440

ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 1500

aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 1560

ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 1620

gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 1680

gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 1740

acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 1800

gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 1860

ctgttcgcca ggctcaaggc gcgcatgccc gacggcgatg atctcgtcgt gacccatggc 1920

gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 1980

ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 2040

gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 2100

gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagg ggatccgctg 2160

taagtctgca gaaattgatg atctattaaa caataaagat gtccactaaa atggaagttt 2220

ttcctgtcat actttgttaa gaagggtgag aacagagtac ctacattttg aatggaagga 2280

ttggagctac gggggtgggg gtggggtggg attagataaa tgcctgctct ttactgaagg 2340

ctctttacta ttgctttatg ataatgtttc atagttggat atcataattt aaacaagcaa 2400

aaccaaatta agggccagct cattcctccc actcatgatc tatagatcta tagatctctc 2460

gtgggatcat tgtttttctc ttgattccca ctttgtggtt ctaagtactg tggtttccaa 2520

atgtgtcagt ttcatagcct gaagaacgag atcagcagcc tctgttccac atacacttca 2580

ttctcagtat tgttttgcca agttctaatt ccatcagacc tcgacctgca gcccctagcc 2640

cgggcgccag tagcagcacc cacgtccacc ttctgtctag taatgtccaa cacctccctc 2700

agtccaaaca ctgctctgca tccatgtggc tcccatttat acctgaagca cttgatgggg 2760

cctcaatgtt ttactagagc ccacccccct gcaactctga gaccctctgg atttgtctgt 2820

cagtgcctca ctggggcgtt ggataatttc ttaaaaggtc aagttccctc agcagcattc 2880

tctgagcagt ctgaagatgt gtgcttttca cagttcaaat ccatgtggct gtttcaccca 2940

cctgcctggc cttgggttat ctatcaggac ctagcctaga agcaggtgtg tggcacttaa 3000

cacctaagct gagtgactaa ctgaacactc aagtggatgc catctttgtc acttcttgac 3060

tgtgacacaa gcaactcctg atgccaaagc cctgcccacc cctctcatgc ccatatttgg 3120

acatggtaca ggtcctcact ggccatggtc tgtgaggtcc tggtcctctt tgacttcata 3180

attcctaggg gccactagta tctataagag gaagagggtg ctggctccca ggccacagcc 3240

cacaaaattc cacctgctca caggttggct ggctcgaccc aggtggtgtc ccctgctctg 3300

agccagctcc cggccaagcc agcaccatgg gtacccccaa gaagaagagg aaggtgcgta 3360

ccgatttaaa ttccaattta ctgaccgtac accaaaattt gcctgcatta ccggtcgatg 3420

caacgagtga tgaggttcgc aagaacctga tggacatgtt cagggatcgc caggcgtttt 3480

ctgagcatac ctggaaaatg cttctgtccg tttgccggtc gtgggcggca tggtgcaagt 3540

tgaataaccg gaaatggttt cccgcagaac ctgaagatgt tcgcgattat cttctatatc 3600

ttcaggcgcg cggtctggca gtaaaaacta tccagcaaca tttgggccag ctaaacatgc 3660

ttcatcgtcg gtccgggctg ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc 3720

ggcggatccg aaaagaaaac gttgatgccg gtgaacgtgc aaaacaggct ctagcgttcg 3780

aacgcactga tttcgaccag gttcgttcac tcatggaaaa tagtgatcgc tgccaggata 3840

tacgtaatct ggcatttctg gggattgctt ataacaccct gttacgtata gccgaaattg 3900

ccaggatcag ggttaaagat atctcacgta ctgacggtgg gagaatgtta atccatattg 3960

gcagaacgaa aacgctggtt agcaccgcag gtgtagagaa ggcacttagc ctgggggtaa 4020

ctaaactggt cgagcgatgg atttccgtct ctggtgtagc tgatgatccg aataactacc 4080

tgttttgccg ggtcagaaaa aatggtgttg ccgcgccatc tgccaccagc cagctatcaa 4140

ctcgcgccct ggaagggatt tttgaagcaa ctcatcgatt gatttacggc gctaaggtaa 4200

atataaaatt tttaagtgta taatgtgtta aactactgat tctaattgtt tgtgtatttt 4260

aggatgactc tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg 4320

cgcgagatat ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga 4380

ccaatgtaaa tattgtcatg aactatatcc gtaacctgga tagtgaaaca ggggcaatgg 4440

tgcgcctgct ggaagatggc gattgatcta gataagtaat gatcataatc agccatatca 4500

catctgtaga ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac 4560

ataaaatgaa tgcaattgtt gttgttaaac ctgccctagt tgcggccaat tccagctgag 4620

cgtgcctccg caccattacc agttggtctg gtgtcaaaaa taataataac cgggcagggg 4680

ggatctaagc tctagataag taatgatcat aatcagccat atcacatctg tagaggtttt 4740

acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 4800

tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 4860

aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 4920

caatgtatct tatcatgtct ggaataactt cgtataatgt atgctatacg aagttatgct 4980

agtaactata acggtcctaa ggtagcgagc tagccaagtc tgtgtgctac caagtagcaa 5040

aactgagcct ggaactcaca catgcgtgtc tgagagccca gcactatcgc caggaaaacc 5100

cagcgtctcc ctgctcaagc ctgaccctca gccctctctg cctctccctg cacttgcctt 5160

ccagtcaagg tgattctgga taaatactac ttcctctgcg ggcagcctct ccacttcatc 5220

ccgaggaagc agctgtgtga cggagagctg gactgtccct tgggggagga cgaggagcac 5280

tgtgtcaaga gcttccccga agggcctgca gtggcaggtg agtgcagggt ctgaggcaca 5340

agagaagtgg gcccagcagg aggtctgctc aggcccccac ggcccactgc atagtatctg 5400

ccccctactt gtcacttttc atccttgttg tataaggttc tttgtttgtt tgtttgttgt 5460

tgttttgagg cagagtgctc tgtggcccaa gatggagtgc agtgtcttgg tctcggctca 5520

ctgcaacctc tgcctcccag tttcaagtga ttcttctgcc tcagcctcat gagtagctgg 5580

gattacaggt gccagccacc acgcctggct aatttttata tttttagtag agacggggtt 5640

ttgccacatt ggtcaggctg atcttgaact cctgacctca ggtgatctgc ccgcctcagc 5700

ctcccaaagt gctgggatta caggcgtgag ccaccgtgcc cagctgtgta agtttcttga 5760

gagcaggacc ctgtcttgtc tacctttaaa tcctagtact taacacacag caaacagtaa 5820

ctatttgatg accaaatgtg agccagaaag gacaggaaat tgtaactgag gctgccccat 5880

gcgtgctgcg cctggtggat ttcaggcaga gggctagact gggtgacctt ggggcattcc 5940

tcctttctat gaaatttgtt atttcaagga gactagaaaa gagacttctc agccacttcg 6000

ccagctattg gtccttctat tcattagtgt ttgctgagac atgctatgtg acaggactga 6060

gccaggtcct ttcaatggat aggagatgtt ttgagcataa aatccacgtt ctctcttggg 6120

ctgggctctt ctaccttctt ccccctggtg cttgggctct gaagaaaaaa agataggtag 6180

gagatgagtg atggggcttc tgagggcagg gctgagtgac tttctgtgta tttgctcttt 6240

ctttatcaga agtcaaatgc ccacaggcac ctgtcatcct actgccagta ggacttctca 6300

ctcaaccttc ccctctgacc ttacttggag aaggacttag gtccctctct cagacatttc 6360

cccaggctgg gcaagttgtg tggaccatgg atgggtatgt ggtccataca atttaaacaa 6420

gctgtatatg gtcgctgggt agagtgacca cataattgat catcaaaact gatacctgta 6480

agagcaaaag ggggcactat taaccattgg gtcagggcaa caggtcaaaa tggagaccta 6540

ccctgggact tctggtcaca ctagctactg tcaaaatggg gcccaaatag acaaagccaa 6600

atggaagaaa ttcccttgac attgaaagtg ttggggctct gtggcacccc cagttctagg 6660

ttgggggagc ttgggctggt ctcatgatga gttctgaggg ggatgggcca gttgggcccc 6720

ccgttccatc taactcaggt tcctttcctc ccagtccgcc tctccaagga ccgatccaca 6780

ctgcaggtgc tggactcggc cacagggaac tggttctctg cctgtttcga caacttcaca 6840

gaagctctcg ctgagacagc ctgtaggcag atgggctaca gcaggtaacc aacctgggcc 6900

tctctccttt ttccctcctt cctccttcct cctcttcctc ctttccttcc tcccttcttc 6960

tctctttcct aaaaattacg ggcattggag ccaggcagaa tggcttttga atcccagcat 7020

ttcacttata agcaacatga agttaaattt cctaagcctc aggttcctca ggagttaatt 7080

gggggaacta atgccaacct cataggatag ttttgcaatg ccagtgagag aatgtgtgct 7140

gccctccaac acacacacac acacttctag cgtctatgca gtcctctcct ttcctttact 7200

cctcaacctt cactcctttg tgctggcttt gcaagaaact gttcctgccc agtaatacaa 7260

aagctaagtt aacttattca aagtttcgtt agttaagatt tagcttaagt gagcctagtt 7320

tcagtggggc cccatcttca gcaatcccag ctctctctgc aaatttcaaa agcagttcca 7380

aatctggagt ggatgaaaag gtgtaagatg atagtaagag taatttgcat tctatatatt 7440

tatattcact tgattttggc agaaaaccaa aaagatagtt attatatctt atatatagat 7500

atatattata tctatttcat aaataggctc aaacaaagta agtaacttgc tagggtacta 7560

gctgggaggt agagggctag aatttgagcc caagacccct aattcttgcg cattaggagt 7620

tcccacattg tttctgtttc tagactgagt aattctttat tctcatgtag gacatcatct 7680

ctaagggaag gggctaatga gatggttgat cactcagaga gtttagctgg agaggatgga 7740

aaagaaccca tacattcagt tgcagattga gatagcctat ctctggcagg cctcagattt 7800

cttcaggatt ctaacagact ggacccagag actaggccaa acaaacaaac aaacaaaaac 7860

tctactaggc agacatcacc aaccaatcac agaactctct cccatggatc cctaatacag 7920

cctcaaagtc cttttcagta aatgctccag gcagccatta caaatcaatc agaattattt 7980

gcctttctct tctctgctca acgggcttct gctgctctct actttccata gggggcaact 8040

tccattaccc tctagaaagc acaccccacc accttcattt caaggagagt gaggaactca 8100

tgcccagcac ctgctattct cccctcttcc tgcagccacg gagcccagcc tcgctgcagc 8160

cagccctgcc tccccactgt agtccagtca actgctgcat cagccgttcc tggcacagca 8220

ggctgagcct tgattatgaa acctgggtgt ctccaggggt tcttaagatg ataggctcct 8280

ggaatttctg tccttttgga gctcagtaag gcaccaaacc acctgagtct tgtgcttcac 8340

aaaatcaaag ttcatcagaa tcattcattg ggatggaatt ggtgaacaga agttaacttt 8400

cctgggaatg tccatttcca ccatattccg tccttctagg tctcagactt ctctactttc 8460

tttcctctct ctagatcgga ggcccttctt gtcctagaac cataggcatt tcaagatgtg 8520

ggagacccta gggatcatct agtccacgca tctttttttt ttttttttga cagagtctca 8580

ctctgtcacc caggctggag tgcaatggca ccatctctgc ttactgcaac ctccacctcc 8640

caggttcaag tgattctttc gcctcagcct cccaagtagc tgggattaca ggcacgcacc 8700

atcatgccca gctaattttt atatttttgt agagaccgag tttcaccatg ttggccaggc 8760

tggtcttgaa ctcctgacct caggtgatcc acccacctcg gcctcccaaa gtgctgggat 8820

tacaggcgtg agccactgca cccagccccg tgcatctttt tatagagggg gaaactgagg 8880

cttggagaga cccagaaaaa gaatatgacc tgcccaaggc cacacatcaa actagtgcca 8940

gagccaggga cagaacctag atcatgagga ctcttaaaat gcactctagt cctcccaggt 9000

ctgagacttg ggtccttcca ggaagtgcca gcattcctgc ctgagaatgt gccaatccac 9060

cagtattgcc aatgactcag ccctccatgg agagcttcta ctaacattac tagcatagtt 9120

agggatggaa ggaaaagatt tagaagaggc agattcagta aaggaacaat cagagagatg 9180

gaattaatca aggaaggctt cctggaggag gaaaaacttc aacccaaggt ttgaaagtag 9240

caagcatgga ttagcaggga gaaagaggga gagtggtcca gttgagagaa acgtttgtct 9300

ggattcatat gaagacagat ctagtcctgt tctattaaat atctctaagg gggccaaaaa 9360

catacccccg ctatcaaagt cagaccagat gctttgtttg gagaacgaaa tatccacatt 9420

ccaactccct cccaggtgag aagggagcta acctgagccc ctatgcctct ttgtttccct 9480

gctgtgaacc agaagacatt gctgggatat ttgaaatagg gacagagctg ggaatatgga 9540

aaggagaccc ctaacatttc tccagggctc tgggttctgg atttggattc cccacccaag 9600

aaagcaagtt acatcagcaa tgcactgagg gttgagtcct gggatgccaa gggtcggttc 9660

tttattgtat agcaaagcag gccccatctt cactgactaa gaccatctcc actccctggc 9720

cactccccac caagcattct ctgccactct ttctcctgaa agtgggggcc aactctacca 9780

tcttgttcta accccctgcc ccagctcaca actctctctc cctcttgatg tgagcagcaa 9840

acccactttc agagctgtgg agattggccc agaccaggat ctggatgttg ttgaaatcac 9900

agaaaacagc caggagcttc gcatgcggaa ctcaagtggg taagtgaggg gacaccttct 9960

ggcctacaga aggcccccac atggacgctg ctcttcaggt tgcaaccagc tcacctggaa 10020

ccccaagcag ccaggggaat gtaagcagac atcaggaaga actcctagcc agatggatca 10080

ttcaatgcca agagctatag actcacattt tggagaggtt ttctgtgttg acttgttttt 10140

aatacaatgg acagctggac aaagtgtgtt gtcctactca gagccagagg gatggataat 10200

gtgacctttc catcaatctg gatagtaaat agtttttgct actgctgtag gttttctaat 10260

aaattgccca ataggcaaga ttccaaagtc actttgtcct tccctaccac ttacccagcc 10320

agagctcccc accttcttga tgctccaggg aagaggctcc atggcccttg tgggtggcct 10380

gttcctgagc ctcgccaccc tgtgttagag cagagcatcc agatgaaatc tgtcacactg 10440

tggcaaagtg gctcagagag gaggctggct tcctagcatt cagggacgtt gctgagggcc 10500

gcttattcac cgaaaataaa tcttgaaaag gacagggctg gtagcagaat gatcctttac 10560

ctaaaattct atcaaaatcc cattcttcca tttggaaagc ccacagtgtc acagactctg 10620

ttccgggctc tgtcctcttc cctcttgggt cccaggagcc caggctgggc tttgaagcag 10680

gcagggccca gcacacagta ggtactcagc agtgggggtg ttgaatccaa tcaaacggaa 10740

gtgtcaatgc aggaaatgca atggatgtca atgcagtctc caaatgttcc ccactgtgca 10800

gcttccacat tcccgaggta ttgggagggg acttgaatta acagcttcgg gaggcctgag 10860

tccctgcctc ccagctgagg aagaagctta aatcacaggg cgctgtgtct gtcttccagg 10920

ccctgtctct caggctccct ggtctccctg cactgtcttg gtgagtaccc ccaatctctg 10980

agggtttggg gcctgggcca gcaatgagca gggaggaaga ccttcatctt cactcctaaa 11040

tttctgggac tccaagtttc attctgcctt ggtctacagc ccttgggctt gtcggtcaat 11100

gccccctcga gttgttggtg gccttgggca ggtcacattc tttttctggg tctttccaag 11160

ccccagtttc ccccttctac catctgtgca tggctccatg acctaagtgg agacctggga 11220

gagagtgtta ggaagaccga aaagggcagg acggggcctc cactgcctcc catccctggt 11280

ccgggcccac atagccttct ttgtcacaat cagctcaggt atccaagatc agattaccca 11340

cattcattat ttgagcaact attcattgaa cagttagaat atgtctcact ctgtcagttg 11400

ctggctagaa gtagaaagta ccagatgagt gaaataattg gccactatcc ttggtagctg 11460

atgactaagt aagagagaga tgcaagacaa catgtggaaa atgccaaact gagtagcagt 11520

cacagttgac atgctgcaga gagagctggc cgggggtcag aagacctggg caccagtcct 11580

gttcatttcc agtgtggcct cgagtcattc acctgacctc cctgaagttc attttcccaa 11640

gaagttgttt agtccaactg cccatcaagg atctttaggg acccttctag ctctaacaga 11700

ggagatcaga aaagaaaaca agcaatgtgg ctcagctcat cctacaagct tcatagagaa 11760

ctgagactgg cctggaagca tagccagaaa ttagaacgcc taagggaaga aggtcacaac 11820

gctgcctctg caatttagga gtgtatatgc tttcctgcag gatgttgaga gtttcattca 11880

ttatcgtatg ccccctaccc cggccccaca atacctagtg cgtgggatct gacacgtggt 11940

ggctggtcaa tgaatgaatg aatgaatggt cacaccatct gaggttctgc actgagtagc 12000

cctgaaggct tgaagcagca taagtgacag gtcctccctt gaggggcctc tgttttacca 12060

ataagccaag acctaagctc aacaacactg aaagggtggc caatacccag gacagcctgt 12120

gggaattcca gagaaaggga gattcccagg gactgggggc ccaggctaaa cactgaaaaa 12180

tgcatctgta ggctcaagga ggaaaagccc atgtctgtct gtcttgccca ccactctctc 12240

ccagcaccca gcactgcccc aggacagaga gcacttgaca caagttggtt agattaatga 12300

atgatttaga gttcagtggt ccccaacctt tttggcacaa gagactggtt gcatggaaga 12360

caatttttcc gcaaaccaag agggggatag agagcattag attctctctt tttttttttt 12420

ttgagaccaa gtctggctct tgtcactcag cctggagtaa agtgttgcga tctcggctca 12480

ctgcaacctc cgcctcctgg attcaagcga ttctcctgcc tcagccccct aaatagctgg 12540

gattacaggc acccgtcacc agcccagctg ggactatagg catgtgccac catgcccggc 12600

taatttttgt atttttagta gagacggcgt ttcaccatgt tggccaggct agtctcgaac 12660

tcctgacctc aggtgatctg cccgcctgag cctcccaaag tgctgggatt acaggcatga 12720

gctgcctcac ccagcctaaa gtctcataag gaacgtacag catagatccc tcacatgtgc 12780

agttcacaat aaggttgtgc tcctacaaga atctaacgcc acctctgatc tgacaggagg 12840

tgaagctcag gtggtcatgc tcgcttgtcc ctgccactca cttcctaatg tacagccagg 12900

ttcctaacag gccacgaacc agtgggaagg gcatcttttt ggatcaaaaa cagaattact 12960

ttttagagaa ctacaagcag atcaatttgg ctagacagag actttatatg aaacagcagg 13020

aggctgctag gaggagtgga aactctactt tgccctcaag ggagatcccg aagggctttg 13080

caggagcggg caaggtggca tgaagaaagc agtgtttgaa atcaggtggt atttgaaaag 13140

cccagccctt ccccttagaa tggcccttct accatctgtg catggctcca caaccgtggt 13200

ggtggctgcc agaagaattg gaaaggcaga gcatgggtgg agagggggga cctgagggct 13260

ttacaggagt tccgggggtg gtgagggtgt gaaagccagg tcagtcagta ggaagacagg 13320

atgtcagatt gagagactcc cctggccggg gaaacagact tggagaaggg ggagttttgg 13380

atgagacagt ccacttccga gtcacaaaat agcttgtggg tgtctgttta ctgttactca 13440

gtgggagtgg ctggggacac gccacctggg cagggctttc gtaattctgc atcacttgtg 13500

aaggtcacag attcccagca caacggacac acccatgttc atagtctgaa ctcctaaaca 13560

catcttaaac caaaataaaa aaaaaagaaa gaaagaaaga aaaaggagag ggaggtttga 13620

ggaaagccta tggtctggga cactcaatac ctcccatgaa tatctcatat tgggctggtc 13680

ctctctccac tctggcccca gccataaggg ccctgcttag agcagatttt gggtgctgag 13740

tggaggcagc ctcatcccca acagcctgac ttcctgcctc ctccctgcct ctgcctgtgt 13800

ccagcctgtg ggaagagcct gaagaccccc cgtgtggtgg gtgtggagga ggcctctgtg 13860

gattcttggc cttggcaggt cagcatccag tacgacaaac agcacgtctg tggagggagc 13920

atcctggacc cccactgggt cctcacggca gcccactgct tcaggtaaga ccccagctgt 13980

aaggaggtct ctggggacca aggccagtca gggaccagag agcttggggt cctgtctcct 14040

ggcaccgtcc ttctcttcac tctcccacta gagacgtttt ccaggttgtg gtggccccaa 14100

tgagacaatg gccatgatgc cctttgttag gcttttgggt gtctgagcag agggtgctgg 14160

tcaccaagca tggcctcttc ctggtgggac accagcagat acccagagtc ctcaccccac 14220

ccccatatcg ttcaagctac aaaagctctt cccacctgcc tcaacttcca agaactcact 14280

ctctttttgc ttgtttccag gaagttgttc cagggtctag agtcatagcc acgtcctcat 14340

tatgtctgga aactttaaaa aaattaaaga gcataggttc ctttcagtcc acagagaagc 14400

ctggccttac ctcagggaag ggctactccc agaccccctt cacttttttt tttttttttt 14460

tttttttttt ttttgagaca gagtcttgct ctgttgctta ggctggagcg cagcagcatg 14520

atcttggctc actgcaacct ccgcctcctg agttcaagca attctcctgc ctcagcttcc 14580

caagtagctg ggactatagg catgggccac catgcccggc taatttttgt atttttggta 14640

gagacagggt ttcaccatgt tggccaggct gatctctaac tcctgacctc aagtgatctg 14700

cccacctcag cctcccaaac tgctgggatt acaggcatga gccagggcat ccggctttta 14760

tttattcatt cattcaatat ctaatgagca cctaccaggt accaaacacc agatgatgcg 14820

cccaagttca ttagacccca ccgctgtctt caaggcactc atgatctagg ccagcgtttt 14880

ttaaccactt tttttttttt tttttttgag attctggtga gagctataaa ttctttcctg 14940

gaaaaacatc tctgcacact aagctgtgcc tggcattggg aaaaagaaag cacgtaatgt 15000

aactgacagc atgagtaaca cagtgagaaa ggttggagga gagagcgcca ggacctcaga 15060

actcaggcat tagaggagcc ccttccccag ccctccttga ggtttcgttg ggcaggtttc 15120

actgaggaaa aagggtcaaa tccctttttc gaatttgact tcttgtaagt gccagaagac 15180

tgccccttct ccaccatccc tgcctcacca tcatctttcc tcccaaggca gtgacatcca 15240

gcaccccgat ccctagggcc ctggggaccc agcctttggc aaagtctcct caggcttgga 15300

tcaggcctga acccagctgt ctctaccccc aggaaacata ccgatgtgtt caactggaag 15360

gtgcgggcag gctcagacaa actgggcagc ttcccatccc tggctgtggc caagatcatc 15420

atcattgaat tcaaccccat gtaccccaaa gacaatgaca tcgccctcat gaagctgcag 15480

ttcccactca ctttctcagg tgagaagcag ggcccaaggc cactcaagcc tcttacatca 15540

gttttcacgc ccactctgct attagctcac tgaccgccct tggcacataa tgtctcctct 15600

caagtcctca gcttgcccat ttgtctctaa tacgtcagcc taacatcact gatgccatga 15660

ggcctcctca agctgtcagc taacacctcc actccattcc ctgccagaga ttcttccaag 15720

gcctgtcttc cctatgtgga gcccctcgag tgagaactgg agtttcatcc aatcttggag 15780

ttttaggaga ccttttaaaa agattatcga gctaattccc caccactgac caacacgcaa 15840

gagcctgctc agtatccctg ccaaggagtc attgtgcccc tgtttgctct cctccagggg 15900

cagggaaccc attacctgtg aggcagccca cagagtcttt gaacagctct gttggatgcc 15960

ttgtgcttat actgaaatgt atttagatca ggattcccaa ctgtggggtc cacaagacac 16020

tggccccttg gagaagagag gattccattg tcaaataagt ttggggaaca ttttcatact 16080

acagctccct tcttggaaca cattagttta ttaaaggtag gagaagtttt taaaataatc 16140

tgttttattg cgtttaacct acatttttta aatttatttg accacagaat ccttttttca 16200

tgctacttct attagcatcc catagaacaa gtgttctaga gaccctggtg tgaccccttt 16260

cagagagctt aactgccagg ctctcctgag ccctggtgtg tgtttcaaga tttgtgcctg 16320

ggaattgttt taatcaggta tggcaaggtg acagatacag acacagctat ctttgaaaga 16380

agagtttatt atttataatt cctgagagaa agggacatac cccacccccc aacacaggga 16440

cacccgggga agcagctggg tccaccagga ggcaggagtg aggggaaggc atggcccaga 16500

gccacctgtg gcttccatgg gcaggtctgg ccaaggtagg gtaggcaaga ttgagcatgc 16560

tcaggattgg atagtgtgga caattctcta ggctatagat gtcagcctct ggttgtctag 16620

tatctgtccc tggggtgatt tagggcaggg aaaatattgg cttggtgtct gagagtcaga 16680

taaaggaagt ggttggggat atgggctttg ggttggctgg tttgcctatt aaaggcgtgc 16740

ccaaagccaa gttgtttact atctgcagga attagctaac ccagtctctc ccagaccagc 16800

aagatcccca taatcataaa gcatcataat ttacagaaaa ttaacactta tgatgaataa 16860

aagatctcct tcttcctctg tgctcctggc aggcacagtc aggcccatct gtctgccctt 16920

ctttgatgag gagctcactc cagccacccc actctggatc attggatggg gctttacgaa 16980

gcagaatgga ggtaagtcct gggtgcagga ccacagggca ggagatgccc ttgtatgagg 17040

gagcagcttc cagaagtaat gggaaggagg accacccttc agagaaaccc atcctggagg 17100

accaagcacc aaggcgccag gcagaaagca aagtggtttg gcaatccagg gctgggggat 17160

agaaggcaag gatgggaatg tgagtgtttt taccctccca gggaagatgt ctgacatact 17220

gctgcaggcg tcagtccagg tcattgacag cacacggtgc aatgcagacg atgcgtacca 17280

gggggaagtc accgagaaga tgatgtgtgc aggcatcccg gaagggggtg tggacacctg 17340

ccaggtgggg cctccaagaa tcatggggag ttctaagaat agggtttagg tcctagagag 17400

atgagaaaac ccagaggctg catgccctac aggaagcctt gcatatcatg ggcactcaat 17460

gtgtgatgat gggaggaaga gagggaggga aggaaaggat agtcagataa aagtgtacca 17520

atagatgagt gggtggatgg atggatgcag acaagcagag agatttcaaa tgtctctttc 17580

acattcgaag atgatgttac tggcctggca tggtggctca cgcttgtaat cccagcactt 17640

tgggaggctg aggcgggcag gtgatttgag gtcaggaatt caagaccagc ctggccaaca 17700

tggtgaaatc ccatctctac taaaaagaat acaaaaatta gctgggcgtg gtggcacgtg 17760

cctgtaatcc cagctacttg ggaggctgag gcaggagaat tgcttgaacc caggaggcag 17820

aggttgcagt aagctgagat tgcgccactg cactccagcc tgggtgaccc agcaagactc 17880

catctgaaaa caacaacaac aacaaagatg acattactca tccaccccac ccacccttct 17940

cactagctac agaatgatta gccccttgag gtcaggaatc ccaggtctat tttctctgtg 18000

actctcccca agctgctgaa ctacactagg aaagaattac cgcctgcaga atgctggaag 18060

cacatctgtg tgtgccctca ccccggcctc attggccatc aggactgctt agcaatccct 18120

gtagaccttc ttcctccccc atacttccag aggatcttct gaactatttt ctttttttat 18180

tttttctttt atgtttttta acagagacag ggtcactatg ttgcccagtc tggtctcaaa 18240

ctcctgggtt caagggattc tcccacctca gctttccaaa atgctgggat tacaggcatg 18300

agccatcgtg cttggcctga accattttca ttaaaacccc taccctactc tcacctccat 18360

ttccagtcat taaattcctt catttaagag gcatctctta gtcatcgcat gtgtgccatg 18420

aacatggtag tctttggaga cccctcaggg agctcacagt ggttggggga aaggggggca 18480

ttaaacagac atttaagcta tagttttggg ttcagaggga ggaagcccca ggggctaaaa 18540

cagctgataa ggactcccag ataagtgcac ttttcactat ctggcatttt cttgttttgt 18600

tatttgcttg ttcactgtct ctcaccccat ttgatcctaa gctttctgag ggcagggatc 18660

tttgtttttt ttcatcagtt ggatcccaat tgcttagaac actacctggc acaaaatagg 18720

cactctataa gtgattacac aaattttgga acgactaggt taaacaatga taaccaggct 18780

tttttttttt tttttgagac tgagtctcac tctgttgccc aggctagagt gaagtggttt 18840

gatctcggct cactgcagcc tccgcctctg ggttcgaatg attctccacc tcagcctcct 18900

gagtagctgg gattacaggt gcctgccact atgcccagct aatttttgta tttgtagtag 18960

agacgggttt caccatgttg gccaggctgg tcttgaactc ctgacctcaa gtgattcacc 19020

cgcctcagcc tcccaaggtg ctgggattac aggtgtgagc caccgctcct ggccaacaac 19080

caggcttttt taagacatca ctcagagcct ttaatttgct aatgtgagtt gtgaatctct 19140

gagagaaggc taacggcatg cttgcaactt acttgtccac agacaagcct ttctgcccca 19200

gaagagaaga ccattctagg gtgctaatga gcaaagaggg tgagggtgga atatcggaga 19260

gcagcaggga gtgcagggga acagataggc cagttcaggg agcagagaag gagaagcccc 19320

cccacctcac ctgccctccc cagcagtctc tgttctggtc tctcacaggg tgacagtggt 19380

gggcccctga tgtaccaatc tgaccagtgg catgtggtgg gcatcgttag ttggggctat 19440

ggctgcgggg gcccgagcac cccaggagta tacaccaagg tctcagccta tctcaactgg 19500

atctacaatg tctggaaggt aaggtacctt tgccctaccc actgtgcctt ccctccagtc 19560

ctctacctgg ggggtgccaa tccatcctca ggtttgattt aaatggttct gacaactctt 19620

tacatcccaa ataactttcc ctccaagcaa gggacagcct gagattgcac tattaaggct 19680

gaaattcctt aggtcagaga tttctgataa atgcaaatac cttagggaat agaacacacc 19740

aagcctttct ttctcttttc tgacagaatg agactatcag atcctttcta gagagaagat 19800

tctgataagg aagagagtgg aaaggctcat gagacctcct ggccctctgc agggtaggga 19860

gagaagcaaa gtgtttcaga aaaggaagac tcacgttaca catgtcacca ctttgtccag 19920

tttcagataa tctgactttc tcttcatcgg tctctcttat tctaggctga gctgtaacgc 19980

tgccgtcccc cacatccaga agctgcttcc cttcagacct acctacggca tgacccctca 20040

aagtcagata tgggacaaga gcctccttga acaaactc 20078

<210> 13

<211> 15159

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный полинуклеотид

<400> 13

ccacccgcac acactacagt cgagataact tcgtataatg tatgctatac gaagttatgc 60

tagtaactat aacggtccta aggtagcgag ctagccaagt ctgtgtgcta ccaagtagca 120

aaactgagcc tggaactcac acatgcgtgt ctgagagccc agcactatcg ccaggaaaac 180

ccagcgtctc cctgctcaag cctgaccctc agccctctct gcctctccct gcacttgcct 240

tccagtcaag gtgattctgg ataaatacta cttcctctgc gggcagcctc tccacttcat 300

cccgaggaag cagctgtgtg acggagagct ggactgtccc ttgggggagg acgaggagca 360

ctgtgtcaag agcttccccg aagggcctgc agtggcaggt gagtgcaggg tctgaggcac 420

aagagaagtg ggcccagcag gaggtctgct caggccccca cggcccactg catagtatct 480

gccccctact tgtcactttt catccttgtt gtataaggtt ctttgtttgt ttgtttgttg 540

ttgttttgag gcagagtgct ctgtggccca agatggagtg cagtgtcttg gtctcggctc 600

actgcaacct ctgcctccca gtttcaagtg attcttctgc ctcagcctca tgagtagctg 660

ggattacagg tgccagccac cacgcctggc taatttttat atttttagta gagacggggt 720

tttgccacat tggtcaggct gatcttgaac tcctgacctc aggtgatctg cccgcctcag 780

cctcccaaag tgctgggatt acaggcgtga gccaccgtgc ccagctgtgt aagtttcttg 840

agagcaggac cctgtcttgt ctacctttaa atcctagtac ttaacacaca gcaaacagta 900

actatttgat gaccaaatgt gagccagaaa ggacaggaaa ttgtaactga ggctgcccca 960

tgcgtgctgc gcctggtgga tttcaggcag agggctagac tgggtgacct tggggcattc 1020

ctcctttcta tgaaatttgt tatttcaagg agactagaaa agagacttct cagccacttc 1080

gccagctatt ggtccttcta ttcattagtg tttgctgaga catgctatgt gacaggactg 1140

agccaggtcc tttcaatgga taggagatgt tttgagcata aaatccacgt tctctcttgg 1200

gctgggctct tctaccttct tccccctggt gcttgggctc tgaagaaaaa aagataggta 1260

ggagatgagt gatggggctt ctgagggcag ggctgagtga ctttctgtgt atttgctctt 1320

tctttatcag aagtcaaatg cccacaggca cctgtcatcc tactgccagt aggacttctc 1380

actcaacctt cccctctgac cttacttgga gaaggactta ggtccctctc tcagacattt 1440

ccccaggctg ggcaagttgt gtggaccatg gatgggtatg tggtccatac aatttaaaca 1500

agctgtatat ggtcgctggg tagagtgacc acataattga tcatcaaaac tgatacctgt 1560

aagagcaaaa gggggcacta ttaaccattg ggtcagggca acaggtcaaa atggagacct 1620

accctgggac ttctggtcac actagctact gtcaaaatgg ggcccaaata gacaaagcca 1680

aatggaagaa attcccttga cattgaaagt gttggggctc tgtggcaccc ccagttctag 1740

gttgggggag cttgggctgg tctcatgatg agttctgagg gggatgggcc agttgggccc 1800

cccgttccat ctaactcagg ttcctttcct cccagtccgc ctctccaagg accgatccac 1860

actgcaggtg ctggactcgg ccacagggaa ctggttctct gcctgtttcg acaacttcac 1920

agaagctctc gctgagacag cctgtaggca gatgggctac agcaggtaac caacctgggc 1980

ctctctcctt tttccctcct tcctccttcc tcctcttcct cctttccttc ctcccttctt 2040

ctctctttcc taaaaattac gggcattgga gccaggcaga atggcttttg aatcccagca 2100

tttcacttat aagcaacatg aagttaaatt tcctaagcct caggttcctc aggagttaat 2160

tgggggaact aatgccaacc tcataggata gttttgcaat gccagtgaga gaatgtgtgc 2220

tgccctccaa cacacacaca cacacttcta gcgtctatgc agtcctctcc tttcctttac 2280

tcctcaacct tcactccttt gtgctggctt tgcaagaaac tgttcctgcc cagtaataca 2340

aaagctaagt taacttattc aaagtttcgt tagttaagat ttagcttaag tgagcctagt 2400

ttcagtgggg ccccatcttc agcaatccca gctctctctg caaatttcaa aagcagttcc 2460

aaatctggag tggatgaaaa ggtgtaagat gatagtaaga gtaatttgca ttctatatat 2520

ttatattcac ttgattttgg cagaaaacca aaaagatagt tattatatct tatatataga 2580

tatatattat atctatttca taaataggct caaacaaagt aagtaacttg ctagggtact 2640

agctgggagg tagagggcta gaatttgagc ccaagacccc taattcttgc gcattaggag 2700

ttcccacatt gtttctgttt ctagactgag taattcttta ttctcatgta ggacatcatc 2760

tctaagggaa ggggctaatg agatggttga tcactcagag agtttagctg gagaggatgg 2820

aaaagaaccc atacattcag ttgcagattg agatagccta tctctggcag gcctcagatt 2880

tcttcaggat tctaacagac tggacccaga gactaggcca aacaaacaaa caaacaaaaa 2940

ctctactagg cagacatcac caaccaatca cagaactctc tcccatggat ccctaataca 3000

gcctcaaagt ccttttcagt aaatgctcca ggcagccatt acaaatcaat cagaattatt 3060

tgcctttctc ttctctgctc aacgggcttc tgctgctctc tactttccat agggggcaac 3120

ttccattacc ctctagaaag cacaccccac caccttcatt tcaaggagag tgaggaactc 3180

atgcccagca cctgctattc tcccctcttc ctgcagccac ggagcccagc ctcgctgcag 3240

ccagccctgc ctccccactg tagtccagtc aactgctgca tcagccgttc ctggcacagc 3300

aggctgagcc ttgattatga aacctgggtg tctccagggg ttcttaagat gataggctcc 3360

tggaatttct gtccttttgg agctcagtaa ggcaccaaac cacctgagtc ttgtgcttca 3420

caaaatcaaa gttcatcaga atcattcatt gggatggaat tggtgaacag aagttaactt 3480

tcctgggaat gtccatttcc accatattcc gtccttctag gtctcagact tctctacttt 3540

ctttcctctc tctagatcgg aggcccttct tgtcctagaa ccataggcat ttcaagatgt 3600

gggagaccct agggatcatc tagtccacgc atcttttttt tttttttttg acagagtctc 3660

actctgtcac ccaggctgga gtgcaatggc accatctctg cttactgcaa cctccacctc 3720

ccaggttcaa gtgattcttt cgcctcagcc tcccaagtag ctgggattac aggcacgcac 3780

catcatgccc agctaatttt tatatttttg tagagaccga gtttcaccat gttggccagg 3840

ctggtcttga actcctgacc tcaggtgatc cacccacctc ggcctcccaa agtgctggga 3900

ttacaggcgt gagccactgc acccagcccc gtgcatcttt ttatagaggg ggaaactgag 3960

gcttggagag acccagaaaa agaatatgac ctgcccaagg ccacacatca aactagtgcc 4020

agagccaggg acagaaccta gatcatgagg actcttaaaa tgcactctag tcctcccagg 4080

tctgagactt gggtccttcc aggaagtgcc agcattcctg cctgagaatg tgccaatcca 4140

ccagtattgc caatgactca gccctccatg gagagcttct actaacatta ctagcatagt 4200

tagggatgga aggaaaagat ttagaagagg cagattcagt aaaggaacaa tcagagagat 4260

ggaattaatc aaggaaggct tcctggagga ggaaaaactt caacccaagg tttgaaagta 4320

gcaagcatgg attagcaggg agaaagaggg agagtggtcc agttgagaga aacgtttgtc 4380

tggattcata tgaagacaga tctagtcctg ttctattaaa tatctctaag ggggccaaaa 4440

acataccccc gctatcaaag tcagaccaga tgctttgttt ggagaacgaa atatccacat 4500

tccaactccc tcccaggtga gaagggagct aacctgagcc cctatgcctc tttgtttccc 4560

tgctgtgaac cagaagacat tgctgggata tttgaaatag ggacagagct gggaatatgg 4620

aaaggagacc cctaacattt ctccagggct ctgggttctg gatttggatt ccccacccaa 4680

gaaagcaagt tacatcagca atgcactgag ggttgagtcc tgggatgcca agggtcggtt 4740

ctttattgta tagcaaagca ggccccatct tcactgacta agaccatctc cactccctgg 4800

ccactcccca ccaagcattc tctgccactc tttctcctga aagtgggggc caactctacc 4860

atcttgttct aaccccctgc cccagctcac aactctctct ccctcttgat gtgagcagca 4920

aacccacttt cagagctgtg gagattggcc cagaccagga tctggatgtt gttgaaatca 4980

cagaaaacag ccaggagctt cgcatgcgga actcaagtgg gtaagtgagg ggacaccttc 5040

tggcctacag aaggccccca catggacgct gctcttcagg ttgcaaccag ctcacctgga 5100

accccaagca gccaggggaa tgtaagcaga catcaggaag aactcctagc cagatggatc 5160

attcaatgcc aagagctata gactcacatt ttggagaggt tttctgtgtt gacttgtttt 5220

taatacaatg gacagctgga caaagtgtgt tgtcctactc agagccagag ggatggataa 5280

tgtgaccttt ccatcaatct ggatagtaaa tagtttttgc tactgctgta ggttttctaa 5340

taaattgccc aataggcaag attccaaagt cactttgtcc ttccctacca cttacccagc 5400

cagagctccc caccttcttg atgctccagg gaagaggctc catggccctt gtgggtggcc 5460

tgttcctgag cctcgccacc ctgtgttaga gcagagcatc cagatgaaat ctgtcacact 5520

gtggcaaagt ggctcagaga ggaggctggc ttcctagcat tcagggacgt tgctgagggc 5580

cgcttattca ccgaaaataa atcttgaaaa ggacagggct ggtagcagaa tgatccttta 5640

cctaaaattc tatcaaaatc ccattcttcc atttggaaag cccacagtgt cacagactct 5700

gttccgggct ctgtcctctt ccctcttggg tcccaggagc ccaggctggg ctttgaagca 5760

ggcagggccc agcacacagt aggtactcag cagtgggggt gttgaatcca atcaaacgga 5820

agtgtcaatg caggaaatgc aatggatgtc aatgcagtct ccaaatgttc cccactgtgc 5880

agcttccaca ttcccgaggt attgggaggg gacttgaatt aacagcttcg ggaggcctga 5940

gtccctgcct cccagctgag gaagaagctt aaatcacagg gcgctgtgtc tgtcttccag 6000

gccctgtctc tcaggctccc tggtctccct gcactgtctt ggtgagtacc cccaatctct 6060

gagggtttgg ggcctgggcc agcaatgagc agggaggaag accttcatct tcactcctaa 6120

atttctggga ctccaagttt cattctgcct tggtctacag cccttgggct tgtcggtcaa 6180

tgccccctcg agttgttggt ggccttgggc aggtcacatt ctttttctgg gtctttccaa 6240

gccccagttt cccccttcta ccatctgtgc atggctccat gacctaagtg gagacctggg 6300

agagagtgtt aggaagaccg aaaagggcag gacggggcct ccactgcctc ccatccctgg 6360

tccgggccca catagccttc tttgtcacaa tcagctcagg tatccaagat cagattaccc 6420

acattcatta tttgagcaac tattcattga acagttagaa tatgtctcac tctgtcagtt 6480

gctggctaga agtagaaagt accagatgag tgaaataatt ggccactatc cttggtagct 6540

gatgactaag taagagagag atgcaagaca acatgtggaa aatgccaaac tgagtagcag 6600

tcacagttga catgctgcag agagagctgg ccgggggtca gaagacctgg gcaccagtcc 6660

tgttcatttc cagtgtggcc tcgagtcatt cacctgacct ccctgaagtt cattttccca 6720

agaagttgtt tagtccaact gcccatcaag gatctttagg gacccttcta gctctaacag 6780

aggagatcag aaaagaaaac aagcaatgtg gctcagctca tcctacaagc ttcatagaga 6840

actgagactg gcctggaagc atagccagaa attagaacgc ctaagggaag aaggtcacaa 6900

cgctgcctct gcaatttagg agtgtatatg ctttcctgca ggatgttgag agtttcattc 6960

attatcgtat gccccctacc ccggccccac aatacctagt gcgtgggatc tgacacgtgg 7020

tggctggtca atgaatgaat gaatgaatgg tcacaccatc tgaggttctg cactgagtag 7080

ccctgaaggc ttgaagcagc ataagtgaca ggtcctccct tgaggggcct ctgttttacc 7140

aataagccaa gacctaagct caacaacact gaaagggtgg ccaataccca ggacagcctg 7200

tgggaattcc agagaaaggg agattcccag ggactggggg cccaggctaa acactgaaaa 7260

atgcatctgt aggctcaagg aggaaaagcc catgtctgtc tgtcttgccc accactctct 7320

cccagcaccc agcactgccc caggacagag agcacttgac acaagttggt tagattaatg 7380

aatgatttag agttcagtgg tccccaacct ttttggcaca agagactggt tgcatggaag 7440

acaatttttc cgcaaaccaa gagggggata gagagcatta gattctctct tttttttttt 7500

tttgagacca agtctggctc ttgtcactca gcctggagta aagtgttgcg atctcggctc 7560

actgcaacct ccgcctcctg gattcaagcg attctcctgc ctcagccccc taaatagctg 7620

ggattacagg cacccgtcac cagcccagct gggactatag gcatgtgcca ccatgcccgg 7680

ctaatttttg tatttttagt agagacggcg tttcaccatg ttggccaggc tagtctcgaa 7740

ctcctgacct caggtgatct gcccgcctga gcctcccaaa gtgctgggat tacaggcatg 7800

agctgcctca cccagcctaa agtctcataa ggaacgtaca gcatagatcc ctcacatgtg 7860

cagttcacaa taaggttgtg ctcctacaag aatctaacgc cacctctgat ctgacaggag 7920

gtgaagctca ggtggtcatg ctcgcttgtc cctgccactc acttcctaat gtacagccag 7980

gttcctaaca ggccacgaac cagtgggaag ggcatctttt tggatcaaaa acagaattac 8040

tttttagaga actacaagca gatcaatttg gctagacaga gactttatat gaaacagcag 8100

gaggctgcta ggaggagtgg aaactctact ttgccctcaa gggagatccc gaagggcttt 8160

gcaggagcgg gcaaggtggc atgaagaaag cagtgtttga aatcaggtgg tatttgaaaa 8220

gcccagccct tccccttaga atggcccttc taccatctgt gcatggctcc acaaccgtgg 8280

tggtggctgc cagaagaatt ggaaaggcag agcatgggtg gagagggggg acctgagggc 8340

tttacaggag ttccgggggt ggtgagggtg tgaaagccag gtcagtcagt aggaagacag 8400

gatgtcagat tgagagactc ccctggccgg ggaaacagac ttggagaagg gggagttttg 8460

gatgagacag tccacttccg agtcacaaaa tagcttgtgg gtgtctgttt actgttactc 8520

agtgggagtg gctggggaca cgccacctgg gcagggcttt cgtaattctg catcacttgt 8580

gaaggtcaca gattcccagc acaacggaca cacccatgtt catagtctga actcctaaac 8640

acatcttaaa ccaaaataaa aaaaaaagaa agaaagaaag aaaaaggaga gggaggtttg 8700

aggaaagcct atggtctggg acactcaata cctcccatga atatctcata ttgggctggt 8760

cctctctcca ctctggcccc agccataagg gccctgctta gagcagattt tgggtgctga 8820

gtggaggcag cctcatcccc aacagcctga cttcctgcct cctccctgcc tctgcctgtg 8880

tccagcctgt gggaagagcc tgaagacccc ccgtgtggtg ggtgtggagg aggcctctgt 8940

ggattcttgg ccttggcagg tcagcatcca gtacgacaaa cagcacgtct gtggagggag 9000

catcctggac ccccactggg tcctcacggc agcccactgc ttcaggtaag accccagctg 9060

taaggaggtc tctggggacc aaggccagtc agggaccaga gagcttgggg tcctgtctcc 9120

tggcaccgtc cttctcttca ctctcccact agagacgttt tccaggttgt ggtggcccca 9180

atgagacaat ggccatgatg ccctttgtta ggcttttggg tgtctgagca gagggtgctg 9240

gtcaccaagc atggcctctt cctggtggga caccagcaga tacccagagt cctcacccca 9300

cccccatatc gttcaagcta caaaagctct tcccacctgc ctcaacttcc aagaactcac 9360

tctctttttg cttgtttcca ggaagttgtt ccagggtcta gagtcatagc cacgtcctca 9420

ttatgtctgg aaactttaaa aaaattaaag agcataggtt cctttcagtc cacagagaag 9480

cctggcctta cctcagggaa gggctactcc cagaccccct tcactttttt tttttttttt 9540

tttttttttt tttttgagac agagtcttgc tctgttgctt aggctggagc gcagcagcat 9600

gatcttggct cactgcaacc tccgcctcct gagttcaagc aattctcctg cctcagcttc 9660

ccaagtagct gggactatag gcatgggcca ccatgcccgg ctaatttttg tatttttggt 9720

agagacaggg tttcaccatg ttggccaggc tgatctctaa ctcctgacct caagtgatct 9780

gcccacctca gcctcccaaa ctgctgggat tacaggcatg agccagggca tccggctttt 9840

atttattcat tcattcaata tctaatgagc acctaccagg taccaaacac cagatgatgc 9900

gcccaagttc attagacccc accgctgtct tcaaggcact catgatctag gccagcgttt 9960

tttaaccact tttttttttt ttttttttga gattctggtg agagctataa attctttcct 10020

ggaaaaacat ctctgcacac taagctgtgc ctggcattgg gaaaaagaaa gcacgtaatg 10080

taactgacag catgagtaac acagtgagaa aggttggagg agagagcgcc aggacctcag 10140

aactcaggca ttagaggagc cccttcccca gccctccttg aggtttcgtt gggcaggttt 10200

cactgaggaa aaagggtcaa atcccttttt cgaatttgac ttcttgtaag tgccagaaga 10260

ctgccccttc tccaccatcc ctgcctcacc atcatctttc ctcccaaggc agtgacatcc 10320

agcaccccga tccctagggc cctggggacc cagcctttgg caaagtctcc tcaggcttgg 10380

atcaggcctg aacccagctg tctctacccc caggaaacat accgatgtgt tcaactggaa 10440

ggtgcgggca ggctcagaca aactgggcag cttcccatcc ctggctgtgg ccaagatcat 10500

catcattgaa ttcaacccca tgtaccccaa agacaatgac atcgccctca tgaagctgca 10560

gttcccactc actttctcag gtgagaagca gggcccaagg ccactcaagc ctcttacatc 10620

agttttcacg cccactctgc tattagctca ctgaccgccc ttggcacata atgtctcctc 10680

tcaagtcctc agcttgccca tttgtctcta atacgtcagc ctaacatcac tgatgccatg 10740

aggcctcctc aagctgtcag ctaacacctc cactccattc cctgccagag attcttccaa 10800

ggcctgtctt ccctatgtgg agcccctcga gtgagaactg gagtttcatc caatcttgga 10860

gttttaggag accttttaaa aagattatcg agctaattcc ccaccactga ccaacacgca 10920

agagcctgct cagtatccct gccaaggagt cattgtgccc ctgtttgctc tcctccaggg 10980

gcagggaacc cattacctgt gaggcagccc acagagtctt tgaacagctc tgttggatgc 11040

cttgtgctta tactgaaatg tatttagatc aggattccca actgtggggt ccacaagaca 11100

ctggcccctt ggagaagaga ggattccatt gtcaaataag tttggggaac attttcatac 11160

tacagctccc ttcttggaac acattagttt attaaaggta ggagaagttt ttaaaataat 11220

ctgttttatt gcgtttaacc tacatttttt aaatttattt gaccacagaa tccttttttc 11280

atgctacttc tattagcatc ccatagaaca agtgttctag agaccctggt gtgacccctt 11340

tcagagagct taactgccag gctctcctga gccctggtgt gtgtttcaag atttgtgcct 11400

gggaattgtt ttaatcaggt atggcaaggt gacagataca gacacagcta tctttgaaag 11460

aagagtttat tatttataat tcctgagaga aagggacata ccccaccccc caacacaggg 11520

acacccgggg aagcagctgg gtccaccagg aggcaggagt gaggggaagg catggcccag 11580

agccacctgt ggcttccatg ggcaggtctg gccaaggtag ggtaggcaag attgagcatg 11640

ctcaggattg gatagtgtgg acaattctct aggctataga tgtcagcctc tggttgtcta 11700

gtatctgtcc ctggggtgat ttagggcagg gaaaatattg gcttggtgtc tgagagtcag 11760

ataaaggaag tggttgggga tatgggcttt gggttggctg gtttgcctat taaaggcgtg 11820

cccaaagcca agttgtttac tatctgcagg aattagctaa cccagtctct cccagaccag 11880

caagatcccc ataatcataa agcatcataa tttacagaaa attaacactt atgatgaata 11940

aaagatctcc ttcttcctct gtgctcctgg caggcacagt caggcccatc tgtctgccct 12000

tctttgatga ggagctcact ccagccaccc cactctggat cattggatgg ggctttacga 12060

agcagaatgg aggtaagtcc tgggtgcagg accacagggc aggagatgcc cttgtatgag 12120

ggagcagctt ccagaagtaa tgggaaggag gaccaccctt cagagaaacc catcctggag 12180

gaccaagcac caaggcgcca ggcagaaagc aaagtggttt ggcaatccag ggctggggga 12240

tagaaggcaa ggatgggaat gtgagtgttt ttaccctccc agggaagatg tctgacatac 12300

tgctgcaggc gtcagtccag gtcattgaca gcacacggtg caatgcagac gatgcgtacc 12360

agggggaagt caccgagaag atgatgtgtg caggcatccc ggaagggggt gtggacacct 12420

gccaggtggg gcctccaaga atcatgggga gttctaagaa tagggtttag gtcctagaga 12480

gatgagaaaa cccagaggct gcatgcccta caggaagcct tgcatatcat gggcactcaa 12540

tgtgtgatga tgggaggaag agagggaggg aaggaaagga tagtcagata aaagtgtacc 12600

aatagatgag tgggtggatg gatggatgca gacaagcaga gagatttcaa atgtctcttt 12660

cacattcgaa gatgatgtta ctggcctggc atggtggctc acgcttgtaa tcccagcact 12720

ttgggaggct gaggcgggca ggtgatttga ggtcaggaat tcaagaccag cctggccaac 12780

atggtgaaat cccatctcta ctaaaaagaa tacaaaaatt agctgggcgt ggtggcacgt 12840

gcctgtaatc ccagctactt gggaggctga ggcaggagaa ttgcttgaac ccaggaggca 12900

gaggttgcag taagctgaga ttgcgccact gcactccagc ctgggtgacc cagcaagact 12960

ccatctgaaa acaacaacaa caacaaagat gacattactc atccacccca cccacccttc 13020

tcactagcta cagaatgatt agccccttga ggtcaggaat cccaggtcta ttttctctgt 13080

gactctcccc aagctgctga actacactag gaaagaatta ccgcctgcag aatgctggaa 13140

gcacatctgt gtgtgccctc accccggcct cattggccat caggactgct tagcaatccc 13200

tgtagacctt cttcctcccc catacttcca gaggatcttc tgaactattt tcttttttta 13260

ttttttcttt tatgtttttt aacagagaca gggtcactat gttgcccagt ctggtctcaa 13320

actcctgggt tcaagggatt ctcccacctc agctttccaa aatgctggga ttacaggcat 13380

gagccatcgt gcttggcctg aaccattttc attaaaaccc ctaccctact ctcacctcca 13440

tttccagtca ttaaattcct tcatttaaga ggcatctctt agtcatcgca tgtgtgccat 13500

gaacatggta gtctttggag acccctcagg gagctcacag tggttggggg aaaggggggc 13560

attaaacaga catttaagct atagttttgg gttcagaggg aggaagcccc aggggctaaa 13620

acagctgata aggactccca gataagtgca cttttcacta tctggcattt tcttgttttg 13680

ttatttgctt gttcactgtc tctcacccca tttgatccta agctttctga gggcagggat 13740

ctttgttttt tttcatcagt tggatcccaa ttgcttagaa cactacctgg cacaaaatag 13800

gcactctata agtgattaca caaattttgg aacgactagg ttaaacaatg ataaccaggc 13860

tttttttttt ttttttgaga ctgagtctca ctctgttgcc caggctagag tgaagtggtt 13920

tgatctcggc tcactgcagc ctccgcctct gggttcgaat gattctccac ctcagcctcc 13980

tgagtagctg ggattacagg tgcctgccac tatgcccagc taatttttgt atttgtagta 14040

gagacgggtt tcaccatgtt ggccaggctg gtcttgaact cctgacctca agtgattcac 14100

ccgcctcagc ctcccaaggt gctgggatta caggtgtgag ccaccgctcc tggccaacaa 14160

ccaggctttt ttaagacatc actcagagcc tttaatttgc taatgtgagt tgtgaatctc 14220

tgagagaagg ctaacggcat gcttgcaact tacttgtcca cagacaagcc tttctgcccc 14280

agaagagaag accattctag ggtgctaatg agcaaagagg gtgagggtgg aatatcggag 14340

agcagcaggg agtgcagggg aacagatagg ccagttcagg gagcagagaa ggagaagccc 14400

ccccacctca cctgccctcc ccagcagtct ctgttctggt ctctcacagg gtgacagtgg 14460

tgggcccctg atgtaccaat ctgaccagtg gcatgtggtg ggcatcgtta gttggggcta 14520

tggctgcggg ggcccgagca ccccaggagt atacaccaag gtctcagcct atctcaactg 14580

gatctacaat gtctggaagg taaggtacct ttgccctacc cactgtgcct tccctccagt 14640

cctctacctg gggggtgcca atccatcctc aggtttgatt taaatggttc tgacaactct 14700

ttacatccca aataactttc cctccaagca agggacagcc tgagattgca ctattaaggc 14760

tgaaattcct taggtcagag atttctgata aatgcaaata ccttagggaa tagaacacac 14820

caagcctttc tttctctttt ctgacagaat gagactatca gatcctttct agagagaaga 14880

ttctgataag gaagagagtg gaaaggctca tgagacctcc tggccctctg cagggtaggg 14940

agagaagcaa agtgtttcag aaaaggaaga ctcacgttac acatgtcacc actttgtcca 15000

gtttcagata atctgacttt ctcttcatcg gtctctctta ttctaggctg agctgtaacg 15060

ctgccgtccc ccacatccag aagctgcttc ccttcagacc tacctacggc atgacccctc 15120

aaagtcagat atgggacaag agcctccttg aacaaactc 15159

<210> 14

<211> 435

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный белок

<400> 14

Met Glu Ser Asp Ser Gly Gln Pro Leu Asn Asn Arg Asp Ile Val Pro

1 5 10 15

Phe Arg Lys Pro Arg Arg Pro Gln Glu Thr Phe Lys Lys Val Gly Ile

20 25 30

Pro Ile Ile Ala Val Leu Leu Ser Leu Ile Ala Leu Val Ile Val Ala

35 40 45

Leu Leu Ile Lys Val Ile Leu Asp Lys Tyr Tyr Phe Leu Cys Gly Gln

50 55 60

Pro Leu His Phe Ile Pro Arg Lys Gln Leu Cys Asp Gly Glu Leu Asp

65 70 75 80

Cys Pro Leu Gly Glu Asp Glu Glu His Cys Val Lys Ser Phe Pro Glu

85 90 95

Gly Pro Ala Val Ala Val Arg Leu Ser Lys Asp Arg Ser Thr Leu Gln

100 105 110

Val Leu Asp Ser Ala Thr Gly Asn Trp Phe Ser Ala Cys Phe Asp Asn

115 120 125

Phe Thr Glu Ala Leu Ala Glu Thr Ala Cys Arg Gln Met Gly Tyr Ser

130 135 140

Ser Lys Pro Thr Phe Arg Ala Val Glu Ile Gly Pro Asp Gln Asp Leu

145 150 155 160

Asp Val Val Glu Ile Thr Glu Asn Ser Gln Glu Leu Arg Met Arg Asn

165 170 175

Ser Ser Gly Pro Cys Leu Ser Gly Ser Leu Val Ser Leu His Cys Leu

180 185 190

Ala Cys Gly Lys Ser Leu Lys Thr Pro Arg Val Val Gly Val Glu Glu

195 200 205

Ala Ser Val Asp Ser Trp Pro Trp Gln Val Ser Ile Gln Tyr Asp Lys

210 215 220

Gln His Val Cys Gly Gly Ser Ile Leu Asp Pro His Trp Val Leu Thr

225 230 235 240

Ala Ala His Cys Phe Arg Lys His Thr Asp Val Phe Asn Trp Lys Val

245 250 255

Arg Ala Gly Ser Asp Lys Leu Gly Ser Phe Pro Ser Leu Ala Val Ala

260 265 270

Lys Ile Ile Ile Ile Glu Phe Asn Pro Met Tyr Pro Lys Asp Asn Asp

275 280 285

Ile Ala Leu Met Lys Leu Gln Phe Pro Leu Thr Phe Ser Gly Thr Val

290 295 300

Arg Pro Ile Cys Leu Pro Phe Phe Asp Glu Glu Leu Thr Pro Ala Thr

305 310 315 320

Pro Leu Trp Ile Ile Gly Trp Gly Phe Thr Lys Gln Asn Gly Gly Lys

325 330 335

Met Ser Asp Ile Leu Leu Gln Ala Ser Val Gln Val Ile Asp Ser Thr

340 345 350

Arg Cys Asn Ala Asp Asp Ala Tyr Gln Gly Glu Val Thr Glu Lys Met

355 360 365

Met Cys Ala Gly Ile Pro Glu Gly Gly Val Asp Thr Cys Gln Gly Asp

370 375 380

Ser Gly Gly Pro Leu Met Tyr Gln Ser Asp Gln Trp His Val Val Gly

385 390 395 400

Ile Val Ser Trp Gly Tyr Gly Cys Gly Gly Pro Ser Thr Pro Gly Val

405 410 415

Tyr Thr Lys Val Ser Ala Tyr Leu Asn Trp Ile Tyr Asn Val Trp Lys

420 425 430

Ala Glu Leu

435

<210> 15

<211> 2046

<212> ДНК

<213> Mus musculus

<400> 15

cagaaacaag gacctcttca ttattcaaga gtaaaatgta taggccaaga ccaatgctat 60

caccgtcaag attcttcact ccctttgcag tagctttcgt tgtcataata acggtagggc 120

tcctggccat gatggcaggt ctacttattc actttttagc ttttgacaag aaagcttact 180

tttatcatag cagctttcaa atcctaaacg ttgaatacac tgaggcttta aactcaccag 240

ctacacacga atacagaacc ttgagtgaaa gaattgaggc tatgattact gatgaatttc 300

gaggatcaag tctaaaaagt gagtttatca ggacacatgt tgtcaaacta agaaaagaag 360

ggactggtgt ggttgcggat gttgtcatga aatttcgatc tagtaaacgt aacaacagaa 420

aggtaatgaa aaccagaatt caatctgtgc tacgaagact cagcagctct ggaaacttgg 480

aaatagcccc ttcgaatgag ataacatcac tcactgacca ggatacagaa aatgttttga 540

ctcaagaatg tggagcacgt ccagacctta taacactgtc agaagagaga atcattggag 600

gcatgcaagc tgagcccggt gactggccct ggcaagtcag tctacagctc aataatgtcc 660

accactgtgg aggtgccctg atcagtaaca tgtgggtcct gacagcagct cattgcttca 720

aaagctatcc taatcctcaa tattggacag ccacctttgg ggtttctaca atgagcccta 780

ggctgagagt gagagtaagg gctattttag cccacgacgg gtacagctcc gtaactcgtg 840

acaatgacat cgcagttgta caacttgaca gatctgtcgc cttttccaga aatatccata 900

gggtatgtct cccagcagca acccaaaata tcatccctgg ttctgtcgca tatgttacag 960

gatggggatc tctcacatat ggaggcaacg cagtcacaaa tctacggcaa ggagaggtca 1020

gaataataag ttcagaggaa tgcaatacgc cagctggtta cagtggaagt gtcttgccag 1080

gaatgctgtg tgctggaatg cgttcagggg ccgtggatgc atgccagggt gattcaggtg 1140

gcccgctagt acaagaagac tcaaggcggc tttggtttgt tgtgggcatt gtgagctggg 1200

gatatcagtg tggcctccca aataagccag gcgtgtatac tcgagtgaca gcctaccgca 1260

actggatcag acagcagacg ggaatctagt gcaaccgagg aaaaaacgtg ccatgaggtc 1320

tctgtatcca agtgtgactg actcggatgc catggcttca catttcaact gcaaaggaga 1380

ctggaaatgc cccttctgaa cgtcccatta cataaatatg gtttaactgt ttagtatttc 1440

tttgtcggta cagattttta ctttcttgag gaaaaaaaaa acatgaacat ggctaagtaa 1500

gaattatgtt aggctagtaa caggaagaca tttattacat gggtggtcag gtgtagtagt 1560

gagaagtcag gtaagttaag tcaataattt acagaaaata atgtcaggta gtcctaacgt 1620

taaatatgtg aggccacaga acaaatagtg ttagaactga agccatccca agtatttaac 1680

atttgttttc aagtgaaact aagaaacaga cttacatata gttttaatgg tgaattttca 1740

ttttaaatat tttatctaca tagaaaagac atatctcctt catgaagaag ctgaggtgat 1800

gaatcaacac agcctcttca gctatgtttg caaccacaag atttgtggga aagaaatccc 1860

tactaccaac ttcctactgt tggcattatt ttttagagta acacgacgca caatagcaaa 1920

atttaagtaa caaattaaaa gttaatgatg aagaagaagt aaagagtttg tttgcaaaga 1980

caaaaattaa acagattaat atcaataaat ctggagacag aagggtctca gattcatatt 2040

ctctct 2046

<210> 16

<211> 417

<212> БЕЛОК

<213> Mus musculus

<400> 16

Met Tyr Arg Pro Arg Pro Met Leu Ser Pro Ser Arg Phe Phe Thr Pro

1 5 10 15

Phe Ala Val Ala Phe Val Val Ile Ile Thr Val Gly Leu Leu Ala Met

20 25 30

Met Ala Gly Leu Leu Ile His Phe Leu Ala Phe Asp Lys Lys Ala Tyr

35 40 45

Phe Tyr His Ser Ser Phe Gln Ile Leu Asn Val Glu Tyr Thr Glu Ala

50 55 60

Leu Asn Ser Pro Ala Thr His Glu Tyr Arg Thr Leu Ser Glu Arg Ile

65 70 75 80

Glu Ala Met Ile Thr Asp Glu Phe Arg Gly Ser Ser Leu Lys Ser Glu

85 90 95

Phe Ile Arg Thr His Val Val Lys Leu Arg Lys Glu Gly Thr Gly Val

100 105 110

Val Ala Asp Val Val Met Lys Phe Arg Ser Ser Lys Arg Asn Asn Arg

115 120 125

Lys Val Met Lys Thr Arg Ile Gln Ser Val Leu Arg Arg Leu Ser Ser

130 135 140

Ser Gly Asn Leu Glu Ile Ala Pro Ser Asn Glu Ile Thr Ser Leu Thr

145 150 155 160

Asp Gln Asp Thr Glu Asn Val Leu Thr Gln Glu Cys Gly Ala Arg Pro

165 170 175

Asp Leu Ile Thr Leu Ser Glu Glu Arg Ile Ile Gly Gly Met Gln Ala

180 185 190

Glu Pro Gly Asp Trp Pro Trp Gln Val Ser Leu Gln Leu Asn Asn Val

195 200 205

His His Cys Gly Gly Ala Leu Ile Ser Asn Met Trp Val Leu Thr Ala

210 215 220

Ala His Cys Phe Lys Ser Tyr Pro Asn Pro Gln Tyr Trp Thr Ala Thr

225 230 235 240

Phe Gly Val Ser Thr Met Ser Pro Arg Leu Arg Val Arg Val Arg Ala

245 250 255

Ile Leu Ala His Asp Gly Tyr Ser Ser Val Thr Arg Asp Asn Asp Ile

260 265 270

Ala Val Val Gln Leu Asp Arg Ser Val Ala Phe Ser Arg Asn Ile His

275 280 285

Arg Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Ile Pro Gly Ser Val

290 295 300

Ala Tyr Val Thr Gly Trp Gly Ser Leu Thr Tyr Gly Gly Asn Ala Val

305 310 315 320

Thr Asn Leu Arg Gln Gly Glu Val Arg Ile Ile Ser Ser Glu Glu Cys

325 330 335

Asn Thr Pro Ala Gly Tyr Ser Gly Ser Val Leu Pro Gly Met Leu Cys

340 345 350

Ala Gly Met Arg Ser Gly Ala Val Asp Ala Cys Gln Gly Asp Ser Gly

355 360 365

Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Val Val Gly

370 375 380

Ile Val Ser Trp Gly Tyr Gln Cys Gly Leu Pro Asn Lys Pro Gly Val

385 390 395 400

Tyr Thr Arg Val Thr Ala Tyr Arg Asn Trp Ile Arg Gln Gln Thr Gly

405 410 415

Ile

<210> 17

<211> 2800

<212> ДНК

<213> Homo sapiens

<400> 17

atttgagtgg gaatctcaaa gcagttgagt aggcagaaaa aagaacctct tcattaagga 60

ttaaaatgta taggccagca cgtgtaactt cgacttcaag atttctgaat ccatatgtag 120

tatgtttcat tgtcgtcgca ggggtagtga tcctggcagt caccatagct ctacttgttt 180

actttttagc ttttgatcaa aaatcttact tttataggag cagttttcaa ctcctaaatg 240

ttgaatataa tagtcagtta aattcaccag ctacacagga atacaggact ttgagtggaa 300

gaattgaatc tctgattact aaaacattca aagaatcaaa tttaagaaat cagttcatca 360

gagctcatgt tgccaaactg aggcaagatg gtagtggtgt gagagcggat gttgtcatga 420

aatttcaatt cactagaaat aacaatggag catcaatgaa aagcagaatt gagtctgttt 480

tacgacaaat gctgaataac tctggaaacc tggaaataaa cccttcaact gagataacat 540

cacttactga ccaggctgca gcaaattggc ttattaatga atgtggggcc ggtccagacc 600

taataacatt gtctgagcag agaatccttg gaggcactga ggctgaggag ggaagctggc 660

cgtggcaagt cagtctgcgg ctcaataatg cccaccactg tggaggcagc ctgatcaata 720

acatgtggat cctgacagca gctcactgct tcagaagcaa ctctaatcct cgtgactgga 780

ttgccacgtc tggtatttcc acaacatttc ctaaactaag aatgagagta agaaatattt 840

taattcataa caattataaa tctgcaactc atgaaaatga cattgcactt gtgagacttg 900

agaacagtgt cacctttacc aaagatatcc atagtgtgtg tctcccagct gctacccaga 960

atattccacc tggctctact gcttatgtaa caggatgggg cgctcaagaa tatgctggcc 1020

acacagttcc agagctaagg caaggacagg tcagaataat aagtaatgat gtatgtaatg 1080

caccacatag ttataatgga gccatcttgt ctggaatgct gtgtgctgga gtacctcaag 1140

gtggagtgga cgcatgtcag ggtgactctg gtggcccact agtacaagaa gactcacggc 1200

ggctttggtt tattgtgggg atagtaagct ggggagatca gtgtggcctg ccggataagc 1260

caggagtgta tactcgagtg acagcctacc ttgactggat taggcaacaa actgggatct 1320

agtgcaacaa gtgcatccct gttgcaaagt ctgtatgcag gtgtgcctgt cttaaattcc 1380

aaagctttac atttcaactg aaaaagaaac tagaaatgtc ctaatttaac atcttgttac 1440

ataaatatgg tttaacaaac actgtttaac ctttctttat tattaaaggt tttctatttt 1500

ctccagagaa ctatatgaat gttgcatagt actgtggctg tgtaacagaa gaaacacact 1560

aaactaatta caaagttaac aatttcatta cagttgtgct aaatgcccgt agtgagaaga 1620

acaggaacct tgagcatgta tagtagagga acctgcacag gtctgatggg tcagaggggt 1680

cttctctggg tttcactgag gatgagaagt aagcaaactg tggaaacatg caaaggaaaa 1740

agtgatagaa taatattcaa gacaaaaaga acagtatgag gcaagagaaa taatatgtat 1800

ttaaaatttt tggttactca atatcttata cttagtatga gtcctaaaat taaaaatgtg 1860

aaactgttgt actatacgta taacctaacc ttaattattc tgtaagaaca tgcttccata 1920

ggaaatagtg gataattttc agctatttaa ggcaaaagct aaaatagttc actcctcaac 1980

tgagacccaa agaattatag atatttttca tgatgaccca tgaaaaatat cactcatcta 2040

cataaaggag agactatatc tattttatag agaagctaag aaatatacct acacaaactt 2100

gtcaggtgct ttacaactac atagtacttt ttaacaacaa aataataatt ttaagaatga 2160

aaaatttaat catcgggaag aacgtcccac tacagacttc ctatcactgg cagttatatt 2220

tttgagcgta aaagggtcgt caaacgctaa atctaagtaa cgaattgaaa gtttaaagag 2280

ggggaagagt tggtttgcaa aggaaaagtt taaatagctt aatatcaata gaatgatcct 2340

gaagacagaa aaaactttgt cactcttcct ctctcatttt ctttctctct ctctcccctt 2400

ctcatacaca tgcctccccc accaaagaat ataatgtaaa ttaaatccac taaaatgtaa 2460

tggcatgaaa atctctgtag tctgaatcac taatattcct gagtttttat gagctcctag 2520

tacagctaaa gtttgcctat gcatgatcat ctatgcgtca gagcttcctc cttctacaag 2580

ctaactccct gcatctgggc atcaggactg ctccatacat ttgctgaaaa cttcttgtat 2640

ttcctgatgt aaaattgtgc aaacacctac aataaagcca tctactttta gggaaaggga 2700

gttgaaaatg caaccaactc ttggcgaact gtacaaacaa atctttgcta tactttattt 2760

caaataaatt ctttttaaaa taaaaaaaaa aaaaaaaaaa 2800

<210> 18

<211> 418

<212> БЕЛОК

<213> Homo sapiens

<400> 18

Met Tyr Arg Pro Ala Arg Val Thr Ser Thr Ser Arg Phe Leu Asn Pro

1 5 10 15

Tyr Val Val Cys Phe Ile Val Val Ala Gly Val Val Ile Leu Ala Val

20 25 30

Thr Ile Ala Leu Leu Val Tyr Phe Leu Ala Phe Asp Gln Lys Ser Tyr

35 40 45

Phe Tyr Arg Ser Ser Phe Gln Leu Leu Asn Val Glu Tyr Asn Ser Gln

50 55 60

Leu Asn Ser Pro Ala Thr Gln Glu Tyr Arg Thr Leu Ser Gly Arg Ile

65 70 75 80

Glu Ser Leu Ile Thr Lys Thr Phe Lys Glu Ser Asn Leu Arg Asn Gln

85 90 95

Phe Ile Arg Ala His Val Ala Lys Leu Arg Gln Asp Gly Ser Gly Val

100 105 110

Arg Ala Asp Val Val Met Lys Phe Gln Phe Thr Arg Asn Asn Asn Gly

115 120 125

Ala Ser Met Lys Ser Arg Ile Glu Ser Val Leu Arg Gln Met Leu Asn

130 135 140

Asn Ser Gly Asn Leu Glu Ile Asn Pro Ser Thr Glu Ile Thr Ser Leu

145 150 155 160

Thr Asp Gln Ala Ala Ala Asn Trp Leu Ile Asn Glu Cys Gly Ala Gly

165 170 175

Pro Asp Leu Ile Thr Leu Ser Glu Gln Arg Ile Leu Gly Gly Thr Glu

180 185 190

Ala Glu Glu Gly Ser Trp Pro Trp Gln Val Ser Leu Arg Leu Asn Asn

195 200 205

Ala His His Cys Gly Gly Ser Leu Ile Asn Asn Met Trp Ile Leu Thr

210 215 220

Ala Ala His Cys Phe Arg Ser Asn Ser Asn Pro Arg Asp Trp Ile Ala

225 230 235 240

Thr Ser Gly Ile Ser Thr Thr Phe Pro Lys Leu Arg Met Arg Val Arg

245 250 255

Asn Ile Leu Ile His Asn Asn Tyr Lys Ser Ala Thr His Glu Asn Asp

260 265 270

Ile Ala Leu Val Arg Leu Glu Asn Ser Val Thr Phe Thr Lys Asp Ile

275 280 285

His Ser Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Pro Pro Gly Ser

290 295 300

Thr Ala Tyr Val Thr Gly Trp Gly Ala Gln Glu Tyr Ala Gly His Thr

305 310 315 320

Val Pro Glu Leu Arg Gln Gly Gln Val Arg Ile Ile Ser Asn Asp Val

325 330 335

Cys Asn Ala Pro His Ser Tyr Asn Gly Ala Ile Leu Ser Gly Met Leu

340 345 350

Cys Ala Gly Val Pro Gln Gly Gly Val Asp Ala Cys Gln Gly Asp Ser

355 360 365

Gly Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Ile Val

370 375 380

Gly Ile Val Ser Trp Gly Asp Gln Cys Gly Leu Pro Asp Lys Pro Gly

385 390 395 400

Val Tyr Thr Arg Val Thr Ala Tyr Leu Asp Trp Ile Arg Gln Gln Thr

405 410 415

Gly Ile

<210> 19

<211> 38992

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный полинуклеотид

<400> 19

gagggagggt ggtgctttgc taatggtgaa ttactaactc ctcaataaag aatattattt 60

gaaataattt ttgaaatttc ataattactt tgggttcttt cttaatgata aataaataat 120

agtatattac aaacatacat taatatttcc tgaatgaata caccacaaat ctcccttaaa 180

atatagcaag aataaaaatt atactatttc tgacaatttt taatttctca aataataata 240

ccactctgat ttttaaacat ctacaccact ctggctttgc caatcttttt aaaaattgaa 300

aagataataa ttttatcata attacactga agcatagaac tttttctttc aaggaaagca 360

aatttttgaa attctataat ataacctccc ataatcctga ataaattaaa ggttcaacaa 420

cttagtaaag taagactgac cttccctttt atttcttttt cagatcaaaa atcttacttt 480

tataggagca gttttcaact cctaaatgtt gaatataata gtcagttaaa ttcaccagct 540

acacaggaat acaggacttt gagtggaaga attgaatctc tggtaagtta atatttgtct 600

ttgctcttta ttccattata aaatgaatat gataataaac ctaatgtttt gtaatatatt 660

ttcagttgct aagtgctcta catattttcc ttccttgaat ggtgaaacat gtgtttctct 720

ctgcttttat ccagttagtt tactcatata ctggttctta ttcacatctt tgtcatgagt 780

aaaaagtgtt agaaaggcca cgagtaaata tgcattttat ttgtttatga attcaaatac 840

taaaagtttt ttatttgttt aattaagcat tgacattgtc tttttaaatt cttttcattt 900

taccttcttc cctcttcctt atccaactaa agacgcaaag caggaggtgt taaaaaacag 960

gtttaccata tcagcagtaa catagtttgg acaacattac actttggttc aatgatagac 1020

atagaagttt gaacagaaat atgcaaagca agtttgagct ctaacttgaa gagagcctct 1080

gggtgcctgc caggaaacct cacgagtgga cccttaacat tcatgtgtca ccacaaacta 1140

ggggctgccc tttagttttg accagtctca gtgtcactca cttaccctta ccttttcaaa 1200

aaaaagtcct aagaatataa agtaattcaa tggttctaca attttagcat gtaactgagt 1260

cacctggcag ggttgctttg gtgagctcaa gataaaattt tatcagcatt tctacatttt 1320

ctggaatatt ccttaatcca ggcttttaat cccttggtgc ttttctgaac cactgcaatg 1380

agcttctaac tgttctcact gtgtgcaggc tcttttcctt ctaatctaat ttacacactt 1440

ctgaacacaa atctctcaca gcctgtttcc ttcatgttac ctccagctca agactttttg 1500

cctacaaaat aaaattcaaa cttgttagct aagcaccttc tcatgtctat gctttggctc 1560

atatttcagc catcgtgtgc cccacttatt cttatagcca acctgaaaag ccatctttta 1620

taagaaacta cctctgctct ccatgattgg atataattaa tcctccttcc acatcacctc 1680

gccacaaaat tgtatctgtg ttgatctcat gccacatacc tgtatgtatt ttatattata 1740

aatatttgca gacttgttta atttgccatg ttagactaag ttccatgaag acagctccat 1800

atccattcca tttttatata tccacaacat ttggtcgggt tgatgcttaa taaatgttta 1860

ttgaaggaac aggagtctcc cacttctgac ataatgaact tatttccccc agtgttaacc 1920

ctacatctgg ttcctgtcca agagtctctt cccaaatcat tctgattcaa ctgttcattc 1980

tgatctcatt aaacatttaa atgatatatc taacttcgct tgctttattc tatgctcatc 2040

ctgcagtctc ctcataactt ggtttcaatg atgcttgctt ctagagaaaa aaatgtatta 2100

aataagctta tgattcagtc ctccagctgt gatggttctc actgaacatt agctcagtgg 2160

ttttcgaagt atggtctcta gcataaccta gaaacttgtt agaaatgcaa attcttgggc 2220

tcaccaagac atactaaatc aaaaattctg acattggggc ctagaaatct gtgttttaac 2280

aagcctgcca gtgcagcctg gtcccttttc ttctcggagc cccactcaaa gctttcagtg 2340

ctcatctccc accaatgaca gggtcctcta tggaaaccgg caggacggtt tccaactcta 2400

actacgtttt agagtttgct tcctagggct atccaggcac caagtatcac aggttagttt 2460

cccagggaag cagactctga gacttgcatg cagggagtgt ctctggggtg ctctcaacca 2520

acaccttcag gaagagaagg aagcagcatt gggcagaggc atagtcaaac tacagtgctg 2580

ttggcacaga agactgaagg gagtcagagc cagggggtag aggtgggccc ttagcatcca 2640

tccttcacca ttaggtgtga gttgccccac ctccttgatg gtgtaacctc agtcccaagg 2700

tgggtgggag tgcagcagag cagcccctac aagggccaaa ccagagatac accaggcgcc 2760

agaagtgctg ccagggaata gagaggaaag gatgggctta aggtaggatc cacagaactt 2820

ggcaatggat tagaagacag gatgagaagt gacaggttaa cactaacaca gaaatgtcta 2880

acttcggtag ataatggtgc cattggctag aagaggaaac cgaaatgaaa gcaggttgtt 2940

cagggagaca aaagttcact gtggacatct cagcagagtg attcagtggg gaaaggaatg 3000

gatgcccaga ccacctcaga ggaagatcta agctggagcc agcaataaag atacaagatg 3060

aacaatccct aacgaactgc tcctcagcca tgctccccag acacgctgct tcagatttat 3120

agtccgggtg aggctaggag gtgcgcctcc ctcagtggag gacagcaaag caccagtggc 3180

tccagggagt taaaatcttt tgataatttt tgttctagca tctgtctgca gagctgtctc 3240

tcagccattg cctgccttta cacaggagtg cagtccgaaa ttgggagatg agtgaaattt 3300

attatgccta gagatctgga tccccagttg tttgggagta tattttctga accacttgtt 3360

ggtttaagta atgcagattt attgatgcca cttctcttga atctgtgact ctggacccac 3420

catctaagtg aatgtgcaga gggaacggaa tggctgcaat agatctccat taaaaccagt 3480

gcatcctccc agacacatac agtagtaggg aggtgagtca atgtcaggac agcaccagct 3540

cccgcttcgg tacatttcca aagttctcag tctgtgtaca aaggtttgct ctggggcagc 3600

agaaatagcc ctgggcaggt agtcaaaggc ctggtttgat ttcctccact tccaggcaag 3660

tcactcgaag gctcacaggc tttttcctca cctgccacat gggtccagtg agatctactg 3720

agctgtaaat aatgaaatga gtgtgtgtgc agtcatctat aagttgtaaa gtactagaaa 3780

atggtgaaac tttgggattt gggctattta aggctgaatg ctaaaaatgt caggcattgt 3840

ggagaaagga atttaaatat aagattgatt gactgggatt taaagacaaa tgaaggcaca 3900

cacgcaagtg cacacccaca ctgacactgc acagctcccg ttggaggcat atcctgacca 3960

tgcagacctg gggctctgcc tgtccaagtg cactccttta ctacataaac cctccttctc 4020

ttttggggct gtcaccccac cagagctggc accgagccct tgctgctgcg cttccctggg 4080

gtgtcagctt ttgacagggt gtttcctccc tctgcaggag ccttaacatc ccttggactt 4140

ccttcccccc acccaccccc agcagtttta tctcttccta actcgggacc ctttttttcc 4200

cacacaaagt ttattgtcag ttgctggttt catctgtttg agcggctgca acaaaatacc 4260

atagactggg tggcatatgc acgacaaaaa tttatttctc acaggagaag tcaaagatta 4320

atgcaccagc agatctggtg tctgaggggc caccttctgg tttgtagatg atgctttcta 4380

gttaaaacac ctatttaaca cactattaaa cactaagtgt gttaaatagt gcagttgatg 4440

tatttgtcat gtcaccttta tcatacacta aatccttctt tgtctttttt tctgtactct 4500

aatctctttc tgtaagtaat ctttgcttgc agcagtagga tatttagagt actgtggctt 4560

gacaatatat ttagtatttc aagatttcca tgaaattctt ctgatgtatg agttccctag 4620

ttaatcttac atatgtatcc ctttgtaaaa acactttgaa catttaaaat gatacatgaa 4680

tagtactcta atacaatgcc ataaaaatta taaatcattt gtatagactg gtaagtaaag 4740

attgtgagat taagaaacgc atcaaaggcc attgagctgg aaagtggtat aatgagaatt 4800

caaaccaggg tctcttgact caaaatctaa ggatcatacc atttctcatg ataatatgag 4860

tattattgtt atctctatcc catagacaaa gtgttaacac tgaatgagca gtgaaatagt 4920

ctcagaattt tttattttat ttagcaattc acttgtcatt tctggtcctc agtttattca 4980

cgagtaaaat aaaatagttg gactagataa tttctatagt acattcttac acaaaaaatc 5040

tatgattttg ttatttttaa tgtgatatac tcatggcact cattcacctc attttcccag 5100

cctgcctcac tggtcattac ttctctgtgt tctttacagg ctccccctcc tctacactgc 5160

cattaaatat tgaaacacct caaagcttta cttatgtcca cctctcctct gacactatca 5220

ttctgtctag atgatcccat acatacatgc ccattacttc aacctgtatt tatacgccaa 5280

tgattcacta tatttccagc ctagacattc ttttgtactc tagttaccag cttgatatcc 5340

ttacatggct gtttcaaaac aactcaaata tattatctct caaaatcaaa ctcatgatgt 5400

ccccacacca tcctagcttt ccaccaacaa tacctatccc tattaatagc aataccattt 5460

attcagttat ccaaatcaaa aacctagaat tcatccttaa aattctacta tcattccaaa 5520

tatcctatcc atcagcagcc actgtattct taatcccctg tatttccttc aaatccattc 5580

acctctctcc atatccattg ctgcatgact atccaagcca tcgcctctac cctagggtac 5640

caaaatagca acaaacctaa tctgttcatt tgcattattt tttctccaaa actgattatc 5700

tatatgtagc aagacagatt gttctcaaat tgcaaatccc actatattat cctcttgctt 5760

caaacacttc catggtttcc cattgtttat gataaaacca aatgcttcaa gttcgaagac 5820

cggcatgatt gggaatttcc tgtcacccta gcctacttgc tctccatggt acagttgcac 5880

tggctttctt tcattcctta agtacaacct gtttcctccc acctcaggac tgtgcatgtg 5940

ccattcattc tgctgaggag cctttttcct tccacttcaa tcagctaagt ctgattcttc 6000

ctgacaatct cagctcaata agcatttcct ctaagaaatg tctctaatat cattaattgg 6060

ctcaggtccc tctactgtat tgctgcactt ttcacagtta taattttact taattatgaa 6120

tgattatttg attaggtcta tttccatcca ttagacataa gcttcatgat ggccagatta 6180

ctgttttcta tccatcgttg tattccaata cctgacagaa ggagggcggg aggtggtggc 6240

acacaagaga tgctcaaaaa caattgttga ataagtaaat gaatgaggcc atttagaaat 6300

aacgaaagta cctgtttaca aagtacatgt atcaaaacta tgaatgcatt ctacttacat 6360

ggttttctcc aaataaaaca aaagacttca atcaggatta atacctggga taaactgagt 6420

cattaaatct ctcctttgcc atcaggagtg acattgaaac aaatgtctgc aaacaacaaa 6480

tacttttttc ccaaaatata ttgaatggca tttccataaa caaactagaa catgggagga 6540

gaaagaaagc aatattaatt taaaattaat cttatcacat aacttatacc atcagggatt 6600

tcgggtaaaa ttcctttcag gcacatccat ttaacaagaa ttgattgtta ctgaaagcct 6660

agaagagaat ttggcacata cttggtgttc aaatatttgt tgactgagtg aataaatgat 6720

gcaagtgtct aagaaacaca aaataaggac atgattacag tcacggtgga gttcacagtc 6780

atctccaaaa tgaggatatg catcccaggg aggaccaaca attcattgga gtgctgaaat 6840

aaaatactca aaggtcattt tacatgtatt ttttctctaa attacttttc ttaagacaca 6900

gaaaacaaaa aaagaaactt agctttgtta ctttctaaca aatagttaaa tcattaaaca 6960

ggattgacac tagcatcctt gtttggtctt atgccttagg ggaacatgaa atgtgtgaag 7020

acattctgag atctgaggga agggtagaca gtaatacagt gggactgacc aggcttcagc 7080

acacctttac ctcctctcag cagatttcag tgatgagcag tttacaacta gattgaaaga 7140

ttatattatc tagttctaaa agaaaactaa gcctcccaaa agcaacaagg gaactgagag 7200

gaatcctgca aaacaaaaac aaattttaaa acttgcactt tgtaataacc ctaatatgta 7260

atcacagtaa tgaacagtaa gataatgaca gaactgacat atttccttat ctattaaagc 7320

catattaaca ggtaaagcaa tgccagtcag tggtacactt cttagaagat atttaataca 7380

tactagacac atacacacac acaacatttt ccttcaaggt gtatgtatca gaaaatcact 7440

ttttaaggcc ggatgcagtg gctcaggcct gtaatcccag cactttggga ggccgacgtg 7500

ggcggatcat ctgaggtcag gagttcaaga ccagcctgcc caacatggcg aaaccccatc 7560

tctacaaaaa tacaaaaatt agccagggat gatggtggat gcttgtagtc ccagctactc 7620

aagaggcaga ggcaggagaa tcacttgaac ctgggaggca gaggttgcag tgagccaaga 7680

tcacccattg cactccagcc tgggcaacag agtgagactc tgtctcaaaa aaaaaaaaat 7740

cactttttag ataaaattca tgctatagag agaagactat gaaaatatgt ttagcaatgt 7800

gtccatcatt aggtgattga gtttcctttt gttttgtttt actgaaaatc atataaagta 7860

tgttatctgt aaaagttctc tgacatgcac acataaaaat ttgggagaaa agattaacta 7920

taatgtttaa tagattttgt acacatttct ttaaaaatat ataaaacaca acacctttca 7980

attggtttgc aagaataacc aattgacatc atggaaaatg gaaattcact tgctgaattt 8040

taacaaaaat ttgcatgatg agtgagactg acaacttagt gtcatgattt aatgaattat 8100

gccaatggta aacttcatgc acatggggcc aggtaattat gtggaaactt tttcaatgct 8160

taaagccaag tattgaaatt aaacttagaa tcagaccttt gaaccatttt atgacaatgt 8220

tcaaaaatta taaattctat ccacttatat tataatatta aaaatatcat tacaaaaaaa 8280

acctgtgttt attttataac tcagcctttt taatttctaa tttcataaat atattataat 8340

ggatattgtt agtaatgtag tattattaca tgtatataat ttataagtaa atatacatgt 8400

tttggctact catgcataaa atgtttcacc cataggagca cataatcaga aatgtctgga 8460

gaccattata gtaatagata gatcatattg ccacatattt tatctcctcc ttgacaactg 8520

agctttccag atcttctggt gaaacgaaag agaaagttgt aacagaagag tgattaaaat 8580

gacaaaagca ttacttctat tacttctatt ctaataatat gagcaaagct ataactatca 8640

agtaataatg cactaaagaa ggtgattaat ctgatatatt cacaggcaac taataagacc 8700

tttctattgc agccatgaaa aatatgtgac aattatagat atcctgtgtg cagtgtttca 8760

acctttatgt gacctgttct actaacagat ttagtgatgt tcactttgtt agaattttct 8820

tacacatgcc ataacttgct tcagtctttt gattatgaat attatggata ttaaggattc 8880

tagactattc tagatttaaa aaataatatt gtcacctcaa tcagaaggga aatattaaat 8940

agttctcatt ttttcaatgt ttactcagtt tttgtccaat gtaatgaaag tgtcagcagt 9000

acaggttaca aaataaaatg tgtattaaag taaactcatt tgaacaggtt aataattgta 9060

gagggaggga aaaggctaaa agattgaatg taaaacttat gaaaagtaga tacatcgtct 9120

ctatgatttg cagtagtcaa ctgcatacag atgaatcatt ttaatacacg ttaactactt 9180

tccttttaca gatggagaaa ctgagaggaa gaaagtttat atggttcatt aaactttgtg 9240

atgcaagcta aactaacctg tctctgtatt ttccatctac tgcccttatc actatctcat 9300

tagaatactc ttcaagcatc tccttactga ttttcttacc aagcatttgt taagttctaa 9360

tgagagttgg tagtaacatt ttcacccact ctgtgaaata tgaaatctta ttcataggcc 9420

tcttctttta ttcttgtatt tgcatatcaa ccaattaatc aacttgcttt ctttatgttg 9480

cttattatct tagtccttac taaattgcct cttaatgttg tccacataac agaaatgtta 9540

aggtggatac ttaacatttt agtccagtct agccggtgcc agtgcaatgc caaatcatga 9600

attaaaatat aattacaaga accacttatc aaattttaac aattccttca gctttgtgac 9660

agttttttct acttcgatta aagtcaagta aaattaaagt taaatatttt tattaaaata 9720

tctcctttaa cattccatat taataaacat attaaagctc atgcttctaa gtagattact 9780

agaagttact ttatcgaatt acagcaatgg ttaattctag atcatagaat ttagaatgac 9840

tttttgcctt cttctttttt ttcctttttt ttaaacagag tcttgctctg ttgtccaggc 9900

tggagtgtac tggcgcgatc ttgactcact gcgacctctg ccctgcaggt tcaagtgatt 9960

ctcctgcccc agcctcttaa gtagttggga ttacaggtgc ctgccaccac acctggctaa 10020

tttttttttt gtatttttag gagagacagg gtttcaccat gttggccaga ctggtctcga 10080

actcctgacc tcaagtgatc cacttgcctc agcctcccaa agtgctggga ttacaggtgt 10140

gagccactgt gcctggcctg actttttgct ttcttcttaa tacttactag tatttcttga 10200

atttttaaaa aagaaacata aagtactttg ataaaaccaa cagtctcatt gttcttaaaa 10260

ttgttcaaag gttctctgga aaaaaaaaag aaaattatca tttggttaag aatcatgttg 10320

gtctgacatc aatcatccta taggagtgaa tattgaaaaa gtaagatata ttgtggtata 10380

atcgagattg cataaatttt accatttttg agaagaatct gctccaaatc ctggcttaat 10440

gtaatatcca gcatgctact taattttctt gtcttcacct tttcatatcc acatccacct 10500

aggtgccacc tcacagtata agccagcata atccattctt ctcaatgaaa ccacaataca 10560

tctgaccctg catctcagga gaactgtatc agccacagca cttccagttg actatgaatc 10620

tgaatgttat gcctcaggag aaacatcctt gctgggactg agtagtgatt caaggagata 10680

gttatgattc agtcaagaaa ttaataatta gtgttatttt tattattgag acagagtctc 10740

gttctgtagc ccaggctgga gtacagtggc atgatctcgg ctcactgcaa cctctacctc 10800

cccggttcaa gtgattctcc tgcctcagcc tcccaaataa ctgggacagc aggcacttgc 10860

caccacgcct agctaatttt ttgtattttt agtagagacg gagtttcacc gtgttagcca 10920

ggatggtctc gatctcctga cctcaaggtc cacctgcctc agcctcccaa agtgctggga 10980

ttacaggcgt gagccactgc gcccggccat aaattattaa ctgagccagg cacagtggta 11040

cacacttata gtcccagata ctcaggagac tgaggttgga gtatcctttt ttatgttatt 11100

ttatttttaa ttattatggg tacataatag gtgtacatac ccatggagta caagtcatgt 11160

tctgatacag acacataatg tttaataatc acatcagggt aattgggata tccatcacct 11220

caagcattta tctttctttg tgttaggaac attccacctc cactcttgga ataggcaccc 11280

tgttgtgcta ttaaatacga ggtcttattc atttcatcta actatatttt tctacccatt 11340

aaccatcacc tcttttcccc tcttccccac tacctttcct gtgaggctgc aggattctta 11400

agcacaacag ttagaggcca gcctggacaa catagtgaga ctcaatttct aaaaaataaa 11460

aaagaaatta ccaactaatg ctaaaaaaat agtctctgat gcttaggtat gaattagaaa 11520

tgaccaaaaa aaaaaaaaaa aaaaagactg ccctttgctt ccttctcccc ttctcttcaa 11580

gttttccatt gctactcatt ttagtctggt ttaatcaggt ttcatccatt aaaagcaatt 11640

gttgggatca cacattttga gttgtgtcag tggacttccc tcatgctggc atgattcctg 11700

ccccaagccc ttagtaaaag ccaccaagcc atataacata atctctcatt gagtaaaaca 11760

tctgatgtgt ttagaatgac ttctagcaaa aaaccagcct gtccagcatc atctctgtat 11820

aacagataaa ggaataggta ctgcatcaaa aggttataga acctgcccaa atcaatccca 11880

tgtgttttgc aatggaatta ggttgaacta aagtgaaaat tcagttttct actcctcatt 11940

aacatgtctc atgttgcaag gttgagagga aggagaagaa gaactgtatt tacagagaga 12000

ttccccctct ctttctttct acagattact aaaacattca aagaatcaaa tttaagaaat 12060

cagttcatca gagctcatgt tgccaaactg aggtgagtgg aactgtagaa aaaatattta 12120

agtatagata caatgtggca tacttgactt tttgtcacag aatgaatagt aaatgacatg 12180

ttcagataag ttgttgtaat attatgaaaa tagtatttta gtcagcttaa aaaccaatgc 12240

caaaaaagcc aaacatatga tctatttagc tactaatgta aataaccata ttatatctat 12300

tcttattggg aagaggaaga aggggtggag agagagttgg ggtgaaggta cagtaacaag 12360

gccatcctat tgtaaaactc cagtggatat cattcacagt gcagcctatg taaacagtcc 12420

ctcctggagt tgtacaatgc tgtggtttgg gtgtatccat ccaagatcaa gacactatga 12480

ccaacatcaa aagtggcttt ttggttttat ctgcctgatg tgctataata aaagggtatt 12540

atggccaaat ccaaggcatg tctatcatga attaataata ggaggagtag cagcatgcat 12600

gctagttatt tgccattcct gccttagtta aatatgatgt gataaaacca gcctttccaa 12660

ctgaaatagt cacctttact gactctcccg caaatgtctc aaatgaccac attgctctag 12720

tctttaaata atatgcaata gttctttggt agaagaggaa ttatactaat tctttctcaa 12780

atactagcat cacaagaaaa ttaattcttg ttctctggag agtcacctag taagtatctg 12840

gagcacagat gtctggtcag gtaagttttg atgaggagtt aaagggataa gaagagtcca 12900

tgagaagggt attttccaaa acacctttcg gtcaattcag tgcacattca cttagtactt 12960

tcttgtcagt atctgtatca gccactaatg ttcaaaagtg agtaagccct gaaaacctgt 13020

aggactacat gagccttctg ccttttctct ccttttgttc acttcccact tatcactcaa 13080

tcctctgcaa cctggcttca ataccaccat aaaatatcaa ctgctcttgc cgattcaaca 13140

atgacatcca gataacaaaa tccaaagaaa ccacatcagt cctattcttg gacctttcaa 13200

cagtatttgg tcctgttggc ctgtcactcc ttgaaatagg actatccctt ggtttgcatg 13260

gccttgtata ccctgatttt ccccttacct ccctagctat tccttcttag tttcctttac 13320

taggtcttac ttctttgtat attccttaaa tgttgctgaa catcaggctg tgctctaggc 13380

ctctcatctt ctcaggtcac actctctcct ttccttggcc ttcactgcca cccatatgct 13440

gagtgctctc aaagttgtat ctctaggcca gtcctctttt gcctccaaac atgaatatat 13500

gcagccatct acttggtacc atcacatgga taattctcat gatctcttcc agtatgactg 13560

cttctttatt tttttctggg ctctttttta gcattgcttt acatggaact ttatcatgtc 13620

tctcaacctc tattttatct tttatctatg tatgtagagt ctgtgtaatt tcttcatctc 13680

ttttagataa ctaatatctc ttcagctttg acttgtattc tgtgtaaccc atttattgcg 13740

ttttcaattt caatgagtat gttttcctat ctgcaagttc tatttgtttc ttttgagaat 13800

cttcctggtc ttttaaacac atttcttatt ttaatttttg ggggtaccta gtagttgtat 13860

gtatttttgg agtacatgag atgttttgat acaagcaaac aatgcataat aatcacattg 13920

tgtaaaatgg ggtatccatc ccctcaagca tttatccttt gtgttacaaa caatccaatt 13980

atattctttt agttattttt aaatgtacaa ttaaattatt attgaccata gtgactctgt 14040

tgtgctatca gatactaggt gatcttttaa aaataatgtt ttctacttaa tctcattttt 14100

atgattccct cttttacgtc atttgtcatt tcaaatacag tcacttgtct gttgattcta 14160

ttatgtgaag tttttgagga taatcttttt gttactttga ttccaccttg gtatggtttg 14220

gctgtgcccc cactaaaatc tcatcttgaa ctctggttcc cataataccc acatgttgtg 14280

ggagggacct tgtgggaggt gattagatta tagggacgtt tccccccttt gctctgttct 14340

ttttcctgcc accatgtaag aaagatgtgt ttgcttcccc ttctgccatg attgtaaatt 14400

tcctgaggcc tccgcagcca tgcaggacct cttttctttg taaattaccc agtctccggc 14460

ggttctttat agctccgtga gaaaaaacta atacacacct catgatgtat tgtttaccac 14520

tgaaattgta tgcttaaatt taatctcact tgggaccctg tacaacctag acttaacata 14580

tctacctcca gagcagttac atctgtcaga cattctagag gaatcagcag cacatggact 14640

ttgttgttgt taatttgttg tcgggggagg ggggagggat agcattagga gatacaccta 14700

atgctaaatg acgagttaat gggtgcagca caccaacatg gcacatgtat acatatgtaa 14760

caaacctgca cgttgtgcac atatacccta aaacttaaag tataataata ataaaattaa 14820

aaaaaaaaag gttctgggag tattcaggta gtattaatga agattcagac atcgtgcagc 14880

caggcccatg cttatgaatt ttcaggtgat acttcttttt cttttttctt aatttaaagc 14940

tggatctcgg aaacagataa atttattttt ttatgacatg acgagcattt ttttcattct 15000

agttcatgct gttattgggt gtttagttct ttgagactcc tggccttttt ctaaaacctc 15060

aagttcaact tcctattttg cactggccca aggtcccatc tccagtctct atgtaaatgc 15120

taaacataag cctgtggaat attctagtct caccacatac tattcacatt cttctttgtt 15180

tttggtcttc caggattttc cttacttttc tatgaaccca gtcttgcatt tgaaatggaa 15240

tttattatat attatctatc ctttctattt gttttatgca gaaagtgttt tctaaaatta 15300

tttaggcttc catattgcta gacatggaag ttgtaattat ttgttcagtg cctgtttcta 15360

catctaaact gcaagaccca tatggcaact gtgaatctta gtcccagcta atttctgaag 15420

cttagaatag tgcctagcac aagaagttgt ttatctaaca tttttaaaaa taaatattaa 15480

attcatatct ggaatgaata ttaagttaga gctggtcatt gaggtgagag gaggaagcca 15540

agagagaata tgagagcctc aaagccaaat atctttaatg tactttttca gaaaagaaga 15600

cagccaatgt caggtggagg aactggttta tgaggtaact ttcctggaag aaaatagaaa 15660

ttactgaggt tttagataat ccaaatattt aatcaagtca ccaaggttta ttgtggggaa 15720

tctttattat taattaaaat gagtgatgaa atcttaatat acgacaaaag ttaaaatttg 15780

cttttgcagg cagatgaatg gtctaggtat caaaaaatta agttgagtct ctaactcaca 15840

caaatttaca accctatcac tttatgaatt tgtttaggag attattttta ataacactgg 15900

tgaagtctaa gaatagctaa aatttatagt acacttattg tgtgctattg actcttcttt 15960

gaagttttgc atatagtgat tcatctaatc ttcataaccc attttacatg tgaagaaact 16020

tagatataga aagattaaga aacttacata acttatccaa agttacacag taaaactctg 16080

gcattataac ttcaaaatca gctatcctac agtgagtaca gtgttctgtg cattgaaatc 16140

aaataagtga gatagcatcg tgatatagta ttacgtatgc aaacactgtt acagagatct 16200

gtctaaagtt aaattccaca aatgaattct ttaaaagggt ttaatcaaga agaatatata 16260

aacaggatgg tgaaaaattg tcatattatt tgttttttaa aatatcttta tgatttacag 16320

gcaagatggt agtggtgtga gagcggatgt tgtcatgaaa tttcaattca ctagaaataa 16380

caatggagca tcaatgaaaa gcagaattga gtctgtttta cgacaaatgc tgaataactc 16440

tggaaacctg gaaataaacc cttcaactga gataacatgt aagtataatt tttcataaac 16500

aattttattt caatatatcc ctcaagttta ccaattcaaa ttcatatttt aattgagagg 16560

ctgacttttc tttctttgaa actaaactgt gaaaacaatc cattaaaaag ctaaatatac 16620

catatagctc cctaacgtaa atcattctaa gacttaaaga atcatttggc atttatatag 16680

taaattttat ttgctaaaaa ttctcattaa ttatccctgc aacattcctt atgagtgatg 16740

ttactgtcag atgtcattag tggataggcc ataggagggg tacatagatg ctcaaggtca 16800

gagaactatt taattaatga tccacctcag aggcttcttc atttttcttt gtaacattta 16860

tcacaattga aattacaaag ttatctgtgt aaattttgta ttgtttggct tcatcctaca 16920

ctgtaatcat cctaaaagaa agaaccagtc aaccttcttc atcctactac cctcctacca 16980

cccagtctcc atcatataac acatattcaa taaataattc ttgcatgact gaaagaaaag 17040

aaataatata tgcatagaat ttaaggacat tcctccaagt tggttacatt ctgctagttt 17100

aataagccat tatttcttct cgatgagctc aagattaaaa ggattttgat gattcccata 17160

ctagactggt aggtaccagt tacagatgta ctaactgtta aatattgaaa tgctttccta 17220

tttgttggta aacaattact gcatcaggcc cacaaagttg tcttccgaga tgtttcaaat 17280

ccactgcccc tgctgctaaa gagttatgct tagcaaagca aagcactcta agacactgct 17340

ccaactccat ggcctgattg catcttttat gactggccaa tgctcacgca ctgcagtttg 17400

ttaggtagtt gaatattacc tctgcttcca cacattaagg aatgctcccg aacgcacttc 17460

ccaagtgttt atttatttat cattatacta gacaatatgg tgatacgatg gtcacagaat 17520

agcggtttcc acctccagag cccataatct agttgaaggg aaagatattc caacacaaga 17580

gtgttgacaa tcaagataga atatgatcaa gggcccagtg tgaggcccag gcaatgatca 17640

ctgcaggaat ctggggaaga aagagaccag cgtgcttggg atatctagca aaagtttcat 17700

gaaggagaat ggactttgac tttgaaatat gggtaggatt tacatatttt gagatgagaa 17760

aaagaaagtt cccagagaag gaaagcatga aaaggcaaac agtctgtact gaacgcgatg 17820

ctttgacaga ataatgaaga aagggacctg ctggaatgat tgatcagtgt tcatcattca 17880

caccatcatc atcaaaacac ttatttaatg agaacttact gttttttagg catggcttta 17940

atgccctata tgaatttttt tcttgattaa tccttacaac aaacatatcc catagatagt 18000

tttattgtcc cccttagaaa agataaattg cctaggctga cacagtcagt atatgaggca 18060

gtcaggattc aaactaagtc tgtttgttca aaaaattaag aatggccagc tttttaaaat 18120

tttctgtctc cagaagtatg atttggctcc actgaagttt gcaaaacaaa tgtgataccc 18180

aaaccttgtg aaacttttag tgggaaataa ctttgcataa gtcggtttga gagagcgtgg 18240

aaacctgtct tgaaaagttt taatttaact tgcaggaaat aaaaatgatg ggtttctcaa 18300

ttaaaaattt caatcaagga aggatatgag ctaacataac atttttttaa aaagatcagt 18360

ctggtaaggt agaggtgcat aaactgaaaa ggagcaaaag tggtggaatt cagttagaaa 18420

attattgtaa ctgtactgat gtcaaatgat gaaaccatga actaaagtag taccaaaagg 18480

agtgaggagg atggaataat tcaaaagata gaggacagat gtgcagaacc tggagattat 18540

aagatgtgaa aggaggagtt tgagaaaatt tcagattttg gaagtggtgt cattttacta 18600

aaaggatata ataagtagca aattttggat aaagttgggt cccactgagt ttgagatggc 18660

tgttggacat gcagagaaaa ctgtcttgta tgctgttctt aaattgaaat agacagacct 18720

ttaccctctg atactgacat attttccttt ccaggctcac cctccatttc cctaaacaca 18780

acacatgcac tagctctcct tactttattg ctccacaaac atcttacacc tccaagcatt 18840

tgtgcccact gtaccttcta tctggaatct cttttgtcct cttgtgtgcc tgaaaaattc 18900

ctttcagatc ttcaaaatac agtgcagatg ctatttcttc tagctcaaat attatctcct 18960

ccatataatt taattactct cttttttctt ttctctactt tgcacttaca tttatttgaa 19020

tgattgcttg attaatttct acctgtaaat tatgtgaggg caggtcctct atattttgct 19080

cgcagttaaa tctgcagcac ttattataga gtggtatcat tagagtaata tacatatatt 19140

tgaggacatg ataaattaac ttcccctata gtatttatca cattgcatct caatgacttg 19200

cttatgtttc tgttttccca tataaattga gtaacttgaa aaaagagata tctattaagt 19260

atttaatgag aaattaaagt acaaacttta gtatgcataa caacaaattg ggaaaaggtt 19320

gtaaacaaag agatttgtag ggcccatgag ttagagatcg tttcagcagg tctgaaagga 19380

agcctaggaa tctgcatttt agaggaccac ctcccaaccc caacaagtaa ttctgcttct 19440

tgttgtctgg gtactgtact ttaagaaatt atggtgaaat gatatcagcc tttattgtat 19500

ttatcttatt ctcatttttt aatactagca cttactgacc aggctgcagc aaattggctt 19560

attaatggta agttttaata ttattttgta actgtaattt gccaaatcat aaagagtaaa 19620

agtgcaagtc ttttgtgtac ttttggccaa ggcagtatct atcaagttga tgtctttgtt 19680

cttagttcgc tcaggtggtg ttgaaacaag acagtgctga tcccaagtgt cccatggagt 19740

ggactttagg tttccccttt ccttttagaa aaaggaagaa gttgtagtgg aggactaccc 19800

actctgcact caaaattgcc ctcatgaaaa tttctttggc agctttgaga accttttact 19860

gccctggttc taaggtggca tttctgtaga cttacaaatt atgtttgatg acaccgttta 19920

tgtagcttct cctaaccacc agagtagctt gctttgttgt gaattcaggt taatcacaaa 19980

gtataataaa aaagaattgt cagaagtctt cccagctttg ggtctataac ctgaaggaaa 20040

agtcactact cttcaacatc atcctatgta ctctcaggct aggatagcag aaatgcaatc 20100

cctagaaaac agcaacttac ttctctgacc aaaaaaatgc agttaaaaat tagttcaatg 20160

tacctggtag ctggcctatc ttaggtactt cagtgatttt acaaagtgat ggtagtccta 20220

tgggtgtttt tcagcttcac tacgtattta attcatgctt attgttaatg aaactgtgat 20280

aagcaattta ctagggtatt tgtttgggag atgccacaaa ggaacacatg tatctcttaa 20340

tggaagcctg gtcctccttt atccaggaaa tttgctagga aaaaaaagcc tttaggtggt 20400

tgtgctatta aaccagggca ctacttaaaa gccagcccag caatagttgt gtgatttacc 20460

attaatttct tagtaataga ccacacaaaa gaagaaaatt atgggaatgc gagttgagag 20520

gaattgggtg atcagcctac cccagcccgt ttcagctctg gccagtagac tattcacgag 20580

ctctttgaaa acatttaaat aaaccttatt tagatactag aaaccctctg tcaccctcaa 20640

gaatattctg tggtatagcg actcctttat gagggcatgt ttggtaatac agcatcagtc 20700

ttggaggtgg actggattct acaaggtgaa ctgcagtcac taaggagtct tttggatgag 20760

accagttttc ctccaacttc aatgtgtgca tgaacctcac atcaaaatgt agctttagat 20820

ttgtcccatg atgtggttcc aagaatcagc acttctaata agtttccagg ggatgcccat 20880

gctgcaggcc cacaaaccac actgagcata gcaagactat tgagaaaaag gaaatttccc 20940

aggagtctgt ggcctgagct ggcacatcca ataatgacct atcttaacct caactcatga 21000

ggaattccag ggaactctga agctgctcaa aatttgaagc ctatatgcca actaaattca 21060

gaaatgttct ccaaaatgct atctataagc aacagtagtc acaaatgcat tgtagaaata 21120

tatcgatcat gctttttgga aaatccagca tgtcctgagg aagaatgtat aagacataaa 21180

agtcataaat tatggaaaga ctcttcagct tcttccaaat gtaaaggaat catgatcttc 21240

ccagcacatt aatgcccttt ctcattagaa tgtggggccg gtccagacct aataacattg 21300

tctgagcaga gaatccttgg aggcactgag gctgaggagg gaagctggcc gtggcaagtc 21360

agtctgcggc tcaataatgc ccaccactgt ggaggcagcc tgatcaataa catgtggatc 21420

ctgacagcag ctcactgctt cagaaggtga ggccaccact acctacccat ctgggaacaa 21480

ttagaataga caggtcatga agactgcacc ctctacccta ggattgaatt gagccagaaa 21540

taattcaatg caaaaaaatc agtaagaatt ttcttcctat tcatgaaagg aaaaggattt 21600

ttccccttta gcatgctaat ttagtgctat ttctctgttt caggtaataa tatattagca 21660

cagtaaagaa caaagattta tatgtcagaa tgttttttaa atcctagcta taaaagctta 21720

agaaatttac taaatctcca taagctttat tttttttcca aattaaggga caacactgtt 21780

atctgtgact tagtgttact ggtagcattg agtacactaa tgtaaacata cgttaaatgt 21840

tagcgaaacg aattgctgtg gaagatttgc acattatatc atgggagctg atggctaacc 21900

tagagactgc cccatgccat taatttattc attcataaag attattgagt atctagtatg 21960

agcacagtgt tatatattgt agaagctact agtataaaca aagtattgcc tctgccttca 22020

aagagcttac actcgaatgt tggaatcaga atgcacaaaa ataatgatca attacaatga 22080

gtagcataaa taaaattaat gtaggcaact tacaagaatt cttaattgag gtgactaaac 22140

tattgccaac actagggtga tatgctacca gtggcgagta ggttgcataa acttacctta 22200

ttggtaaaaa gaaaagttca cattgctcat aaaagaagga ttttagattt cagcataact 22260

aaaatctgtt tcaaacctgc cttgttactg gggcatcgca gaccacaaca gttgttggga 22320

acttaactca aaaagttcac ccagaaaaat aatggagatt tgaactcgtg tgcccctgac 22380

catatcaatt ttcttctcag actcttactc taaactggac ctccttatca cacacacaaa 22440

gccttccata ggcagatcaa tccagtctta tttctcaaag catgtacctt gagcttcaga 22500

taaacagcat tgttctcttc ccctggactc ttcctacatt tccctaccta tgagtatctg 22560

atcaatctgc ttatccttga aatgttaata tatttaccac atctctattt gaattttatg 22620

aaatttttga taatttctaa gtagtttttt cagatttata ggcactactt catggtacag 22680

tgactgttac aaacgtattt gttaaattta gaaggaataa agatttaaaa gactagggta 22740

gttactgaac taaagtttta ggaaatccca aattatttca aatttttctt atggtaattt 22800

tatgacttaa tatttttata tgcagtgaac aaatttgaaa ctttaaaaga tactcccaga 22860

attatcagtt ttctgatgta gattggcaaa tttattacta tatcccaaat aacccaagag 22920

acaaaattca caaaaacatt tcaattttca ttgccacttg aaaggccaaa aagcagaaat 22980

ggcacgcatt gatttcaatc gtactcttga gtgtgggaac caggaattaa aatacctgga 23040

cttatcaggc acttagcata accaagaacg gaatagaaac ctccctggat tctaagccct 23100

attcagtccc aatcaccaaa aaccaagtaa acgatatcac tataatgaaa gccacagtta 23160

taaatatcga caacgattac caaaggaatc catggaactt tgaattttgc caccccacat 23220

ccttctattc attaccatga ttgatccact aaagctaaca gactctgtga accttgtatt 23280

ggacccctcc ctaaagacct gattgtcact gagaaccatc agtgaggatt tgtttggggc 23340

atgaccagcc ttacatcaaa gtacatagaa gtgatgaggt cttatcaaag aggattattg 23400

aattatcacc tcttctatgt agctttccct gatactctct ttcctctcca ttgagttcca 23460

cagaaatttt tttatctgcc tttaacagtt gtcctcatga tttgtgatat ttgacttacc 23520

tcttgtcagt ttccttcact agtgtagagt tcctcaaaga aagagaccat aattacttat 23580

atttttattc ctggagactc atactattcc ttatacaaag tagacactta acaatggctt 23640

gttgaactat aattaatgaa aataatagct accttcatga aagttcactt tgtgccaaac 23700

actatagttg acataataca tttgtctcat taatacttaa caattgtgtg agaaggtatc 23760

accaatcaca ttttatatgt aaataaaccc cagagctatt aattaacttg tcataaataa 23820

cacttttcat atgtggcata gccaagattt aaatataaat gttactggtt ccaaaatgat 23880

gctctaattc acttgctgga aagaaggaaa ggaagaaaat aaacgagtgg aaggaagaga 23940

gggagggaag agagaaaagg aaggaaagaa aaaagagtct cttcagaacc ttcactgtaa 24000

agactccgag caaaagaagt tgaatataaa aacaacatag gtttgtttgt tttctaatat 24060

tttttcttca aaatttttaa ctcaggttca ctcttacaca aactactgtg tcttataaaa 24120

gtatttccgg tcatagaatt tttattttct gtattaactc cactatctaa tctccataaa 24180

actcctaaat tggtattatc ggtaacattt tgtttttact caacccttag gaacaatgtt 24240

aagttaatca gccctccaca tcacagatcc ttattttcat cagtctgtac aaggcatttc 24300

tctcatttta attttttttc ctcctgtcat ccctggattt cactttcact gccctccttc 24360

cacccatatg cctcatacta atatattcga aatatacatg tcttaaaggt acatgcacgc 24420

acctacaaaa cctatagtgt ttttttgtat gtatatgtct ttaatttaaa taagtagcat 24480

tgtgtaaaag tctaatattg tttcttactg ttttcactca attcttggaa ttttcatctg 24540

atgcactgct gcatagcacc ccatggtatg cagccaccat atttccttca tccaattagg 24600

ttgcatgacc taccttccca ttgccacaaa gagtacacac aaaatatttg tacttatctt 24660

tctgtaaacc ttcaggaatt tcagaagcac acatgcaggc tgctaaatat accagaatac 24720

tttccagcca cttaaatctt taccagtatt gcaaaagagg ccccatttcc ctccacatca 24780

acatttagta ttattctttt gtttaagttt tatcaatctt ttaaatgtac acaagatgct 24840

catttttata attttaattt ctcagattac tagtttgagt atcttttcat atatctaaga 24900

gctgttttga tctcccctac catgaactgc cactaatatt ctttgcctat tttacaatgg 24960

tttttctgct tatttattac tggtttacag acttttaaaa tatattctac aaaaatttta 25020

gacattaaac attaccaata ttttcccatg gttcctcatc catctggtaa acttgtctat 25080

ggtatatcta attttgattt aatagaattc attctatttt taccttttag tttgtgtttt 25140

tgttgtttag ccaaaaagtc cccattccta ggtcataaag gtaatgtcct tttttttttt 25200

ttaacgctac tgttctctct ctgtctcccc ctatgtatat aggtgcacat atacttgtac 25260

acacatacat atacctatat atgaggggag ttcgataagt ttatggaaaa taaaattaaa 25320

agataaaata aaaaattata aactttattt ctcaacataa gctccttcaa gttcaagaca 25380

cttttgtaag caataatacc agccatatcg tccatcccta aagaactgag ggtcctgaga 25440

atttaactat gtcaatgcag tcttttttac attacttttt tacagtactt attgatgaaa 25500

aatgggtgcc ttttaaagat tgttttaaga ttagggaaca aaaataagtc agaggaagtc 25560

aaatcaggac tgaaaggtgg atgcctagtg atttattgct gaaactttca taaaactaac 25620

cttatttgat gagaggaatg agcatgagca tggttgtgat ggagaagaac tctggtggag 25680

ctttcctgga cactttttct actaaagctt tggctaactt tcttactctc ataagaagaa 25740

gatgttattt ttcactgacc ctttagaagg tcaacaagca aaatgccttc agcatcccaa 25800

atgtctgttg tcatgacttt tgttcttgac tagtctggtt ttgctttgac tggaccactt 25860

ctacctcttt atagccattg ctttgatggt gctttgtctt caagattgta ttagtaaagc 25920

catatttcat cttctgttac aattcttcaa agaaatactt cagaatcttg atctgacatg 25980

tttaaaattt ctattggaag ctctgacctt gggtgcagct gatctgggcg aaacagtttt 26040

ggcatccatc aagtagaaag tttgctcaac tttagttttt cagtcagaat tgtataagct 26100

gaaccagttg agatgtctat ggtgttgtct attgtttctc acagttaatt gttggtcctc 26160

tttgagacat gaacaagatg aaatttttcc tagcaaactg atgtggatga tctgttgctg 26220

cgggcttcac cctcaacaac atctctttct ttcttgaaac aaattatcca ttagtaaact 26280

gatgattggg ggagatgctg tccccataaa ctttttgtaa ggcataaata atttcaccat 26340

tcttccagtt tcaccataaa tttgacgttt ttttgcttca attttagcag cattcatgtt 26400

gctttgataa gagctctttt caaattcatg tcttattcct cttagtgcct caaactagat 26460

cttgttcagt atgacaagtt agtatgagtt tatctgcatg caaaaatctt tgaaatccat 26520

gcatagtttg tttataatat acattttcaa tgaacttttg aagaccccat acatacatat 26580

gtatatatat gcacacacac acacacacac acaccaaaat cttcaaccat tatcagactt 26640

agtgcagaaa aattattcat ccattaacaa gataagaatg ccccttatca tcactactat 26700

ttaaatggag ctcctggcta aaggaaaaga cagggattga aaaaaattag ttaaatctaa 26760

aatgtttatt atttcaggtt tcttagttgc ttaaatggga agggaggtat ggacaaaaga 26820

gaaatcaaag atatttgtgt tatgctactt atcattaaag tatcagaata acttcattgg 26880

aatagaaaaa caccaagatc accccacgat atgttttcta aaatcttctc catttcttta 26940

gacaagtgac catgtattcg gccagtgaag aattaaactc acttgccagc ttataatgca 27000

ggaaaatata gcaaagagat gtggatccaa tagtttctag atagtggtac aggatggcta 27060

agatgaattt atatatctga aatgttcaca aattccctac tcatatagca tgttttcata 27120

atgttttagc aactctaatc ctcgtgactg gattgccacg tctggtattt ccacaacatt 27180

tcctaaacta agaatgagag taagaaatat tttaattcat aacaattata aatctgcaac 27240

tcatgaaaat gacattgcac ttgtgagact tgagaacagt gtcaccttta ccaaagatat 27300

ccatagtgtg tgtctcccag ctgctaccca gaatattcca cctggctcta ctgcttatgt 27360

aacaggatgg ggcgctcaag aatatgctgg taagtgtctc ggaaaaaaaa attaacaata 27420

gaaatgtctt atatttgcta ttaggtaatt ttttaaatta ggaaacatct ggaataggtg 27480

tttctattct tctacagaca gaaccattct atattctgct cagcccaagc tctggctacc 27540

cctgagtctc cttagcaaag caaagcaatg ctccagaaac tatgggaatt ctcaaatata 27600

gtaataggaa aatgtaaaag aaagttatga agacacgagt tctttaataa tccagagatt 27660

ctataagatt caaatagctt ccctataaac aataaaaaag attttgtttg tttgtttgtt 27720

tgcttgtttt ttagagacaa agactttctc agactggagt gcagtggtgc aatcatggct 27780

tactgcagcc tcaaactctg gtcttaagaa atcctcttgc ttcagcctcc caagtagcta 27840

gaattataaa taagtgtgta ccaccatacc cagctttttt tttttttttc tacagacagg 27900

ttcttgctct gttgcccagg ctggtctgga attcctgccc tcaagccatc ctcctgcctt 27960

gttggcctcc caaagcaatg ggaggattta gattagacat tgtatgaggg cttaataatc 28020

cttaaggtat taactgccct ttaaagtatt ctgggatatg gcaaaaactc gatgtgtata 28080

taaacattgg tcatatttgt ttattgaatg aataaaatgg aaactaaaat gaggacaatg 28140

cacaagagct actagaacca gtaagagtat cagcgaagga gtggaagggt agcattgaca 28200

atttccctgg gcttttaccc atgttgtaga ttgtctctcc aaggaataat acaaagcctt 28260

aatagtccta gaacacattc tattgtgttc ttatggccca aagtaaattg gtgtagtaga 28320

taacatttgc accagtcatg aaaaactatt ggtgtcattc tgagagtaca tcaatataaa 28380

atagactagt tctttagcct tgaaactaga ctggtttctc ttttgctgct aggttaaagg 28440

ttattcaata tgtaatcttc caatccaaaa tctgtcagtg gataatttaa aagcttttag 28500

tcaattttaa gatatttgtt ttcttaaaat tttaaggggc actgtgtcac aaagctaaag 28560

aaaaaaaaga aaaaaaaact gatctgtgaa aggggttatc ctcatctact tggggaattt 28620

tggctgcgaa gaaactccaa agtaaatctt tagaagcctt cattgttaaa tatgaaataa 28680

tgtttggagt acatttattt cttctcaaat ttattatagg gtcaataatg tacacatctt 28740

gaagtccatt tttttcctgc ttttataaca aacaggccac acagttccag agctaaggca 28800

aggacaggtc agaataataa gtaatgatgt atgtaatgca ccacatagtt ataatggagc 28860

catcttgtct ggaatgctgt gtgctggagt acctcaaggt ggagtggacg catgtcaggt 28920

aagctcaaga caatctcatc catgtcatca tccaagaagt gtataagcac ttcctagtat 28980

gtgataatgt gatagacata agtgtaacag ttacaataca cagccctgtt cctctaaaat 29040

ttataatcta gattttagaa ataaattttt ttatgaatga agtttatcta tcatgaaagc 29100

attaactctg agaggccaaa ttacagagta gttaaccatc caaagctcaa gaatcagaaa 29160

gacctcgatt tgaattcctt aacctctatt accaagtctc taactaaaag ctggggataa 29220

tcataatagc acctaacttt ttgggtacta agaaaagtta aatgaagact aaatatatca 29280

ggcacatggt aaacaacaaa gaaatctcat ctatttcact attattaatg tagaccatgg 29340

tcactcgtgt taataacttt aacctcaacc ttttaactgc tgtgaaggat taaataaaaa 29400

attaatcact atattataaa aattaattga tatataataa atgaatttta agagatacgt 29460

aataattcat ggactccttg aagatagaaa atttatacaa aatcctagta atttgagtca 29520

caaaagctcc tacaataatg aaacagtatg aatgaaaaag aaaagaaata actattatat 29580

ttggatctag cccataattt ttaaccaaat gcacaaaaac aaacaacaaa tatgaaattc 29640

tcactgtaaa gtgattaaaa tcaaatttga attctaaaat tttaaattaa attatctaaa 29700

cataattgat gcagttatat gttttaatag gttttgttca catatctgaa atccaactcc 29760

acacagtagc aggaacagct ggtgtcagaa attaaatatt cttttagtct ggagttttaa 29820

aaaatcaatc tgtttacttg agtaatttgt tgctgttttc atgggtgaat tgtatacaga 29880

aggataagaa ttattcttcg catcaaaagg tcactgactt tcatatttag tgctcatggt 29940

ctttaaaaag tggataaaaa gtagttctca catttcatgg aaagccccca atccatgagc 30000

acatttccca aaatgaaaca tttttatcaa ctgcaagttg tgtgtaggtg gagatttgtt 30060

tttcaattgt caagatactg ttaattaccc agtcctttat ctccttttgg tggagatgtc 30120

tctgtgctag gaaacccttc ttgctctcct tcctgtttct cttttactac tggccctgaa 30180

acaacaaatt ctcaagtttc atgacagctt tccaaagaat ccatcaatca aataagcaac 30240

acaactcgac actgacaatt ccagacctac taagagcatt aattaagact taaaaataaa 30300

catgagtttt aaaagggtgt tattcattat tttcccattt ataacgtccc ttaccttctg 30360

tccttcagtg catacaaatt attatcttcc ttgaagccca gttcaagccg tacctcacca 30420

tgataccttc catgtatatt ccactctagg cctcactgat ttttaactga aatactataa 30480

tgcatagttc acacttaaaa aaaaaaaaaa aacacagcac tttacataag agcttacagg 30540

atcctatttg ttttatccat tcttttgttc atttttacaa tcattaattc aaaggaatta 30600

tattaattac tttctatgca cccgacgttg tgttaacaca acaatactat ccctgcattc 30660

agcaagtcta tggtctacaa gagaggacac aaattcaaat gtctgtagtc aagcagtgaa 30720

gctggctaga tatggaaaaa ttacaagtcc ctcttgcttt aacatttgct tgcccacatt 30780

tggtcagaca tcatgcaaaa taatttctca ctatagaaaa aaaaacacta caaaaacaat 30840

aatataaaga actgagaact ggttaactga agcatgcata tgtcatctaa aagaagcagg 30900

tgacgaccag cttcatgaag tacttgccat gcatattggc acttcacaca ctgacccttc 30960

tccccaccta gaccagtaat taaacaggta tggatgagct agctactaag agcagccaac 31020

tgaatagctg actaacttag aagcacactt ggtaataata gctgactttt attagtactg 31080

actatactat atgctaagct gtactcaaag tgctttgagt tttaaactga tacaaacatt 31140

atatgaggaa acagaggtac agagagctat tcaccagctt accaaaggtc acatagctgg 31200

taagtggagg acttaaaccc agactatcta gtttcagaac ccacagactt aatccatcgt 31260

gcagaacata agacatactc catctgtctc cccaactagg ttattatgtg cacaaatatt 31320

tattggttgg ttggttcatt attatgactg ggtggtaagt atgtcattag gagtgttttg 31380

cttatgacta tataaatttc ttcaccaaaa gaagactttc tgatgatata ctatgcatca 31440

gacaccacgc agggtgctaa ggttaggaag ataagtgaga cttctagaaa ctcattcatt 31500

caacaaatat ctcctaaggg ctagaagctt aggtttcagc agtgaacaga ataggtatgt 31560

tctctttcgt gttggacctt atagtatatc tgggaaaaca gacattgaat aaatatcaca 31620

aatgcaagtg agtgtttcag agacatgcag ctgctacatc aaaacaaaac agaacaaaac 31680

aaacaaacaa aaactgacca gtgggattaa gtgtaaatag gcacacaaat gcacaaatat 31740

gcttttataa aatagtgaag cagtgacaga gacacacaca agatataaag acacaatgaa 31800

gaacaattga gcccaaagct ggaaagggtg agagtgtgaa ggaaaaaggt tgatcagaga 31860

agttttcccg aaggagagaa agcctggatg attaggaggc aaccactcgg tgactgaggg 31920

aaatctgaaa aatgtatttg tcatcttctc agacttgctg aaggaatgac ttgggtactt 31980

tgaggatttc agtaattttt ccatgacttg gtataatatt tcaaaaggaa ataggctgac 32040

tttatttgta taatgaatgt gactccttcc tcgactgcca tagaaataaa ctccttaata 32100

ttttgggttt gtctttgcac ttaagtaatc agtcattctg tttttttaca gggtgactct 32160

ggtggcccac tagtacaaga agactcacgg cggctttggt ttattgtggg gatagtaagc 32220

tggggagatc agtgtggcct gccggataag ccaggagtgt atactcgagt gacagcctac 32280

cttgactgga ttaggcaaca aactgggatc tagtgcaaca agtgcatccc tgttgcaaag 32340

tctgtatgca ggtgtgcctg tcttaaattc caaagcttta catttcaact gaaaaagaaa 32400

ctagaaatgt cctaatttaa catcttgtta cataaatatg gtttaacaaa cactgtttaa 32460

cctttcttta ttattaaagg ttttctattt tctccagaga actatatgaa tgttgcatag 32520

tactgtggct gtgtaacaga agaaacacac taaactaatt acaaagttaa caatttcatt 32580

acagttgtgc taaatgcccg tagtgagaag aacaggaacc ttgagcatgt atagtagagg 32640

aacctgcaca ggtctgatgg gtcagagggg tcttctctgg gtttcactga ggatgagaag 32700

taagcaaact gtggaaacat gcaaaggaaa aagtgataga ataatattca agacaaaaag 32760

aacagtatga ggcaagagaa ataatatgta tttaaaattt ttggttactc aatatcttat 32820

acttagtatg agtcctaaaa ttaaaaatgt gaaactgttg tactatacgt ataacctaac 32880

cttaattatt ctgtaagaac atgcttccat aggaaatagt ggataatttt cagctattta 32940

aggcaaaagc taaaatagtt cactcctcaa ctgagaccca aagaattata gatatttttc 33000

atgatgaccc atgaaaaata tcactcatct acataaagga gagactatat ctattttata 33060

gagaagctaa gaaatatacc tacacaaact tgtcaggtgc tttacaacta catagtactt 33120

tttaacaaca aaataataat tttaagaatg aaaaatttaa tcatcgggaa gaacgtccca 33180

ctacagactt cctatcactg gcagttatat ttttgagcgt aaaagggtcg tcaaacgcta 33240

aatctaagta acgaattgaa agtttaaaga gggggaagag ttggtttgca aaggaaaagt 33300

ttaaatagct taatatcaat agaatgatcc tgaagacaga aaaaactttg tcactcttcc 33360

tctctcattt tctttctctc tctctcccct tctcatacac atgcctcccc caccaaagaa 33420

tataatgtaa attaaatcca ctaaaatgta atggcatgaa aatctctgta gtctgaatca 33480

ctaatattcc tgagttttta tgagctccta gtacagctaa agtttgccta tgcatgatca 33540

tctatgcgtc agagcttcct ccttctacaa gctaactccc tgcatctggg catcaggact 33600

gctccataca tttgctgaaa acttcttgta tttcctgatg taaaattgtg caaacaccta 33660

caataaagcc atctactttt agggaaaggg agttgaaaat gcaaccaact cttggcgaac 33720

tgtacaaaca aatctttgct atactttatt tcaaataaat tctttttaaa ataatttccc 33780

tgcctaatta tttatggaag ttatgacttt tgaaggacaa ttcaaaacca tttatttaat 33840

tggttctgca atgaaagaac tgccccatat actctactaa aggcttggca ctttctgctg 33900

ccttttaatc cagcgctata attgaggcaa gcgtccagct tgacacctcg agataacttc 33960

gtataatgta tgctatacga agttatatgc atggcctccg cgccgggttt tggcgcctcc 34020

cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg 34080

tcctgatcct tccgcccgga cgctcaggac agcggcccgc tgctcataag actcggcctt 34140

agaaccccag tatcagcaga aggacatttt aggacgggac ttgggtgact ctagggcact 34200

ggttttcttt ccagagagcg gaacaggcga ggaaaagtag tcccttctcg gcgattctgc 34260

ggagggatct ccgtggggcg gtgaacgccg atgattatat aaggacgcgc cgggtgtggc 34320

acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga 34380

tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg ctttcgtggc cgccgggccg 34440

ctcggtggga cggaagcgtg tggagagacc gccaagggct gtagtctggg tccgcgagca 34500

aggttgccct gaactggggg ttggggggag cgcagcaaaa tggcggctgt tcccgagtct 34560

tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg aaacaaggtg gggggcatgg 34620

tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg cgggaaagct cttattcggg 34680

tgagatgggc tggggcacca tctggggacc ctgacgtgaa gtttgtcact gactggagaa 34740

ctcggtttgt cgtctgttgc gggggcggca gttatggcgg tgccgttggg cagtgcaccc 34800

gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc acccgttctg ttggcttata 34860

atgcagggtg gggccacctg ccggtaggtg tgcggtaggc ttttctccgt cgcaggacgc 34920

agggttcggg cctagggtag gctctcctga atcgacaggc gccggacctc tggtgagggg 34980

agggataagt gaggcgtcag tttctttggt cggttttatg tacctatctt cttaagtagc 35040

tgaagctccg gttttgaact atgcgctcgg ggttggcgag tgtgttttgt gaagtttttt 35100

aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa ttttcagtgt tagactagta 35160

aattgtccgc taaattctgg ccgtttttgg cttttttgtt agacgtgttg acaattaatc 35220

atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa ccatgggatc 35280

ggccattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt 35340

cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc 35400

agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact 35460

gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt 35520

gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca 35580

ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat 35640

gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg 35700

catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga 35760

agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc gcatgcccga 35820

cggcgatgat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa 35880

tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc gctatcagga 35940

catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt 36000

cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct 36060

tgacgagttc ttctgagggg atccgctgta agtctgcaga aattgatgat ctattaaaca 36120

ataaagatgt ccactaaaat ggaagttttt cctgtcatac tttgttaaga agggtgagaa 36180

cagagtacct acattttgaa tggaaggatt ggagctacgg gggtgggggt ggggtgggat 36240

tagataaatg cctgctcttt actgaaggct ctttactatt gctttatgat aatgtttcat 36300

agttggatat cataatttaa acaagcaaaa ccaaattaag ggccagctca ttcctcccac 36360

tcatgatcta tagatctata gatctctcgt gggatcattg tttttctctt gattcccact 36420

ttgtggttct aagtactgtg gtttccaaat gtgtcagttt catagcctga agaacgagat 36480

cagcagcctc tgttccacat acacttcatt ctcagtattg ttttgccaag ttctaattcc 36540

atcagacctc gacctgcagc ccctagcccg ggcgccagta gcagcaccca cgtccacctt 36600

ctgtctagta atgtccaaca cctccctcag tccaaacact gctctgcatc catgtggctc 36660

ccatttatac ctgaagcact tgatggggcc tcaatgtttt actagagccc acccccctgc 36720

aactctgaga ccctctggat ttgtctgtca gtgcctcact ggggcgttgg ataatttctt 36780

aaaaggtcaa gttccctcag cagcattctc tgagcagtct gaagatgtgt gcttttcaca 36840

gttcaaatcc atgtggctgt ttcacccacc tgcctggcct tgggttatct atcaggacct 36900

agcctagaag caggtgtgtg gcacttaaca cctaagctga gtgactaact gaacactcaa 36960

gtggatgcca tctttgtcac ttcttgactg tgacacaagc aactcctgat gccaaagccc 37020

tgcccacccc tctcatgccc atatttggac atggtacagg tcctcactgg ccatggtctg 37080

tgaggtcctg gtcctctttg acttcataat tcctaggggc cactagtatc tataagagga 37140

agagggtgct ggctcccagg ccacagccca caaaattcca cctgctcaca ggttggctgg 37200

ctcgacccag gtggtgtccc ctgctctgag ccagctcccg gccaagccag caccatgggt 37260

acccccaaga agaagaggaa ggtgcgtacc gatttaaatt ccaatttact gaccgtacac 37320

caaaatttgc ctgcattacc ggtcgatgca acgagtgatg aggttcgcaa gaacctgatg 37380

gacatgttca gggatcgcca ggcgttttct gagcatacct ggaaaatgct tctgtccgtt 37440

tgccggtcgt gggcggcatg gtgcaagttg aataaccgga aatggtttcc cgcagaacct 37500

gaagatgttc gcgattatct tctatatctt caggcgcgcg gtctggcagt aaaaactatc 37560

cagcaacatt tgggccagct aaacatgctt catcgtcggt ccgggctgcc acgaccaagt 37620

gacagcaatg ctgtttcact ggttatgcgg cggatccgaa aagaaaacgt tgatgccggt 37680

gaacgtgcaa aacaggctct agcgttcgaa cgcactgatt tcgaccaggt tcgttcactc 37740

atggaaaata gtgatcgctg ccaggatata cgtaatctgg catttctggg gattgcttat 37800

aacaccctgt tacgtatagc cgaaattgcc aggatcaggg ttaaagatat ctcacgtact 37860

gacggtggga gaatgttaat ccatattggc agaacgaaaa cgctggttag caccgcaggt 37920

gtagagaagg cacttagcct gggggtaact aaactggtcg agcgatggat ttccgtctct 37980

ggtgtagctg atgatccgaa taactacctg ttttgccggg tcagaaaaaa tggtgttgcc 38040

gcgccatctg ccaccagcca gctatcaact cgcgccctgg aagggatttt tgaagcaact 38100

catcgattga tttacggcgc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 38160

ctactgattc taattgtttg tgtattttag gatgactctg gtcagagata cctggcctgg 38220

tctggacaca gtgcccgtgt cggagccgcg cgagatatgg cccgcgctgg agtttcaata 38280

ccggagatca tgcaagctgg tggctggacc aatgtaaata ttgtcatgaa ctatatccgt 38340

aacctggata gtgaaacagg ggcaatggtg cgcctgctgg aagatggcga ttgatctaga 38400

taagtaatga tcataatcag ccatatcaca tctgtagagg ttttacttgc tttaaaaaac 38460

ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaaacct 38520

gccctagttg cggccaattc cagctgagcg tgcctccgca ccattaccag ttggtctggt 38580

gtcaaaaata ataataaccg ggcagggggg atctaagctc tagataagta atgatcataa 38640

tcagccatat cacatctgta gaggttttac ttgctttaaa aaacctccca cacctccccc 38700

tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 38760

atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 38820

attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg aataacttcg 38880

tataatgtat gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta 38940

gctgcaaccg aggaaaaaac gtgccatgag gtctctgtat ccaagtgtga ct 38992

<210> 20

<211> 34073

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный полинуклеотид

<400> 20

gagggagggt ggtgctttgc taatggtgaa ttactaactc ctcaataaag aatattattt 60

gaaataattt ttgaaatttc ataattactt tgggttcttt cttaatgata aataaataat 120

agtatattac aaacatacat taatatttcc tgaatgaata caccacaaat ctcccttaaa 180

atatagcaag aataaaaatt atactatttc tgacaatttt taatttctca aataataata 240

ccactctgat ttttaaacat ctacaccact ctggctttgc caatcttttt aaaaattgaa 300

aagataataa ttttatcata attacactga agcatagaac tttttctttc aaggaaagca 360

aatttttgaa attctataat ataacctccc ataatcctga ataaattaaa ggttcaacaa 420

cttagtaaag taagactgac cttccctttt atttcttttt cagatcaaaa atcttacttt 480

tataggagca gttttcaact cctaaatgtt gaatataata gtcagttaaa ttcaccagct 540

acacaggaat acaggacttt gagtggaaga attgaatctc tggtaagtta atatttgtct 600

ttgctcttta ttccattata aaatgaatat gataataaac ctaatgtttt gtaatatatt 660

ttcagttgct aagtgctcta catattttcc ttccttgaat ggtgaaacat gtgtttctct 720

ctgcttttat ccagttagtt tactcatata ctggttctta ttcacatctt tgtcatgagt 780

aaaaagtgtt agaaaggcca cgagtaaata tgcattttat ttgtttatga attcaaatac 840

taaaagtttt ttatttgttt aattaagcat tgacattgtc tttttaaatt cttttcattt 900

taccttcttc cctcttcctt atccaactaa agacgcaaag caggaggtgt taaaaaacag 960

gtttaccata tcagcagtaa catagtttgg acaacattac actttggttc aatgatagac 1020

atagaagttt gaacagaaat atgcaaagca agtttgagct ctaacttgaa gagagcctct 1080

gggtgcctgc caggaaacct cacgagtgga cccttaacat tcatgtgtca ccacaaacta 1140

ggggctgccc tttagttttg accagtctca gtgtcactca cttaccctta ccttttcaaa 1200

aaaaagtcct aagaatataa agtaattcaa tggttctaca attttagcat gtaactgagt 1260

cacctggcag ggttgctttg gtgagctcaa gataaaattt tatcagcatt tctacatttt 1320

ctggaatatt ccttaatcca ggcttttaat cccttggtgc ttttctgaac cactgcaatg 1380

agcttctaac tgttctcact gtgtgcaggc tcttttcctt ctaatctaat ttacacactt 1440

ctgaacacaa atctctcaca gcctgtttcc ttcatgttac ctccagctca agactttttg 1500

cctacaaaat aaaattcaaa cttgttagct aagcaccttc tcatgtctat gctttggctc 1560

atatttcagc catcgtgtgc cccacttatt cttatagcca acctgaaaag ccatctttta 1620

taagaaacta cctctgctct ccatgattgg atataattaa tcctccttcc acatcacctc 1680

gccacaaaat tgtatctgtg ttgatctcat gccacatacc tgtatgtatt ttatattata 1740

aatatttgca gacttgttta atttgccatg ttagactaag ttccatgaag acagctccat 1800

atccattcca tttttatata tccacaacat ttggtcgggt tgatgcttaa taaatgttta 1860

ttgaaggaac aggagtctcc cacttctgac ataatgaact tatttccccc agtgttaacc 1920

ctacatctgg ttcctgtcca agagtctctt cccaaatcat tctgattcaa ctgttcattc 1980

tgatctcatt aaacatttaa atgatatatc taacttcgct tgctttattc tatgctcatc 2040

ctgcagtctc ctcataactt ggtttcaatg atgcttgctt ctagagaaaa aaatgtatta 2100

aataagctta tgattcagtc ctccagctgt gatggttctc actgaacatt agctcagtgg 2160

ttttcgaagt atggtctcta gcataaccta gaaacttgtt agaaatgcaa attcttgggc 2220

tcaccaagac atactaaatc aaaaattctg acattggggc ctagaaatct gtgttttaac 2280

aagcctgcca gtgcagcctg gtcccttttc ttctcggagc cccactcaaa gctttcagtg 2340

ctcatctccc accaatgaca gggtcctcta tggaaaccgg caggacggtt tccaactcta 2400

actacgtttt agagtttgct tcctagggct atccaggcac caagtatcac aggttagttt 2460

cccagggaag cagactctga gacttgcatg cagggagtgt ctctggggtg ctctcaacca 2520

acaccttcag gaagagaagg aagcagcatt gggcagaggc atagtcaaac tacagtgctg 2580

ttggcacaga agactgaagg gagtcagagc cagggggtag aggtgggccc ttagcatcca 2640

tccttcacca ttaggtgtga gttgccccac ctccttgatg gtgtaacctc agtcccaagg 2700

tgggtgggag tgcagcagag cagcccctac aagggccaaa ccagagatac accaggcgcc 2760

agaagtgctg ccagggaata gagaggaaag gatgggctta aggtaggatc cacagaactt 2820

ggcaatggat tagaagacag gatgagaagt gacaggttaa cactaacaca gaaatgtcta 2880

acttcggtag ataatggtgc cattggctag aagaggaaac cgaaatgaaa gcaggttgtt 2940

cagggagaca aaagttcact gtggacatct cagcagagtg attcagtggg gaaaggaatg 3000

gatgcccaga ccacctcaga ggaagatcta agctggagcc agcaataaag atacaagatg 3060

aacaatccct aacgaactgc tcctcagcca tgctccccag acacgctgct tcagatttat 3120

agtccgggtg aggctaggag gtgcgcctcc ctcagtggag gacagcaaag caccagtggc 3180

tccagggagt taaaatcttt tgataatttt tgttctagca tctgtctgca gagctgtctc 3240

tcagccattg cctgccttta cacaggagtg cagtccgaaa ttgggagatg agtgaaattt 3300

attatgccta gagatctgga tccccagttg tttgggagta tattttctga accacttgtt 3360

ggtttaagta atgcagattt attgatgcca cttctcttga atctgtgact ctggacccac 3420

catctaagtg aatgtgcaga gggaacggaa tggctgcaat agatctccat taaaaccagt 3480

gcatcctccc agacacatac agtagtaggg aggtgagtca atgtcaggac agcaccagct 3540

cccgcttcgg tacatttcca aagttctcag tctgtgtaca aaggtttgct ctggggcagc 3600

agaaatagcc ctgggcaggt agtcaaaggc ctggtttgat ttcctccact tccaggcaag 3660

tcactcgaag gctcacaggc tttttcctca cctgccacat gggtccagtg agatctactg 3720

agctgtaaat aatgaaatga gtgtgtgtgc agtcatctat aagttgtaaa gtactagaaa 3780

atggtgaaac tttgggattt gggctattta aggctgaatg ctaaaaatgt caggcattgt 3840

ggagaaagga atttaaatat aagattgatt gactgggatt taaagacaaa tgaaggcaca 3900

cacgcaagtg cacacccaca ctgacactgc acagctcccg ttggaggcat atcctgacca 3960

tgcagacctg gggctctgcc tgtccaagtg cactccttta ctacataaac cctccttctc 4020

ttttggggct gtcaccccac cagagctggc accgagccct tgctgctgcg cttccctggg 4080

gtgtcagctt ttgacagggt gtttcctccc tctgcaggag ccttaacatc ccttggactt 4140

ccttcccccc acccaccccc agcagtttta tctcttccta actcgggacc ctttttttcc 4200

cacacaaagt ttattgtcag ttgctggttt catctgtttg agcggctgca acaaaatacc 4260

atagactggg tggcatatgc acgacaaaaa tttatttctc acaggagaag tcaaagatta 4320

atgcaccagc agatctggtg tctgaggggc caccttctgg tttgtagatg atgctttcta 4380

gttaaaacac ctatttaaca cactattaaa cactaagtgt gttaaatagt gcagttgatg 4440

tatttgtcat gtcaccttta tcatacacta aatccttctt tgtctttttt tctgtactct 4500

aatctctttc tgtaagtaat ctttgcttgc agcagtagga tatttagagt actgtggctt 4560

gacaatatat ttagtatttc aagatttcca tgaaattctt ctgatgtatg agttccctag 4620

ttaatcttac atatgtatcc ctttgtaaaa acactttgaa catttaaaat gatacatgaa 4680

tagtactcta atacaatgcc ataaaaatta taaatcattt gtatagactg gtaagtaaag 4740

attgtgagat taagaaacgc atcaaaggcc attgagctgg aaagtggtat aatgagaatt 4800

caaaccaggg tctcttgact caaaatctaa ggatcatacc atttctcatg ataatatgag 4860

tattattgtt atctctatcc catagacaaa gtgttaacac tgaatgagca gtgaaatagt 4920

ctcagaattt tttattttat ttagcaattc acttgtcatt tctggtcctc agtttattca 4980

cgagtaaaat aaaatagttg gactagataa tttctatagt acattcttac acaaaaaatc 5040

tatgattttg ttatttttaa tgtgatatac tcatggcact cattcacctc attttcccag 5100

cctgcctcac tggtcattac ttctctgtgt tctttacagg ctccccctcc tctacactgc 5160

cattaaatat tgaaacacct caaagcttta cttatgtcca cctctcctct gacactatca 5220

ttctgtctag atgatcccat acatacatgc ccattacttc aacctgtatt tatacgccaa 5280

tgattcacta tatttccagc ctagacattc ttttgtactc tagttaccag cttgatatcc 5340

ttacatggct gtttcaaaac aactcaaata tattatctct caaaatcaaa ctcatgatgt 5400

ccccacacca tcctagcttt ccaccaacaa tacctatccc tattaatagc aataccattt 5460

attcagttat ccaaatcaaa aacctagaat tcatccttaa aattctacta tcattccaaa 5520

tatcctatcc atcagcagcc actgtattct taatcccctg tatttccttc aaatccattc 5580

acctctctcc atatccattg ctgcatgact atccaagcca tcgcctctac cctagggtac 5640

caaaatagca acaaacctaa tctgttcatt tgcattattt tttctccaaa actgattatc 5700

tatatgtagc aagacagatt gttctcaaat tgcaaatccc actatattat cctcttgctt 5760

caaacacttc catggtttcc cattgtttat gataaaacca aatgcttcaa gttcgaagac 5820

cggcatgatt gggaatttcc tgtcacccta gcctacttgc tctccatggt acagttgcac 5880

tggctttctt tcattcctta agtacaacct gtttcctccc acctcaggac tgtgcatgtg 5940

ccattcattc tgctgaggag cctttttcct tccacttcaa tcagctaagt ctgattcttc 6000

ctgacaatct cagctcaata agcatttcct ctaagaaatg tctctaatat cattaattgg 6060

ctcaggtccc tctactgtat tgctgcactt ttcacagtta taattttact taattatgaa 6120

tgattatttg attaggtcta tttccatcca ttagacataa gcttcatgat ggccagatta 6180

ctgttttcta tccatcgttg tattccaata cctgacagaa ggagggcggg aggtggtggc 6240

acacaagaga tgctcaaaaa caattgttga ataagtaaat gaatgaggcc atttagaaat 6300

aacgaaagta cctgtttaca aagtacatgt atcaaaacta tgaatgcatt ctacttacat 6360

ggttttctcc aaataaaaca aaagacttca atcaggatta atacctggga taaactgagt 6420

cattaaatct ctcctttgcc atcaggagtg acattgaaac aaatgtctgc aaacaacaaa 6480

tacttttttc ccaaaatata ttgaatggca tttccataaa caaactagaa catgggagga 6540

gaaagaaagc aatattaatt taaaattaat cttatcacat aacttatacc atcagggatt 6600

tcgggtaaaa ttcctttcag gcacatccat ttaacaagaa ttgattgtta ctgaaagcct 6660

agaagagaat ttggcacata cttggtgttc aaatatttgt tgactgagtg aataaatgat 6720

gcaagtgtct aagaaacaca aaataaggac atgattacag tcacggtgga gttcacagtc 6780

atctccaaaa tgaggatatg catcccaggg aggaccaaca attcattgga gtgctgaaat 6840

aaaatactca aaggtcattt tacatgtatt ttttctctaa attacttttc ttaagacaca 6900

gaaaacaaaa aaagaaactt agctttgtta ctttctaaca aatagttaaa tcattaaaca 6960

ggattgacac tagcatcctt gtttggtctt atgccttagg ggaacatgaa atgtgtgaag 7020

acattctgag atctgaggga agggtagaca gtaatacagt gggactgacc aggcttcagc 7080

acacctttac ctcctctcag cagatttcag tgatgagcag tttacaacta gattgaaaga 7140

ttatattatc tagttctaaa agaaaactaa gcctcccaaa agcaacaagg gaactgagag 7200

gaatcctgca aaacaaaaac aaattttaaa acttgcactt tgtaataacc ctaatatgta 7260

atcacagtaa tgaacagtaa gataatgaca gaactgacat atttccttat ctattaaagc 7320

catattaaca ggtaaagcaa tgccagtcag tggtacactt cttagaagat atttaataca 7380

tactagacac atacacacac acaacatttt ccttcaaggt gtatgtatca gaaaatcact 7440

ttttaaggcc ggatgcagtg gctcaggcct gtaatcccag cactttggga ggccgacgtg 7500

ggcggatcat ctgaggtcag gagttcaaga ccagcctgcc caacatggcg aaaccccatc 7560

tctacaaaaa tacaaaaatt agccagggat gatggtggat gcttgtagtc ccagctactc 7620

aagaggcaga ggcaggagaa tcacttgaac ctgggaggca gaggttgcag tgagccaaga 7680

tcacccattg cactccagcc tgggcaacag agtgagactc tgtctcaaaa aaaaaaaaat 7740

cactttttag ataaaattca tgctatagag agaagactat gaaaatatgt ttagcaatgt 7800

gtccatcatt aggtgattga gtttcctttt gttttgtttt actgaaaatc atataaagta 7860

tgttatctgt aaaagttctc tgacatgcac acataaaaat ttgggagaaa agattaacta 7920

taatgtttaa tagattttgt acacatttct ttaaaaatat ataaaacaca acacctttca 7980

attggtttgc aagaataacc aattgacatc atggaaaatg gaaattcact tgctgaattt 8040

taacaaaaat ttgcatgatg agtgagactg acaacttagt gtcatgattt aatgaattat 8100

gccaatggta aacttcatgc acatggggcc aggtaattat gtggaaactt tttcaatgct 8160

taaagccaag tattgaaatt aaacttagaa tcagaccttt gaaccatttt atgacaatgt 8220

tcaaaaatta taaattctat ccacttatat tataatatta aaaatatcat tacaaaaaaa 8280

acctgtgttt attttataac tcagcctttt taatttctaa tttcataaat atattataat 8340

ggatattgtt agtaatgtag tattattaca tgtatataat ttataagtaa atatacatgt 8400

tttggctact catgcataaa atgtttcacc cataggagca cataatcaga aatgtctgga 8460

gaccattata gtaatagata gatcatattg ccacatattt tatctcctcc ttgacaactg 8520

agctttccag atcttctggt gaaacgaaag agaaagttgt aacagaagag tgattaaaat 8580

gacaaaagca ttacttctat tacttctatt ctaataatat gagcaaagct ataactatca 8640

agtaataatg cactaaagaa ggtgattaat ctgatatatt cacaggcaac taataagacc 8700

tttctattgc agccatgaaa aatatgtgac aattatagat atcctgtgtg cagtgtttca 8760

acctttatgt gacctgttct actaacagat ttagtgatgt tcactttgtt agaattttct 8820

tacacatgcc ataacttgct tcagtctttt gattatgaat attatggata ttaaggattc 8880

tagactattc tagatttaaa aaataatatt gtcacctcaa tcagaaggga aatattaaat 8940

agttctcatt ttttcaatgt ttactcagtt tttgtccaat gtaatgaaag tgtcagcagt 9000

acaggttaca aaataaaatg tgtattaaag taaactcatt tgaacaggtt aataattgta 9060

gagggaggga aaaggctaaa agattgaatg taaaacttat gaaaagtaga tacatcgtct 9120

ctatgatttg cagtagtcaa ctgcatacag atgaatcatt ttaatacacg ttaactactt 9180

tccttttaca gatggagaaa ctgagaggaa gaaagtttat atggttcatt aaactttgtg 9240

atgcaagcta aactaacctg tctctgtatt ttccatctac tgcccttatc actatctcat 9300

tagaatactc ttcaagcatc tccttactga ttttcttacc aagcatttgt taagttctaa 9360

tgagagttgg tagtaacatt ttcacccact ctgtgaaata tgaaatctta ttcataggcc 9420

tcttctttta ttcttgtatt tgcatatcaa ccaattaatc aacttgcttt ctttatgttg 9480

cttattatct tagtccttac taaattgcct cttaatgttg tccacataac agaaatgtta 9540

aggtggatac ttaacatttt agtccagtct agccggtgcc agtgcaatgc caaatcatga 9600

attaaaatat aattacaaga accacttatc aaattttaac aattccttca gctttgtgac 9660

agttttttct acttcgatta aagtcaagta aaattaaagt taaatatttt tattaaaata 9720

tctcctttaa cattccatat taataaacat attaaagctc atgcttctaa gtagattact 9780

agaagttact ttatcgaatt acagcaatgg ttaattctag atcatagaat ttagaatgac 9840

tttttgcctt cttctttttt ttcctttttt ttaaacagag tcttgctctg ttgtccaggc 9900

tggagtgtac tggcgcgatc ttgactcact gcgacctctg ccctgcaggt tcaagtgatt 9960

ctcctgcccc agcctcttaa gtagttggga ttacaggtgc ctgccaccac acctggctaa 10020

tttttttttt gtatttttag gagagacagg gtttcaccat gttggccaga ctggtctcga 10080

actcctgacc tcaagtgatc cacttgcctc agcctcccaa agtgctggga ttacaggtgt 10140

gagccactgt gcctggcctg actttttgct ttcttcttaa tacttactag tatttcttga 10200

atttttaaaa aagaaacata aagtactttg ataaaaccaa cagtctcatt gttcttaaaa 10260

ttgttcaaag gttctctgga aaaaaaaaag aaaattatca tttggttaag aatcatgttg 10320

gtctgacatc aatcatccta taggagtgaa tattgaaaaa gtaagatata ttgtggtata 10380

atcgagattg cataaatttt accatttttg agaagaatct gctccaaatc ctggcttaat 10440

gtaatatcca gcatgctact taattttctt gtcttcacct tttcatatcc acatccacct 10500

aggtgccacc tcacagtata agccagcata atccattctt ctcaatgaaa ccacaataca 10560

tctgaccctg catctcagga gaactgtatc agccacagca cttccagttg actatgaatc 10620

tgaatgttat gcctcaggag aaacatcctt gctgggactg agtagtgatt caaggagata 10680

gttatgattc agtcaagaaa ttaataatta gtgttatttt tattattgag acagagtctc 10740

gttctgtagc ccaggctgga gtacagtggc atgatctcgg ctcactgcaa cctctacctc 10800

cccggttcaa gtgattctcc tgcctcagcc tcccaaataa ctgggacagc aggcacttgc 10860

caccacgcct agctaatttt ttgtattttt agtagagacg gagtttcacc gtgttagcca 10920

ggatggtctc gatctcctga cctcaaggtc cacctgcctc agcctcccaa agtgctggga 10980

ttacaggcgt gagccactgc gcccggccat aaattattaa ctgagccagg cacagtggta 11040

cacacttata gtcccagata ctcaggagac tgaggttgga gtatcctttt ttatgttatt 11100

ttatttttaa ttattatggg tacataatag gtgtacatac ccatggagta caagtcatgt 11160

tctgatacag acacataatg tttaataatc acatcagggt aattgggata tccatcacct 11220

caagcattta tctttctttg tgttaggaac attccacctc cactcttgga ataggcaccc 11280

tgttgtgcta ttaaatacga ggtcttattc atttcatcta actatatttt tctacccatt 11340

aaccatcacc tcttttcccc tcttccccac tacctttcct gtgaggctgc aggattctta 11400

agcacaacag ttagaggcca gcctggacaa catagtgaga ctcaatttct aaaaaataaa 11460

aaagaaatta ccaactaatg ctaaaaaaat agtctctgat gcttaggtat gaattagaaa 11520

tgaccaaaaa aaaaaaaaaa aaaaagactg ccctttgctt ccttctcccc ttctcttcaa 11580

gttttccatt gctactcatt ttagtctggt ttaatcaggt ttcatccatt aaaagcaatt 11640

gttgggatca cacattttga gttgtgtcag tggacttccc tcatgctggc atgattcctg 11700

ccccaagccc ttagtaaaag ccaccaagcc atataacata atctctcatt gagtaaaaca 11760

tctgatgtgt ttagaatgac ttctagcaaa aaaccagcct gtccagcatc atctctgtat 11820

aacagataaa ggaataggta ctgcatcaaa aggttataga acctgcccaa atcaatccca 11880

tgtgttttgc aatggaatta ggttgaacta aagtgaaaat tcagttttct actcctcatt 11940

aacatgtctc atgttgcaag gttgagagga aggagaagaa gaactgtatt tacagagaga 12000

ttccccctct ctttctttct acagattact aaaacattca aagaatcaaa tttaagaaat 12060

cagttcatca gagctcatgt tgccaaactg aggtgagtgg aactgtagaa aaaatattta 12120

agtatagata caatgtggca tacttgactt tttgtcacag aatgaatagt aaatgacatg 12180

ttcagataag ttgttgtaat attatgaaaa tagtatttta gtcagcttaa aaaccaatgc 12240

caaaaaagcc aaacatatga tctatttagc tactaatgta aataaccata ttatatctat 12300

tcttattggg aagaggaaga aggggtggag agagagttgg ggtgaaggta cagtaacaag 12360

gccatcctat tgtaaaactc cagtggatat cattcacagt gcagcctatg taaacagtcc 12420

ctcctggagt tgtacaatgc tgtggtttgg gtgtatccat ccaagatcaa gacactatga 12480

ccaacatcaa aagtggcttt ttggttttat ctgcctgatg tgctataata aaagggtatt 12540

atggccaaat ccaaggcatg tctatcatga attaataata ggaggagtag cagcatgcat 12600

gctagttatt tgccattcct gccttagtta aatatgatgt gataaaacca gcctttccaa 12660

ctgaaatagt cacctttact gactctcccg caaatgtctc aaatgaccac attgctctag 12720

tctttaaata atatgcaata gttctttggt agaagaggaa ttatactaat tctttctcaa 12780

atactagcat cacaagaaaa ttaattcttg ttctctggag agtcacctag taagtatctg 12840

gagcacagat gtctggtcag gtaagttttg atgaggagtt aaagggataa gaagagtcca 12900

tgagaagggt attttccaaa acacctttcg gtcaattcag tgcacattca cttagtactt 12960

tcttgtcagt atctgtatca gccactaatg ttcaaaagtg agtaagccct gaaaacctgt 13020

aggactacat gagccttctg ccttttctct ccttttgttc acttcccact tatcactcaa 13080

tcctctgcaa cctggcttca ataccaccat aaaatatcaa ctgctcttgc cgattcaaca 13140

atgacatcca gataacaaaa tccaaagaaa ccacatcagt cctattcttg gacctttcaa 13200

cagtatttgg tcctgttggc ctgtcactcc ttgaaatagg actatccctt ggtttgcatg 13260

gccttgtata ccctgatttt ccccttacct ccctagctat tccttcttag tttcctttac 13320

taggtcttac ttctttgtat attccttaaa tgttgctgaa catcaggctg tgctctaggc 13380

ctctcatctt ctcaggtcac actctctcct ttccttggcc ttcactgcca cccatatgct 13440

gagtgctctc aaagttgtat ctctaggcca gtcctctttt gcctccaaac atgaatatat 13500

gcagccatct acttggtacc atcacatgga taattctcat gatctcttcc agtatgactg 13560

cttctttatt tttttctggg ctctttttta gcattgcttt acatggaact ttatcatgtc 13620

tctcaacctc tattttatct tttatctatg tatgtagagt ctgtgtaatt tcttcatctc 13680

ttttagataa ctaatatctc ttcagctttg acttgtattc tgtgtaaccc atttattgcg 13740

ttttcaattt caatgagtat gttttcctat ctgcaagttc tatttgtttc ttttgagaat 13800

cttcctggtc ttttaaacac atttcttatt ttaatttttg ggggtaccta gtagttgtat 13860

gtatttttgg agtacatgag atgttttgat acaagcaaac aatgcataat aatcacattg 13920

tgtaaaatgg ggtatccatc ccctcaagca tttatccttt gtgttacaaa caatccaatt 13980

atattctttt agttattttt aaatgtacaa ttaaattatt attgaccata gtgactctgt 14040

tgtgctatca gatactaggt gatcttttaa aaataatgtt ttctacttaa tctcattttt 14100

atgattccct cttttacgtc atttgtcatt tcaaatacag tcacttgtct gttgattcta 14160

ttatgtgaag tttttgagga taatcttttt gttactttga ttccaccttg gtatggtttg 14220

gctgtgcccc cactaaaatc tcatcttgaa ctctggttcc cataataccc acatgttgtg 14280

ggagggacct tgtgggaggt gattagatta tagggacgtt tccccccttt gctctgttct 14340

ttttcctgcc accatgtaag aaagatgtgt ttgcttcccc ttctgccatg attgtaaatt 14400

tcctgaggcc tccgcagcca tgcaggacct cttttctttg taaattaccc agtctccggc 14460

ggttctttat agctccgtga gaaaaaacta atacacacct catgatgtat tgtttaccac 14520

tgaaattgta tgcttaaatt taatctcact tgggaccctg tacaacctag acttaacata 14580

tctacctcca gagcagttac atctgtcaga cattctagag gaatcagcag cacatggact 14640

ttgttgttgt taatttgttg tcgggggagg ggggagggat agcattagga gatacaccta 14700

atgctaaatg acgagttaat gggtgcagca caccaacatg gcacatgtat acatatgtaa 14760

caaacctgca cgttgtgcac atatacccta aaacttaaag tataataata ataaaattaa 14820

aaaaaaaaag gttctgggag tattcaggta gtattaatga agattcagac atcgtgcagc 14880

caggcccatg cttatgaatt ttcaggtgat acttcttttt cttttttctt aatttaaagc 14940

tggatctcgg aaacagataa atttattttt ttatgacatg acgagcattt ttttcattct 15000

agttcatgct gttattgggt gtttagttct ttgagactcc tggccttttt ctaaaacctc 15060

aagttcaact tcctattttg cactggccca aggtcccatc tccagtctct atgtaaatgc 15120

taaacataag cctgtggaat attctagtct caccacatac tattcacatt cttctttgtt 15180

tttggtcttc caggattttc cttacttttc tatgaaccca gtcttgcatt tgaaatggaa 15240

tttattatat attatctatc ctttctattt gttttatgca gaaagtgttt tctaaaatta 15300

tttaggcttc catattgcta gacatggaag ttgtaattat ttgttcagtg cctgtttcta 15360

catctaaact gcaagaccca tatggcaact gtgaatctta gtcccagcta atttctgaag 15420

cttagaatag tgcctagcac aagaagttgt ttatctaaca tttttaaaaa taaatattaa 15480

attcatatct ggaatgaata ttaagttaga gctggtcatt gaggtgagag gaggaagcca 15540

agagagaata tgagagcctc aaagccaaat atctttaatg tactttttca gaaaagaaga 15600

cagccaatgt caggtggagg aactggttta tgaggtaact ttcctggaag aaaatagaaa 15660

ttactgaggt tttagataat ccaaatattt aatcaagtca ccaaggttta ttgtggggaa 15720

tctttattat taattaaaat gagtgatgaa atcttaatat acgacaaaag ttaaaatttg 15780

cttttgcagg cagatgaatg gtctaggtat caaaaaatta agttgagtct ctaactcaca 15840

caaatttaca accctatcac tttatgaatt tgtttaggag attattttta ataacactgg 15900

tgaagtctaa gaatagctaa aatttatagt acacttattg tgtgctattg actcttcttt 15960

gaagttttgc atatagtgat tcatctaatc ttcataaccc attttacatg tgaagaaact 16020

tagatataga aagattaaga aacttacata acttatccaa agttacacag taaaactctg 16080

gcattataac ttcaaaatca gctatcctac agtgagtaca gtgttctgtg cattgaaatc 16140

aaataagtga gatagcatcg tgatatagta ttacgtatgc aaacactgtt acagagatct 16200

gtctaaagtt aaattccaca aatgaattct ttaaaagggt ttaatcaaga agaatatata 16260

aacaggatgg tgaaaaattg tcatattatt tgttttttaa aatatcttta tgatttacag 16320

gcaagatggt agtggtgtga gagcggatgt tgtcatgaaa tttcaattca ctagaaataa 16380

caatggagca tcaatgaaaa gcagaattga gtctgtttta cgacaaatgc tgaataactc 16440

tggaaacctg gaaataaacc cttcaactga gataacatgt aagtataatt tttcataaac 16500

aattttattt caatatatcc ctcaagttta ccaattcaaa ttcatatttt aattgagagg 16560

ctgacttttc tttctttgaa actaaactgt gaaaacaatc cattaaaaag ctaaatatac 16620

catatagctc cctaacgtaa atcattctaa gacttaaaga atcatttggc atttatatag 16680

taaattttat ttgctaaaaa ttctcattaa ttatccctgc aacattcctt atgagtgatg 16740

ttactgtcag atgtcattag tggataggcc ataggagggg tacatagatg ctcaaggtca 16800

gagaactatt taattaatga tccacctcag aggcttcttc atttttcttt gtaacattta 16860

tcacaattga aattacaaag ttatctgtgt aaattttgta ttgtttggct tcatcctaca 16920

ctgtaatcat cctaaaagaa agaaccagtc aaccttcttc atcctactac cctcctacca 16980

cccagtctcc atcatataac acatattcaa taaataattc ttgcatgact gaaagaaaag 17040

aaataatata tgcatagaat ttaaggacat tcctccaagt tggttacatt ctgctagttt 17100

aataagccat tatttcttct cgatgagctc aagattaaaa ggattttgat gattcccata 17160

ctagactggt aggtaccagt tacagatgta ctaactgtta aatattgaaa tgctttccta 17220

tttgttggta aacaattact gcatcaggcc cacaaagttg tcttccgaga tgtttcaaat 17280

ccactgcccc tgctgctaaa gagttatgct tagcaaagca aagcactcta agacactgct 17340

ccaactccat ggcctgattg catcttttat gactggccaa tgctcacgca ctgcagtttg 17400

ttaggtagtt gaatattacc tctgcttcca cacattaagg aatgctcccg aacgcacttc 17460

ccaagtgttt atttatttat cattatacta gacaatatgg tgatacgatg gtcacagaat 17520

agcggtttcc acctccagag cccataatct agttgaaggg aaagatattc caacacaaga 17580

gtgttgacaa tcaagataga atatgatcaa gggcccagtg tgaggcccag gcaatgatca 17640

ctgcaggaat ctggggaaga aagagaccag cgtgcttggg atatctagca aaagtttcat 17700

gaaggagaat ggactttgac tttgaaatat gggtaggatt tacatatttt gagatgagaa 17760

aaagaaagtt cccagagaag gaaagcatga aaaggcaaac agtctgtact gaacgcgatg 17820

ctttgacaga ataatgaaga aagggacctg ctggaatgat tgatcagtgt tcatcattca 17880

caccatcatc atcaaaacac ttatttaatg agaacttact gttttttagg catggcttta 17940

atgccctata tgaatttttt tcttgattaa tccttacaac aaacatatcc catagatagt 18000

tttattgtcc cccttagaaa agataaattg cctaggctga cacagtcagt atatgaggca 18060

gtcaggattc aaactaagtc tgtttgttca aaaaattaag aatggccagc tttttaaaat 18120

tttctgtctc cagaagtatg atttggctcc actgaagttt gcaaaacaaa tgtgataccc 18180

aaaccttgtg aaacttttag tgggaaataa ctttgcataa gtcggtttga gagagcgtgg 18240

aaacctgtct tgaaaagttt taatttaact tgcaggaaat aaaaatgatg ggtttctcaa 18300

ttaaaaattt caatcaagga aggatatgag ctaacataac atttttttaa aaagatcagt 18360

ctggtaaggt agaggtgcat aaactgaaaa ggagcaaaag tggtggaatt cagttagaaa 18420

attattgtaa ctgtactgat gtcaaatgat gaaaccatga actaaagtag taccaaaagg 18480

agtgaggagg atggaataat tcaaaagata gaggacagat gtgcagaacc tggagattat 18540

aagatgtgaa aggaggagtt tgagaaaatt tcagattttg gaagtggtgt cattttacta 18600

aaaggatata ataagtagca aattttggat aaagttgggt cccactgagt ttgagatggc 18660

tgttggacat gcagagaaaa ctgtcttgta tgctgttctt aaattgaaat agacagacct 18720

ttaccctctg atactgacat attttccttt ccaggctcac cctccatttc cctaaacaca 18780

acacatgcac tagctctcct tactttattg ctccacaaac atcttacacc tccaagcatt 18840

tgtgcccact gtaccttcta tctggaatct cttttgtcct cttgtgtgcc tgaaaaattc 18900

ctttcagatc ttcaaaatac agtgcagatg ctatttcttc tagctcaaat attatctcct 18960

ccatataatt taattactct cttttttctt ttctctactt tgcacttaca tttatttgaa 19020

tgattgcttg attaatttct acctgtaaat tatgtgaggg caggtcctct atattttgct 19080

cgcagttaaa tctgcagcac ttattataga gtggtatcat tagagtaata tacatatatt 19140

tgaggacatg ataaattaac ttcccctata gtatttatca cattgcatct caatgacttg 19200

cttatgtttc tgttttccca tataaattga gtaacttgaa aaaagagata tctattaagt 19260

atttaatgag aaattaaagt acaaacttta gtatgcataa caacaaattg ggaaaaggtt 19320

gtaaacaaag agatttgtag ggcccatgag ttagagatcg tttcagcagg tctgaaagga 19380

agcctaggaa tctgcatttt agaggaccac ctcccaaccc caacaagtaa ttctgcttct 19440

tgttgtctgg gtactgtact ttaagaaatt atggtgaaat gatatcagcc tttattgtat 19500

ttatcttatt ctcatttttt aatactagca cttactgacc aggctgcagc aaattggctt 19560

attaatggta agttttaata ttattttgta actgtaattt gccaaatcat aaagagtaaa 19620

agtgcaagtc ttttgtgtac ttttggccaa ggcagtatct atcaagttga tgtctttgtt 19680

cttagttcgc tcaggtggtg ttgaaacaag acagtgctga tcccaagtgt cccatggagt 19740

ggactttagg tttccccttt ccttttagaa aaaggaagaa gttgtagtgg aggactaccc 19800

actctgcact caaaattgcc ctcatgaaaa tttctttggc agctttgaga accttttact 19860

gccctggttc taaggtggca tttctgtaga cttacaaatt atgtttgatg acaccgttta 19920

tgtagcttct cctaaccacc agagtagctt gctttgttgt gaattcaggt taatcacaaa 19980

gtataataaa aaagaattgt cagaagtctt cccagctttg ggtctataac ctgaaggaaa 20040

agtcactact cttcaacatc atcctatgta ctctcaggct aggatagcag aaatgcaatc 20100

cctagaaaac agcaacttac ttctctgacc aaaaaaatgc agttaaaaat tagttcaatg 20160

tacctggtag ctggcctatc ttaggtactt cagtgatttt acaaagtgat ggtagtccta 20220

tgggtgtttt tcagcttcac tacgtattta attcatgctt attgttaatg aaactgtgat 20280

aagcaattta ctagggtatt tgtttgggag atgccacaaa ggaacacatg tatctcttaa 20340

tggaagcctg gtcctccttt atccaggaaa tttgctagga aaaaaaagcc tttaggtggt 20400

tgtgctatta aaccagggca ctacttaaaa gccagcccag caatagttgt gtgatttacc 20460

attaatttct tagtaataga ccacacaaaa gaagaaaatt atgggaatgc gagttgagag 20520

gaattgggtg atcagcctac cccagcccgt ttcagctctg gccagtagac tattcacgag 20580

ctctttgaaa acatttaaat aaaccttatt tagatactag aaaccctctg tcaccctcaa 20640

gaatattctg tggtatagcg actcctttat gagggcatgt ttggtaatac agcatcagtc 20700

ttggaggtgg actggattct acaaggtgaa ctgcagtcac taaggagtct tttggatgag 20760

accagttttc ctccaacttc aatgtgtgca tgaacctcac atcaaaatgt agctttagat 20820

ttgtcccatg atgtggttcc aagaatcagc acttctaata agtttccagg ggatgcccat 20880

gctgcaggcc cacaaaccac actgagcata gcaagactat tgagaaaaag gaaatttccc 20940

aggagtctgt ggcctgagct ggcacatcca ataatgacct atcttaacct caactcatga 21000

ggaattccag ggaactctga agctgctcaa aatttgaagc ctatatgcca actaaattca 21060

gaaatgttct ccaaaatgct atctataagc aacagtagtc acaaatgcat tgtagaaata 21120

tatcgatcat gctttttgga aaatccagca tgtcctgagg aagaatgtat aagacataaa 21180

agtcataaat tatggaaaga ctcttcagct tcttccaaat gtaaaggaat catgatcttc 21240

ccagcacatt aatgcccttt ctcattagaa tgtggggccg gtccagacct aataacattg 21300

tctgagcaga gaatccttgg aggcactgag gctgaggagg gaagctggcc gtggcaagtc 21360

agtctgcggc tcaataatgc ccaccactgt ggaggcagcc tgatcaataa catgtggatc 21420

ctgacagcag ctcactgctt cagaaggtga ggccaccact acctacccat ctgggaacaa 21480

ttagaataga caggtcatga agactgcacc ctctacccta ggattgaatt gagccagaaa 21540

taattcaatg caaaaaaatc agtaagaatt ttcttcctat tcatgaaagg aaaaggattt 21600

ttccccttta gcatgctaat ttagtgctat ttctctgttt caggtaataa tatattagca 21660

cagtaaagaa caaagattta tatgtcagaa tgttttttaa atcctagcta taaaagctta 21720

agaaatttac taaatctcca taagctttat tttttttcca aattaaggga caacactgtt 21780

atctgtgact tagtgttact ggtagcattg agtacactaa tgtaaacata cgttaaatgt 21840

tagcgaaacg aattgctgtg gaagatttgc acattatatc atgggagctg atggctaacc 21900

tagagactgc cccatgccat taatttattc attcataaag attattgagt atctagtatg 21960

agcacagtgt tatatattgt agaagctact agtataaaca aagtattgcc tctgccttca 22020

aagagcttac actcgaatgt tggaatcaga atgcacaaaa ataatgatca attacaatga 22080

gtagcataaa taaaattaat gtaggcaact tacaagaatt cttaattgag gtgactaaac 22140

tattgccaac actagggtga tatgctacca gtggcgagta ggttgcataa acttacctta 22200

ttggtaaaaa gaaaagttca cattgctcat aaaagaagga ttttagattt cagcataact 22260

aaaatctgtt tcaaacctgc cttgttactg gggcatcgca gaccacaaca gttgttggga 22320

acttaactca aaaagttcac ccagaaaaat aatggagatt tgaactcgtg tgcccctgac 22380

catatcaatt ttcttctcag actcttactc taaactggac ctccttatca cacacacaaa 22440

gccttccata ggcagatcaa tccagtctta tttctcaaag catgtacctt gagcttcaga 22500

taaacagcat tgttctcttc ccctggactc ttcctacatt tccctaccta tgagtatctg 22560

atcaatctgc ttatccttga aatgttaata tatttaccac atctctattt gaattttatg 22620

aaatttttga taatttctaa gtagtttttt cagatttata ggcactactt catggtacag 22680

tgactgttac aaacgtattt gttaaattta gaaggaataa agatttaaaa gactagggta 22740

gttactgaac taaagtttta ggaaatccca aattatttca aatttttctt atggtaattt 22800

tatgacttaa tatttttata tgcagtgaac aaatttgaaa ctttaaaaga tactcccaga 22860

attatcagtt ttctgatgta gattggcaaa tttattacta tatcccaaat aacccaagag 22920

acaaaattca caaaaacatt tcaattttca ttgccacttg aaaggccaaa aagcagaaat 22980

ggcacgcatt gatttcaatc gtactcttga gtgtgggaac caggaattaa aatacctgga 23040

cttatcaggc acttagcata accaagaacg gaatagaaac ctccctggat tctaagccct 23100

attcagtccc aatcaccaaa aaccaagtaa acgatatcac tataatgaaa gccacagtta 23160

taaatatcga caacgattac caaaggaatc catggaactt tgaattttgc caccccacat 23220

ccttctattc attaccatga ttgatccact aaagctaaca gactctgtga accttgtatt 23280

ggacccctcc ctaaagacct gattgtcact gagaaccatc agtgaggatt tgtttggggc 23340

atgaccagcc ttacatcaaa gtacatagaa gtgatgaggt cttatcaaag aggattattg 23400

aattatcacc tcttctatgt agctttccct gatactctct ttcctctcca ttgagttcca 23460

cagaaatttt tttatctgcc tttaacagtt gtcctcatga tttgtgatat ttgacttacc 23520

tcttgtcagt ttccttcact agtgtagagt tcctcaaaga aagagaccat aattacttat 23580

atttttattc ctggagactc atactattcc ttatacaaag tagacactta acaatggctt 23640

gttgaactat aattaatgaa aataatagct accttcatga aagttcactt tgtgccaaac 23700

actatagttg acataataca tttgtctcat taatacttaa caattgtgtg agaaggtatc 23760

accaatcaca ttttatatgt aaataaaccc cagagctatt aattaacttg tcataaataa 23820

cacttttcat atgtggcata gccaagattt aaatataaat gttactggtt ccaaaatgat 23880

gctctaattc acttgctgga aagaaggaaa ggaagaaaat aaacgagtgg aaggaagaga 23940

gggagggaag agagaaaagg aaggaaagaa aaaagagtct cttcagaacc ttcactgtaa 24000

agactccgag caaaagaagt tgaatataaa aacaacatag gtttgtttgt tttctaatat 24060

tttttcttca aaatttttaa ctcaggttca ctcttacaca aactactgtg tcttataaaa 24120

gtatttccgg tcatagaatt tttattttct gtattaactc cactatctaa tctccataaa 24180

actcctaaat tggtattatc ggtaacattt tgtttttact caacccttag gaacaatgtt 24240

aagttaatca gccctccaca tcacagatcc ttattttcat cagtctgtac aaggcatttc 24300

tctcatttta attttttttc ctcctgtcat ccctggattt cactttcact gccctccttc 24360

cacccatatg cctcatacta atatattcga aatatacatg tcttaaaggt acatgcacgc 24420

acctacaaaa cctatagtgt ttttttgtat gtatatgtct ttaatttaaa taagtagcat 24480

tgtgtaaaag tctaatattg tttcttactg ttttcactca attcttggaa ttttcatctg 24540

atgcactgct gcatagcacc ccatggtatg cagccaccat atttccttca tccaattagg 24600

ttgcatgacc taccttccca ttgccacaaa gagtacacac aaaatatttg tacttatctt 24660

tctgtaaacc ttcaggaatt tcagaagcac acatgcaggc tgctaaatat accagaatac 24720

tttccagcca cttaaatctt taccagtatt gcaaaagagg ccccatttcc ctccacatca 24780

acatttagta ttattctttt gtttaagttt tatcaatctt ttaaatgtac acaagatgct 24840

catttttata attttaattt ctcagattac tagtttgagt atcttttcat atatctaaga 24900

gctgttttga tctcccctac catgaactgc cactaatatt ctttgcctat tttacaatgg 24960

tttttctgct tatttattac tggtttacag acttttaaaa tatattctac aaaaatttta 25020

gacattaaac attaccaata ttttcccatg gttcctcatc catctggtaa acttgtctat 25080

ggtatatcta attttgattt aatagaattc attctatttt taccttttag tttgtgtttt 25140

tgttgtttag ccaaaaagtc cccattccta ggtcataaag gtaatgtcct tttttttttt 25200

ttaacgctac tgttctctct ctgtctcccc ctatgtatat aggtgcacat atacttgtac 25260

acacatacat atacctatat atgaggggag ttcgataagt ttatggaaaa taaaattaaa 25320

agataaaata aaaaattata aactttattt ctcaacataa gctccttcaa gttcaagaca 25380

cttttgtaag caataatacc agccatatcg tccatcccta aagaactgag ggtcctgaga 25440

atttaactat gtcaatgcag tcttttttac attacttttt tacagtactt attgatgaaa 25500

aatgggtgcc ttttaaagat tgttttaaga ttagggaaca aaaataagtc agaggaagtc 25560

aaatcaggac tgaaaggtgg atgcctagtg atttattgct gaaactttca taaaactaac 25620

cttatttgat gagaggaatg agcatgagca tggttgtgat ggagaagaac tctggtggag 25680

ctttcctgga cactttttct actaaagctt tggctaactt tcttactctc ataagaagaa 25740

gatgttattt ttcactgacc ctttagaagg tcaacaagca aaatgccttc agcatcccaa 25800

atgtctgttg tcatgacttt tgttcttgac tagtctggtt ttgctttgac tggaccactt 25860

ctacctcttt atagccattg ctttgatggt gctttgtctt caagattgta ttagtaaagc 25920

catatttcat cttctgttac aattcttcaa agaaatactt cagaatcttg atctgacatg 25980

tttaaaattt ctattggaag ctctgacctt gggtgcagct gatctgggcg aaacagtttt 26040

ggcatccatc aagtagaaag tttgctcaac tttagttttt cagtcagaat tgtataagct 26100

gaaccagttg agatgtctat ggtgttgtct attgtttctc acagttaatt gttggtcctc 26160

tttgagacat gaacaagatg aaatttttcc tagcaaactg atgtggatga tctgttgctg 26220

cgggcttcac cctcaacaac atctctttct ttcttgaaac aaattatcca ttagtaaact 26280

gatgattggg ggagatgctg tccccataaa ctttttgtaa ggcataaata atttcaccat 26340

tcttccagtt tcaccataaa tttgacgttt ttttgcttca attttagcag cattcatgtt 26400

gctttgataa gagctctttt caaattcatg tcttattcct cttagtgcct caaactagat 26460

cttgttcagt atgacaagtt agtatgagtt tatctgcatg caaaaatctt tgaaatccat 26520

gcatagtttg tttataatat acattttcaa tgaacttttg aagaccccat acatacatat 26580

gtatatatat gcacacacac acacacacac acaccaaaat cttcaaccat tatcagactt 26640

agtgcagaaa aattattcat ccattaacaa gataagaatg ccccttatca tcactactat 26700

ttaaatggag ctcctggcta aaggaaaaga cagggattga aaaaaattag ttaaatctaa 26760

aatgtttatt atttcaggtt tcttagttgc ttaaatggga agggaggtat ggacaaaaga 26820

gaaatcaaag atatttgtgt tatgctactt atcattaaag tatcagaata acttcattgg 26880

aatagaaaaa caccaagatc accccacgat atgttttcta aaatcttctc catttcttta 26940

gacaagtgac catgtattcg gccagtgaag aattaaactc acttgccagc ttataatgca 27000

ggaaaatata gcaaagagat gtggatccaa tagtttctag atagtggtac aggatggcta 27060

agatgaattt atatatctga aatgttcaca aattccctac tcatatagca tgttttcata 27120

atgttttagc aactctaatc ctcgtgactg gattgccacg tctggtattt ccacaacatt 27180

tcctaaacta agaatgagag taagaaatat tttaattcat aacaattata aatctgcaac 27240

tcatgaaaat gacattgcac ttgtgagact tgagaacagt gtcaccttta ccaaagatat 27300

ccatagtgtg tgtctcccag ctgctaccca gaatattcca cctggctcta ctgcttatgt 27360

aacaggatgg ggcgctcaag aatatgctgg taagtgtctc ggaaaaaaaa attaacaata 27420

gaaatgtctt atatttgcta ttaggtaatt ttttaaatta ggaaacatct ggaataggtg 27480

tttctattct tctacagaca gaaccattct atattctgct cagcccaagc tctggctacc 27540

cctgagtctc cttagcaaag caaagcaatg ctccagaaac tatgggaatt ctcaaatata 27600

gtaataggaa aatgtaaaag aaagttatga agacacgagt tctttaataa tccagagatt 27660

ctataagatt caaatagctt ccctataaac aataaaaaag attttgtttg tttgtttgtt 27720

tgcttgtttt ttagagacaa agactttctc agactggagt gcagtggtgc aatcatggct 27780

tactgcagcc tcaaactctg gtcttaagaa atcctcttgc ttcagcctcc caagtagcta 27840

gaattataaa taagtgtgta ccaccatacc cagctttttt tttttttttc tacagacagg 27900

ttcttgctct gttgcccagg ctggtctgga attcctgccc tcaagccatc ctcctgcctt 27960

gttggcctcc caaagcaatg ggaggattta gattagacat tgtatgaggg cttaataatc 28020

cttaaggtat taactgccct ttaaagtatt ctgggatatg gcaaaaactc gatgtgtata 28080

taaacattgg tcatatttgt ttattgaatg aataaaatgg aaactaaaat gaggacaatg 28140

cacaagagct actagaacca gtaagagtat cagcgaagga gtggaagggt agcattgaca 28200

atttccctgg gcttttaccc atgttgtaga ttgtctctcc aaggaataat acaaagcctt 28260

aatagtccta gaacacattc tattgtgttc ttatggccca aagtaaattg gtgtagtaga 28320

taacatttgc accagtcatg aaaaactatt ggtgtcattc tgagagtaca tcaatataaa 28380

atagactagt tctttagcct tgaaactaga ctggtttctc ttttgctgct aggttaaagg 28440

ttattcaata tgtaatcttc caatccaaaa tctgtcagtg gataatttaa aagcttttag 28500

tcaattttaa gatatttgtt ttcttaaaat tttaaggggc actgtgtcac aaagctaaag 28560

aaaaaaaaga aaaaaaaact gatctgtgaa aggggttatc ctcatctact tggggaattt 28620

tggctgcgaa gaaactccaa agtaaatctt tagaagcctt cattgttaaa tatgaaataa 28680

tgtttggagt acatttattt cttctcaaat ttattatagg gtcaataatg tacacatctt 28740

gaagtccatt tttttcctgc ttttataaca aacaggccac acagttccag agctaaggca 28800

aggacaggtc agaataataa gtaatgatgt atgtaatgca ccacatagtt ataatggagc 28860

catcttgtct ggaatgctgt gtgctggagt acctcaaggt ggagtggacg catgtcaggt 28920

aagctcaaga caatctcatc catgtcatca tccaagaagt gtataagcac ttcctagtat 28980

gtgataatgt gatagacata agtgtaacag ttacaataca cagccctgtt cctctaaaat 29040

ttataatcta gattttagaa ataaattttt ttatgaatga agtttatcta tcatgaaagc 29100

attaactctg agaggccaaa ttacagagta gttaaccatc caaagctcaa gaatcagaaa 29160

gacctcgatt tgaattcctt aacctctatt accaagtctc taactaaaag ctggggataa 29220

tcataatagc acctaacttt ttgggtacta agaaaagtta aatgaagact aaatatatca 29280

ggcacatggt aaacaacaaa gaaatctcat ctatttcact attattaatg tagaccatgg 29340

tcactcgtgt taataacttt aacctcaacc ttttaactgc tgtgaaggat taaataaaaa 29400

attaatcact atattataaa aattaattga tatataataa atgaatttta agagatacgt 29460

aataattcat ggactccttg aagatagaaa atttatacaa aatcctagta atttgagtca 29520

caaaagctcc tacaataatg aaacagtatg aatgaaaaag aaaagaaata actattatat 29580

ttggatctag cccataattt ttaaccaaat gcacaaaaac aaacaacaaa tatgaaattc 29640

tcactgtaaa gtgattaaaa tcaaatttga attctaaaat tttaaattaa attatctaaa 29700

cataattgat gcagttatat gttttaatag gttttgttca catatctgaa atccaactcc 29760

acacagtagc aggaacagct ggtgtcagaa attaaatatt cttttagtct ggagttttaa 29820

aaaatcaatc tgtttacttg agtaatttgt tgctgttttc atgggtgaat tgtatacaga 29880

aggataagaa ttattcttcg catcaaaagg tcactgactt tcatatttag tgctcatggt 29940

ctttaaaaag tggataaaaa gtagttctca catttcatgg aaagccccca atccatgagc 30000

acatttccca aaatgaaaca tttttatcaa ctgcaagttg tgtgtaggtg gagatttgtt 30060

tttcaattgt caagatactg ttaattaccc agtcctttat ctccttttgg tggagatgtc 30120

tctgtgctag gaaacccttc ttgctctcct tcctgtttct cttttactac tggccctgaa 30180

acaacaaatt ctcaagtttc atgacagctt tccaaagaat ccatcaatca aataagcaac 30240

acaactcgac actgacaatt ccagacctac taagagcatt aattaagact taaaaataaa 30300

catgagtttt aaaagggtgt tattcattat tttcccattt ataacgtccc ttaccttctg 30360

tccttcagtg catacaaatt attatcttcc ttgaagccca gttcaagccg tacctcacca 30420

tgataccttc catgtatatt ccactctagg cctcactgat ttttaactga aatactataa 30480

tgcatagttc acacttaaaa aaaaaaaaaa aacacagcac tttacataag agcttacagg 30540

atcctatttg ttttatccat tcttttgttc atttttacaa tcattaattc aaaggaatta 30600

tattaattac tttctatgca cccgacgttg tgttaacaca acaatactat ccctgcattc 30660

agcaagtcta tggtctacaa gagaggacac aaattcaaat gtctgtagtc aagcagtgaa 30720

gctggctaga tatggaaaaa ttacaagtcc ctcttgcttt aacatttgct tgcccacatt 30780

tggtcagaca tcatgcaaaa taatttctca ctatagaaaa aaaaacacta caaaaacaat 30840

aatataaaga actgagaact ggttaactga agcatgcata tgtcatctaa aagaagcagg 30900

tgacgaccag cttcatgaag tacttgccat gcatattggc acttcacaca ctgacccttc 30960

tccccaccta gaccagtaat taaacaggta tggatgagct agctactaag agcagccaac 31020

tgaatagctg actaacttag aagcacactt ggtaataata gctgactttt attagtactg 31080

actatactat atgctaagct gtactcaaag tgctttgagt tttaaactga tacaaacatt 31140

atatgaggaa acagaggtac agagagctat tcaccagctt accaaaggtc acatagctgg 31200

taagtggagg acttaaaccc agactatcta gtttcagaac ccacagactt aatccatcgt 31260

gcagaacata agacatactc catctgtctc cccaactagg ttattatgtg cacaaatatt 31320

tattggttgg ttggttcatt attatgactg ggtggtaagt atgtcattag gagtgttttg 31380

cttatgacta tataaatttc ttcaccaaaa gaagactttc tgatgatata ctatgcatca 31440

gacaccacgc agggtgctaa ggttaggaag ataagtgaga cttctagaaa ctcattcatt 31500

caacaaatat ctcctaaggg ctagaagctt aggtttcagc agtgaacaga ataggtatgt 31560

tctctttcgt gttggacctt atagtatatc tgggaaaaca gacattgaat aaatatcaca 31620

aatgcaagtg agtgtttcag agacatgcag ctgctacatc aaaacaaaac agaacaaaac 31680

aaacaaacaa aaactgacca gtgggattaa gtgtaaatag gcacacaaat gcacaaatat 31740

gcttttataa aatagtgaag cagtgacaga gacacacaca agatataaag acacaatgaa 31800

gaacaattga gcccaaagct ggaaagggtg agagtgtgaa ggaaaaaggt tgatcagaga 31860

agttttcccg aaggagagaa agcctggatg attaggaggc aaccactcgg tgactgaggg 31920

aaatctgaaa aatgtatttg tcatcttctc agacttgctg aaggaatgac ttgggtactt 31980

tgaggatttc agtaattttt ccatgacttg gtataatatt tcaaaaggaa ataggctgac 32040

tttatttgta taatgaatgt gactccttcc tcgactgcca tagaaataaa ctccttaata 32100

ttttgggttt gtctttgcac ttaagtaatc agtcattctg tttttttaca gggtgactct 32160

ggtggcccac tagtacaaga agactcacgg cggctttggt ttattgtggg gatagtaagc 32220

tggggagatc agtgtggcct gccggataag ccaggagtgt atactcgagt gacagcctac 32280

cttgactgga ttaggcaaca aactgggatc tagtgcaaca agtgcatccc tgttgcaaag 32340

tctgtatgca ggtgtgcctg tcttaaattc caaagcttta catttcaact gaaaaagaaa 32400

ctagaaatgt cctaatttaa catcttgtta cataaatatg gtttaacaaa cactgtttaa 32460

cctttcttta ttattaaagg ttttctattt tctccagaga actatatgaa tgttgcatag 32520

tactgtggct gtgtaacaga agaaacacac taaactaatt acaaagttaa caatttcatt 32580

acagttgtgc taaatgcccg tagtgagaag aacaggaacc ttgagcatgt atagtagagg 32640

aacctgcaca ggtctgatgg gtcagagggg tcttctctgg gtttcactga ggatgagaag 32700

taagcaaact gtggaaacat gcaaaggaaa aagtgataga ataatattca agacaaaaag 32760

aacagtatga ggcaagagaa ataatatgta tttaaaattt ttggttactc aatatcttat 32820

acttagtatg agtcctaaaa ttaaaaatgt gaaactgttg tactatacgt ataacctaac 32880

cttaattatt ctgtaagaac atgcttccat aggaaatagt ggataatttt cagctattta 32940

aggcaaaagc taaaatagtt cactcctcaa ctgagaccca aagaattata gatatttttc 33000

atgatgaccc atgaaaaata tcactcatct acataaagga gagactatat ctattttata 33060

gagaagctaa gaaatatacc tacacaaact tgtcaggtgc tttacaacta catagtactt 33120

tttaacaaca aaataataat tttaagaatg aaaaatttaa tcatcgggaa gaacgtccca 33180

ctacagactt cctatcactg gcagttatat ttttgagcgt aaaagggtcg tcaaacgcta 33240

aatctaagta acgaattgaa agtttaaaga gggggaagag ttggtttgca aaggaaaagt 33300

ttaaatagct taatatcaat agaatgatcc tgaagacaga aaaaactttg tcactcttcc 33360

tctctcattt tctttctctc tctctcccct tctcatacac atgcctcccc caccaaagaa 33420

tataatgtaa attaaatcca ctaaaatgta atggcatgaa aatctctgta gtctgaatca 33480

ctaatattcc tgagttttta tgagctccta gtacagctaa agtttgccta tgcatgatca 33540

tctatgcgtc agagcttcct ccttctacaa gctaactccc tgcatctggg catcaggact 33600

gctccataca tttgctgaaa acttcttgta tttcctgatg taaaattgtg caaacaccta 33660

caataaagcc atctactttt agggaaaggg agttgaaaat gcaaccaact cttggcgaac 33720

tgtacaaaca aatctttgct atactttatt tcaaataaat tctttttaaa ataatttccc 33780

tgcctaatta tttatggaag ttatgacttt tgaaggacaa ttcaaaacca tttatttaat 33840

tggttctgca atgaaagaac tgccccatat actctactaa aggcttggca ctttctgctg 33900

ccttttaatc cagcgctata attgaggcaa gcgtccagct tgacacctcg agataacttc 33960

gtataatgta tgctatacga agttatgcta gtaactataa cggtcctaag gtagcgagct 34020

agctgcaacc gaggaaaaaa cgtgccatga ggtctctgta tccaagtgtg act 34073

<210> 21

<211> 418

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Рекомбинантный белок

<400> 21

Met Tyr Arg Pro Arg Pro Met Leu Ser Pro Ser Arg Phe Phe Thr Pro

1 5 10 15

Phe Ala Val Ala Phe Val Val Ile Ile Thr Val Gly Leu Leu Ala Met

20 25 30

Met Ala Gly Leu Leu Ile His Phe Leu Ala Phe Asp Gln Lys Ser Tyr

35 40 45

Phe Tyr Arg Ser Ser Phe Gln Leu Leu Asn Val Glu Tyr Asn Ser Gln

50 55 60

Leu Asn Ser Pro Ala Thr Gln Glu Tyr Arg Thr Leu Ser Gly Arg Ile

65 70 75 80

Glu Ser Leu Ile Thr Lys Thr Phe Lys Glu Ser Asn Leu Arg Asn Gln

85 90 95

Phe Ile Arg Ala His Val Ala Lys Leu Arg Gln Asp Gly Ser Gly Val

100 105 110

Arg Ala Asp Val Val Met Lys Phe Gln Phe Thr Arg Asn Asn Asn Gly

115 120 125

Ala Ser Met Lys Ser Arg Ile Glu Ser Val Leu Arg Gln Met Leu Asn

130 135 140

Asn Ser Gly Asn Leu Glu Ile Asn Pro Ser Thr Glu Ile Thr Ser Leu

145 150 155 160

Thr Asp Gln Ala Ala Ala Asn Trp Leu Ile Asn Glu Cys Gly Ala Gly

165 170 175

Pro Asp Leu Ile Thr Leu Ser Glu Gln Arg Ile Leu Gly Gly Thr Glu

180 185 190

Ala Glu Glu Gly Ser Trp Pro Trp Gln Val Ser Leu Arg Leu Asn Asn

195 200 205

Ala His His Cys Gly Gly Ser Leu Ile Asn Asn Met Trp Ile Leu Thr

210 215 220

Ala Ala His Cys Phe Arg Ser Asn Ser Asn Pro Arg Asp Trp Ile Ala

225 230 235 240

Thr Ser Gly Ile Ser Thr Thr Phe Pro Lys Leu Arg Met Arg Val Arg

245 250 255

Asn Ile Leu Ile His Asn Asn Tyr Lys Ser Ala Thr His Glu Asn Asp

260 265 270

Ile Ala Leu Val Arg Leu Glu Asn Ser Val Thr Phe Thr Lys Asp Ile

275 280 285

His Ser Val Cys Leu Pro Ala Ala Thr Gln Asn Ile Pro Pro Gly Ser

290 295 300

Thr Ala Tyr Val Thr Gly Trp Gly Ala Gln Glu Tyr Ala Gly His Thr

305 310 315 320

Val Pro Glu Leu Arg Gln Gly Gln Val Arg Ile Ile Ser Asn Asp Val

325 330 335

Cys Asn Ala Pro His Ser Tyr Asn Gly Ala Ile Leu Ser Gly Met Leu

340 345 350

Cys Ala Gly Val Pro Gln Gly Gly Val Asp Ala Cys Gln Gly Asp Ser

355 360 365

Gly Gly Pro Leu Val Gln Glu Asp Ser Arg Arg Leu Trp Phe Ile Val

370 375 380

Gly Ile Val Ser Trp Gly Asp Gln Cys Gly Leu Pro Asp Lys Pro Gly

385 390 395 400

Val Tyr Thr Arg Val Thr Ala Tyr Leu Asp Trp Ile Arg Gln Gln Thr

405 410 415

Gly Ile

<210> 22

<211> 257

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 22

agcacccctc tcttccgcag agtctaagaa atcgctgtgt ttagccctcg ccctgggcac 60

tgtcctcacg ggagctgctg tggctgctgt cttgctttgg aagttcagta agtgcaggga 120

gcctcgatcc caccatgtgc tcctgcagtc cccagtgctc tgagccagac cctgctctct 180

gggctattga gacctctgga ggccctccgt gaggttcctc tcttacataa cgaggctgtc 240

tctcttccct tctcttg 257

<210> 23

<211> 190

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 23

ggtcagagga ccaaaggtga ggcaaggcca gacttggtgc tcctgtggtt ctcgagataa 60

cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120

ctcccgcggg cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg 180

agcgtcctga 190

<210> 24

<211> 171

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 24

attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag ataacttcgt 60

ataatgtatg ctatacgaag ttatgctagt aactataacg gtcctaaggt agcgagctag 120

ctccacgtgg ctttgtccca gacttccttt gtcttcaaca accttctgca a 171

<210> 25

<211> 177

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 25

ggtcagagga ccaaaggtga ggcaaggcca gacttggtgc tcctgtggtt ctcgagataa 60

cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120

agctagctcc acgtggcttt gtcccagact tcctttgtct tcaacaacct tctgcaa 177

<210> 26

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 26

gccgtgactg tgaccttctc 20

<210> 27

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 27

tggaggagcc acctgatgcc tc 22

<210> 28

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 28

gccttgccct caatggaaac 20

<210> 29

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 29

ggttgcacag caaggaagaa g 21

<210> 30

<211> 24

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 30

ccaggagttc ctgtgagcct accc 24

<210> 31

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 31

tggaatggaa ggagctggag 20

<210> 32

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 32

gtcccacctc ctgcaactg 19

<210> 33

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 33

tgagccttcc catcagcctg gg 22

<210> 34

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 34

ccacaatggc acatgggtct g 21

<210> 35

<211> 18

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 35

ggtgcttgct ccccaaga 18

<210> 36

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 36

cctaaaaggt gttgtaatgg 20

<210> 37

<211> 24

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 37

ggcaataaag aaggaagacg tttt 24

<210> 38

<211> 120

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 38

ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca gtcgagataa 60

cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120

<210> 39

<211> 198

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 39

attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg aataacttcg 60

tataatgtat gctatacgaa gttatgctag taactataac ggtcctaagg tagcgagcta 120

gccaagtctg tgtgctacca agtagcaaaa ctgagcctgg aactcacaca tgcgtgtctg 180

agagcccagc actatcgc 198

<210> 40

<211> 100

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 40

taatctgact ttctcttcat cggtctctct tattctaggc tgagctgtaa cgctgccgtc 60

ccccacatcc agaagctgct tcccttcaga cctacctacg 100

<210> 41

<211> 177

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 41

ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca gtcgagataa 60

cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120

agctagccaa gtctgtgtgc taccaagtag caaaactgag cctggaactc acacatg 177

<210> 42

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 42

gagcagggcc atgacacat 19

<210> 43

<211> 24

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 43

accattagat cccagcactg gaca 24

<210> 44

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 44

aaacccttcc cgagagagaa 20

<210> 45

<211> 23

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 45

gaggaacact gtgtcaagga ctt 23

<210> 46

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 46

cctgaaaagc ccggagtggc ag 22

<210> 47

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 47

gggcagagac cacatctga 19

<210> 48

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 48

ggaagccctc tctcgatact tg 22

<210> 49

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 49

ttctaccctg agggcatgca gc 22

<210> 50

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 50

tgggatgtag aaggttgtca ga 22

<210> 51

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 51

ctgagcctgg aactcacaca tg 22

<210> 52

<211> 23

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 52

tctgagagcc cagcactatc gcc 23

<210> 53

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 53

gctgagggtc aggcttgag 19

<210> 54

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 54

tctgcagggt agggagagaa g 21

<210> 55

<211> 29

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 55

tgtttcagaa aaggaagact cacgttaca 29

<210> 56

<211> 24

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 56

gagaccgatg aagagaaagt caga 24

<210> 57

<211> 100

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 57

gaccatttta aggttttgct tggttgtttt ggagggaggg tggtgctttg ctaatggtga 60

attactaact cctcaataaa gaatattatt tgaaataatt 100

<210> 58

<211> 190

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 58

gctgcctttt aatccagcgc tataattgag gcaagcgtcc agcttgacac ctcgagataa 60

cttcgtataa tgtatgctat acgaagttat atgcatggcc tccgcgccgg gttttggcgc 120

ctcccgcggg cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg 180

agcgtcctga 190

<210> 59

<211> 171

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 59

attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag ataacttcgt 60

ataatgtatg ctatacgaag ttatgctagt aactataacg gtcctaaggt agcgagctag 120

ctgcaaccga ggaaaaaacg tgccatgagg tctctgtatc caagtgtgac t 171

<210> 60

<211> 177

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 60

ccagtcaggg acacacatgc tcacacgccc gcccacccgc acacactaca ctcgagataa 60

cttcgtataa tgtatgctat acgaagttat gctagtaact ataacggtcc taaggtagcg 120

agctagctgc aaccgaggaa aaaacgtgcc atgaggtctc tgtatccaag tgtgact 177

<210> 61

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 61

tcctctccag acaagaaagc t 21

<210> 62

<211> 30

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 62

tcatagcagc tttcaaatcc taaacgttga 30

<210> 63

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 63

tcgtgtgtag ctggtgagtt 20

<210> 64

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 64

catgcgatca caggaggaga tc 22

<210> 65

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 65

aattgggccc gaagccagat gc 22

<210> 66

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 66

cggaaggctt ctgtgacttc 20

<210> 67

<211> 25

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 67

gtctcccact tctgacataa tgaac 25

<210> 68

<211> 27

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 68

cccagtgtta accctacatc tggttcc 27

<210> 69

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 69

tgggaagaga ctcttggaca 20

<210> 70

<211> 25

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 70

atgagctcct agtacagcta aagtt 25

<210> 71

<211> 26

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 71

atgcatgatc atctatgcgt cagagc 26

<210> 72

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> синтетический олигонуклеотид

<400> 72

tgcccagatg cagggagtta g 21

<---

Похожие патенты RU2749715C2

название год авторы номер документа
МОДЕЛИ ЗАБОЛЕВАНИЯ DITRA НА ЖИВОТНЫХ, ОТЛИЧНЫХ ОТ ЧЕЛОВЕКА, И ПУТИ ИХ ПРИМЕНЕНИЯ 2019
  • Мерфи, Эндрю Дж.
  • Муджика, Александер О.
  • Лаи, Ка-Ман Венус
  • Хаксинасто, Сокол
  • Зарухи, Ховханнисян
RU2804448C2
НЕ ОТНОСЯЩИЕСЯ К ЧЕЛОВЕКУ ЖИВОТНЫЕ, ЭКСПРЕССИРУЮЩИЕ ГУМАНИЗИРОВАННЫЙ КОМПЛЕКС CD3 2015
  • Олсон, Кара Л.
  • Смит, Эрик
  • Лай, Ка-Ман Венус
  • Мерфи, Эндрю Дж.
  • Терстон, Гэвин
  • Джуо, Дэйонг
RU2726446C2
ЖИВОТНЫЕ, ОТЛИЧНЫЕ ОТ ЧЕЛОВЕКА, ИМЕЮЩИЕ ГУМАНИЗИРОВАННЫЙ ГЕН КЛАСТЕРА ДИФФЕРЕНЦИРОВКИ 47 2015
  • Гурер Каган
  • Иоффе Элла
  • Мужика Александер
  • Терстон Гэвин
RU2728412C2
НЕ ЯВЛЯЮЩИЕСЯ ЧЕЛОВЕКОМ ЖИВОТНЫЕ, СОДЕРЖАЩИЕ ГУМАНИЗИРОВАННЫЙ ЛОКУС TrkB 2018
  • Муджика, Александер О.
  • Тан, Яцзюнь
  • Ли, Джеффри Д.
  • Гао, Минь
  • Кролл, Сьюзан
  • Макдоналд, Линн
  • Ху, Ин
  • Романо, Кармело
RU2800428C2
ГЕНЕТИЧЕСКИ МОДИФИЦИРОВАННЫЕ ЖИВОТНЫЕ, ОТЛИЧНЫЕ ОТ ЧЕЛОВЕКА, ДЛЯ ВЫРАБОТКИ ТЕРАПЕВТИЧЕСКИХ АНТИТЕЛ ПРОТИВ КОМПЛЕКСОВ ПЕПТИД-MHC, СПОСОБЫ ИХ ПОЛУЧЕНИЯ И ВАРИАНТЫ ПРИМЕНЕНИЯ 2019
  • Мерфи, Эндрю, Дж.
RU2819525C2
ГУМАНИЗИРОВАННЫЕ МЫШИ С НОКИНОМ SIRPA-IL15 И СПОСОБЫ ИХ ИСПОЛЬЗОВАНИЯ 2016
  • Херндлер-Брендстеттер, Дитмар
  • Флавелл, Ричард А.
  • Фрлета, Давор
  • Гурер, Каган
  • Манц, Маркус Гэбриэл
  • Мёрфи, Эндрю Дж.
  • Палм, Ноа В.
  • Шань, Лян
  • Стивенс, Шон
  • Штровиг, Тилль
  • Янкопулос, Джордж Д.
  • Де Зуте, Марсел
RU2822370C2
МЫШИ, СОДЕРЖАЩИЕ МУТАЦИИ, ВСЛЕДСТВИЕ КОТОРЫХ ЭКСПРЕССИРУЕТСЯ УКОРОЧЕННЫЙ НА С-КОНЦЕ ФИБРИЛЛИН-1 2017
  • Хант Шарлин
  • Мастаитис Джейсон
  • Гонг Гуочун
  • Лаи Ка-Ман Винус
  • Громада Джеспер
  • Экономидес Арис Н.
RU2721125C1
ЖИВОТНЫЕ, ОТЛИЧНЫЕ ОТ ЧЕЛОВЕКА, СОДЕРЖАЩИЕ ГУМАНИЗИРОВАННЫЙ ЛОКУС ASGR1 2018
  • Муджика, Александер О.
  • Гусарова, Виктория
  • Ванг, Ченг
  • Киратсус, Кристос
  • Потоки, Терра
  • Сигнар, Катрин
  • Мартин, Джоэл
RU2796949C2
Животные, отличные от человека, содержащие гуманизированный локус альбумина 2020
  • Фан, Цин
  • Сыао, Чиа-Жень
  • Чалоторн, Дэн
  • Лай, Кэхдих
  • Сабин, Леа
  • Сэттлер, Рэйчел
  • Замбрович, Брайан
  • Мортон, Лори
RU2815514C2
ВАРИАНТЫ, КОМПОЗИЦИИ И МЕТОДЫ ПРИМЕНЕНИЯ ХОМИНГ-ЭНДОНУКЛЕАЗЫ PD-1 2017
  • Манн, Джасдип
  • Гай, Джоэл
  • Джарджур, Джордан
  • Чжан, Джой
RU2781083C2

Иллюстрации к изобретению RU 2 749 715 C2

Реферат патента 2021 года ГРЫЗУНЫ, ХАРАКТЕРИЗУЮЩИЕСЯ ГУМАНИЗИРОВАННЫМ ГЕНОМ TMPRSS

Изобретение относится к области биотехнологии, в частности к грызуну, который экспрессирует гуманизированный белок Tmprss, а также к его клетке и ткани. Также раскрыт эмбрион грызуна для получения грызуна, который экспрессирует гуманизированный белок Tmprss. Изобретение также относится к способу получения грызуна, имеющего гуманизированный ген Tmprss. Изобретение позволяет эффективно осуществлять оценку терапевтической эффективности соединения в лечении инфекции, вызванной вирусом гриппа. 7 н. и 25 з.п. ф-лы, 4 табл., 3 пр., 4 ил.

Формула изобретения RU 2 749 715 C2

1. Грызун, который экспрессирует гуманизированный белок Tmprss, причем геном грызуна содержит гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, где гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где грызун представляет собой мышь или крысу.

2. Грызун по п. 1, где гуманизированный ген Tmprss образован в результате замены геномной последовательности эндогенного гена Tmprss грызуна указанной нуклеотидной последовательностью родственного гена TMPRSS человека.

3. Грызун по п. 1 или 2, где гуманизированный ген Tmprss представляет собой гуманизированный ген Tmprss2, эндогенный ген Tmprss грызуна представляет собой эндогенный ген Tmprss2 грызуна, и родственный ген TMPRSS человека представляет собой ген TMPRSS2 человека.

4. Грызун по п. 3, где белок TMPRSS2 человека содержит аминокислотную последовательность, приведенную в SEQ ID NO: 4.

5. Грызун по п. 3, где нуклеотидная последовательность гена TMPRSS2 человека содержит область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS2 человека.

6. Грызун по п. 3, где гуманизированный ген Tmprss2 содержит

(i) кодирующие экзоны 1-2 эндогенного гена Tmprss2 грызуна,

(ii) экзон 3, который содержит 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна и 3'-часть кодирующего экзона 3 гена TMPRSS2 человека, и

(iii) область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, и где гуманизированный ген Tmprss2 кодирует гуманизированный белок Tmprss2, который содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам белка Tmprss2 грызуна, кодируемого указанным эндогенным геном Tmprss2 грызуна, и эктодомен, который практически идентичен эктодомену белка TMPRSS2 человека, кодируемого указанным геном TMPRSS2 человека.

7. Грызун по п. 1 или 2, где гуманизированный ген Tmprss представляет собой гуманизированный ген Tmprss4, эндогенный ген Tmprss грызуна представляет собой эндогенный ген Tmprss4 грызуна, и родственный ген TMPRSS человека представляет собой ген TMPRSS4 человека.

8. Грызун по п. 7, где белок TMPRSS4 человека содержит аминокислотную последовательность, приведенную в SEQ ID NO: 11.

9. Грызун по п. 7, где нуклеотидная последовательность гена TMPRSS4 человека содержит область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.

10. Грызун по п. 7, где гуманизированный ген Tmprss4 содержит область от кодирующего экзона 1 до кодирующего экзона 3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека.

11. Грызун по п. 1 или 2, где гуманизированный ген Tmprss представляет собой гуманизированный ген Tmprss11d, эндогенный ген Tmprss грызуна представляет собой эндогенный ген Tmprss11d грызуна, и родственный ген TMPRSS человека представляет собой ген TMPRSS11D человека.

12. Грызун по п. 11, где белок TMPRSS11D человека содержит аминокислотную последовательность, приведенную в SEQ ID NO: 18.

13. Грызун по п. 11, где нуклеотидная последовательность гена TMPRSS11D человека содержит область от кодирующего экзона 3 до стоп-кодона в кодирующем экзоне 10 гена TMPRSS11D человека.

14. Грызун по п. 11, где гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека.

15. Грызун по любому из пп. 1-14, где грызун представляет собой мышь.

16. Грызун по любому из пп. 1-14, где грызун представляет собой крысу.

17. Грызун по п. 15 или 16, где грызун является гетерозиготным по гуманизированному гену Tmprss.

18. Грызун по п. 15 или 16, где грызун является гомозиготным по гуманизированному гену Tmprss.

19. Выделенная клетка грызуна, которая экспрессирует гуманизированный белок Tmprss, в геноме которой содержится гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, причем гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и находится под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где клетка грызуна представляет собой клетку мыши или клетку крысы.

20. Выделенная клетка грызуна по п. 19, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.

21. Выделенная ткань грызуна, которая экспрессирует гуманизированный белок Tmprss, в геноме которой содержится гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, причем гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и находится под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где ткань грызуна представляет собой ткань мыши или ткань крысы.

22. Выделенная ткань грызуна по п. 21, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.

23. Эмбриональная стволовая (ЭС) клетка грызуна для получения грызуна, который экспрессирует гуманизированный белок Tmprss, содержащая гуманизированный ген Tmprss, кодирующий гуманизированный белок Tmprss, где гуманизированный ген Tmprss содержит нуклеотидную последовательность эндогенного гена Tmprss грызуна и нуклеотидную последовательность родственного гена TMPRSS человека и расположен в эндогенном локусе Tmprss грызуна и под контролем промотора эндогенного гена Tmprss грызуна, причем гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где ЭС клетка грызуна представляет собой ЭС клетку мыши или ЭС клетку крысы.

24. ЭС клетка грызуна по п. 23, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.

25. Эмбрион грызуна для получения грызуна, который экспрессирует гуманизированный белок Tmprss, содержащий ЭС клетку грызуна по п. 23 или 24, причем эмбрион грызуна представляет собой эмбрион мыши или эмбрион крысы.

26. Способ получения грызуна, имеющего гуманизированный ген Tmprss, включающий:

(a) вставку геномного фрагмента в эндогенный локус Tmprss грызуна в ЭС клетке грызуна, при этом указанный геномный фрагмент содержит нуклеотидную последовательность родственного гена TMPRSS человека, тем самым обеспечивая получение ЭС клетки грызуна, содержащей гуманизированный ген Tmprss, где гуманизированный ген Tmprss находится под контролем промотора гена Tmprss грызуна в эндогенном локусе Tmprss грызуна и кодирует гуманизированный белок Tmprss, где гуманизированный белок Tmprss содержит эктодомен, практически идентичный эктодомену белка TMPRSS человека, кодируемого родственным геном TMPRSS человека, и содержит цитоплазматический и трансмембранный участки, которые практически идентичны цитоплазматическому и трансмембранному участкам эндогенного белка Tmprss грызуна, кодируемого эндогенным геном Tmprss грызуна, и где грызун представляет собой мышь или крысу; и

(b) получение грызуна с применением ЭС клетки грызуна полученной в (а).

27. Способ по п. 26, где гуманизированный ген Tmprss выбран из группы, состоящей из гуманизированного гена Tmprss2, гуманизированного гена Tmprss4 и гуманизированного гена Tmprss11d.

28. Способ по п. 27, где гуманизированный ген Tmprss2 содержит

(i) кодирующие экзоны 1-2 эндогенного гена Tmprss2 грызуна,

(ii) экзон 3, который содержит 5'-часть кодирующего экзона 3 эндогенного гена Tmprss2 грызуна и 3'-часть кодирующего экзона 3 гена TMPRSS2 человека, и

(iii) и область от кодирующего экзона 4 до кодирующего экзона 13 гена TMPRSS2 человека, и/или где гуманизированный ген Tmprss4 содержит область от кодирующего экзона 1 до кодирующего экзона 3 эндогенного гена Tmprss4 грызуна и область от кодирующего экзона 4 до стоп-кодона в кодирующем экзоне 13 гена TMPRSS4 человека, и/или где гуманизированный ген Tmprss11d содержит кодирующие экзоны 1-2 эндогенного гена Tmprss11d грызуна и область от кодирующего экзона 3 до кодирующего экзона 10 гена TMPRSS11D человека.

29. Способ по любому из пп. 26-28, где грызун представляет собой мышь.

30. Способ по любому из пп. 26-28, где грызун представляет собой крысу.

31. Способ оценки терапевтической эффективности соединения в лечении инфекции, вызванной вирусом гриппа, включающий:

получение грызуна по любому из пп. 1-18;

введение грызуну вируса гриппа и соединения кандидата; и

мониторинг наличия и тяжести инфекции, вызванной вирусом гриппа, у грызуна для определения терапевтической эффективности соединения кандидата.

32. Способ по п. 31, где соединение кандидат представляет собой антитело или его антигенсвязывающий фрагмент, специфичный в отношении белка TMPRSS человека.

Документы, цитированные в отчете о поиске Патент 2021 года RU2749715C2

YU SUN, Characterization of the TMPRSS2 Protease as a Modulator of Prostate Cancer Metastasis, 2009
US2005026255 A1, 03.02.2005
US2006101531 A1, 11.05.2006
THOMAS H
BUGGE et al., Type II Transmembrane Serine Proteases, J Biol Chem., 2009, Vol
СЧЕТНЫЙ ДИСК ДЛЯ РАСЧЕТА СОСТАВНЫХ ЧАСТЕЙ ПИЩИ 1919
  • Бечин М.И.
SU284A1
23177-23181
NORA KUHN et al., The Proteolytic Activation of (H3N2) Influenza A Virus

RU 2 749 715 C2

Авторы

Пурселл Нгамбо Лиса

Муджика Александер О.

Тан Яцзюнь

Даты

2021-06-16Публикация

2017-02-27Подача