ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к прямому или непрямому получению противоопухолевых соединений из бактерий и к новым противоопухолевым соединениям, содержащим их фармацевтическим композициям и их применению в качестве противоопухолевых средств.
УРОВЕНЬ ТЕХНИКИ
В 1949 году Ueta сообщил о выделении токсического соединения из жука Paederus fuscipes (Kyushu Igaku Zasshi, 1949, 249). Четыре года спустя вещество с идентичными физическими свойствами из того же вида жуков было также описано Pavan и Bo (Physiol. Comp. Oecol. 1953, 3, 307). Структура этого токсичного соединения, названного педерином, была впервые предложена в 1965 году Cardani и его коллегами (Tetrahedron Lett. 1965, 2537), но она была исправлена в 1968 Furusaki и его коллегами на основе кристаллической структуры производного. (Tetrahedron Lett. 1968, 6301). Структура педерина представляет собой:
Педерин
Кроме того, группа Cardani сообщила о выделении двух дополнительных соединений из Paederus fuscipes, которые были названы псевдопедерин и педерон. Педерон был описан два года спустя (Tetrahedron Lett. 1967, 41, 4023).
Педерин является мощным цитотоксическим и везикантным средством. Brega и соавторы (J. Cell Biol. 1968, 485-496) протестировали педерин против ряда клеточных линий, таких как EUE, E6D, HeLa, KB, Hep, AS, MEF, CE, BHK, Z1 и M1, и сообщили, что концентрации порядка 3 нМ достаточны для индукции клеточной гибели в течение четырех дней во всех анализируемых клеточных линиях. Кроме того, педерин вызывает немедленное нарушение синтеза белка и ДНК.
Цитотоксичность псевдопедерина также была описана Soldati и сотрудниками (Experientia 1966, 3, 176-178). Псевдопедерин имеет токсичность ниже педерина и активен в дозах в 10 раз выше.
В европейском патенте EP0289203 описано выделение и противоопухолевая и противовирусная активность Микаламида А, соединения, выделенного из губок Mycale sp., собранных в Новой Зеландии.
Микаламид А
Его изобретатели, группа Munro, затем сообщили о выделении Микаламида B, близко родственного соединения с противоопухолевой и противовирусной активностью, выделенного из того же источника (J. Org. Chem. 1990, 55, 223).
Микаламид В
Затем они выделили два дополнительных микаламида, Микаламид C и D, из губок Stylinos (J. Nat. Prod. 2000, 63, 704). Микаламиды A, B, C и D имеют значения IC50 против линии клеток мышиного лейкоза P-388, равные 3,0, 0,7, 95,0 и 35 нг/мл, соответственно.
Было также показано, что микаламиды являются мощными иммуносупрессивными агентами, сравнимыми по эффективности in vitro с клиническим средством циклоспорин А.
В US4801606 описано выделение Оннамида A из образцов Theonella sp, собранных у берегов Японии. Оннамид А представляет собой противоопухолевое соединение со значением IC50 против мышиной линии клеток P388, равным 1 нг/мл. Он также обладает противовирусной активностью.
Оннамид А
Семейство оннамида состоит из нескольких представителей. У трех из них, Оннамидов D-F, отсутствует диоксолановое кольцо Оннамида A. Оннамиды D и E были выделены из губок Theonella Matsunaga и его коллегами (Tetrahedron, 1992, 48, 8369), и Оннамид F собран группой Capon из губки Trachycladus laevispirulifer (J. Nat. Prod. 2001, 64, 640).
Оннамид E не проявлял цитотоксической активности в отношении клеточной линии P388 при концентрации 0,4 мкг/мл, а Оннамид F описан как мощный нематоцид.
Экспериментальное доказательство бактериального биосинтеза педерина было впервые предоставлено Kellner, который сообщил, что свойство производить педерин может быть передано непроизводящей линии Paederus spp путем скармливания яиц педерин-позитивных самок (Chemoecology, 2001, 11, 127). Напротив, яйца, обработанные антибиотиками, не вызывали такого эффекта. Этот результат указал на существование продуцирующей педерин бактерии, которая способна колонизировать непродуцирующие варианты (J. Insect. Physiol., 2001, 47, 475).
Piel и коллеги выделили генный крастер для поликетидного синтеза (PKS) педерина (Proc. Natl. Acad. Sci. U.S.A., 2002, 99, 14002 и WO2003044186) и оннамидов (Proc. Natl. Acad. Sci. U.S.A., 2004, 101, 16222). В этой работе было показано активное участие бактериальных симбионтов в качестве истинных источников этих соединений, что дает объяснение тому, что структурно подобные соединения выделены из разрозненных организмов. Описание участия симбионтов дано Piel, J., Curr. Med. Chem. 2006, 13, 39.
Другое близкородственное соединение, диафорин, было выделено Nakabachi и коллегами из насекомого Diaphorina citri (Current Biology 2013, 23(15), 1478-1484). Это соединение также является цитотоксическим и имеет значение IC50, равное приблизительно 1 мкМ и приблизительно против клеток B104 и HeLa, соответственно. Его присутствие в экстрактах Diaphorina citri было спрогнозировано в той же публикации при анализе системы поликетидсинтазы (PKS) Candidatus Profftella armatura, защитного бактериального симбионта, связанного с Diaphorina citri.
Диафорин
С другой стороны, в патентной заявке WO2013016120 описан полный синтез педерина и его аналогов формулы:
,
где по меньшей мере один из R1 или R2 включает линкер, который включает реакционно активную функциональную группу, которая может связываться с мишеневой группой. Это полный синтез основан на многокомпонентной конструкции на основе ациламинала.
Подробные исследования фармакологических свойств педеринов, микаламидов и оннамидов были затруднены нехваткой этих соединений из природных источников. Например, для выделения достаточного количества материала для выяснения структуры педерина требовалось приблизительно 100 кг Paederus fuscipes. Хотя системы PKS педеринов и оннамидов были описаны, получить эти соединения биотехнологическими методами пока не удавалось. Поэтому единственным способом получения этих интересующих соединений на практике на данный момент является полный синтез. Сообщалось о целом ряде случаев синтеза педерина и микаламидов. Они были недавно рассмотрены Witezak и соавторами (Mini Rev. Med. Chem. 2012, 12(14), 1520-1532) и Floreancig и Mosey (Nat. Prod. Rep. 2012, 29, 980).
Эти варианты синтеза привели к путям, которые являются в достаточной степени короткими для получения достаточного количества материала для биологических испытаний, и дают аналоги, которые могли быть эффективными для разработки связей структура-активность для этих соединений. Тем не менее, остается необходимость в более коротком пути получения этих соединений и их новых противоопухолевых аналогов.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В первом аспекте настоящее изобретение относится к соединению общей формулы I или его фармацевтически приемлемой соли, таутомеру или стереоизомеру
I,
где:
R1, R2, и R3, каждый, независимо, выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, –C(=O)Ra, –C(=O)ORb и –(C=O)NRcRd;
R4 выбран из водорода, -C(=O)Ra, -C(=O)ORb и –C(=O)NRcRd;
Ra выбран из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;
Rb выбран из замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;
Rc и Rd независимо выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;
при условии, что R1 и R2 одновременно не представляют собой метил.
Во втором аспекте настоящее изобретение относится к фармацевтическим композициям, содержащим соединение формулы I, или его фармацевтически приемлемую соль, таутомер или стереоизомер вместе с фармацевтически приемлемым носителем или разбавителем.
В третьем аспекте настоящее изобретение относится к соединениям формулы I или их фармацевтически приемлемым солям, таутомерам или стереоизомерам для применения в качестве лекарственного средства, в частности, в качестве лекарственного средства для лечения злокачественного новообразования.
В четвертом аспекте настоящее изобретение относится к фармацевтическим композициям, содержащим соединение формулы I, для применения в качестве лекарственного средства, в частности, в качестве лекарственного средства для лечения злокачественного новообразования.
В пятом аспекте настоящее изобретение относится также к применению соединения формулы I или его фармацевтически приемлемой соли, таутомера или стереоизомера для лечения злокачественного новообразования, или при получении лекарственного средства, предпочтительно, для лечения злокачественного новообразования. Другими аспектами данного изобретения являются способы лечения и соединения для применения в этих способах. Таким образом, в настоящем изобретении, кроме того, предложен способ лечения пациента, а именно - человека, страдающего злокачественным новообразованием, который включает введение указанному страдающему лицу, нуждающемуся в этом, терапевтически эффективного количества соединения, определенного выше.
В шестом аспекте настоящее изобретение относится к способу получения соединение формулы II или его фармацевтически приемлемой соли, таутомера или стереоизомера
,
где
R1, R2, и R3, каждый, независимо, выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, –C(=O)Ra, -C(=O)ORb и -(C=O)NRcRd;
R4 выбран из водорода, -C(=O)Ra, -C(=O)ORb и –C(=O)NRcRd;
Ra выбран из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;
Rb выбран из замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;
Rc и Rd независимо выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;
где способ включает стадии:
культивирование штамма PHM005 морских бактерий дикого типа или их мутантов в соответствующих условиях для продуцирования соединений 1 и/или 2 формулы:
;
- выделение соединения 1 или 2; и, при необходимости,
- получение производных соединение 1 или 2.
В шестом аспекте настоящее изобретение относится к штамму PHM005. Свободноживущие морские альфа-протеобактерии, производители соединений 1 и 2, были депонированы для патентных целей в коллекции CECT с кодом CECT-9225.
В восьмом аспекте в настоящем изобретении предложена выделенная последовательность нуклеиновой кислоты, содержащая биосинтетический генный кластер Lab или являющаяся комплементарной к последовательности, содержащей Lab биосинтетический генный кластер. Этот генный кластер представляет собой первый пример генов культивируемой бактерии, кодирующих биосинтез педерин-подобных и оннамид-подобных соединений.
В девятом аспекте в настоящем изобретении предложены фрагменты нуклеиновых кислот, выбранные из группы, включающей гены lab706, lab707, lab708, lab709, lab710, lab711, lab712, lab713, lab714, lab715, lab716, lab717, lab718, lab719, lab720, lab721, lab722, lab723, lab724, lab725 и/или lab726, как показано на фигуре 3.
В десятом аспекте изобретение относится к модульной ферментативной системе, кодируемой последовательностью нуклеиновой кислоты, описанной выше. Модульная ферментативная система предпочтительно обладает функциональной активностью в биосинтезе педерин-подобных и оннамид-подобных соединений и/или фрагмента поликетида и/или фрагмента нерибосомного пептида.
В одиннадцатом аспекте настоящее изобретение относится к вектору, содержащему нуклеиновую кислоту, по существу состоящую из биосинтетического генного кластера Lab, полученного из Labrenzia sp. и, в частности, из штамма PHM005, или вектору, содержащему последовательность нуклеиновой кислоты, описанную выше.
В двенадцатом аспекте настоящее изобретение относится к рекомбинантной клетке-хозяину или к трансгенному организму, содержащему указанную нуклеиновую кислоту или содержащему указанный вектор.
В тринадцатом аспекте настоящее изобретение относится к способу получения педерин-подобных или оннамид-подобных соединений с использованием мутанта PHM005 или рекомбинантной клетки-хозяина или трансгенного организма, описанных выше, включающему стадии:
- Культивирование мутанта PHM005 или рекомбинантной клетки-хозяина или трансгенного организма в условиях экспрессии биосинтетического генного кластера Lab; и
- Выделение продуцированных педерин-подобных и/или оннамид-подобных соединений.
Другие аспекты настоящего изобретения относятся к применению нуклеиновой кислоты, определенной выше, при получении модифицированного биосинтетического генного кластера Lab, к применению нуклеиновой кислоты, определенной выше, при получении педерин-подобного или оннамид-подобного соединения и к способам улучшенного продуцирования педерин-подобных и оннамид-подобных соединений бактериями, включающим стадии a) культивирования штамма PHM005 в присутствии o-мутагенного агента в течение периода времени, достаточного для мутагенеза, и b) отбор указанных мутантов путем изменения фенотипа, что приводит к увеличению продуцирования педерин-подобных или оннамид-подобных соединений. Мутагенный агент может представлять собой химический агент, такой как даунорубицин и нитрозогуанидин; физический агент, такой как гамма-излучение или ультрафиолетовое излучение; или биологический агент, такой как, например, транспозон. Примеры модификаций включают в себя нокаут адаптации генов, чтобы избежать метилирования и гидроксилирования.
КРАТКОЕ ОПИСАНИЕ ФИГУР И ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Фигура 1. Электронная микроскопия (негативное окрашивание) Labrenzia sp. PHM005. Клетки в фазе среднего экспоненциального роста адсорбировали в течение 2 минут на сетках с углеродным коллодием с ячейками 400 меш, негативно окрашивали 2% уранилацетатом, регистрировали с помощью электронного просвечивающего микроскопа Jeol JEM 1011, работающего при 100 кВ, и фотографировали с помощью камеры CCD Gatan Erlangshen ES1000W.
Фигура 2. Соседнее дерево, основанное на последовательностях генов 16S рРНК, которое показывает связь между PHM005 и типовыми штаммами близкородственных видов родов Labrenzia и Stappia. Филогенетическое дерево было создано с помощью коэффициента подобия на основе парного выравнивания и UPGMA для кластерного анализа с использованием BioNumerics V7.5 (Applied Maths). Были идентифицированы филогенетические соседи и попарное сходство последовательностей генов 16S рДНК, рассчитанное путем сравнения с базой данных SILVA LTPs123.
Фигура 3. Карта биосинтетического генного кластера Lab. Полный остров генного кластера Lab: 69 Kb.
Фигура 4. 1H ЯМР спектр соединения 1 в CDCl3.
Фигура 5. 13C ЯМР спектр соединения 1 в CDCl3.
Фигура 6. gCOSY спектр соединения 1 в CDCl3.
Фигура 7. TOCSY спектр соединения 1 в CDCl3.
Фигура 8. gHSQC спектр соединения 1 в CDCl3.
Фигура 9. LR-HSQMBC спектр соединения 1 в CDCl3.
Фигура 10. ROESY спектр соединения 1 в CDCl3.
Последовательности, упомянутые в этой заявке, перечислены в прилагаемом списке последовательностей. Эти последовательности кратко изложены следующим образом:
SEQ ID №: 1 последовательность (1355 bp) гена 16S рРНК Labrenzia sp. PHM005
SEQ ID №: 2 последовательность нуклеиновой кислоты биосинтетического генного кластера Lab .
SEQ ID №: 3 последовательность структуры белка Lab706 предполагаемого ацильного белка-носителя.
SEQ ID №: 4 последовательность структуры белка Lab707 предполагаемого HMGS.
SEQ ID №: 5 последовательность структуры белка Lab708 PKS.
SEQ ID №: 6 последовательность структуры белка Lab709 ТрансAT PKS.
SEQ ID №: 7 последовательность структуры белка Lab710 предполагаемого ацильного белка-носителя.
SEQ ID №: 8 последовательность структуры белка Lab711 предполагаемой FAD оксигеназы.
SEQ ID №: 9 последовательность структуры белка Lab712 предполагаемой O-метилтрансферазы.
SEQ ID №: 10 последовательность структуры белка Lab713 предполагаемого цитохрома P450.
SEQ ID №: 11 последовательность структуры белка Lab714 предполагаемой малонил-CoA-ACP трансацилазы или FMT оксидоредуктазы.
SEQ ID №: 12 последовательность структуры белка Lab715 предполагаемой малонил-CoA-ACP трансацилазы или ацилтрансферазы.
SEQ ID №: 13 последовательность структуры белка Lab716 малонил-CoA-ACP трансацилазы.
SEQ ID №: 14 последовательность структуры белка Lab717 Enoyl-CoA гидратазы.
SEQ ID №: 15 последовательность структуры белка Lab718 бета-кетоацил-синтазы.
SEQ ID №: 16 последовательность структуры белка Lab719 ТрансAT PKS/NRPS.
SEQ ID №: 17 последовательность структуры белка Lab720 предполагаемой FAD монооксигеназа.
SEQ ID №: 18 последовательность структуры белка Lab721, части ТрансAT PKS.
SEQ ID №: 19 последовательность структуры белка Lab722, части ТрансAT PKS.
SEQ ID №: 20 последовательность структуры белка Lab723, части PKS.
SEQ ID №: 21 последовательность структуры белка Lab724, части ТрансAT PKS/NRPS.
SEQ ID №: 22 последовательность структуры белка Lab725, части PKS.
SEQ ID №: 23 последовательность структуры белка Lab726 предполагаемой O-метилтрансферазы.
ПОДРОБНОЕ ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к соединениям общей формулы I, определенным выше.
В соединениях, определенных формулами Маркуша в данном описании, группы могут быть выбраны в соответствии со следующими инструкциями:
Алкильные группы могут быть разветвленными или неразветвленными и, предпочтительно, имеют от 1 до примерно 12 атомов углерода. Еще один предпочтительный класс алкильных групп имеет от 1 до примерно 6 атомов углерода. Еще более предпочтительными являются алкильные группы, имеющие 1, 2, 3 или 4 атома углерода. Метил, этил, н-пропил, изопропил и бутил, включая н-бутил, трет-бутил, втор-бутил и изобутил, являются особенно предпочтительными алкильными группами в соединениях по настоящему изобретению. Используемый в настоящем документе термин алкил, если не указано иное, относится как к циклическим, так и к нециклическим группам, хотя циклические группы будут содержать по меньшей мере три углеродных кольцевых члена.
Алкенильные и алкинильные группы в соединениях по настоящему изобретению могут быть разветвленными или неразветвленными, иметь одну или несколько ненасыщенных связей и от 2 до примерно 12 атомов углерода. Еще один предпочтительный класс алкенильных и алкинильных групп имеет от 2 до примерно 6 атомов углерода. Еще более предпочтительными являются алкенильные и алкинильные группы, имеющие 2, 3 или 4 атома углерода. Используемые в настоящем документе термины алкенил и алкинил относятся как к циклическим, так и к нециклическим группам, хотя циклические группы будут содержать по меньшей мере три атома углерода кольца.
Подходящие арильные группы в соединениях по настоящему изобретению включают соединения с одним или несколькими кольцами, включая соединения с несколькими кольцами, которые содержат отдельные и/или конденсированные арильные группы. Типичные арильные группы содержат от 1 до 3 отдельных или конденсированных колец и от 6 до примерно 18 атомов углерода в кольце. Предпочтительно, арильные группы содержат от 6 до около 14 атомов углерода кольца. Особенно предпочтительные арильные группы включают замещенный или незамещенный фенил, замещенный или незамещенный нафтил, замещенный или незамещенный бифенил, замещенный или незамещенный фенантрил и замещенный или незамещенный антрил. Наиболее предпочтительной арильной группой является замещенный или незамещенный фенил.
Подходящие гетероциклические группы включают гетероароматические и гетероалициклические группы, содержащие от 1 до 3 отдельных и/или конденсированных колец и от 5 до примерно 18 атомов кольца. Предпочтительно, гетероароматические и гетероалициклические группы содержат от 5 до около 10 кольцевых атомов, более предпочтительно 5, 6 или 7 кольцевых атомов. Подходящие гетероароматические группы в соединениях по настоящему изобретению содержат один, два или три гетероатома, выбранных из атомов N, O или S, и включают, например, кумаринил, включая 8-кумаринил, хинолил, включая 8-хинолил, изохинолил, пиридил, пиразинил, пиразолил, пиримидинил, фурил, пирролил, тиенил, тиазолил, изотиазолил, триазолил, тетразолил, изоксазолил, оксазолил, имидазолил, индолил, изоиндолил, индазолил, индолизинил, фталазинил, птеридинил, пуринил, оксадиазолил, тиадиазолил, фуразанил, пиридазинил, триазинил, циннолинил, бензимидазолил, бензофуранил, бензофуразанил, бензотиофенил, бензотиазолил, бензоксазолил, хиназолинил, нафтиридинил и фуропиридил. Подходящие гетероалициклические группы в соединениях по настоящему изобретению содержат один, два или три гетероатома, выбранных из атомов N, O или S, и включают, например, пирролидинил, тетрагидрофуранил, тетрагидротиенил, тетрагидротиопиранил, пиперидил, морфолинил, тиоморфолинил, тиоксанинил, пиперазинил, азетидинил, оксетанил, тиетанил, гомопиперидил, оксепанил, тиепанил, оксазепинил, диазепинил, тиазепинил, 1,2,3,6-тетрагидропиридил, 2-пирролинил, 3-пирролинил, индолинил, 2H-пиранил, 4H-пиранил, 4H-пиранил, диоксанил, 1,3-диоксоланил, пиразолинил, дитианил, дитиоланил, дигидропиранил, дигидротиенил, дигидрофуранил, пиразолидинил, имидазолинил, имидазолидинил, 3-азабицикло[3.1.0]гексил, 3-азабицикло[4.1.0]гептил, 3H-индолил и хинолизинил.
Указанные выше группы могут быть замещены в одном или нескольких доступных положениях одной или несколькими подходящими группами, такими как OR’, =O, SR’, SOR’, SO2R’, OSO2R’, NO2, NHR’, NR’R’, =N-R’, N(R’)COR’, N(COR’)2, N(R’)SO2R, N(R’)C(=NR’)N(R’)R’, CN, галоген, COR’ COOR’, OCOR’, OCOOR’, OCONHR’, OCON(R’)R’, CON(R’)R’, CON(R’)OR’, CON(R’)SO2R’, PO(OR’)2, PO(OR’)R’, PO(OR’)(N(R’)R’), защищенный OH, замещенный или незамещенный C1-C12 алкил, замещенный или незамещенный C2-C12 алкенил, замещенный или незамещенный C2-C12 алкинил, замещенный или незамещенный арил и замещенная или незамещенная гетероциклильная группа, где каждая из групп R’ независимо выбрана из группы, включающей водород, OH, NO2, NH2, SH, CN, галоген, COH, CO-алкил, COOH, замещенный или незамещенный C1-C12 алкил, замещенный или незамещенный C2-C12 алкенил, замещенный или незамещенный C2-C12 алкинил, замещенный или незамещенный арил и замещенная или незамещенная гетероциклильная группа. Когда такие группы сами замещены, заместители могут быть выбраны из приведенного выше перечня.
Подходящие галогеновые группы или заместители в соединениях по настоящему изобретению включают F, Cl, Br и I.
Подходящие защитные группы для ОН, включая защитные группы для 1,2-диолов, хорошо известны специалисту в данной области. Общий обзор защитных групп в органической химии представлен Wuts, PGM and Greene TW in Protecting Groups in Organic Synthesis 4th Ed. Wiley-Interscience, и Kocienski PJ в обзоре Protecting Groups, 3rd Ed. Georg Thieme Verlag. Эти ссылки предоставляют разделы по защитным группам для ОН. Все эти ссылки включены в качестве ссылки во всей своей полноте.
В рамках настоящего изобретения защитная группа OH определена как фрагмент, связанный с O, в результате защиты группы ОН посредством образования подходящей защищенной группы OH. Примеры таких защищенных ОН включают простые эфиры, простые силиловые эфиры, сложные эфиры, сульфонаты, сульфенаты и сульфинаты, карбонаты и карбаматы. В случае простых эфиров защитная группа для ОН может быть выбрана из метила, метоксиметила, метиламетила, (фенилдиметилсилил)метоксиметила, бензилоксиметила, п-метоксибензилоксиметила, [(3,4-диметоксибензил)окси]метила, п-нитробензилоксиметила, о-нитробензилоксиметила, [(R)-1-(2-нитрофенил)этокси]метила, (4-метоксифенокси)метила, гваяколметила, [(п-фенилфенил)-окси]метила, трет-бутоксиметила, 4-пентенилоксиметила, силоксиметила, 2-метоксиэтоксиметила, 2-цианоэтоксиметила, бис(2-хлорэтокси)метила, 2,2,2-трихлорэтоксиметила, 2-(триметилсилил)-этоксиметила, метоксиметила, O-бис(2-ацетоксиэтокси)метила, тетрагидропиранила, фтористого тетрагидропиранила, 3-атетрагидропиранила, тетрагидротиопиранила, 1-метоксиа, 4-метокситетрагидропиранила, 4-метокситетрагидротиопиранила, 4-метокситетрагидротиопиранил S,S-диоксида, 1-[(2-хлор-4-метил)фенил]-4-метоксипиперидин-4-ила, 1-(2-фторфенил)-4-метоксипиперидин-4-ила, 1-(4-хлорфенил)-4-метоксипиперидин-4-ила, 1,4-диоксан-2-ила, тетрагидрофуранила, тетрагидротиофуранила, 2,3,3a,4,5,6,7,7a-октагидро-7,8,8-триметил-4,7-метанобензофуран-2-ила, 1-этоксиэтила, 1-(2-хлорэтокси)этила, 2-гидроксиэтила, 2-бромэтила, 1-[2-(триметилсилил)этокси]этила, 1-метил-1-метоксиэтила, 1-метил-1-бензилоксиэтила, 1-метил-1-бензилокси-2-фторэтила, 1-метил-1-феноксиэтила, 2,2,2-трихлорэтила, 1,1-дианизил-2,2,2-трихлорэтила, 1,1,1,3,3,3-гексафтор-2-фенилизопропила, 1-(2-цианоэтокси)этила, 2-триметилсилилэтила, 2-(бензилтио)этила, 2-(фенилселенил)этила, трет-бутила, циклогексила, 1-метил-1’-циклопропилметила, аллила, пренила, циннамила, 2-феналлила, пропаргила, п-хлорфенила, п-метоксифенила, п-нитрофенила, 2,4-динитрофенила, 2,3,5,6-тетрафтор-4-(трифторметил)фенила, бензила, п-метоксибензила, 3,4-диметоксибензила, 2,6-диметоксибензила, о-нитробензила, п-нитробензила, пентадиенилнитробензила, пентадиенилнитропиперонила, галогенбензила, 2,6-дихлорбензила, 2,4-дихлорбензила, 2,6-дифторбензила, п-цианобензила, фтористого бензила, 4-фтористогоалкоксибензила, триметилсилилксилила, п-фенилбензила, 2-фенил-2-пропила, п-ациламинобензила, п-азидобензила, 4-азидо-3-хлорбензила, 2-трифторметилбензила, 4-трифторметилбензила, п-(метилсульфинил)бензила, п-силетанилбензила, 4-ацетоксибензила, 4-(2-триметилсилил)этоксиметоксибензила, 2-нафтилметила, 2-пиколила, 4-пиколила, 3-метил-2-пиколил N-оксида, 2-хинолинилметила, 6-метокси-2-(4-метилфенил-4-хинолинметила, 1-пиренилметила, дифенилметила, 4-метоксидифенилметила, 4-фенилдифенилметила, п,п’-динитробензгидрила, 5-дибензосуберила, трифенилметила, трис(4-трет-бутилфенил)метила, α-нафтилдифенилметила, п-метоксифенилдифенилметила, ди(п-метоксифенил)фенилметила, три(п-метоксифенил)метила, 4-(4’-бромфенацилокси)фенилдифенилметила, 4,4’,4’’-трис(4,5-дихлорфталимидофенил)метила, 4,4’4’’-трис(левулиноилоксифенил)метила, 4,4’,4’’-трис(бензоилоксифенил)метила, 4,4’-диметокси-3’’-[N-(имидазолилметил)]тритила, 4,4’-диметокси-3’’-[N-(имидазолилэтил)карбамоил]тритила, бис(4-метоксифенил)-1’-пиренилметила, 4-(17-тетрабензо[a,c,g,i]флуоренилметил)-4,4’’-диметокситритила, 9-антрила, 9-(9-фенил)ксантенила, 9-фенилтиоксантила, 9-(9-фенил-10-оксо)антрила, 1,3-бензодитиолан-2-ил и 4,5-бис(этоксикарбонил)-[1,3]-диоксолан-2-ила, бензизотиазолил S,S-диоксида. В случае сложных силиловых эфиров защитная группа для OH может быть выбрана из триметилсилила, триэтилсилила, триизопропилсилила, диметилизопропилсилила, диэтилизопропилсилила, диметилгексилсилила, 2-норборнилдиметилсилила, трет-бутилдиметилсилила, трет-бутилдифенилсилила, трибензилсилила, три-п-ксилилсилила, трифенилсилила, дифенилметилсилила, ди-трет-бутилметилсилила, бис-(трет-бутил)-1-пиренилметоксисилила, трис(триметилсилил)силила, (2-гидроксистирил)диметилсилила, (2-гидроксистирил)диизопропилсилила, трет-бутилметоксифенилсилила, трет-бутоксидифенилсилила, 1,1,3,3-тетраизопропил-3-[2-(трифенилметокси)этокси]дисилоксан-1-ила и фтористого силила В случае сложных эфиров защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует сложный эфир, который может быть выбран из формиата, бензоилформиата, ацетата, хлорацетата, дихлорацетата, трихлорацетата, трихлорацетамидата, трифторацетата, метоксиацетата, трифенилметоксиацетата, феноксиацетата, п-хлорфеноксиацетата, фенилацетата, дифенилацетата, 3-фенилпропионата, пропаноил с цепью бисфтористого типа, 4-пентеноата, 4-оксопентаноата, 4,4-(этилендитио)пентаноата, 5-[3-бис(4-метоксифенил)гидроксиметилфенокси]левулината, пивалоата, 1-адамантоата, кротоната, 4-метоксикротоната, бензоата, п-фенилбензоата, 2,4,6-триметилбензоата, 4-бромбензоата, 2,5-дифторбензоата, п-нитробензоата, пиколината, никотината, 2-(азидометил)бензоата, 4-азидобутирата, (2-азидометил)фенилацетата, 2-{[тритилтио)окси]метил}бензоата, 2-{[(4-метокситритилтио)окси]метил}бензоата, 2-{[метил(тритилтио)амино]метил}бензоата, 2-{{[(4-метокситритил)тио]метиламино]-метил}бензоата, 2-(аллилокси)фенилацетата, 2-(пренилоксиметил)бензоата, 6-(левулинилоксиметил)-3-метокси-2-нитробензоата, 6-(левулинилоксиметил)-3-метокси-4-нитробензоата, 4-бензилоксибутирата, 4-триалкилсилилоксибутирата, 4-ацетокси-2,2-диметилбутирата, 2,2-диметил-4-пентеноата, 2-йодбензоата, 4-нитро-4-метилпентаноата, о-(дибромметил)бензоата, 2-формилбензолсульфоната, 4-(метилтиометокси)бутирата, 2-(метилтиометоксиметил)бензоата, 2-(хлорацетоксиметил)бензоата, 2-[(2-хлорацетокси)этил]бензоата, 2-[2-бензилокси)этил]бензоата, 2-[2-(4-метоксибензилокси)этил]бензоата, 2,6-дихлор-4-метилфеноксиацетата, 2,6-дихлор-4-(1,1,3,3-тетраметилбутил)феноксиацетата, 2,4-бис(1,1-диметилпропил)феноксиацетата, хлордифенилацетата, изобутирата, моносукциноата, (E)-2-метил-2-бутеноата, о-(метоксикарбонил)бензоата, α-нафтоата, нитрата, алкил N,N,N’,N’-тетраметилфосфородиамидата и 2-хлорбензоата. В случае сульфонатов, сульфенатов и сульфинатов защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует сульфонат, сульфенат или сульфинат, который может быть выбран из сульфата, аллилсульфоната, метансульфоната, бензилсульфоната, тозилата, 2-[(4-нитрофенил)этил]сульфоната, 2-трифторметилбензолсульфоната, 4-монометокситритилсульфената, алкил 2,4-динитрофенилсульфената, 2,2,5,5-тетраметилпирролидин-3-он-1-сульфината и диметилфосфинотиолила. В случае карбонатов защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует карбоната, который может быть выбран из метил карбоната, метоксиметил карбоната, 9-флуоренилметил карбоната, этил карбоната, бромэтил карбоната, 2-(метилтиометокси)этил карбоната, 2,2,2-трихлорэтил карбоната, 1,1-диметил-2,2,2-трихлорэтил карбоната, 2-(триметилсилил)этил карбоната, 2-[диметил(2-нафтилметил)силил]этил карбоната, 2-(фенилсульфонил)этил карбоната, 2-(трифенилфосфонио)этил карбоната, цис-[4-[[(метокситритил)сульфенил]окси]-тетрагидрофуран-3-ил]окси карбоната, изобутил карбоната, трет-бутил карбоната, винил карбоната, аллил карбоната, циннамил карбоната, пропаргил карбоната, п-хлорфенил карбоната, п-нитрофенил карбоната, 4-этокси-1-нафтил карбоната, 6-бром-7-гидроксикумарин-4-илметил карбоната, бензил карбоната, о-нитробензил карбоната, п-нитробензил карбоната, п-метоксибензил карбоната, 3,4-диметоксибензил карбоната, антрахинон-2-илметил карбоната, 2-данзилэтил карбоната, 2-(4-нитрофенил)этил карбоната, 2-(2,4-динитрофенил)этил карбоната, 2-(2-нитрофенил)пропил карбоната, алкил 2-(3,4-метилендиокси-6-нитрофенил)пропил карбоната, 2-циано-1-фенилэтил карбоната, 2-(2-пиридиламино-1-фенилэтил карбоната, 2-[N-метил-N-(2-пиридил)]амино-1-фенилэтил карбоната, фенацил карбоната, 3’,5’-диметоксибензоил карбоната, метил дитиокарбоната и S-бензил тиокарбоната. И в случае карбаматов защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует карбамат, который может быть выбран из диметилтиокарбамата, N-фенилкарбамата и N-метил-N-(o-нитрофенил)карбамата.
В пределах объема настоящего изобретения защитная группа 1,2-диола определяется как присоединенный к O фрагмент, образующийся в результате одновременной защиты 1,2-диола посредством образования защищенного 1,2-диола. Примеры таких защищенных 1,2-диолов включают циклические ацетали и кетали, циклические сложные ортоэфиры, силильные производные, диалкилсилиленовые производные, циклические карбонаты, циклические боронаты. Примеры циклических ацеталей и кеталей включают метилен ацеталь, этилиден ацеталь, трет-бутилметилиден ацеталь, 1-трет-бутилэтилиден кеталь, 1-фенилэтилиден кеталь, 2-(метоксикарбонил)этилиден (Mocdene) ацеталь, или 2-(трет-бутилкарбонил)этилиден (Bocdene) ацеталь, фенилсульфонилэтилиден ацеталь, 2,2,2-трихлорэтилиден ацеталь, 3-(бензилокси)пропил ацеталь, акролеин ацеталь, ацетонид (изопропилиден кеталь), циклопентилиден кеталь, циклогексилиден кеталь, циклогептилиден кеталь, бензилиден ацеталь, п-метоксибензилиден ацеталь, 1-(4-метоксифенил)этилиден кеталь, 2,4-диметоксибензилиден ацеталь, 3,4-диметоксибензилиден ацеталь, п-ацетоксибензилиден ацеталь, 4-(трет-бутилдиметилсилилокси)бензилиден ацеталь, 2-нитробензилиден ацеталь, 4-нитробензилиден ацеталь, мезитилен ацеталь, 6-бром-7-гидроксикумарин-2-илметилиден ацеталь, 1-нaфтальдегид ацеталь, 2-нaфтальдегид ацеталь, 9-антрацен ацеталь, бензофенон кеталь, ди-(п-анизил)метилиден ацеталь, ксантен-9-илиден кеталь, 2,7-диметилксантен-9-илиден кеталь, дифенилметилен кеталь, камфор кеталь и ментон кеталь. Примеры циклических сложных ортоэфиров включают метоксиметилен ацеталь, этоксиметилен ацеталь, 2-оксациклопентилиден сложный ортоэфир, диметоксиметилен сложный ортоэфир, 1-метоксиэтилиден сложный ортоэфир, 1-этоксиэтилиден сложный ортоэфир, фталид сложный ортоэфир, 1,2-диметоксиэтилиден сложный ортоэфир, α-метоксибензилиден сложный ортоэфир, 1-(N,N-диметиламино)этилиден производное, α-(N,N-диметиламино)бензилиден производное, бутан 2-3-бисацеталь (BBA), циклогексан-1,2-диацеталь (CDA) и диспирокетали. Примеры силил производных включают ди-трет-бутилсилиленовую группу (DTBS(OR)2), 1-(циклогексил)-1-(метил)силилен (Cy)(Me)Si(OR)2, ди-изопропилсилилен (изо-пропил)2Si(OR)2, дициклогексиласилилен (Cy)2Si(OR)2, 1,3-(1,1,3,3-тетраизопропилдисилоксанилиден) производное (TIPDS(OR)2), 1,1,3,3-тетра-трет-бутоксидисилоксанилиден производное (TBDS(OR)2), метилен-бис-(диизопропилсиланосанилиден) (MDPS(OR)2) и 1,1,4,4-тетрафенил-1,4-дисиланилиден (SIBA(OR)2). Примеры циклических боронатов включают метил боронат, этил боронат, фенил боронат и о-ацетамидофенил боронат.
Упоминание этих групп не следует интерпретировать как ограничение объема изобретения, поскольку они были упомянуты как простая иллюстрация защитных групп для ОН, но специалисту в данной области техники могут быть известны дополнительные группы, имеющие указанную функцию, и их следует понимать как охватываемые настоящим изобретением.
Термин «фармацевтически приемлемая соль» относится к любой фармацевтически приемлемой соли, которая при введении пациенту способна предоставить (прямо или косвенно) соединение, описанное в настоящем документе. Однако следует понимать, что не фармацевтически приемлемые соли также входят в объем изобретения, поскольку они могут быть использованы при получении фармацевтически приемлемых солей. Получение солей может быть осуществлено способами, известными в данной области.
Например, фармацевтически приемлемые соли соединений, представленные в настоящем документе, синтезируют обычными химическими способами из исходного соединения, которое содержит основной или кислотный фрагмент. Обычно такие соли получают, например, путем взаимодействия кислотных или основных форм этих соединений со стехиометрическим количеством подходящего основания или кислоты в воде или в органическом растворителе или в смеси обоих. Как правило, предпочтительными являются неводные среды, такие как эфир, этилацетат, этанол, 2-пропанол или ацетонитрил. Примеры солей присоединения кислот включают соли присоединения минеральных кислот, такие как, например, гидрохлорид, гидробромид, гидройодид, сульфат, нитрат, фосфат, и соли присоединения органических кислот, такие как, например, ацетат, трифторацетат, малеат, фумарат, цитрат, оксалат, сукцинат, тартрат, малат, манделат, метансульфонат и п-толуолсульфонат. Примеры солей присоединения оснований включают соли с неорганическими основаниями, такие как, например, соли натрия, калия, кальция и аммония, и соли с органическими основаниями, такие как, например, соли с этилендиамином, этаноламином, N,N-диалкиленэтаноламином, триэтаноламином и основными аминокислотами.
Соединения по изобретению могут быть в кристаллической или аморфной форме либо в виде свободных соединений, либо в виде сольватов (например, гидратов, алкоголятов, в частности, метанолатов), и предполагается, что любая из этих форм входит в объем настоящего изобретения. Способы сольватации обычно известны в данной области техники. Соединения по изобретению могут быть представлены в виде различных полиморфных форм, и предполагается, что изобретение охватывает все такие формы.
Предполагается, что любое соединение, упомянутое в настоящем документе, представляет такое конкретное соединение, а также определенные варианты или формы. В частности, упомянутые в настоящем документе соединения могут иметь асимметрические центры и поэтому существуют в различных энантиомерных или диастереомерных формах. Таким образом, любое данное соединение, упомянутое в данном документе, предназначено для представления любых рацематов, одной или нескольких энантиомерных форм, одной или нескольких диастереомерных форм и их смесей. Также возможна стереоизомерия или геометрическая изомерия относительно двойной связи, поэтому в некоторых случаях молекула может существовать в виде (E)-изомера или (Z)-изомера (транс- и цис-изомеры). Если молекула содержит несколько двойных связей, каждая двойная связь будет иметь свою собственную стереоизомерию, которая может быть такой же или отличаться от стереоизомерии других двойных связей молекулы. Кроме того, упомянутые в настоящем документе соединения могут существовать в виде атропоизомеров. Все стереоизомеры, включая энантиомеры, диастереоизомеры, геометрические изомеры и атропоизомеры соединений, упомянутые в настоящем документе, а также их смеси рассматриваются в рамках объема настоящего изобретения.
Кроме того, любое упомянутое в настоящем документе соединение может существовать в виде таутомеров. В частности, термин таутомеры относится к одному из двух или более структурных изомеров соединения, которые существуют в равновесии и легко преобразуются из одной изомерной формы в другую. Обычными таутомерными парами являются амин-имин, амид-имидная кислота, кето-енол, лактам-лактим и т.д.
Если не указано иное, соединения по изобретению также должны включать изотопно-меченые формы, то есть соединения, которые отличаются только наличием одного или нескольких изотопно-обогащенных атомов. Например, соединения, имеющие настоящие структуры, за исключением замены, по меньшей мере, одного атома водорода дейтерием или тритием, или замены, по меньшей мере, одного атома углерода на 13C- или 14C-обогащенный углерод, или замены, по меньшей мере, одного атом азота на 15N-обогащенный азот входят в объем данного изобретения.
Чтобы сократить описание, некоторые количественные выражения, приведенные в данном документе, не квалифицированы термином «примерно». Понятно, что независимо от того, используется ли термин «примерно» явно или нет, каждая величина, приведенная в настоящем документе, предназначена для обозначения фактического заданного значения, а также для ссылки на приближение к такому заданному значению, которое могло бы быть разумно выведено специалистом в данной области на основе обычных навыков, включая эквиваленты и приближения ввиду экспериментальных и/или измерительных условий для такого заданного значения.
Более конкретно, предпочтительными соединениями формулы I являются такие, которые также имеют общую формулу III или их фармацевтически приемлемые соли, таутомеры и стереоизомеры
III,
где R1, R2, R3 и R4 определены выше в общей формуле I.
В соединениях общей формулы I и III особенно предпочтительный R1 выбран из водорода и замещенного или незамещенного C1-C12 алкила. Более предпочтительно, R1 выбран из водорода и замещенного или незамещенного C1-C6 алкила. Еще более предпочтительно, R1 выбран из водорода, метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительный R1 представляет собой водород и метил.
В соединениях общей формулы I и III особенно предпочтительный R2 выбран из водорода и –C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил. Более предпочтительный Ra представляет собой замещенный или незамещенный C1-C6 алкил. Еще более предпочтительно Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительный R2 представляет собой водород и ацетил.
В соединениях общей формулы I и III особенно предпочтительные R3 и R4 независимо выбраны из водорода и -C(=O)Ra, где Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C12 алкила. Более предпочтительно, Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C6 алкила. Еще более предпочтительно, Ra в каждом случае независимо выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительно, R3 и R4 независимо выбраны из водорода и ацетила.
В дополнительных предпочтительных вариантах осуществления изобретения описанные выше предпочтения для различных заместителей объединены. Настоящее изобретение относится также к таким комбинациям предпочтительных замещений в общих формулах I и III, указанных выше.
В одном варианте осуществления изобретения R1 выбран из замещенного или незамещенного C1-C6 алкила и R2 представляет собой водород.
В другом варианте осуществления изобретения R1 выбран из замещенного или незамещенного C1-C6 алкила и R2 представляет собой –C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил.
В следующем варианте осуществления изобретения оба R1 и R2 представляют собой водород.
В настоящем описании и определениях, когда имеется несколько групп Ra, Rb, Rc, Rd или R’, присутствующих в соединениях по изобретению, и если это не указано явно, следует понимать, что каждая из них может независимо отличаться в рамках данного определения, то есть не обязательно представляют одну и ту же группу одновременно в данном соединении по изобретению.
Особенно предпочтительными соединениями по данному изобретению являются следующие:
,,
или их фармацевтически приемлемые соли, таутомеры или стереоизомеры.
Наиболее предпочтительными соединениями по данному изобретению являются следующие:
, ,
или их фармацевтически приемлемые соли, таутомеры или стереоизомеры.
Соединения 1 и 2 были выделены из Labrenzia sp., названным штаммом PHM005. Эта альфа-протеобактерия была выделена из образца морского осадка, собранного в Индийском океане. Оценка клеток методом просвечивающей электронной микроскопии (фигура 1) позволила идентифицировать подвижные палочки (шириной 0,6-0,8 мкм и длиной 1,6-2,1 мкм) с однополярными вставленными жгутиками. Культура этого штамма была депонирована в CECT (« de Cultivos Tipo») при университете в Валенсии, Испания, под регистрационным номером CECT-9225. Депозит был внесен в соответствии с положениями Будапештского договора.
Бактерии явно зависят от морской соли, поскольку для их роста требуется более 2,5% NaCl, а оптимальная концентрация морской соли для производства 1 составляет 36 г/л, аналогично условиям океана. Колонии на морском агаре 2216 (DIFCO) бежевые, почти прозрачные, гладкие и с целым краем. Через три недели колонии становятся темно-коричневыми, возможно, из-за эффекта бактериохлорофилла а и продукции каротиноидов, как описано для Labrenzia alexandrii DFL-11T (Biebl и коллеги, Evol, Microbiol, 2007, 57, 1095-1107).
Для выделения микроорганизма-продуцента все манипуляции проводили в асептических условиях. PHM005 выделяли из замороженного образца осадка, нанесенного непосредственно на чашки Петри с морской солевой средой следующего состава (г/л): морские соли (Tropic Marin® PRO-REEF, 27; агар, 16; с добавлением циклогексамида 0,2 мг/мл. Плашки инкубировали при температуре 28°C в течение трех недель при атмосферном давлении. После этого периода колонию слегка коричневого цвета пикетировали и переносили в ту же морскую соляную среду для подтверждения чистоты и начала таксономических и ферментационных исследований.
Таксономическую оценку PHM005 проводили по частичной последовательности 16S рРНК в соответствии со стандартными процедурами. PHM005 выращивали в морском бульоне (DIFCO 1196) в течение 72 часов. Клетки выделяли и лизировали путем кипячения с 4% NP40 в течение 10 минут. Остатки клеток отбрасывали центрифугированием. 16S рРНК амплифицировали полимеразной цепной реакцией с использованием бактериальных праймеров F1 и R5, описанных Cook и Myers (International Journal of Systematics and Evolutionary Microbiology, 2003, 53, 1907-1915). Полученная почти полноразмерная последовательность гена 16S рРНК показана в SEQ №: 1.
Филогенетическое дерево было сформировано методом парного выравнивания на основе коэффициента подобия и UPGMA для кластерного анализа с использованием BioNumerics V7.5. Филогенетические соседи были идентифицированы, и попарно рассчитано сходство последовательности генов 16S рРНК по сравнению с базой данных SILVA LTPs123. Филогенетическое дерево показано на фигуре.2.
PHM005 продуцирует соединения 1 и 2 при культивировании в контролируемых условиях в подходящей среде. Этот штамм явно нуждается в морской соли для роста. Этот штамм предпочтительно выращивали в обычной водной питательной среде. Культуру необходимо поддерживать в аэробных условиях и получение соединений 1 и 2 должно начинаться через 3 дня роста при контроле температуры в интервале 26-28°C. Было установлено, что обычные ферментационные резервуары хорошо подходят для проведения культивирования этого организма. Добавление питательных веществ и контроль рН, а также добавление пеногасителей на различных стадиях ферментации может потребоваться для увеличения производства и предотвращения вспенивания.
Соединения по настоящему изобретению могут быть получены, начиная с колонии или замороженной чистой культуры штамма PHM005 для получения достаточного количества биомассы. Эта стадия может повторяться несколько раз по мере необходимости, и собранный материал используется в качестве инокулята для посева в одной или нескольких ферментационных колбах или емкостях с соответствующей питательной средой. Эти колбы или емкости можно использовать для создания инокулята или для стадии продуцирования, в зависимости от необходимого объема бульона. Иногда среда для продукции может отличаться от тех, которые используются для инокуляции.
Соединения по настоящему изобретению могут быть выделены из ферментационного бульона преимущественно из клеток и из супернатанта штамма PHM005 путем экстракции подходящей смесью растворителей или абсорбции в адекватных смолах.
Отделение и очистка соединения по настоящему изобретению от неочищенного активного экстракта могут быть выполнены с использованием соответствующей комбинации обычных хроматографических методов.
Кроме того, соединения по изобретению могут быть получены путем модификации соединений, уже полученных из природного источника, или путем дальнейшей модификации соединений, уже модифицированных с помощью различных химических реакций. Таким образом, гидроксильные группы могут быть ацилированы стандартными методами связывания или ацилирования, например, с использованием ацетилхлорида или уксусного ангидрида в пиридине или тому подобное. Формиатные группы могут быть получены взаимодействием соответствующего алкоксида с ангидридом муравьиной и уксусной кислот. Карбаматы могут быть получены нагреванием гидроксильных предшественников с изоцианатами. Карбонаты могут быть получены с использованием соответствующего ангидрида и активатора, такого как Mg(ClO4)2 или Zn(OAc)2, гидроксильные группы также могут быть преобразованы в алкоксигруппы путем алкилирования с использованием йодида или сульфоната алкилбромида или в амино низшие алкоксигруппы с использованием, например, защищенного 2-бромэтиламина. При необходимости, соответствующие защитные группы могут быть использованы на заместителях для сохранности реакционноактивных групп и для всего избирательного преобразования функциональных гидроксильных групп. Способы и реагенты, необходимые для получения этих производных, известны квалифицированному специалисту и могут быть найдены в общих учебниках, таких как March's Advanced Organic Chemistry 7th Edition 2013, Wiley Interscience.
Важной особенностью вышеописанных соединений формулы I и III является их биоактивность и, в частности, их цитотоксическая активность в отношении опухолевых клеток. Таким образом, в настоящем изобретении предложены фармацевтические композиции соединений общей формулы I и III или их фармацевтически приемлемых солей, таутомеров или стереоизомеров, обладающих цитотоксической активностью, и их применение в качестве противоопухолевых агентов. Настоящее изобретение относится также к фармацевтическим композициям, содержащим соединение общей формулы I и III или его фармацевтически приемлемые соли, таутомеры или стереоизомеры с фармацевтически приемлемым носителем или разбавителем.
Примеры фармацевтических композиций включают твердую (таблетки, пилюли, капсулы, гранулы, порошок для флаконов и тому подобное) или жидкую (растворы, суспензии или эмульсии) композицию для перорального, местного или парентерального введения.
Введение соединений или композиций по настоящему изобретению может осуществляться любым подходящим способом, таким как внутривенная инфузия, пероральными препаратами, а также внутрибрюшинное и внутривенное введение. Предпочтительно, время инфузии составляет до 24 часов, более предпочтительно, 1-12 часов, наиболее предпочтительно, 1-6 часов. Особенно желательны короткая продолжительность инфузии, что позволяет проводить лечение без пребывания в стационаре в ночное время. Однако инфузия может длиться от 12 до 24 часов или даже дольше, если это необходимо. Инфузию можно проводить с подходящими интервалами, скажем, от 1 до 4 недель. Фармацевтические композиции, содержащие соединения по изобретению, могут быть доставлены путем инкапсуляции липосомы или наносферы, в препаратах с замедленным высвобождением или другими стандартными средствами доставки.
Корректная доза соединений будет изменяться в зависимости от конкретного состава, способа применения, а также конкретного состояния, хозяина и обрабатываемой опухоли. Другие факторы, такие как возраст, масса тела, пол, диета, время введения, скорость экскреции, состояние хозяина, комбинации лекарственных средств, чувствительность реакции и тяжесть заболевания должны быть приняты во внимание. Введение может осуществляться непрерывно или периодически в пределах максимально переносимой дозы.
Используемые в настоящем документе термины «лечение» и «лечить» включают эрадикацию, удаление, модификацию или контроль опухоли или первичных, регионарных или метастатических злокачественных клеток или тканей и минимизацию задержки распространения злокачественного новообразования.
Соединения по изобретению обладают противоопухолевой активностью в отношении некоторых типов рака, которые включают, но не ограничиваются ими, рак легких, рак толстой кишки, рак молочной железы и рак поджелудочной железы.
Таким образом, в альтернативных вариантах осуществления настоящего изобретения фармацевтическая композиция, содержащая соединение формулы I и III, определенных выше, предназначена для лечения рака легких, рака толстой кишки, рака молочной железы или рака поджелудочной железы.
В шестом аспекте настоящее изобретение относится к способу получения соединений формулы II. Предпочтительными способами согласно этому аспекту изобретения являются те, которые дают соединение, имеющее также формулу IV
IV
или его фармацевтически приемлемую соль, таутомер или стереоизомер;
где R1, R2, R3 и R4 определены выше в общей формуле II.
В способах синтеза соединений формулы II и IV особенно предпочтительный R1 выбран из водорода, замещенного или незамещенного C1-C12 алкила и -C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил. Более предпочтительно, R1 выбран из водорода, замещенного или незамещенного C1-C6 алкила и -C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C6 алкил. Еще более предпочтительно, R1 выбран из водорода, метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила, изобутила и -C(=O)Ra где Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительный R1 выбран из водорода и метила.
В способах синтеза соединений формулы II и IV особенно предпочтительный R2 выбран из водорода, замещенного или незамещенного C1-C12 алкила и -C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил. Более предпочтительно, R2 выбран из водорода, замещенного или незамещенного C1-C6 алкила и -(C=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C6 алкил. Еще более предпочтительно, R2 выбран из водорода, метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила, изобутила и -C(=O)Ra, где Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутил и изобутила. Наиболее предпочтительный R2 представляет собой водород, метил и ацетил.
В способах синтеза соединений формулы II и IV особенно предпочтительные R3 и R4 независимо выбраны из водорода и -C(=O)Ra, где Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C12 алкила. Более предпочтительно, Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C6 алкила. Еще более предпочтительно, Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительные R3 и R4 независимо выбраны из водорода и ацетил.
В способах синтеза соединений формулы II и IV особенно предпочтительные соединения 1 и 2 имеют, соответственно, следующую относительную стереохимию:
, .
В дополнительных предпочтительных вариантах осуществления изобретения описанные выше предпочтения для различных заместителей объединены. Настоящее изобретение относится также к таким комбинациям предпочтительных замещений в способах синтеза соединений формул II и IV, указанных выше.
В более предпочтительном варианте осуществления изобретения этого аспекта данного изобретения соединение формулы II или IV представляет собой педерин.
В еще более предпочтительном варианте осуществления изобретения педерин получают из соединения 1’ следующим образом:
- защищая все гидрокси группы в соединении 1’ защитной группой для -OH, которую можно избирательно удалить у защищенной первичной группы OH в присутствии защищенной вторичной группы OH. Примеры такой защитной группы включают триметилсилил, триэтилсилил, триизопропилсилил и трет-бутилдиметилсилил. Наиболее предпочтительной защитной группой на этой стадии является трет-бутилдиметилсилил;
- избирательно удаляя защитную группу у первичной группы OH;
- метилируя полученную первичную гидрокси группу подходящим метилирующим агентом; и
- удаляя другие защитные группы для OH.
В другом более предпочтительном варианте осуществления изобретения педерин получают из соединения 2’ следующим образом:
- защищая 1,2-диоловую группа подходящей защитной группой для 1,2-диолов. Примеры подходящих защитных групп для 1,2-диолов включают, но этим не ограничиваются, такие группы, которые после реакции с соответствующим 1,2-диолом образуют Mocdene ацеталь, Bocdene ацеталь, акролеин ацеталь, бензилиден ацеталь, (трет-бутилдиметилсилилокси)бензилиден ацеталь, мезитилен ацеталь, метоксиметилен ацеталь, этоксиметилен ацеталь, циклические карбонаты, метилборонат и этил боронат. Более предпочтительными защитными группами на этой стадии являются такие, которые образуют Mocdene ацеталь, Bocdene ацеталь, бензилиден ацеталь и циклические карбонаты, которые являются наиболее предпочтительной защитной группой, образующей бензилиден ацеталь;
- защищая другие гидрокси группы защитной группой для -OH, которые являются ортогональными с 1,2-диоловой защитной группой с предыдущей стадии. Примерами защитных групп для OH, подходящими на этой стадии, являются триметилсилил, триэтилсилил, триизопропилсилил трет-бутилдиметилсилил и ацетил. Наиболее предпочтительный защитной группой на этой стадии является трет-бутилдиметилсилил и ацетил;
- удаляя 1,2-диоловую защитную группу;
- метилируя полученный 1,2-диол подходящим метилирующим агентом; и
- удаляя другие защитные группы для OH.
Примеры подходящих метилирующих агентов включают метил йодид, метил бромид, диметилсульфат и метил трифлат.
Выделенная нуклеиновая кислота в соответствии с восьмым аспектом изобретения является, предпочтительно, полученной из Labrenzia sp., и, в частности, из штамма PHM005.
Полноразмерная последовательность генома этой бактерии выявила биосинтетический генный кластер, отвечающий за синтез педерина и оннамида. Биоинформационный анализ использовался для прогнозирования функции генов в кластере.
Этот генный кластер, названный генным кластером Lab, представляет собой транс-AT гибридный генный кластер поликетидсинтаза/нерибосомная синтетаза (PKS/NRPS) размером 69 т.п.н. Он был установлен на основании геномного майнинга из всей последовательности генома штамма PHM005, состоящего из 20 ORF, гомологичных описанному для педерина генному кластеру. Он содержит гены, кодирующие ферменты для биосинтеза педерин-подобных и оннамид-подобных соединений.
В предпочтительном варианте осуществления выделенная нуклеиновая кислота, предпочтительно, содержит фрагменты нуклеиновой кислоты, образующие отдельные единицы и/или модули биосинтетического генного кластера Lab, как это показано более подробно на фигуре 3. Как показано на фигуре 3, генный кластер Lab содержит блоки lab706-lab726.
В особо предпочтительном варианте осуществления выделенная нуклеиновая кислота согласно восьмому аспекту настоящего изобретения содержит:
нуклеотидную последовательность с SEQ ID №: 2; или
нуклеотидную последовательность, которая комплементарна SEQ ID №: 2; или
нуклеотидную последовательность, которая гибридизуется в жестких условиях с SEQ ID №: 2; или комплементарной ей; или
нуклеотидную последовательность, которая по меньшей мере на 80% идентична SEQ ID №: 2; или комплементарной ей.
Особенно предпочтительными фрагментами нуклеиновых кислот согласно девятому аспекту настоящего изобретения являются фрагменты нуклеиновых кислот, по существу содержащие по меньшей мере один из генов lab708, lab709, lab710, lab721, lab722, lab723, lab724 и lab725. Кроме того предпочтительными являются фрагменты нуклеиновых кислот, содержащие одну или более нуклеотидных последовательностей кодирующих белковые последовательности с SEQ ID №: 3-23. Также предпочтительными частями являются соответствующие части нуклеотидной последовательности SEQ ID №: 2.
В другом предпочтительном варианте осуществления особенно предпочтительными фрагментами являются те, которые по существу состоят из lab719 и/или lab720. Также предпочтительным является фрагмент нуклеиновой кислоты, содержащий нуклеотидную последовательность, кодирующую последовательность белка с SEQ ID №: 16 и/или SEQ ID №: 17. Также предпочтительными частями являются соответствующие части нуклеотидной последовательности SEQ ID №: 2.
Аннотация всего генома PHM005 выявляет круговую хромосому длиной 6167 bp, 5651 кодирующую последовательность (CDS), 53 тРНК и 10 рРНК. 55% G+С.
Изучение всего генома в уникальном контиге с использованием программного обеспечения для прогнозирования/идентификации вторичных метаболитов как antiSMASH V 3.0 (Weber и сотрудники, Nucleic Acid Research, 2015 doi: 10.1093/nar/gkv437) обнаружило 102 т.п.н высокомолекулярный гибридный генный кластер PKS/NRPS. Среди 317 проанализированных ORF 20 генов (69 КБ) показали гомологию c последовательностями педерина (ped) и оннамида (onn) на основе BLASTp против симбионтной бактерии Paedeus fascipens (GenBank AH013687.2) и симбионтной бактерии Theonella swinhoei (GenBank AY688304.1), как показано более подробно в таблице 1.
Таблица 1. Гомологи генов lab в отношении генов ped (педерин) и onn (оннамид).
(AH013687.2)
(AY688304.1)
onnI
45/73
onnD
46/97
onnB
34/85
onnI
45/95
onnB
41/88
(*) H: Гомология в %. Q: Запрос покрыт в %.
Предполагаемый генный кластер Lab содержит фрагменты нуклеиновых кислот размером 69 т.п.н., образующих отдельные единицы и/или модули, аналогичные описанным для биосинтетических генных кластеров педерина, как показано более подробно на фигуре 3.
ТрансАТ-гибридный генный кластер PKS/NRPS Lab в основном состоит из одного PKS (состоящий из ORF lab708, lab709 и lab710) и двух смешанных систем PKS/NRPS (lab721, lab722, lab723, lab724, lab725 и lab719), фланкированных оксигеназами, оксидоредуктазами и метилазами в закрытой аналогичной архитектуре, описанной J. Piel для генов ped. Предсказанные функции и состав аминокислот каждого ORF подробно описаны в таблице 1.
ТрансAT-PKS lab708, lab709, lab710 (4481 аминокислот) состоит из модулей GNAT-ACP-KS-DHt-KR-cMT-ACP-KS-трансAT-ECH-ACP-ACP-KS-KR-ACP), сходных с описанными для pedI с гомологией 42-49%. Этот биосинтетический генный кластер может быть ответственным за биосинтез шестичленного кольца, несущего экзометиленовую группу структуры педерина. Где домены представляют собой GNAT: Gcn5-связанная-N-ацетилтрасфераза; ACP: белок-носитель ацила; KS: кетосинтаза; DHt дегидратаза; КR: кеторедуктаза; cMT: метилтрансфераза; ECH еноил-Коа-гидратаза о кротоназа; ТрансАТ: транс-ацилтрасфераза).
Гибридный транс-AT PKS/NRPS, образованный lab721, lab722, lab723, lab724, lab725 (5,385 а.к.), состоит из 6 кетосинтаз и 1 NRPS с явным аденилированием глицина. (PS-KR-ACP-KS-ТрансАТ-KR-KS-ТрансАТ-трансАТ-KR-CMT-ACP-KS-ТрансАТ-DH-KR-ACP-KS-DHt-ACP-CA (gly)-PCP-KS-ТрансАТ-KS). С 40-49% гомологией с pedF, но по сути те же функции и архитектурой модулей. Где домены C: нерибосомная пептидная конденсация; A: нерибосомный пептид аденилирования; PCP: белок-тиолат и пептид-носитель.
В соответствии с предпочтительным вариантом осуществления девятого аспекта, авторы идентифицировали систему lab719 PKS/NRPS, связанную с биосинтезом любого оннамид-подобного соединения из генного кластера Lab. Это предполагаемое новое соединение не было идентифицировано в ферментационном бульоне PHM005. Возможно, что продукт гена lab720, оксидоредуктаза, будет предотвращать образование оннамид-подобного соединения путем расщепления структуры педерина перед добавлением к первому домену ACP в lab719 или после того, как после его биосинтеза произойдет окончательный окислительный процесс. Это же опасение обсуждалось J. Piel в WO 03/044186 A2. Генетическая модификация гена lab719 (гомологичен pedG) решит эту неопределенность.
Этот «молчащий» гибридный ген трансAT PKS/NRPS, представленный lab719 (2,254 а.к.), состоит из 4 KS и 1 NRPS с неопределенным доменом аденилирования, возможно, для включения arg (как в случае оннамида), но asp, asn, glu и gln могут быть другими возможными альтернативами, как предложено по алгоритму NRPSPredictor2 SVM. Состав этой ORF представляет собой (ACP-KS-ТрансAT-DH-KR-ACP-KS-DH-DH-DH-ACP-KS-ТрансAT-KR-ACP-KS-ТрансAT-C-A-PCP-TE). Где TE: Тиоэстеразный домен.
Единственная ORF в области lab без гомологии последовательностей с островками ped, onn или nsp (носперин) представляет собой lab713, предполагающая наличие цитохрома P450, возможно, играющая роль в оксигенации поликетидов, как описано J. Piel в случае островков ped (J. Bacteriol. 2004. 186 (5), 1280-1286) со сходными по назначению генными функциями.
Особенно предпочтительная модульная ферментативная система согласно десятому аспекту настоящего изобретения включает последовательность структуры белка с любой из последовательностей от SEQ ID №:3 до SEQ ID №:23 или последовательность структуры белка, которая по меньшей мере на 80% идентична этим последовательностям.
Особенно предпочтительными клетками-хозяевами согласно двенадцатому аспекту настоящего изобретения являются бактериальные клетки. Более предпочтительными клетками-хозяевами являются Pseudomonas, Acinetobacter, Bacillus, Streptomyces и E. coli.
Модификация биосинтетического генного кластера Lab по изобретению может быть использована для получения модифицированного биосинтетического генного кластера Lab или для получения педерин-подобных или оннамид-подобных соединений.
В предпочтительном варианте осуществления согласно тринадцатому аспекту настоящего изобретения экспрессируется продукт lab719.
ПРИМЕРЫ
Общий способ идентификации структуры. Оптическое вращение определяли с помощью поляриметра Jasco P-1020. Спектры ЯМР получали на спектрометре Varian «Unity 500» при 500/125 МГц (1H/13C) и на спектрометре Varian «Unity 400» при 400/100 МГц (1H/13C). Химические сдвиги регистрировали в м.д., используя остаточный пик растворителя для CDCl3 (δ 7,26 м.д. для 1H и 77,0 м.д. для 13C) в качестве внутреннего стандарта. (+)ESIMS фиксировали с использованием спектрометра серии Agilent 1100 LC/MSD. Масс-спектроскопию высокого разрешения (МРС) проводили с использованием системы Agilent 6230 TOF LC/MS и метода ESI-MS.
Пример 1: Выделение бактерий
Продуцирующие педерин бактерии, Labrenzia sp., PHM005, выделяли из образца осадка, собранного на глубине 18 м из высокоэпифитной и неопознанной среды обитания коралловых губок у побережья Кении в 2005 году. Приблизительно 5 граммов морского гравийного материала собирали в пробирку Falcon объемом 50 мл, содержащую стерильную искусственную морскую воду (ASW), и выдерживали при 5°C в течение 5 дней перед обработкой. В лаборатории образец сразу гомогенизировали и 100 мкл разведение ASW 1:100 распределяли непосредственно на чашки Петри со средой морской соли, состоящей из 27 г/л морской соли (Tropic Marin® PRO-REEF), 16 г/л агара и 0,2 мг/мл циклогексимида. После инкубации в течение трех недель при 28°C колонию слегка коричневого цвета отбирали и переносили в ту же среду морской соли для подтверждения чистоты и получения биомассы для молекулярной характеристики с одной колонией, инокулированной на жидком морском бульоне для дальнейшего сохранения на 20% глицерине при -80°C в качестве банка клеток.
Пример 2: Электронная микроскопия.
Клетки в середине экспоненциальной фазы роста адсорбировали на 400-меш сетках с углеродным коллодионным покрытием в течение 2 мин, отрицательно окрашивали 2% уранилацетатом, снимали на просвечивающем электронном микроскопе Jeol JEM 1011, работающем при 100 кВ, и фотографировали с помощью CCD-камеры Gatan Erlangshen ES1000W.
Пример 3: описание 16S рРНК.
Для выделения ДНК штамм выращивали в морском бульоне (DIFCO 1196) в течение 72 часов. Клетки выделяли и лизировали путем кипячения с 4% NP40 в течение 10 минут. Остатки клеток отбрасывали центрифугированием. Ген 16S рДНК амплифицировали методом полимеразной цепной реакции с использованием бактериальных праймеров F1 и R5. Филогенетическое дерево (фигура 2) получали методом парного выравнивания на основе коэффициента подобия и UPGMA для кластерного анализа с использованием BioNumerics V7.5 (Applied Maths). Филогенетические соседи были идентифицированы, и попарно рассчитывали сходство последовательности генов 16S рДНК по сравнению с базой данных SILVA LTPs123.
Пример 4: Культивирование и экстракция.
Штамм явно нуждается в морской соли для роста. После культивирования цельные бульоны лиофилизировали и экстрагировали смесью органических растворителей и 0,5 мл образца сырого экстракта, сушили и скринировали на цитотоксическую активность. Наилучшая цитотоксическая активность была достигнута в среде 16B/d при 120 ч. Это среда состояла из 17,5 г/л пивных дрожжей (Sensient, G2025), 76 г/л маннита, 7 г/л (NH4)2SO4, 13 г/л CaCO3, 0,09 г/л FeCl3 и 36 г/л морской соли (Tropic Marin® PRO-REEF). Масштабный объем получали в 50 л среды 16B/d в 200×2 л колбах Эрленмейера каждой с рабочим объемом 250 мл. Колбы для продукции инокулировали 2% бактерий, выращенных в течение 72 ч в морском бульоне (DIFCO 1196) из другого высокомасштабного предварительного инокулята. Масштабный объем инкубировали в течение 120 ч при 28°C на вращательном шейкере при 220 об/мин с эксцентриситетом 5 см. Затем культуру центрифугировали при 6000 об/мин в течение 20 минут с получением 45 л водного супернатанта, который дважды экстрагировали EtOAc, и органическую фазу высушивали с получением сырого экстракта (1,8 г).
Пример 5: Выделение соединения 1.
Экстракт наносили на систему VFC (вакуумная флэш-хроматография) с силикагелем, используя ступенчатое градиентное элюирование смесями н-гексан-EtOAc и EtOAc-MeOH с получением одиннадцати фракций. Активные фракции элюировали EtOAc и EtOAc-MeOH 9:1 (550,0 мг) и подвергали препаративной обращенно-фазовой ВЭЖХ с использованием колонки Symmetry C18 (19×150 мм, 7 мкм) и линейного градиента H2O/CH3CN от 5% до 35% CH3CN в течение 30 мин при скорости потока 13,5 мл/мин с получением очень активной пиковой фракции (77,0 мг) со временем удерживания 24,5 мин, содержащей соединение 1 согласно данным хроматографии ВЭЖХ-МС. Эту фракцию дополнительно очищали полупрепаративной ВЭЖХ на колонке XBridge C18 (10×250 мм, 5 мкм) и изократическим элюированием H2O/CH3CN (78:22) в потоке 4 мл/мин с получением 24,5 мг чистого соединения 1 со временем удерживания 25,0 мин в этих условиях ВЭЖХ.
(1): бесцветное масло; [α]D20+82,4 (c=0,49; CHCl3) и [α]D20+81,3 (c=0,36; MeOH); 1H ЯМР (CDCl3) δ 3,99 (1H, дкв, J=6,6, 2,7 Гц, H-2), 2,25 (1H, дкв, J=7,1, 2,7 Гц, H-3), 2,43 (1H, д, J=14,1 Гц, H-5a), 2,36 (1H, дт, J=14,1, 2,3 Гц, H-5b), 4,31 (1H, s, H-7), 7,18 (1H, д, J=9,8 Гц, NH), 5,37 (1H, дд, J=9,8, 7,8 Гц, H-10), 3,83 (1H, дт, J=7,8, 2,7 Гц, H-11), 2,04 (1H, дт, J=13,5, 3,6 Гц, H-12a), 1,75 (1H, м, H-12b), 3,64 (1H, м, H-13), 3,31 (1H, м, H-15), 1,75 (1H, м, H-16a), 1,57 (1H, дд, J=14,3, 9,7 Гц, H-16b), 3,36 (1H, м, H-17), 3,65 (1H, м, H-18a), 3,48 (1H, м, H-18b), 1,19 (3H, д, J=6,6 Гц, H-19), 1,01 (3H, д, J=7,1 Гц, H-20), 4,85 (1H, т, J=2,3 Гц, H-21a), 4,73 (1H, т, J=2,3 Гц, H-21b), 0,95 (3H, с, C-22), 0,88 (3H, с, C-23), 3,32 (3H, с, MeO-6), 3,38 (3H, с, MeO-10), 3,32 (3H, с, MeO-17); 13C ЯМР (CDCl3) δ 69,6 (д, C-2), 41,3 (д, C-3), 145,7 (с, C-4), 34,1 (т, C-5), 99,7 (с, C-6), 73,1 (д, C-7), 171,9 (с, C-8), 79,4 (д, C-10), 72,6 (д, C-11), 29,6 (т, C-12), 71,8 (д, C-13), 38,4 (с, C-14), 75,4 (д, C-15), 29,2 (т, C-16), 79,0 (д, C-17), 63,8 (т, C-18), 17,9 (кв, C-19), 12,0 (кв, C-20), 110,5 (т, C-21), 23,1 (с, C-22), 13,5 (с, C-23), 49,1 (кв, MeO-6), 56,4 (кв, MeO-10), 56,6 (кв, MeO-17); (+)-ESIMS m/z 512,3 [M+Na]+; (+)-HRES-TOFMS m/z 512,2873 [M+Na]+ (рассчит. для C24H43NO9Na, 512,2830).
Относительная стереохимия соединения 1 была определена как
на основании данных ROESY data и анализа констант связи. Оптическое вращение соединения 1 ([α]D20+82,4, c=0,49; CHCl3 и [α]D20+81,3, c=0,36; MeOH) показало тот же сигнал, что и у педерина ([α]D20+86,8, c=1,00; CHCl3). Абсолютная стереохимия педерина была определена с помощью рентгеноструктурного исследования (Simpson, J. S. et. al. J. Nat. Prod. 2000, 63, 704-706) и стереоселективного синтеза (Matsuda, F., et. al. Tetrahedron 1988, 44, 7063-7080). Поэтому авторы настоящего изобретения предположительно полагают, что абсолютная конфигурация соединения 1 была такой же, как у педерина и других аналогичных соединений, о которых сообщалось (Wan, S. et. al. J. Am. Chem. Soc. 2011, 133, 16668-16679).
Пример 6. Выделение соединения 2.
Соединение 2 выделяли из цельного бульонного сырого экстракта (9,5 г) ферментационного бульона (15 л) штамма PHM005 морского происхождения. Экстракт наносили на систему VFC (вакуумная флэш-хроматография) с силикагелем, используя ступенчатое градиентное элюирование смесями н-гексан-EtOAc и EtOAc-MeOH с получением семи фракций. Активную фракцию, содержащую соединение 2, элюировали EtOAc-MeOH 4:1 (659,0 мг) и подвергали полупрепаративной обращенно-фазовой ВЭЖХ, снабженной колонкой Symmetry C18 (7,8×150 мм, 5 мкм), используя линейный градиент H2O/CH3CN от 5% до 60% CH3CN за 25 мин при скорости потока 3,0 мл/мин, с получением очень активной временной фракции в интервале 25-30 мин (28,0 мг), содержащей соединение 2, согласно данным хроматографии ВЭЖХ-МС. Эту фракцию опять очищали с помощью полупрепаративной ВЭЖХ на колонке Symmetry C18 (7,8×150 мм, 5 мкм), используя линейный градиент H2O/CH3CN от 20% до 30% CH3CN в течение 20 минут при скорости потока 2,5 мл/мин с получением 2,6 мг чистого соединения 2 со временем удерживания 11,5 мин при этих условиях ВЭЖХ.
2: бесцветное масло; [α]D20+64,5 (c=0,16; CHCl3); 1H ЯМР (CDCl3) δ 3,97 (1H, дкв, J=6,6, 2,6 Гц, H-2), 2,25 (1H, дкв, J=7,1, 2,6 Гц, H-3), 2,50 (1H, дт, J=14,2, 1,45 Гц, H-5a), 2,45 (1H, д, J=14,1 Гц, H-5b), 4,32 (1H, с, H-7), 7,17 (1H, д, J=9,9 Гц, NH), 5,44 (1H, дд, J=9,9, 7,5 Гц, H-10), 3,95 (1H, м, H-11), 2,05 (1H, дт, J=13,5, 4,0 Гц, H-12a), 1,75 (1H, м, H-12b), 3,66 (1H, м, H-13), 3,58 (1H, м, H-15), 1,80 (1H, м, H-16a), 1,55 (1H, м, H-16b), 3,80 (1H, м, H-17), 3,57 (1H, м, H-18), 3,44 (1H, дд, J=11,5, 6,5 Гц, H-18), 1,19 (3H, д, J=6,6 Гц, H-19), 1,01 (3H, д, J=7,1 Гц, H-20), 4,85 (1H, т, J=1,45 Гц, H-21a), 4,75 (1H, т, J=1,45 Гц, H-21b), 0,96 (3H, с, C22), 0,89 (3H, с, C-23), 3,34 (3H, с, MeO-6), 3,41 (3H, с, MeO-10); 13C ЯМР (CDCl3) δ 69,6 (д, C-2), 41,3 (д, C-3), 146,1 (с, C-4), 34,2 (т, C-5), 99,6 (с, C-6), 74,5 (д, C-7), 171,9 (с, C-8), 79,3 (д, C-10), 72,2 (д, C-11), 29,8 (т, C-12), 71,6 (д, C-13), 38,4 (с, C-14), 80,9 (д, C-15), 31,4 (т, C-16), 72,8 (д, C-17), 66,6 (т, C-18), 17,8 (кв, C-19), 11,9 (кв, C-20), 110,2 (т, C-21), 23,4 (с, C-22), 14,3 (с, C-23), 49,6 (кв, MeO-6), 56,3 (кв, MeO-10); (+)-ESIMS m/z 498,4 [M+Na]+; (+)-HRES-TOFMS m/z 498,2713 [M+Na]+ (рассчит. для C23H41NO9Na, 498,2674).
Относительная стереохимия соединения 2 была определена как
на основании анализа констант связи. Оптическое вращение соединения 2 ([α]D20+64,5, c=0,16; CHCl3) показало тот же сигнал, что и у педерина ([α]D20+86,8, c=1,00; CHCl3). Поэтому авторы настоящего изобретения предположительно полагают, что абсолютная конфигурация соединения 2 была такой же, как у педерина и других аналогичных соединений, о которых сообщалось (Wan, S. et. al. J. Am. Chem. Soc. 2011, 133, 16668-16679).
Пример 7. Синтез соединения 3
К раствору 1 (2,5 мг, 5,1 мкмоль) в сухом DCM (2 мл) в атмосфере азота добавляли пиридин (10 мкл, 124 мкмоль), DMAP (каталитическое количество) и Ac2O (2,9 мкл, 31 ммоль). Реакционную смесь оставляли стоять при комнатной температуре в течение ночи. Смесь концентрировали в вакууме и очищали с помощью колоночной флэш-хроматографии на силикагеле (н-гексан/EtOAc 1:1) с получением 3 (3 мг, 95%) в виде твердого вещества белого цвета.
3: 1H ЯМР (CDCl3) δ 3,96 (1H, дкв, J=6,6, 2,6 Гц, H-2), 2,24 (1H, дкв, J=7,0, 2,6 Гц, H-3), 2,62 (1H, дт, J=14,5, 2,2 Гц, H-5a), 2,37 (1H, д, J=14,5 Гц, H-5b), 5,25 (1H, с, H-7), 6,62 (1H, д, J=9,6 Гц, NH), 5,27 (1H, дд, J=9,6, 4,1Гц, H-10), 3,91(1H, дт, J=6,3, 4,6, Гц, H-11), 2,02 (1H, м, H-12a), 1,66 (1H, м, H-12b), 4,91 (1H, дд, J=4,7, 4,1Гц, H-13), 3,55 (1H, м, H-15), 2,02 (1H, м, H-16a), 1,67 (1H, м, H-16b), 3,60 (1H, дд, J=11,3, 2,2 Гц, H-17), 4,32 (1H, дд, J=12,1, 2,6 Гц, H-18a), 4,12 (1H, м, H-18b), 1,15 (3H, д, J=6,6 Гц, H-19), 0,97 (3H, д, J=7,0 Гц, H-20), 4,86 (1H, т, J=2,0 Гц, H-2a), 4,76 (1H, т, J=2,0 Гц, H-21b), 0,97 (3H, с, C22), 0,89 (3H, с, C-23), 3,21 (3H, с, MeO-6), 3,39 (3H, с, MeO-10), 3,38 (3H, с, MeO-17), 2,20 (3H, с, OCOMe-7), 2,08 (3H, с, OCOMe-13), 2,10 (3H, с, OCOMe-18) ; 13C ЯМР (CDCl3) δ 69,6 (д, C-2), 41,3 (д, C-3), 145,5 (с, C-4), 33,8 (т, C-5), 99,1 (с, C-6), 72,1 (д, C-7), 167,4 (с, C-8), 81,8 (д, C-10), 70,0 (д, C-11), 26,7 (т, C-12), 74,2 (д, C-13), 36,7 (с, C-14), 76,5 (д, C-15), 29,3 (т, C-16), 76,4 (д, C-17), 64,0 (т, C-18), 17,9 (кв, C-19), 12,0 (кв, C-20), 110,4 (т, C-21), 24,7 (с, C-22), 17,2 (с, C-23), 48,4 (кв, MeO-6), 56,3 (кв, MeO-10), 57,0 (кв, MeO-17), 20,7 (кв, OCOMe-7), 169,8 (с, OCOMe-7), 21,2 (кв, OCOMe-13), 170,3 (с, OCOMe-13), 20,9 (кв, OCOMe-18), 170,0 (с, OCOMe-18); (+)-ESIMS m/z 638,3 [M+Na]+.
Относительная стереохимия соединения 3 была установлена как
по аналогии с его предшественником, соединением 1.
Пример 8. Биоанализ in vitro для определения противоопухолевой активности
Целью этого анализа является оценка in vitro цитостатической (способность задерживать или останавливать рост опухолевых клеток) или цитотоксической (способность убивать опухолевые клетки) активности тестируемых образцов.
КЛЕТОЧНЫЕ ЛИНИИ
ОЦЕНКА ЦИТОТОКСИЧЕСКОЙ АКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ КОЛОРИМЕТРИЧЕСКОГО АНАЛИЗА SBR
Колориметрический анализ с использованием реакции с сульфородамином B (SRB) был адаптирован для количественного измерения роста и жизнеспособности клеток (следуя методике, описанной Skehan et al. J. Natl. Cancer Inst. 1990, 82, 1107-1112).
В этом виде анализа используют 96-луночные микропланшеты для клеточных культур, соответствующие стандартам Американского национального института стандартов и Общества по лабораторной автоматизации и скринингу (ANSI SLAS 1-2004 (R2012) 10/12/2011). Все клеточные линии, использованные в этом исследовании, были получены из Американской коллекции типовых культур (ATCC) и происходили от различных типов рака человека.
Клетки содержали в модифицированной по Дульбекко среде Игла (DMEM) с добавлением 10% фетальной бычьей сыворотки (FBS), 2 мМ L-глютамина, 100 ед/мл пенициллина и 100 ед/мл стрептомицина при 37°С, 5% СО2 и влажности 98%. Для экспериментов клетки собирали из субконфлюентных культур с использованием трипсинизации и ресуспендировали в свежей среде перед подсчетом и посевом.
Клетки высевали в 96-луночные планшеты для микротитрования, по 5000 клеток на лунку в аликвотах по 150 мкл, и оставляли прикрепляться к поверхности планшета в течение 18 часов (в течение ночи) в среде без лекарственных средств. После этого один контрольный (необработанный) планшет каждой клеточной линии фиксировали (как описано ниже) и использовали как эталонное значение нулевого времени. Затем плашки для культивирования обрабатывали тестируемыми соединениями (аликвоты по 50 мкл 4Х маточных растворов в полной культуральной среде плюс 4% ДМСО) с использованием 10/5 серийных разведений (концентрации в диапазоне от 10 до 0,003 мкг/мл) и трехкратных культур (1% конечной концентрации в ДМСО). После 72-часовой обработки противоопухолевый эффект измеряли с использованием метода SRB: вкратце, клетки дважды промывали PBS, фиксировали в течение 15 минут в 1%-ном растворе глутаральдегида при комнатной температуре, дважды промывали в PBS и окрашивали 0,4% раствором SRB в течение 30 мин при комнатной температуре. Затем клетки несколько раз промывали 1% раствором уксусной кислоты и сушили на воздухе при комнатной температуре. Затем SRB экстрагировали 10 мМ основным раствором тризма и измеряли оптическую плотность в автоматическом спектрофотометрическом ридере для планшетов при 490 нм. Влияние на рост и выживаемость клеток оценивали с использованием алгоритма NCI (Boyd MR and Paull KD. Drug Dev. Res. 1995, 34, 91-104).
Значения, полученные в трехкратных культурах, были сопоставлены с четырех-параметрической логистической кривой с помощью нелинейного регрессионного анализа. Три контрольных параметра были рассчитаны (в соответствии с алгоритмом NCI) путем автоматической интерполяции кривых, полученных при таком подборе: GI50 концентрация соединения, которая вызывает 50% ингибирование роста клеток по сравнению с контрольными культурами; TGI=общее ингибирование роста клеток (цитостатический эффект) по сравнению с контрольными культурами, а LC50=концентрация соединения, которая дает 50%-ный чистый цитотоксический эффект уничтожения клеток.
Таблица 2 иллюстрирует данные о биологической активности соединений по настоящему изобретению.
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> PHARMA MAR SA
<120> ПРОТИВООПУХОЛЕВЫЕ СОЕДИНЕНИЯ
<130> P14452PC00
<150> EP17382140.6
<151> 2017-03-17
<160> 23
<170> BiSSAP 1.3.6
<210> 1
<211> 1355
<212> РНК
<213> Labrenzia sp. PHM005
<400> 1
atctcttcgg agatagtggc agacgggtga gtaacgcgtg ggaatatacc tttcggtacg 60
gaacaacagt tggaaacgac tgctaatacc gtatacgccc tatgggggaa agatttatcg 120
ccgagggatt agcccgcgtt agattagcta gttggtgagg taatggctca ccaaggcgac 180
gatctatagc tggtctgaga ggatgatcag ccacactggg actgagacac ggcccagact 240
cctacgggag gcagcagtgg ggaatattgg acaatggggg caaccctgat ccagccatgc 300
cgcgtgagtg atgaaggccc tagggttgta aagctctttc agcgaggagg ataatgacgt 360
tactcgcaga agaagccccg gctaacttcg tgccagcagc cgcggtaata cgaagggggc 420
tagcgttgtt cggaatcact gggcgtaaag cgcacgtagg cggactttta agtcaggggt 480
gaaatcccag agctcaactc tggaactgcc tttgatactg gaagtcttga gtccgagaga 540
ggtgagtgga actccgagtg tagaggtgaa attcgtagat attcggaaga acaccagtgg 600
cgaaggcggc tcactggctc ggtactgacg ctgaggtgcg aaagcgtggg gagcaaacag 660
gattagatac cctggtagtc cacgccgtaa acgatggaag ctagttgtca ggcagcatgc 720
tgtttggtga cgcagctaac gcattaagct tcccgcctgg ggagtacggt cgcaagatta 780
aaactcaaag gaattgacgg gggcccgcac aagcggtgga gcatgtggtt taattcgaag 840
caacgcgcag aaccttacca gcccttgaca tttggtgcta cattcggaga cggatggttc 900
ccttcgggga cgccaggaca ggtgctgcat ggctgtcgtc agctcgtgtc gtgagatgtt 960
gggttaagtc ccgcaacgag cgcaaccctc gcccttagtt gccatcattt agttgggcac 1020
tctaggggga ctgccggtga taagccgaga ggaaggtggg gatgacgtca agtcctcatg 1080
gcccttacgg gctgggctac acacgtgcta caatggcggt gacagtgggc agcgaactcg 1140
cgagagggag ctaatctcca aaagccgtct cagttcggat tgttctctgc aactcgagag 1200
catgaagttg gaatcgctag taatcgcgta acagcatgac gcggtgaata cgttcccggg 1260
ccttgtacac accgcccgtc acaccatggg agttgggttt acccgaaggc agtgcgctaa 1320
ccgtaagggg gcagctgacc acggtaggct cagcg 1355
<210> 2
<211> 68996
<212> ДНК
<213> Искусственная
<220>
<223> Последовательность нуклеиновой кислоты биосинтетического
генного кластера Lab
<400> 2
ttagactttg gatgctgcca atatttcggc cagatcccgt aaagtcaccg ccttggcaaa 60
actcatcaaa gggatggcaa tgcccatatc ttccatcgac agggtgatga catccatccg 120
atccaccgaa tttgccccga ggtcgaccag gattgactcc ggttggatca tatccggctc 180
gagttcaggc aacacctctt gcacattgcg tttcacagtc tcaaacggat cagtttgact 240
catgatgttg cgtccctggg gttgttcttg gcgcaattga aatcagcgga tacgctgtgt 300
gttctacacg gatgcaggga gagtgtcacg aatgaacacc gcagggattg aagcagttgg 360
tgtttatggc ggcagtgttt acctggatgt ctctgaactg gcgcaatacc gcggcatgga 420
tcttcagcgt ttcgagaacc tcctcatccg ccagaaatca gcggcattgc catatgaaga 480
cgcggtgtcg cttggagtta atgccgccaa acccgtgatc gatgcattgt cgcaggccga 540
acgcgatcag atcgaactgc tgattacatg taccgaatcc ggtctggatt ttggcaaatc 600
gctgagcact tatatccatc actatttggg attaagccgc aactgccggc tctttgaaat 660
caaacaggcc tgctattccg gaaccgcggg ctatcagatg gcactgaact tcatattgtc 720
gcagacctca ccaggtgcga aagctttggt tgttgcgacc gacttatccc gggtcttggt 780
ggacgagacc agtgacgaac tgaccatgga ttgggagtat tttgaaccca gtggcggggc 840
tggcgcggtt gcgcttttgg taagcgacca gccgcgcata tttcagtccg acatcggcgc 900
caatggcaca tattgttttg aagtcatgga tacctgcagg ccaatgccag attctgaagc 960
cggggactca gacctgtcgc tcctgtccta cctcgattgt tgtgagcaga gctttgctgc 1020
ttatcgtgca cgtgtcgaag gtgtttccta ccaagacagc ttcaactatc tggcctttca 1080
cacgcccttt ggcggaatgg tgaaaggcgc tcatcggcac atgatgcgcc ggcttttgcg 1140
cagtcgtcct gatgagatcg acgtggattt cgaaactcga gtggctcccg gattgcgcct 1200
gtgccagagg atcggaaaca tcatgggggc gactgttctg ttgtcactga caggagccgt 1260
gctttatggc gattaccgga cgccccagcg gatcggttgc ttttcctatg gctctggctg 1320
tgcctcggag ttttacagcg gagtttctac tgctgacggg cagcggcggt tacaggacgc 1380
gccgattcaa aaagcgctgg acctgaggca taaacttacc atgccgcaat acgaggcatt 1440
gcttgaaggt tgcaaggctg ttcccttcgg cacgcgcaac caccaaccag atcttgatca 1500
ggttccggac atgaaatcct gcattgccga tcaaagcgcc cagctcggat atcagcggct 1560
cttcctgaaa gaaatcaaaa acttccatcg cgaatacgat gtactttgag ttgtgttgtc 1620
tcctctgctc cgataggctt acccaaggat acttttaaga gcgcttgtct gcgatactgg 1680
acgttcccat cgcagcaggc gatgtgcgag ggaaaatgcc attcacgcat ttcggcaaat 1740
cctaccgaag ctctgaggtg ttgctgtgac tggctgccag agcaaaagag ccgggctctc 1800
gccgttggcc cttttgttga atgctgcagg ccgcgggctt tttcctgccg cgggcgtaac 1860
atttcgaccg gactgccggg ccgaagatct tgaagccagt ctcgaacctg ccgacttcaa 1920
cattcgacca gccgcggtcg acgacattga tacgctccat atgctggaga cagtctgttg 1980
gccgaaggag ctacagacgc cgacaaaaac cttggccagt cgggtggcaa tcgacccgaa 2040
tggacaactg gtcctcacct tggacggctc cccatgcgga gtgatatact cccagcggat 2100
caactccgtc gaggctctga cctcttcgga tatggacaag gttgacagcc tgcgggatcc 2160
ttcaggttca attctgcatt tcctggcaat caacattctc ccaagcgtgc aagaccgtgg 2220
cctgggcgat gcgctccttg aattcatcct gcactacgcc gcacttgctc ccggcatcaa 2280
gtctgccgct gccgttacac tttgccgtga cttcacggga cgaaccctat ccgatctgaa 2340
tgagtattta cgccggaaga caccgctggg cacagtggca gacccggtac tgcgttttca 2400
tgaacttcac ggtggtcgta ttcaacaccc ggtaccaaac tatcgggccc gcgacacccg 2460
caatctgggc gccggagtgc ttgtaaccta cgatctgaac aagcgccgca gatctcatgc 2520
tcctcaaccg cggcaaaaaa ttgcgcggac ggacatcgcc aaccgcgtca attccgcaat 2580
tcgttccgcg ttgggctcaa gcagcgatca gttcgaaaaa gacacgccac tgatctctat 2640
gggtttggat tcagcggcga tattgggatt ggcggactgt ctgcaagccg agtgcggtag 2700
cacactgact gccgcacagc ttttcaaaca caacaccgcg gaaaaaatta tcgcttttct 2760
gcacaacgaa ctgccgtcct ccggtttgtc aaagcctacg ctgctaccgg cgcaaacgag 2820
ttgccccgca gatggcggtt cagaccaaag cgttgccatc atcggcgtct ctttgcgcat 2880
gcctggcggg atcgaaactc ctcaagcact ttgggaactt cttgacctag gcggcaccgt 2940
catcactcca gtcccttctg atcgctggtc ctggccggat ggctttcggc cgcagggagc 3000
cgcctatggt ggcttcttgc aggatcctgc ccgatttgac gccgcattct tccgcatttc 3060
accacacgaa gccgaagcca tggatcctca gcaaaggata ttgctggaat tggcctggca 3120
cggtctggag gacgcgggcc tttccgcgac caagttggct ggctcttcca ccggcgtgtt 3180
tgtcggtgcc agcggatcag attatcaacg cgccatggac gctgcgggag tgccggttca 3240
accgcatcac agcaccggcg cagccttgtc ggtgatagca aaccggctct catatgcgct 3300
ggatttcaca gggccaagcc tggttgttga caccgcctgt tccagttcac tggtcgcagt 3360
gcatcaggct gtggcagcgc ttcaagagcg gacttgcggc ctggcattgg cggcagggat 3420
caatctgatc ctgcatccgg caacatcgca ggcttatcaa tcggcgggca tgctgtcacc 3480
atccgggtta tgccgaagtt tcggttctgg ggccgatggt tatgtccgca gcgaaggtgc 3540
tgttctttta gtccttaagc ctttggctca agccctggcc gaaggctgcc gggtgcacgc 3600
ggtaatccgc ggaagcgcct gtaatcatgg tggcatgacc agtgggttga cggtcccgag 3660
tccggacaag caaacggagc tcttgtccgc agcctggcat aatgcggata taaaacccgc 3720
tgaccttgat tatcttgaag cccatgggac cggcaccaaa cttggtgatc caatcgagat 3780
agagggcatg aaaacggcgc tggctgagtt cgatgatagt cagccgaacc cccctgaaca 3840
acacgcttgc ttgacgggtt cggtcaagtc gaatttgggt catctagaag ctgcagcggg 3900
gctggctggg ctgtgcaaag taatgttggc gttacgccat gaacggctgc ctgcttcgct 3960
gaatgcatcc ccacaaaatc cggaaatctc gctgaacggc tccaatctgg ccatcgctga 4020
caccgctcga gattggccaa aaggaaaccg gcccagaatc tccggcgtca gcagttttgg 4080
gtctggcggt acaaatgctc atattgttgt agccgaaccg ccggatgccc cggatggcgt 4140
catcgatacg ggaccgcaac tttttgtcct ttccgcaaac acgcccgaac ggctgatggc 4200
gttggcggta cattggcaag agtggttgaa gaagcagccg cacgatctga acatccctgc 4260
cctttgtcat gccagccgcc accggcgtgc cgccttgcct gcgcgctttg cgacaaaagt 4320
ctcttcacgg gcagacctgg aaaaagcgct tcaccaagcc gctcagaaaa atcccgcatc 4380
tagtcaggcc aaacccaagt ttctggaaca tctgaaagga gacgctggac aagccttctt 4440
gcaggccttg gcaaaagagg gggacctgtc cgccctggca gatctctggt gtgccggggt 4500
tccggttgat tggtcactga ttgattcgac gcccccagaa cagccggtgc cctggattga 4560
tttgccattg tatccattcg ataaaactcg cttctgggct ttgggaaaag caccggctgt 4620
tccgcaggat cgggctgcgg caactgcaga actgtacgct ccggtctggc aagaactggc 4680
cgcgagcaaa acgcagatgc cagagccaga cttgctgtct gggccgtttg cacttaaagc 4740
cgcgcagctt ttaaagctcg atccatcgga aagccggaac tcagaaacaa acgccatagg 4800
cgagaacatg cacgttctct ggagcagtgc cccgcggccc agcgattccg gtgaaacatt 4860
agaggaattc cgggagtttc aggacttcgt tgccggcttg cctcgccagt tgtcgcgttt 4920
gcggctaacc gtggtgactt ggaacggaca ggccgtgtac ggcaacgagc cggttgatgc 4980
cgaggccgcc gcgatctcgg cgtttacgca tgtcttggcc caggaaaaac ccgaatggga 5040
catacgcacg tttgacttgg actcgtgtga cccgccctca tggtccagtc tcgctgagag 5100
caatgaaacg aggtctgctg tccgggccgg taaagcctat ggtttgcggc tggccatggc 5160
cgacccactt ccggataccg gccaatcgca cctgcgcgaa gacggtgttt acgttgtcat 5220
cggcggggcg ggggcattgg cacgacctgg agtgaagcgg ttctaaacaa cgtccaggcg 5280
caagttattt ggataggccg ccgtccacat aatgcggcga ttacggcaca tatcgaccgg 5340
ctgaccaggc tgggcccacc tccgatctac attcaggcgg acgccacgaa ccccgacgcc 5400
cttgaaaggg ctttgcaaga aattctgaag cgttggggac gaatagatgg cgtgattcat 5460
gcgatcacag gcccatccga ccagcccatc ttggacagtg agccggaaaa tctaacccgt 5520
gtcatggcag ccaaaaccca tggtttgatc caaaccgccc acacgtttgc cgccttggac 5580
ctggatttct ttttagtctt ttcatcgatt atttcgctgg aacagcccgg cggtttcgga 5640
ggttacgcgg ccagctgcgc attcgcggat gctttcgttc gcggactgga ctcccagaca 5700
ccttaccctg tccggtgctt aaactggggg cattgggatg tcggtgtcgc ccgcaatctg 5760
cctgaggcga caaagatacg gctggacaac gccggagttg tcccgatcac ggctcaggac 5820
gcgttgaagc attgcgatac ggcactgaat gctccgctgc ctcaactggc aatattgaaa 5880
tggaatgatc ctgcccggca tcccctggtc gacagccagg ttcatatgcg cctttcgcgg 5940
aaggcaccgg cgcgcagtct cccggctgca acaaatgaat tgaacacacg gctgcaggaa 6000
atcgagcggc acggactttt tgcccatccg gagttggagg cggcattgcc cggcgcaata 6060
gccgcggaac ttgaccgcca tggcctgcgg acatccttgc ctgacacggc tccgtggtat 6120
ctgcgccgat ggcacaaggc gacgaaacgg ctccttgcgc aagggaacac cggcgagaac 6180
tgggatgcga ccgcacgccg tctgcgcgcg gatgcggatc tggctcctgc gatcaatttg 6240
gtgacggcct gcctggcacg actgcacgaa gtcctgacag gtcagacacc ggccactgat 6300
gtcctgtttc ccggtgcatc tctcgatctg ctagagccgg tttatcgcgg cactgcttcc 6360
gcggatctgc tcaacgatgt tttggccgat acattggctg aaacgctccg agcagacctg 6420
agggaccagc ctgagaacac atccttacgg gtccttgaga tcggcgcggg aacaggcggc 6480
acgaccgcgc gggttctgcc ctgcttgtcc gagcttgctg gacagattga gacctatgat 6540
tacacagatc tgtcacgtgc atttttgcag catgcccaac aggcttttgc cccaagtgca 6600
cccttcctga aatcactcag atttgacgtt gaaaaaagcc cggaaagtca aggcctgcaa 6660
cccggcagct acgatgccgt tctggcaaca aatgtgctcc atgccacgcc ggacatccgc 6720
cagacattgc gccatacaca cgctttgctc aaacctggcg gggtgttgct tctcaatgag 6780
attgtgaccc cgtcagtctt tgctcatgca acctttgggc tgttggaagg atggtggaag 6840
tcatgcgatc cgggcctccg ccatcctgac acgccccttc tatcagccga gagttgggaa 6900
aaactgctgc tggcaaacgg ctttaccgct gttgaaatgc ttttgaacag cagcactgcg 6960
cttggtcaac aagtctttgc tgcccgcagc gacggctgtt tcgagtaccg gaaggcagag 7020
attgacacaa cccgcagaca acctgagacg ctcgagccgc gcatcctcaa gaacacggtc 7080
agcgagttgc cattggagga cctggaaaat ccgcaagctg cggctgcaag gcttttaaca 7140
gaaatcgtcg ctagcgcctt acagattaca gaagaccagc tggatccatg gacacctttg 7200
ggcgactacg gattggattc gatcctgaat gcccaggtca ccgcaagatt gcgggagctg 7260
gttccagatc tcgataccac cttcctctac caataccaga ccatcgcaga tctctcgcaa 7320
gcacttgttc aaaaacatcc agaagcgttt gagcagatcg gccacaccac ttgcggagaa 7380
gcggacgtgg catcgccttc gacagtatcc gccagcaaaa gaaccgcggg gaacgaacag 7440
caggacattg ctattgtcgg catgagtttc cgttttccaa aggctgatac acctgaggaa 7500
ttctggaccc tcttgtcaca agggcaaagt gcagtgacgg aaattcctcc cgatcgctgg 7560
caactggacg gtttttatga atctgatcca gacaaggccg tagacggctg gaaaagctac 7620
agcaaatggg gtgcatttct ggagcgggtg acagccttcg acccgctctt tttcgggatc 7680
aacccaaaag aagccgctgc catcgacccg caggaacgcc tgtttctgca gaccgcatgg 7740
gcggcactgg aagatgctgg atttccgcgc cagcgcctgg cagatgaact ggcacggagt 7800
gtcggtgtgt ttgtcggtat cacgcgaacc ggatttgacc tttttggccc cgatttgtgg 7860
caggcaggtc aaaaggtcta tccgcacact tccttcagtt cagctgctaa ccgcctgtcc 7920
tggttcctgg atgccgatgg ccccagcatg ccggtcgata caatgtgttc gtcttccctc 7980
acagcgctcc atcaggcctg tgccagcctc aagacgggcg aatgcagact ggcgattgca 8040
ggcggagtaa acctctttct gcatccgaca agttacatcg ggctctcggc gatgcgcatg 8100
ttgtctccag atggacgctg cagcagtttc ggtgccggag gaaacggatt tgttcctggt 8160
gaaggcgtag ctgccctggt gcttcggcct ctggccgagg cccaagccgc gggcgatcag 8220
gttattggtg tgatccgagg cagcgcagtc aatcatggcg ggcgcacaaa tggtttcacc 8280
gttcccaatc cccgcgccca gagcagtctg gtgcgtgagg cgatgtcccg tgcagggctt 8340
gagcctggac agatcagcta tcttgaggcg catggcacag gcaccgaaat gggggacccg 8400
atcgaaataa ccgggttgac cgaagcattt gccgggcggg agcaaggttt ggcgccgtgc 8460
gccatcggct cgatcaagac caacattgga catcttgagg caactgccgg attggctggc 8520
gtgatcaagg tgctgttgca gatgcgccat cgccagatcg ttccgagcct gcacagcagc 8580
tctctcaatc caaagattga ttttgagcat gcgccatttc gcgtcgcgca ggacctcact 8640
ccatggtccc cagctaaagg gcgccggata gccggagttt catcatttgg cgccggcgga 8700
acaaatgcgc acgtcatcct tgaagaagcg ccggacatac ctgaaaaaag tgcaactgat 8760
cccgcgccaa acgaaccgat cgcgcttgtc ctttctgctc atgacgaacc gcgtttacgg 8820
gcctatgcag cgcggctcgc caagttcttg acttccccca acgcccctcc cctggcactg 8880
gccgctcaaa gcctgcaact gggacgagag ccgatgcgcc atcgcatggc tgctgtcgtg 8940
tccgataagg ctcaggccgt ggcagtcttg caagccgtcg ccgagaaccg gccgttgcct 9000
gacaaaacct tcttgcggga tacacgcagg tacaaggggc aatgtccttc ttcggtggaa 9060
agtgaagacc ttggtgaact gacagatgca tggagcaaag gcagcaaaat cgattgggct 9120
aagctccacc aacgccgcca aaccgtatca ctgcctacct acccatttga tgaaaaacct 9180
tactggttcg ccgacaccgc gcctgttggg ggacccatgg acgtcccctc ctctgaagac 9240
gcttttaggg aattaaaacc ggcttctcgg ccttcaccgg tccggcggac actgccaagg 9300
ctggatactg caccggcaca gtttgagccg catcgccgca gccaaaagct tcggctgtct 9360
tctctgaacc cagcgagtga aacaccgcct gctgaaatcg aattggacat caacggcatc 9420
ggcagagttc gcctagagcc tgccagcccg ccgccaaacc tttcaaccgg aaacgccatg 9480
aaggttctgg tggtcgaggg gcttcagcat tggaacggag accggttggg gctgctgcat 9540
gagctcgacc aactctcgca accagtaatc ctgacagtgt ccgcgagttc gttacccccg 9600
atcccggata cgcttcttac cgctccagcc tttgagcagg cacaggaaat ggcaaacgcc 9660
accgcacgct gtccggctgc cacgctggcc accttaaaaa accatattcg caatcaacct 9720
agctggccgg atatcgcagg gattccggcg gaatggatgg ccggcagcgg atggccggtt 9780
tcgtcgcccg agccggcacc ttctggcggc gctattccgc ttcaatccga agtcgtccaa 9840
ttgcacgaca tggggggcgg tgtcgcgcaa atcacaatgg ccgagcgcga tgcgcaaaac 9900
acctttacgc ccgcttttgt cactggagtt ctggaagcgt tcgacaaggt cgagtcctct 9960
gccgccttca aggttgtcgt tttgacaggc tatgaagcct attttgcttg cggtggtacg 10020
cgcgaagggc tcctggcgat ccagaatgga caagcccgct ttaccgatga gcaaagctac 10080
gcccgtccgc tgcgctgtcc gattcctgtt attgcggcca tgcaggggca cggtatcggt 10140
gctggctggg ccatggggct ttactgcgat ttggcgattt acagcgagga aagctgctat 10200
caaagcccct atatgcttta tggcttcacc cctggagcgg gtgcaacaac ccttttcccc 10260
gcgcggttgg ggcggcaact tgccaatgaa atactattca ctgctcagtc attcccaggc 10320
cacatcctgg cacagaaggg attgactgca ccggttctac cgcgtgaaga ggttttaccc 10380
caggctcatg cattggctcg aagcattgcg caaaacccgc gcgagacgct gatggcccgc 10440
aaatccacgc agacagccga atttctccac atgttgccca ggctgtttga agcggaactg 10500
gctctacatg aaagcacctt tgtagggaat tctgacgttc tggagcagat aagtgagcat 10560
tttgccgaca aacagatgac ccaaaagcct ggcgcatccc agaaagaggc gcggaacacg 10620
tccgcgctca agacgcaact gcgcatgatg cttgcagagg aactggacat ccctcctgac 10680
cggatagacg acgacacgcc tttcgtggat ctcggtttgg agtccattgc agctgtcatc 10740
tgggttcgga aaatcggcga agagctcgga gcccagatcg gagcaaccag tgtctatagc 10800
caccccaacc tggcagcatt tacagaactg gtagctgaga aaggtggcca gctggccgag 10860
gcggtcaaca agaccacagc acccccttcc gagcccccaa aagccgccat ccctgccgat 10920
ccggaagagc gccttttgcc gtcagacagc tctgatcttt ttgtctggct gcaggcatct 10980
ttggaaacag agctctccat cccatccggg acgcttgatc ctgatcgccc gttcgtggaa 11040
ctcgggctcg attcggtgac tgcagtcacc tggatacgcc aggtcaatga cgccctgggc 11100
accaaagaaa ctgggaccgt ggtctatcac cacaccaacc tgactgaatt ggcggcctat 11160
ctggcgggca ttgccggcaa aacacctact accaggacca cttccttacc atacaagctg 11220
gaggcaccag tacgatccgc cttgcctcgg ctggaaaatc tagcgccttt ccaagatgaa 11280
agacccggaa ttgcgattgt cggtatggcg ggccgttttc ccgaagcgcc caacgtgtcc 11340
agcttctggc agaatgtcct ggctggccgg gattgtgtct atgagattcc cgccacacgc 11400
tggtcaatcg acgcctacta tgatccggac cgccaggctc caggcaaaac cgtttgccgc 11460
agaatgggtg cgattgaaga catcgacgca ttcgactctc tgttttttgg catttcgcca 11520
gctgaagccg agctgatgga cccgcaacag agactgttcc tggaaaccgc ctgggaagcg 11580
atagaggatg cgggacacgc gccgtctacc ttagccggga cacgatgcgg tctgttcgtc 11640
ggcactgaaa acggagacta tgcccggatt gccggtgatg ccaaacctga agcattggcg 11700
ctgaccgggc gctccgtggc gatgctcccg gcgcgtgccg cctatgcatt ggatctacag 11760
ggcccctgcc ttgccattga cacagcttgt tcggcgtctc tcgtggcaat tgcccaagcc 11820
tgtgccagtc ttcacgaccg tcactgcgat agcgcgctcg ctggcggtgt aaatgttctg 11880
accggtccgg aaatccatgt cgcgatgagc catgccggca tgctgtcccc aagcggcaaa 11940
tgcaacagct ttgacagccg cgcggatggt tttgtgcccg gagaaggcgt tggcgcgctc 12000
cttttaaaac ggttggagga tgcacaggcc aacggcgacg atgtttacgc ggttatccgg 12060
ggctgggggg tcaatcagga cgggcggacg aatggtatca ctgctcccaa ccccgcagcg 12120
caaactcgtt tacaaacaga gctttaccac cggttccata tcgatccggc tcggatcggc 12180
atggttgagg cgcatggaac cggcacggct cttggcgatc cgatcgaagt tgaagcactc 12240
aagcgaagtt ttgctcagtt cactgaccgc aagaattatt gcgcgctcgg gtctgtcaaa 12300
agcaacatcg gtcacttggc cacagccgca ggggtcgccg gcgcaatcaa ggcaacacta 12360
gcgttaaagc accgcaagat cccagccagc attcatcatg atcagctgaa cccgcatatc 12420
gacctcaaag acgcgccttt ttatgttccg cggactgcag cggattggac agctggtccg 12480
gacgctccac agtatgcggc agtgagttcc ttcggataca gcggaactaa tgcacatttg 12540
gttctggaag cggcaccggc aagacctgtt ccggttacgc agacccaagc agtgattgtt 12600
ccggtttcag cccgttcatt ggaatgctta accgaagccg tgacacgatt gtccacctat 12660
ctgggaaccg gtgccggaca gactgtcccc ttggcagatc ttgctctcac ctatcagact 12720
ggccgggata cctttgacca gcgtgtagcg ttccttgccg acagccacga cagcctccga 12780
gcaggccttg aacagttctt aaacgagcct gagcatgctg gcggtgtcgt ctactcaaat 12840
gacatgccac cgacacttcg tgataccgcc acggcctgga tcgaaggcaa gacaatcgcg 12900
tggcctgtgg tagctggagc aagccggcgg cacgggtgtc cgacctatcc gtttgccaag 12960
gagcgccatt gggtttccga tgcgcccgtg gaattgccgg aagctgcacc cataccctcc 13020
aaagagacgc ccctccaacc ggaagccgaa gacacagctg ttgatcccga ttggcgtgaa 13080
cgcttaaaac agcgttttgc ccgaccaatt acactgttgt ctgacgatcc gaagtggatc 13140
gggtccatgg catccctgct gtccgcgctt ggcgctgctc cgggcggacc gggacagccg 13200
gacctgcgca tcaaatccaa tctgcgtgag gcggagggga gcgttttctg cgacacacat 13260
ctcggaacac ggttgcctgg aaacgaacaa gtggatttgt taatcctgac agaacttcct 13320
tcggacccgg gcctgattcc acagcatgcg ctgattgtta gcgacgataa ccgggatgat 13380
atcgaatccc actgccagcg attgatccag gaatggctcc gattggagcc ggacggctca 13440
aaagataccc tgcacgtaca attccgaaac gggcgccgtt tagtagcggc gaagcctcta 13500
gatccggctg acggtgcttg catcttgcga aagacatggc agcgcacgcc tttggctgac 13560
cagaaaaccg ctccatcaga caaaaacgtc tgcttgatcg gccgtggccc caaattcgag 13620
gcgctggctt ctggtcttga ggcccacttt cagtcagtca ctttacggga cactccgccg 13680
gaaggggcga tggcggcgtg ggatgtgttt atcgacgccg ccgctctgac tgaagtgaga 13740
gacaacgatc cggacgaccc tgaccgcaga cactggatcc aatccctcat gcgtgagggc 13800
cgggacctga acttgctgca cttgacgtgt gatgtgatac cgttccgcag tgtttcccgc 13860
aatctggccg gggcgcggca agccgggttg gtcaagaacc tgcgcgccga ataccggttt 13920
gcagagtccc ggtggctcga tctggatatg gcgcaggtcg cagatacagc tggcctggcg 13980
aaactcattg cggccgaatg tgcgtcagcc ggaccggtct ccgaggtttg ttatcgcggc 14040
ggcgcgcggt ttgcgccggt acttgaggca cctgagccgg tcgcatcacc gtccgttcac 14100
ctgaacgcgg aaggactgta tctcataagc ggtggcaccc gcggcgtcgg tttgactttg 14160
gcgcaggacc tggcagccca gggagcccga catctggcgc tgattggtga aacgcctttg 14220
ccgccgatgc aggactggcc cagtctgatc gccgcggctg acacgcctgc tgaaatccgc 14280
agtcaattga gcatcttgca ggcattgtca gatcaattgg aaactctgga aatcttgcat 14340
gcctgcgtca gcgatgcggc caaagtgtct gcatggctct caagtctccg caaacgcggc 14400
ctgccgctca gcggcgtgat ccatgcagcc gggcgctatt ctgaggtaga cccacccggt 14460
tttgccgcca agtctgccga tcacatgcgc gccgtactca cagccaaggc agatgggctg 14520
gagaccctcc atagtcttac gaaaaacgac ccgctttctt ttcttcttgt gctgacttca 14580
ataaccggct tggttccaca cttcgcacga ggcgccctgg attacgccat ggccaatgct 14640
tatgcggatc tttttgctgc caaagcccat gaactggatg gtggacgcac ccggtcgaca 14700
attctcagtg actggacgca aagtggtgcg ttctgccgtg tcagaccaga gaaagccaag 14760
tcggtccaaa agaatttcga tcaaattgga ttaaagacct tgagtgatgc tgaaggctgc 14820
gcccttatcc ggcgggcgct gtctcccact gcggagaccg gcacaatctt gggtctgatc 14880
gcggaagacc ggtttgctgc tgcccgcccg ggcctgctgc tggccggaac gttaaacgat 14940
gaggccttgg acatgaatac ccagcttgca cgctgggaaa aaatccgctc ccgcggggat 15000
cttgtaacca ttgaagacgt cacatctgta atcggcctgg aacagatccg tgaattgccc 15060
ccgcgcaaat gcttcgcctc caccggatca tgcttggccc cactgaagta gttcctcccg 15120
aagctgagga tgagtctctg ccggacatga tcgccgggat tgtctgcaac gtgcttaaac 15180
tcaaggagat cgaccacaat acgccgttac agaactacgg cctcgattcc atctcgggca 15240
tgatactgag cactcggctg gaaatagctt tagacatgac ggtcgatccg cgcacattaa 15300
tcgatcatcc aagcatcgcc gccttatcag cctatatcca aaaagcacgg gaagcggcat 15360
gagccagagc atagaggaac ttttaggagt cgatacctta ccgaagccgt ccaggcggca 15420
aaacatgcga tttagctgcc tgttcttttc cgatgtgcgc acagacatct catatgccga 15480
gaagtaccgg tttcttggtg atgtcacccg gttcgccgat caaacgggtt tcgaagcggt 15540
ttatttcccg gaacgccatt tccacgaatt cggttcggtc tttgccaatc ccgcaatcgc 15600
cgcagcgcat ctcattcccc aaacacaaaa catccgcttt cgtaccgctg gtgtcaccat 15660
cccgctacac catccagcgg agattgtgga atggtgggcg atgaacgatg ttctatcggg 15720
cggacgggtg gatcttggct ttggctcagg ttgggccaag ggagatttca tctatgctcc 15780
agaaaacttt gaagatcgcc gcaaaatctg cagcgacggc atagagacaa tcaaacgttt 15840
gtggcggggc gagacgctcg cctttcccgg acccgggggc gatgttgtcg acatcaccgt 15900
ctacccccgt ccaatccagt ccgatctggc ggtctggttg ctgataactc agaacgaaga 15960
cgccttcatc cacgccggaa agatgggcta caacgtgttc actatgctct atgggaccaa 16020
cctggagaac ttgtcccaaa agatcgcctt gtatcgcaag gctcggcagg aggcgggcca 16080
tgatccggtc agcggcagag taaccctcac gcttcatacc ctgctgctcg acaccatgga 16140
ctcagttctg gcagccatcg aagtcccatt ccgccagtac atccaaagca gcctgaacgc 16200
ccacgtgaac gccggtgcgg tcacaggcgc ctcagcagat ctgagtgacg ccgaccgtgc 16260
caaagtgctg gattatgcct atcagcgcta tgtcaggaca ggtgcattat tcggcacgcc 16320
cgatactgca aaagatatgg tcgacgaggt tatcgccgct gatgtcgatg aaatcgcctg 16380
cttgatggat tttggtgccg actatgacat tgtcaggcac ggctttacac atttggcaca 16440
attggctcaa cattacagtt cacctctgtt gacaccgtag taccgacggc cgagcacaca 16500
tttttctttc aagggccgtt tcaagatcac catcacaatt ttagcaggaa atccaatatg 16560
gctagcgaac tcaaggatct gcgacagcgg ttggttgacc ggctttcggc tacggtagag 16620
cagaagattt cgtcaatcgg atacgtgccc gaagatttgg tccgcattgc gggctccggc 16680
gtgccagcag aacccagtca tgatgaagtc tataaagccc cggaggactt gaaagaggcc 16740
atcaacgaac actacgattt ctcgttttat gctcgcgaga cgatctgggc cgatatgctt 16800
gctggcacgc attttcgaaa tattggctat tgggatgcaa atactgaatc tctggatcag 16860
gccggccgca atttgcagga tcaactcctg gcactattgc ctcaaaaaac cggacggatc 16920
cttgacgtag cctgcgggat gggcgcctct acaaaacggc ttctggacac ttaccggccc 16980
gaagatgtgt gggccatcaa catctctgcc aaacaaatcg aaaccacctc tcaaaacgct 17040
ccaggctgca atgcacaagt catgagcgca acggagatga cttttgaaga caattttttt 17100
gatgctgtcg aatgcatcga agccgctttt catttcgaca cgcggcgcaa gtttctggaa 17160
gacaccctgc gcattctgaa gccgggaggc cgcttggtca tgtccgatgt tctgatgact 17220
tcaggggctc ggctggagca atatccggtg ttccccaacc cggaaaacca cattgccacc 17280
atcgaagatt acaagtctgt cttggaagaa atcggatacg aaaacatcac aatatctgat 17340
gagcggaaca atatttggaa atcgcatttc atggccacaa ccaaccggat tcacgaagga 17400
tttctagcac ggaagtataa tatcgttgag gtcacagaca tgatctggac gtattacgag 17460
ttggatgcaa ttaccggccc ttgcccgatc ctgggcgcat ctaaacctcg ctaaatgttt 17520
agtacttcgg atgcctatcg ctaggtagga taaaggtact ttggttcaaa cagagactga 17580
caagcatctt tatcgcttga gcgttacgat taagctctca aggctgcgcg cattggttcc 17640
catgtttaac caccttggcg gttcttgcag ctcaatgtca gcaaaggcag aaagcaggca 17700
ctgaaatgcc aaacgccctt ccattcgggc caaaggggct cctaaacaaa aatgtgcgcc 17760
cccgccaaag gtatgatgcg cattgcctgt gcgtgtaata tcaaaccggt gagggtcctt 17820
gaagcgagcc ggatcacgat tggtggcacg aagcaatcca atcaccggcg ccccttgcgg 17880
aattttcaca ccaccgatct cgcacgattg tgcggcaacg cgcagcagga aattacctcc 17940
cgggtcatag cgcaaggttt catccgctgc attgcgcgcc agatccggct gcgctcgcag 18000
ccgctccatt tcttttgggt gttccaacag taactttagc ccgatcccga tgagggtcac 18060
ggtcgtctcg tgtccggcaa tcaacagagc aacgagattt gtcagtgtct cctcttcgtc 18120
cagcgtgccg ttgtccaggc cctgtaatgc cagccgcatg aggctgcctt cagttccagt 18180
gctgctgacg gacaattgct ctctcagata ggatttaaat gccgtcagtg cctccagtcc 18240
gtcggacttc tgctggtcgg ttaacatcag atcgccaatc tggatcaact tcttagacca 18300
atcgctcact gtatctgcca tgtcccgcgg aatatcgaaa aggcggcaga gcacattcaa 18360
aggcatgggc tgtgcgtagg catcaatcag attaaccggg cgtccgtcac tcggtaaggc 18420
agcaatcagc ctttcagttt cctcacgcac catcccttcg agttgagcta cagcctgggc 18480
tctgaaagcg ggttcgtaaa caccccgcat tcgagcgtgg tctatcccgt ccacattgat 18540
catttgcggc tggaataagg aaaaaagacg gaaggctacc ggatcccgct cccgaaagcc 18600
gggatcggaa tgccagcctc ccttccagtt gcgcgaatcc cggccgatag ccttatttcg 18660
catcgcctcc gagaattccg catgaccaag aataaaataa cacccgctcg ccgggtcgaa 18720
atggatggga ttttccgcac gcaacacatc caggcggtca tgtggatcgg ccaggaagtc 18780
agggtccgcc agcatcgtcc accagtccgt atctgtttcc tccggtacgc tcatcgccga 18840
tctccctttc ctcggccgct tatgatagcg ccgtcccggt ctgccgaagc gcattaaatt 18900
gcgctcccag ataagaagcc gtttgatcca tgagatgcaa ccctatgtaa tcgacatgac 18960
ggttctgcca cttttccaga tccgtgccgg ctacataggt gttgaaagct cctaaggccg 19020
ggccgcagta gacctgccag tccgtttttt gaccagtttc cccggccaga gccaaacgca 19080
ttgaatgaat gaaataccaa cggaagatca atgccatctt gacctttgga ttgcgttccg 19140
cacgttcaat ttcctcaggt gcagctttgt cgtagaacga tcgggtttcg gcatacacgt 19200
cttcgaagga gcggcgaaaa tacttgtctt caatctcttt gcggatcgca actggcagcg 19260
cttcgaggcc tggatgggcg cgccaaagat cgtacagctt gttggcacgt gcggggaaga 19320
gcagtccttt cttcaagact tgcactttgg cacccagttc aaacatatcg ccggccggag 19380
cataagccgt gtcttgaacc ccagtgcgct gcaatacttc tttaaccgcc tcactggtgc 19440
cagcctcagg cgtacattga ttgatcgatc cagtggcaat gtaatccgcc cccagaagaa 19500
aggctgttgc cgcagcttgc ggcgtcccta ttccgccggc tgagccgacg cggctaggtt 19560
gggcaaaact gtgctgagcc tgctgagcgt cacgcagagc gatcatcgct ggcaaaagcg 19620
cacttgtaac cccacggtcg gtatgcccgc cggaatctgc ttcaaccgtc aagtcagaag 19680
caaccggaat gcccggagca agggaggctt cttcttcagt gatgagacct tgggacagca 19740
gtcgctggat caattccggc gtcgcaggcg caaggaatgc ggaggcaaca ccaggatgtg 19800
acactttggc aaacacccgg tttggcacat ctagcgcccc atcccgcagt ttcgccccct 19860
ttagacggta tttcaccaac gcttcggtta cctccatgaa ggccgaagct tcgattacac 19920
ggatgcccag ttgcaggagc cgatccacca taagcatttc gcgtctgggg tggagtggat 19980
cggccaggac gttgacgcca aacaccgagc caggcggaac cgtctccttg atcctgcgga 20040
tttggaccgc agcgtcctct atcggtactc ctcccgaccc atatattgcc aagagccggg 20100
cctgtgccat acggatcacc aaatctgccg aggcaatccc ctttaccatg gcaccggcca 20160
tataggcgtg gctcacccca tagtcatccc gaaaagcggc cgagcccaaa tgaccggccg 20220
cgatcatcca accgcctcgc caagatggtt tttcaaggcg ctcaggtttt gcgtatcagc 20280
cccaaaaggg gtcatgaccg caaaactgcg cgcacgcaaa tcatcgccca acccgtaaag 20340
gcacgcggtg cgcaagtttc cagccgggcc gcaatcgata taggtggcct tcgggtattg 20400
agcattcagc gccagcaagg tttcatgcag gcggatcggt ccgcgcacaa ccttccacca 20460
atcccgctcg accggatcaa atggccgtcc tgtgccatcc gatgcaccaa tcacaggtat 20520
ctgtgccgcg ccccagctaa acgcgcgcag tgcagccctg aaggaggttt cgatcgcctc 20580
aatcccggag ccgtgaaaag cataccggac cggcaagcgg tgatgggaga tatcgcgggc 20640
tcgcagatca tcggcaatgt cattaatgcc gtttgtgggc ccggtgataa cgaaacaacg 20700
atcaaatacg acaccagcca gctctgaaga gccacgacga taaatcggat cagcttcaaa 20760
ttgagctaaa tcatcgagca ccatcaacat agcgcccggt tccgctttcg actgaattgt 20820
ccaggcctgg cgcagcaacg ctggcaaaac ctcctctggg gatatcgccc cggaaacagc 20880
cgcggcgaca tattcgccca aactgacacc gagcagcaga ttcggtttcg gcagtccttc 20940
ggcaatcaga gtttcagcca gcgccacctg aaccatgaac agcgccggat gcgtgtcggt 21000
caactgatcg aatgtgtccc caacatgggc gaaatcatca taaagaacgt ctgtgaccgg 21060
atggtcaaga taaggctgta gtgcttcctc catccgcaac atactggcgc gaaaaacggg 21120
atgcgcatca tacaagcccc tgcccatctg gaagtactga gccccctgcc cagcaaacat 21180
ccagatcacc ggatcgggcg ccaaatcggt cggccatgga tgggagaaag cgttcacagt 21240
ggcgagtccg ttgaatgact taaacaatac tgtaaggtat tggtgagtgg tttgaaatac 21300
gcgctatcat attaatagac ataggttcga gatgaaggcg tttttattcc ccgggcaagg 21360
gtcccagcac atcggaatgg gcgaaggcct gtttgagcgc tattctgaaa tgactgaggc 21420
cgcagatacg gtcttgggtt attccattgc cgatctctgt ctgcgggatc ccgacaagca 21480
gttgacgcaa accgaattta cccaacctgc tttgtttgtg gttaacgcca tgatggcgcg 21540
cgcgcagcaa gacgacagcg gagcaccaga tatcgccgcc ggccacagtg tgggcgaata 21600
caatgccttg catcaggctg gtgtggtcaa cttcgaagac ggtttgagat tggttcaaaa 21660
acgcggtgcc ttgatgagca cggcgcccaa gggcggaatg gcggcagtca tcgggctcac 21720
accggatcgc attgcgacgg tcttgcagga taacggcttt gcgtcgatcg atgtggccaa 21780
cttgaactcc gacaagcaaa cgatcatttc cggcctcatt gaggacattt cagcggtaga 21840
accgtttttt tccgatgctg gagcgatgta tattccactg aatgtctcgg gcgcgtttca 21900
ttcccgctac atggctcctg tccaggagga atttgaagca tttctaggcg agttccgttt 21960
tgaagcgccc ggcatccccg tgattgccaa tgtggatgcc cgaccttatc aagatggctg 22020
cactgctcaa atgttggcgc aacaactgac ctccccagtg cgatggcaag aaagtatcgg 22080
gtacatgttg aatttgggtg tgggacattt ttttgaaacg gggcccggca atgtgcttag 22140
caagctggtc gcgggtatcc gtaaacagca tgtggtgaca cccgtggaaa cggagcttcc 22200
gccccaggcc ggcagccctc cggtgctgca ggaggaaacg caggcacagg aagcaaaaac 22260
acctgtccaa atcgtcgaag actggaacac acagcattct gcgggtatcg atgtccaggt 22320
aaatggctat gacggcgtaa tgaaaactcg cagcgaagcc atccttcttt tcggccatcg 22380
accagcagtc tacatggaag gctattcagg ctattttgca ctgtccgatg tgaccccgat 22440
agaggcccag ttgtcctaat caggtgcgga atagcgaata aatcccgaac gattttcgct 22500
cacacctcgc tcggattctt gagtttcaac tggctctaga gttcccaagg gaatttctgt 22560
tctgtggcat aacgttgcaa attggcgcga atgctcgaat cgccaaacag ggaccggttt 22620
tcagcgatcg ccttgtccct actttgacca agtgacttgt cgaggtccgc gcgataggct 22680
ttgaaacgtc gtattgcttg cgggtccagc cgttcaatac ggcgtatgtg ttgtgccaga 22740
ccaagttcga tttccggtaa gatggaatcc accaaatgaa gggacaacgc ctgctctgca 22800
ttgatggatt gggtgcttaa agtcaaatag gacgctgcgt gagctccaat ccgccgcgtc 22860
agaaatggca ggacgcaagc tggatgcagc ccaaacagca gctcgggcaa agtgaaccgg 22920
gcatcgggcc ctgcgaggac catgtcactt gcggccacaa agccgatacc ccctgccgtt 22980
gcctggcctt caacgacgct gagagaaaca aacggtccga gtgccagccg ctcccaaaga 23040
tgataaagcc tttcggggtc caccggatct ccgccgccga aatccgcccc ggtgcaaaac 23100
accgtttgag agccgcgcag gattatcgcg gtgcatccgg cttcctcggc ccggtccagc 23160
gctgcatgag catcctccac caatgcctct gtgatggtgt taccgctctc aggccgatca 23220
aaccataatg ttgaactgcg gccattttgg gtgatggaca gtggcgacaa catccctatt 23280
ccctagtcag aactcaaaac cgtggcgaga ttaaatcctc caaaccctga ggacaggcac 23340
atggcagagt taaaccgtcc ggactcgggg ttatctagca catagttcaa atccgggagc 23400
gtcggctgga ccagtccatg aatcggcgcg atttgacctg cctccatctg caggaaagcc 23460
agggcaattt ccacggcacc agctgccgcc actccatgcc cgagtgcgga ttttggagcc 23520
gtgacatgaa cagaattgag taactgggcc accaaagcct gggcttctgc agcatcgcct 23580
ctcggcgtcc cggtggcatg ggctgaaatg aaatcgagag aactaggggg aataccggca 23640
tcagtcaaag ctgcggtgat ggcctcttgc agcgcatttt gtgacggttc aggcccgcgc 23700
gtctgggcct ggacgcggcc caggcccgat atacgcccat aggactgcgg gcccagatca 23760
ctccttgcca aaaccaaggc agcggcactt tcaccaaaca agaaaccggt accggctgca 23820
tcgaaagggc ggcagcgcgg ctctggcata agatcaccgc tttcatctga aagatgcgga 23880
cccatggctc ccaaattgcg aagcgcctgc aattccaacc aggacatatc ctgcaatggc 23940
ccgataacca ggcagatatc aagctcaccg gagcgaatgg cggcagctgc cagatgaact 24000
gccagcgcac cactggccga agccccgcca acgctcatga tcgggccatc caataccagt 24060
tcctcactga tcaaggcggc gacatccgta tccagaaaac tgtgccccag ccgcggcggc 24120
gcaaggttcg gcgaggtatt aagaagtttg ttgcggatca attccatttc gcgtgactgc 24180
aaattgctgc cgccaaggat cacacccgtg cggccggaga gccggtgttc tccggggtct 24240
ccaaagcccg catcctgcca ggcttctgcg gccaccgctg cgcagacctg cccagtcaag 24300
ccagtggtcc gggacgcccg ccgcgacaac acctgaggga cactgtctgg cagctcgatg 24360
ccaatgaaag ggggattccc ggcgacttgg cgcccttccc tttcaagtgg tcgaaacagg 24420
tttttgccag taagcacccc ctgcagcgcg ctggacttgc caaatccata cccgcaagcc 24480
aaaccaatcc ccatacaatg cacagtacga tcagtcatga gctgttgtta gtttgccgtt 24540
caggagattt gccagaaacc tggaatgctc accttcaagc attgaaagat ggcctccagg 24600
aaccggctgg atatccaaaa cgcccgcttc agccggccac ccccgcatag ccgaagaaat 24660
ctctgcacct tccgcatgaa agacagacgc cgcaacggaa actggctctg gagtgtagcc 24720
gtcaacggct ttcgcaatgt gtttgtaatt attgaaaagc gtgaggagca cctgaaagtc 24780
ttcccccgtg ttttcggcca tattttgcag gtatttctcc ggcgcgcctt tgggctcagc 24840
actcggcagc tccgccgcga gccccatatc ccgggcaaat ccagcgagaa gcgccttttc 24900
gtgatcatgc ggctggatac gattgtcaat atgggaaagc accgcagggg gataagaatc 24960
gatcaatgtc agtgaggcca attcgccgcc cgaccgttct atctgccgcg ccatttccca 25020
agcgacaata ccgccgcttg accatccggc gagatgaagc ggtgcctgcc cttgatcaaa 25080
ttcaagatca gccagatagg ctgttgcggc atccgggatc gagttccacc gatccagccg 25140
gttcatttcc agaccgagaa tggaaaatct gggatccaga tgtttcatca aggtccggta 25200
acaaagcaac gtcccaactc cgccatgcac cagtacaaga cccggaccag acccagcttg 25260
taaattcacc acagatgaac gattaccttt ggcacgttca atcagcacag cttgatcggc 25320
cactgtcggt gcctggaata gctgcgctac ggacaattca gccccaagcc gcgaacgaat 25380
ttctcctgca aaccggatta acagcagtga atgcgcgccc aattcgaata tgttcgcagt 25440
caccggtact gagggacagt ccaacagttc agcccataag ctggccaata ctttttcgat 25500
cctgctgaga ggaccctccg gtattgatac tgatggagcg ggcgccccgt tcaacgattg 25560
ccgatccagt ttcccggcaa tcgtttgcgg cagagccgtg acaactcgaa tttcacttgg 25620
ccacatgtaa tctggcaaac tgcttttaag cgccctggat atggcagccg gctccagatc 25680
cgggtccgat actgtgacat aggcctgcaa cgtggtatcg ggcttgcgat ccgacaccgt 25740
gaccgcagcc cgcagcaccc cgtcaatccg ctccaaaccg gcttcgacct cggctaactc 25800
gaccctaaaa ccgcgaacat tgacctgatt gtcacgccgg ccaaggaact caagctgtcc 25860
atctgtccgc cagcgcgcca ggtcaccggt tttatacagc cggtctgctt tacctcccgg 25920
ccccgaggaa aaaccgcctt gtttgttctg cgctgcgatg tatccatccg caagaccgac 25980
gccgccgatt gcaagctcac cgatcaatcc ggctggtaaa ggctgatccg caacatctag 26040
cacaaacacg ttttctcctg gcaacggccg gccgatcggc agacgtcttt cgggtccgtc 26100
catttgtgcg cggtaaacaa aagcggtact tccgattgtc gtttctgtcg gaccataaac 26160
attaacaaga gcccgatccg ccaaaggact gtcgcaccag gtgctaaggg tgttttcggt 26220
caaggcctcg cccccggtca caaccgtgcg cagactttgc agcagctgcc agtcatcact 26280
ccgcccaaga tcgcgcagga cttcatccag aaaagcgggc ggcaaatccg caaccgtaac 26340
cgcccagcgc tgcacggcct ctgcaaagtc aagcgcggac cataatcctt cggggcgcat 26400
cacgaccgtg gcgccacgaa ccaacgttgt cagccattgt tcaaaagccg catcgaaact 26460
ggtttctacg aattgcagaa cccggtcctg gtcattgacc gcaaaaaggt ttgccatcgc 26520
ttgaatatga tgagccaggg cgtggtgggg cacttgtacg cctttgggac gccctgatga 26580
tcctgacgtg aataggatat aagcggcagc ggccggatcc tgaatgaccg gcgttggcag 26640
cacgccggcc gtggccttgc tgatttccgt tctctcatcc acgcgcatct gacgaatgct 26700
taacaggctt gccgtctttg catcggtcaa cgcaaggaca ggagctccat cagcgatcat 26760
gtcgtccaac cgtgacgacg actggaccgg cgaaagcggc atgtgcaccg ccccgaccca 26820
ccatgtggct agaaccgcga ccagcgaatt tgcagaacgt gccaaacagc ttgcgaccac 26880
atcacccggc tgaacacccg catcgacaag ccgggcggca aggtcaccag cattctgttc 26940
caatgcagcg tttgtcaaaa cggtatcgcc gcaaatcacc gcaggggcat cgggagccat 27000
ccgcacctga gcgcgccagg ctggaataag cgcttcgtcg ggtgcaggcg gaccgccatg 27060
cccccagtca gtaagcacct catcatccgc acccgccagg gacacatcca ccagagcccc 27120
tccgggatcc gcaaggaaag ttgaaaggac tttttgataa gcatccgcca aagcagaaac 27180
agtatcggat ttgaattgcc tcgcattata ggcaaaccgg caacgcattc cttccggtcc 27240
gggataaacc tccagagcca gatcctgaac gccctgttgg tcaatcccgt caacgactga 27300
gacctccagc gatccgcggt ctgtgttttg gggtccgacc agcgattgaa aagcaaactg 27360
aacccgcggc atcagcaaac ggccggtgcc ggatacttcg cccatctccg acaaaggcaa 27420
atccccgtgc tccagcgcat tcagcattgt ctggcgtgtt tccctcacca agtcgcggat 27480
actgacctga tctgacagtc ggatgcgaag aggcaagaga ttggcgaagt agccgacagt 27540
atgatcgaaa ctgcgatcgg gccggcccaa caccggcaag ccgataagca gatcatggga 27600
ccctgtcaaa cgatgcaaga tcagcacgaa cgcagccatc atgaattgcg ctggcgttgc 27660
cccgtgtgcg gtcgaagctt ctgtaatacg ccgggctgta tccttgtcga tccaaagcac 27720
atgactgccg gcctttgagg cgcactccag gtcagcatcc cagtcccccg gcagacacag 27780
ctcgttatgg ccctcgagct catcacgcca gaaagcacgg atgttggttc cccgttcgct 27840
ggtcaagagg cgttcctgcc agcgctggaa cgcatcaaat gaagacccaa ttgggcgtgg 27900
aaggcgcacg ccctgcagcc gggcttcata gagcctcatt aaatcatcaa tcaggatcat 27960
tgcggattgc ccgtcaaaga cgatgtgatg cacgcaaatg atcaagacat gccggtccgc 28020
cgcctcctgg atcaacaggc ttctgaccaa tggaccattg gtaagatcaa atggcaggcc 28080
tgcgaaggca tgcaattcgt tttcgatcac gctcgcaggc gcgccggaca ggtccaactc 28140
ttcaatggga tacgagattc cgtcctggac aattcgttga ggcattccgc cgttggccgt 28200
gaaaacggag gtgaggactg gatgccgttt aagcagatcc gcgaatgccg cgcgaagcat 28260
gtccttgtcc aggctaccgg ccagccgcaa tgccatcggc acagtgtagc cagcgtcgcc 28320
gggtgtcttc tgatcatgga gccacaatgc aatttgccct ttggtcagcg gcaaagcggt 28380
gttcacggcg tcggaggttc ctggctgcgc atgtttagga ttatccattg gcgcatagcc 28440
gtctttcccg gcaatccggg aaagcagcgt ggccagtgat ttgctttcca tgatgtcgcc 28500
cagaccgacg gttaggccac atcgggcctc caaggcttgg cacagcggca tcaacatcac 28560
ggagttcagc ccgtgatcca acgcagaccg gcgaaagtca atttcctccg gggctatgcg 28620
caggtcgttg atcagataat cccggataca ggtttcgggg tcggtagtgt cagaacgggt 28680
gtctggctct agctgtgata cagcctcgcg cgcatcaatg ccgccgagcc aatagcgcgt 28740
ccggcggaac ggataggccg gcagtgctaa acgctgcgcg ccctcggcct gcagtgggga 28800
ccagttaagt cgtgcaccgt ggacccaggc caccgccagc ttcctcaagt ttcggtggcg 28860
caacaggagt gacactattt ctgcgcctgt cttgcctgtc agcaggccgg aaagggcatc 28920
ttgaccagtc attgtattgc cggtgaccag cccatccgct tccagtcctt cagccagggc 28980
ctccagttgg tgcagcaatg cgggcacatc acgtgaaatc attgccgcac gctgatccag 29040
ctggctgcgg ccggtttgca gggtcaacgc caaatccgcc attcgggtct caggacgggt 29100
ttccagatat gtcttcaacc gtcccgccaa gaccctcaag tccgcttcat cccgggccga 29160
aagcggtatc agatactgat cctgcgcaac tgcggccggc ggcgcacttg ttttgggagg 29220
ttcttccaga accatgcagg catttgtgcc cccggcaccc acggaattca aaatcgcccg 29280
caatggctgg ttcgagcccc cactggccgc atctgaccct atcgggcgag cccaggcttg 29340
caactccgat tgcagccgaa acggcccaga ggaaaaatct agcttagggt tcaacgcgtc 29400
agttccgagt gttggaacca gggtttccgc ttgcatctgc agcacaactt tggccagttg 29460
cgacaagccg gaagcggatt ctgcgtgacc gatattcgat ttgaccgagc caatcgcaca 29520
gaatttctgt tccggcgtca aatcctgaaa ggcttgccga aaggcggcca gttcgatgct 29580
atcgcccatc gccgcgccat ttgctgcagc ttccgcatag gtgatagtgt ttaccggcac 29640
gccagcctgg cggatcgtgt cgccaatcaa tttggcctga gcggcaacac tgggcacacg 29700
gtagccgttg gaccggccgc tgtgattgat cccggtcgac ttgatcagcg ccaggacacg 29760
atcgcctgcc gccactgcat cgtccaacgg ccgcagcagc accgccccca ccccttcagc 29820
cggcaagtac ccgtcgccat cgcggaaact ggtgctgtct cggcgcgacc ctatgaactg 29880
actggctgac agcccgatgt atttctttgg gtggatcgaa acgttgacgc ccccagcaat 29940
tgccgcccgg catgcaccgg cccttaggct ttcgcaagcc atatggatgg cgacgatccc 30000
cgaagagcac atcgtatcca ccgccaagct tgggccattg aggtccagca cgttggagac 30060
acgatttgcg atcgaactcg gtgacgacaa gactgtcaac gcttcgcgca atggatctga 30120
acgaacagcg tgatattgct gggtcataga acccgcaaat acaccgacag cgctctccag 30180
atccacgcgc aacgcaggac ccatgtaacc tgccttttcc atcagggccc aggcggtttc 30240
cagaaacaat cgttcctgcg ggtcgagaag ttcggcttca tccggcgtta tccggaagaa 30300
acgtgcgtca aacccatcca catcggaaag aaaaccaccc catttacatc gggctttgcc 30360
ttcatatgca ccgtctgggt caaacaaaga ttcggcgtcc cagcgatcct tgggcacttc 30420
agtgatactg ttgcgcccat ttacaagatt atcccaaaac tcctccagat cttcggcacc 30480
aggaaaccgt ccttccattg cgataatcgc gatatcaccg gaaccggcag attgcgtgtc 30540
gggtacggcc gcttcagcgc ggaccggttt agcattgttg tcaagaagcg ggtcttcact 30600
cggcgcctga tcttctgccg ttcccccagg agctggttcc agaaggtcca cggttggctc 30660
aggcacatgt aaagcctcca tcagggactg ggatgccaga tctgttaacg cgccggcagc 30720
agcttcaatt gtcggatttt caaaaaacag tgtggccggc aaaggcccgg tcacggtttc 30780
gatcgacgcg gtcagggcca tgattgccac cgaatccacg ccgtagtcca ccaacggaac 30840
atccgcttcc agccgctgcg gcgagatacg caacaccttg gcaagttctt ctgccagata 30900
ctcctctaca gcatcttgca agtggaagct gcttggcggc ggcgcgggtt caggcccagc 30960
gggggcgcca gccggctggc ctgcgtctgc tgctgcgatc aatgccgcca aacggtcacc 31020
gtcgccttcc agaaccatag tttgcggcca tccggccctc acgatcctat ccagagcttc 31080
caatcccctg gctgtggaaa ggggaaccaa tcctgcgccg tcgcgcatcg cattaaccgc 31140
cgcagcgtca agcgtcatgc cgccgtccgc ccagtaaggc cacgctactg aaagagccat 31200
tccccttggc ccgccagggc ttagcgcacg gcggttccgt tcctcgacgt attgatcaag 31260
gtaagcgttg gccgccgcat aatcggcctg gcctggattt cccatcgttc cggcgatgga 31320
cgaaaagaca agaaaaagat ccagatccaa tccgtccgta gcgcggtcaa gattggcaac 31380
acctgttacc tttggcgcaa agactcggcg cagatcttct tcggttttgc gcaagatcaa 31440
cgcatccgac agcacgccgc cacaatgaat aaccccatga agcgatccct gatccgtcgt 31500
ctggcggatc atagaccgga ccgccgctgc atcaccaaga tctgttgcaa gatagtccgc 31560
atgggccccc ttgctccgca gttcttgcag caaagcgttt tgtttgggac cagatgggga 31620
ccggccggtt aaaaccagtg aaacccggga cagtgtctgt gccaaatggc gcgccacaat 31680
ggcgcccagt ccgccgcaac caccgacaat caggtaacgt ccaccttccc tccatccccc 31740
gccgggctgt gcatcggcta cgtcctgttc ctcttgccaa gtcagtgctt gccagcgccc 31800
gtcttttttg cgcaaacgag acttgccggg ccaggcagca acagctttga gatcggcctc 31860
caatggaccg gaggccggat catcggtgtc aaagcacaga acctgacagg tcaaacgtgg 31920
aagttcacgt gccgcgctgt cgagcatgcc ggccaatgct gcgctctgag aataggaagc 31980
cggcaatacc acctgataat gaactttctg atccgagctc tgcagcgcca gttccttcag 32040
atcccgcaac agggccagcg cctggtctgt aaacgtgttg ggatccgctg gatcgctggc 32100
tggaagggca agctgagcgt gctcctgcaa atttctcatt ggcccgatat gagcgacacg 32160
gcgcaaggcc gggtcaatag acggcgctgt cagcggcaag tctttccact gcggacgcaa 32220
caacagcaaa tctgtatgta acaccgaggt gtgcccggtc gatttggctt caagtgctct 32280
ggtttcggtc gtcttggctg ttgttgccgc agtccgcaac gcaatgggtg ctggctgagc 32340
cgtggtatca ggccaataaa tctcgcgtgc aaatggatag gttggcaggc tcagccgccg 32400
cgcttcgccg ccatagattt tccgccaatc gtaaactgta ccttgcatcc agccgtccag 32460
aagaacttcg gccgcaagac catcgggatt ctccactgtt ggattgctga caacccgtgc 32520
acgcccggag cgaaccggac cgtcacgtcc ggccaagaat tggcgtaaat accgtgccaa 32580
ctcctcgaca gtgctgactt gcacgccgat gcggtgcggc attggttcac ggccaacctg 32640
cagggtgtag gccagatcac gcaacgaagt ctccgctggt gcattttcgg cccaatcagc 32700
gagcgcgcag gcataggcct tgagccggtc ttccgccttt gcagacagag tgatcagaac 32760
aggcccataa gaatatggtt cgacggacgg aggggggcag tgttcctcga ctaccaaatg 32820
agcattcgac ccacccgcac cgaaggaaga aaccgcagaa acgcgaggca gtgttttacc 32880
ttcatgcacc ggagcgtccc aggtacgcag gcttgtattc acgcgaaacg gagttgctgc 32940
aaaatcgatg tttgggttga gggtctcagc atgcaaagac ggagcaattt cgccagcctt 33000
gagctgcagg agcactttgg tcagccctgc cagtccggat acggcctcgc catggccgat 33060
attggatttg gctgagccga tccagcacgg cccctccaga accggcccat acccgtcatt 33120
caaacccttg atctcgattg gatcgccgag tttggtgccg gttccgtggg cttcgacata 33180
gccgatggcc cgcgggtcta cgccggcctc cctcagagca cgggcaatga catgatgctg 33240
cgcctctgga ttgggcaccg tatagccgtt ggcgcgccct ccgtggttca gcgcgctccc 33300
cttgatcaca ccataaatat ggtcgccatc cgcctccgcg tctgcaaggc gtttcagcag 33360
cacaacgcct acgccttctg cagggacgta accatcgccc tcacttccga aactttggca 33420
ccgcccattg ctcgaaatga actggccctt gctcaaaagg ctgtatttgt tgggatgcag 33480
attcaggttc acgccgccgg caaacgccat ccggacccgt ccaagagcca gatccgcgca 33540
ggccagatgg atcgccgtaa gtgaactgga gcacatggtg tcaaccgcca tactcggacc 33600
atgcaggttc aaggcatagg acacacgatt ggcaacacct gcataataac tggccgtact 33660
cattggctca cccgccagac tgccttgcaa tccaagaagc tggtattcgc cgtacatgac 33720
acccgcatag acaccaacct gtcccggcag gccatcttcg tccaccgact gggcctggag 33780
atccccaggg cggtaaccgg cgtcttccat tgcggtccag gcatgctcca ggaacaaccg 33840
ctcttgcgga tccatggctt cggccatgcc aggtgaaatg ttgaaaaaca acggatcaaa 33900
ggccgccaca tcatcaataa acccgcccca cttcgaaaag tgagcgtcga tgcggctgcg 33960
gtcggtcgag aagtaatctt gccatttcca ccggtccgcc ggcacttctg taatgccgtc 34020
gcggccgttg cgcagattgt cccaaaagcc agcgatgtcg taggcctgcg gataacgccc 34080
ggcaagacca atcacggcaa tatccaaccc gcccgttttg ggctctgtcc gcggtttggc 34140
cgcggcatca acgctggcag gcgtcccggc cgctccccga cccttccgca caactgtggt 34200
cagcgacggg ccgtgcgcct cgataaagtg gtccaggaca gccccaaggg tctgatgttc 34260
aaaaaagagg gtcttggaaa gcgttccgaa ctctttttcc agaaccgccg tcagttccat 34320
gaccatatgc gagtcgaaac cgtagtactc cagtggttca tccagatcga tttcgtccgg 34380
tggacaggcc aacgcttcag aaagaagccg cttgaaatag gcggcagcag cgtccttcag 34440
gccgtcctgt gccggaacgt tcactggatc ttgagcgccc aaggcttgat gggcgggggt 34500
ctttccggcc tcgggcagcg ctacccgccg ggtggaaaag ccgttaatcc gggtcaagac 34560
ctgccctgac tcatcacaga gggcaatgtc gattttttca atcccgtgcg cggccgaggc 34620
gacacttcgc cgctcaagat gaacccgcat gcggcttttg ttggcggtca gacactgcag 34680
gctttcgatc gcaaagggca gggccaagtc accgctctgc tcttccccgg ccaatccgaa 34740
tccgattgcc gcctgcagag cgccatccat aaggctggga tgcaagacga acggttccac 34800
tgcagatccg caaatctccg gcaaggacaa gtccgccacg acacgcgatc cgtcggagac 34860
cagccaattc aggcattgat gtcctggtcc gtagtgcaaa ccggccgtct caaacagcga 34920
ataaatctcg ttggacggaa tacgccggcc agaggggata gcgtcgttat tgatgatttc 34980
cggcggcact tccggcaggt gcgcgattgc cccgcggcaa tgcaaccgct cacctgaatc 35040
accgtgagac agaatccgga aaggatactc ctgccccgga ccaggagaac ccaaaaccac 35100
ctgcagcgtc tgcggttcgg aaatgaccgc cggctgcacc cagaccacgt ctttcaaggc 35160
aaggtcgcgt gattgcaaat gcaaacaccc ggcgctgcgc gccaattcca gataagccac 35220
acccggaagc accggctgcc cctgtactat atgatcgcgc agaaagaact catctccgga 35280
tagcgaaacc tcaaacaccc catcagactt gcgagtcagc gccatgccgc ttggtaggct 35340
tgtgtccttg atctgcggaa ccgcagctga gggtttcccg ttcaacgtat caaaccagat 35400
gcgttccttt ttgaaggacg tccccggcaa aggcacgcgc cgtagatcgc gtccgtccct 35460
ttcagcctcc caatcatacg ctgcgccgcc aacccaaagc cgcgccagct cttccagagg 35520
cacgtccttc ggagattggg tgaccttgtt gtgtcttctg gttttataag gaacccgtcc 35580
gtgccaaaac ccgtcttgac cggtgaggtt gtcccgggtc gccgctaaga tgcgcaaccg 35640
gtctaccaat tccttcaagg attgcgccgc gaatgcgaca cgttccgtca ttgcatcacg 35700
gcccgcccgc aaggtgaatg cgatgtcccg cagcagcggg gcagcttcca ttccggaatg 35760
ctccggcagc gactgaaacg cgctgcttat ctcccggatg gaaccggcgc gatgcacgag 35820
atcatggtca atggtcaggc cgagaacctt ttccaccgac cggcgcaaca acgggcgatg 35880
caccggttcg acccccagat catcgagttt ggtaagtggt tcgacctcat cgatgtcaat 35940
ttctagaata tcggccagac atgcgcagag tcgggactca atcgttggtt ctaaggcccc 36000
cccggtgttt gcatagggag tcagagcctt tgccaaggcg tctgcgctag ccgcaagccc 36060
ctcacgatcc cgcgccgaca gaacaatcag ttcgggaatc tccggcatgt cagcacgtat 36120
ggtctgtgct ggctcttcca gcaccacatg tgcgtttaca ccgccaaatc cgaatgaact 36180
cacaccggcc cggcgcggga tttcctttcc gacggcatcg accggccgac gccactcctg 36240
cgcctgtggg accaggtaga aagggctatc ctttaatttt agatagggat ttacttcttc 36300
cggcaggctc ggagccaaag tccggttgcg catctgcaac agaactttca aaacacctgc 36360
gacaccggct gccagttcca agtggccgat gtttgttttg accgacccga tcgcacaccg 36420
cgcttcctga ccggcttcaa gagcgtcaaa ggctgtcttc aatccttcga tttcaatggg 36480
gtcaccaagt tcggtacccg tgccatgagc ctccatataa ctcagacttt gaggggcaat 36540
tcctgccctg cgcacggctg tttccaccag cgccgcttgg gcgcgtggat tgggcgccgt 36600
caaggaattc gccttgccgc cgtggttttc ggcgctgccc aagatgatgc cgtggacaaa 36660
atcaccgtcc cgttctgccg cagttagcgg cttgagaaac agcattccga caccttcgcc 36720
gcggccatac ccgtctgcct gagcgctgaa agtcttgcag cggccgtccg gactaagcat 36780
tcccgctttc gaaaagctga tatgcgtttc cgggctgagg acaaggttta cgccgccaac 36840
gattgcctgg ctgcaatcac ctgcccgcat ggcactgatc gcgcggtgca gcgcgaccaa 36900
agcgctggaa caagctgttt ccaccggttc gctggggccg tgcaaatcga gaagataact 36960
tatcctgttc gggccaacag aaccgacaga accggtagag ctgtggctgt caatcccgat 37020
accgttttcg gccatccgtg caccgtaccc agacggggca gtgccaataa tcaccgcagt 37080
gtcgcttccg gccaggcttg acggggcata acctgcatct tcaatagcgc gccagacgta 37140
ctccatgagc aatcgctgcg ccgggtccat caaggccgct tcccgacgtg aaatgccaaa 37200
gtgccgggca tcgaattcag cgatcccatc aatgaagccg gctcggttta catcggtcaa 37260
tccagcggcc ttcaaggcgc gccaatccca acggtcttcg gggatctcac gtaagcacgc 37320
gcggccactg cgcaagtttt cccaaaacgt ttccagatcc ggggcgtctg ggaaacggcc 37380
tgccattcca ataatcgcta tcgcctcggc atccggtgga gaagtcggat cgggctgatc 37440
aggcaaaggt ttttcggtga ttttcgcggt atgcctaacg ggattttccg gaagcaaacc 37500
cgacaagcag ctctcatagg tctgcgccag aaaaccggcc atgtcggcga tagtgacgta 37560
ctcaaagaac acggtcggtg tcaggtccat accgtgggct tcattcagcc ggttggagaa 37620
agtggtcatt gtaatggagt caaagccgag gtccgaccac tccgactcgg catccagatc 37680
ctgccgctcg aaccccatgt gttcagcgat gtgctccaac agcaattctt ctgccgctag 37740
ctgcaggcca tctgactctg ttcgctggga taccggttgc gcgctgacag gcgcggccgg 37800
tggtgtcagt atgtcgtcaa tcgccaactg cgtaccgcac atcaccactt gctgcggccc 37860
gccggacagt agtgctgctt caaattcatc aatgccggcg gctgtcgcca gaacccccaa 37920
gccagtgctt tcctgcatcc tggccaaagc ttcgggtgcc atacgcatgc cgccgtcctg 37980
ccagggaggc caggcgatgt tcagacttac cccgaaccgt tcaccttgag cggctttccg 38040
gctgcgccac agggcaaacg cttccaaaaa cccattcgca gcggcatagt ccgtttgccc 38100
agcgctgccc caaacggcag aagcggaccc gaacgtggca aagaaatcca gcggcagatc 38160
tactgaagcc tgatccagcg cccatgttcc agcaagtttg gcacgcccca ccagatcgaa 38220
atccgcttca gccttgtccg caataaagcc gtcttttaag acccccgcgg catgcaaaat 38280
cccgtcgatg cggccatgac gcgcaacaac cgaacgaacc atggcttgca ccgcatctgg 38340
gtcgcccaag tcacaagagg tgctgtccac ttttagaccc aagtcttgta atcggacgac 38400
gagatccgca tccgccgtgc tgcgcgctgc aaggatcaca gtcgctgcgg aagtttcttg 38460
tgcgatgcgc tctgcaaaac gctgccccaa tccaccggtc ccgccagtga tcagatatat 38520
cccatcatta cgccagggag agccctcgcc ttcaaccttc agtttctccc atcctcgagc 38580
caaaatgccc ttcgatgaca gccggagatg tgatgctcca gtaactcgcg ccgcctgaga 38640
taaaagagca ggaagttcca gagcagccag atctcccggg cattcgacaa gctgggcctg 38700
caaacgggtg gattccttgt tcgctgttgc caccagcccc gccagaccgg aaaacaaacc 38760
cgccgttcca tatgcctcat cagattgcgg caccacaatc tgcaaaaatc ccgtcccttc 38820
gccgagcgtc accgccgcct tgaaatcaga aaagattgtt ttggccgccc gtagatagtc 38880
agccacggca ttaccgctaa cgtgcaccac ccgcgcagtt tcgccagcac ccgaatgtcc 38940
gtgtgccatg ccgcatacaa gctgccgtac agcacttggc gtagccgcgc cgggcgttac 39000
cggatgccag accggccggg cccgcagcac ggtgtcgttt gacgtttcct gcccaagtgc 39060
cggatccagt tcgcggttcg caaatccctg aaggcgcatc accaaccggc catcaggacc 39120
ggtgacgtca agatcaatgc ggggtaggcg cgtgttctgt ggtccaaccc gtacacaaac 39180
acgcagctga tccggtactg tcccgaaaag ttccagagtg cccaactcaa atggcaaaga 39240
ggctgaagaa tccgtgtctt tttccgccaa tcccaaacag gattgaagaa cgcaatcgag 39300
catcgccggg tccagcagaa atccctgatc atccgcttca tcgggccgat tgatttcggc 39360
gtaggcctcg ccgtcgggac cacgccagat ctgctgcaag ccacgatggc tcggtccata 39420
ggaaagacca agttcggaaa agcggttata gcactgtgcc ttatccaaaa ctggcgcggt 39480
agtatttgca ggttcggttg ccggaaccgt ctggccagac ccattgcccg tctctccggg 39540
tcgcactaca ccctggcagt gcagctgcga accgggcatg ctggtgatac gaaactcaac 39600
cgatccatct ggcctaccgg tacaatgcac cgtcagatcc gtggaacctt cggtcacagt 39660
acacggctga acccagacga tcttgtcaaa tcgccaggct tcacggtgag aaacgtccaa 39720
aaactgcgcc gctgctgcgc gcgcgatctc cagataggcc gcgccgggaa gcatggggac 39780
gcccacaaca acatggtcct tcaaaaaccg ttcggcgccg gtcagcgtta gatcataccg 39840
gccttcaccc ggctcgttct tatgtgcggc cagcccgaaa cccgattttt tacgaaacac 39900
cgcagatgag cggcggcgca acggcatttc tccggcaggc gcaggaatcc agcaccggcg 39960
tttttcaaac ggataggcgg gcaggcgcac ttttgccgga cggttttcgt gaagcgcaga 40020
ccagtccaga agagcacccg agacccaggc ctcagccaga tcaggcaagg gctggctcaa 40080
atcggccggt gtcgtttctt cccgggatct gcgcctcgtc ttgacacatc ccttagcaaa 40140
tccggcctga tcaccgtccc gcaatcggcg taacgacgcg accagtgatc caaccgtgtc 40200
tgccacaaac gccagtctaa acgccatcgg gtcacgcccg gtttgcaacg tgtaggcaat 40260
ctgttccaat gagggcagtt catcgcctgc aaatccttcc agatgcgcca gcaaatccaa 40320
gataacttga tcaagctggg cttcggttcg ggctgaaagc gggatcagca taggccgatc 40380
cggcctacct actgcagccg tccttgtttc gggaagatat tcctcaacca cgacatgggc 40440
attcgacccg cctgcgccaa aagaactgac gcctgcacgg cgcggaaagg tctgcccatc 40500
aagcactgga cgcggccaat cactgccctt tcgggatatg aagaaaggcg tctgctccag 40560
cgaaatcagg ggattttggt cttctgaatg cagggttggg aaataacgcc cagaacgcaa 40620
tccaattacc gccttgatca gcccggctat cccggccgct gtttccgcgt ggccgatatt 40680
cgacttgatt gatcccaggc cacaatgcgg cgcgccctcg ggagtcttcc cgagggcgtc 40740
ataaagcgac gtgaatgctt gtttcagccc gttgatttct atcgggtctc ccaactcagt 40800
gccggtgcca tggcactcga tatatccaac cctgcgcgga tctccgcctg cgtggccatg 40860
cgcctccgcg atcaaccggg cctgggcaag tggattggga gctgtcagag acgtcgactg 40920
cccgccgtga ttttcagaag aaccgcggat cactgcgagg attgtatcgc catcacgttc 40980
agcggcagac aatggcttga gcaggactgc gccaacccca tcacctcgga catacccatt 41040
tgcccgggcc gagaacgtct tgcagcggcc atcttcgcag agcatgccga ccttggaata 41100
cataatgtgc atatccggtg tcagcatcag attggcgcca ccggcaatcg ccatctcgca 41160
accttcatgc tgcagggcca gcaccgcgcg atgcaccgct atgagtgagc tggaacaggc 41220
agtatcgatc acctggctcg gcccggtaat gtccagcatg aatgacaaac gattgggaca 41280
gaacatatgc cccaagctgg tcaaatgaag tgcctcgatt gatcccgccc gatcaatcat 41340
gtgggcgtaa tcctggagat ttacgccgat aaaaaccccg accggacggc cagcgatcga 41400
acttggagca tagcctgctt cgcccagcaa ccggtatgca ctttggataa aaagccggtg 41460
ctggggatcc atcagctccg cctcacgcgg cgacaagcca aaataaagcg gatcgaattg 41520
atctactgcc ggggcgacgc cgccatattt gaccttggta aactcgcctt ttccgggatc 41580
atcatagatt tgccgccagt cccagcgctc ggcaggaatc tctgtaatgc aatcgtctcc 41640
ctgctccagg tgcgactgca actcgcccaa atctgcgctt tgagcgaacc ggccatccat 41700
ggccagaacc gcaatcggtt caaaagcaga cccgctcacg tgtggggttt caactgcccc 41760
catgtcttcc tgatctgtcc ggaattgtcc aggctgcgcc aaagccgcct tcgcgcttgc 41820
aatccaggac gctgcctttt tggatcggga cgctggcact gtacggctcg tctcctttgg 41880
agcacgtttt tcagcacggc gatcaggcaa cgccagcgga ttttgcggag ctttctgaga 41940
ttgaggaacg cgatcagcct cacggcggta gcgtccatcc aagatttgag ccaactcctt 42000
ggcgttcttg gcttcgaaaa agaccgtagg ggcaattgaa acgccgagca tgtccgaaag 42060
ccgtttcatg atctcggtca cgatgatcga atccaccccg aaccgggata acggcgataa 42120
cgtgtcaaaa cggtcggaag gtatcttgag acaggcggcg acaacatcgc ccacagtatc 42180
ttcaaattcc cggccatctg gcaccgcaga ccgggatgtc tcctgccccc ctgccccata 42240
agctcggctt cgatccggcg ttcagcagcg ccggcgcgac cgttgtcggg ttcagtcgtc 42300
atcgagcatc tcccggtaat agcgcgcatg gcggataaat ttccaaaaat caacttccca 42360
agtatgcctg cggctgtcaa cgaagtagtc ctgacccaaa tctggatcat cctgggcttt 42420
cgccgcgaca aacttctgat agccaagggt ttgattttca aaggctctca cgtaactgcg 42480
gacaaattgc ccctgcagac gcattccatc gcccagcccg gccgcagcgt ttacaaagcc 42540
aaaaaagaaa agattgttga ggttgcgtgg aacgatatgg atgaaaagat ctggaattcc 42600
gtctttccag tcgagaatat ccggatcgat aaaggggaaa tgacggtcat agccggtggc 42660
atagacgatt atgtcgatct cagcttcgtg cccgtctttg aaacgcacgg ttagatcatc 42720
gaaacccgcg acatcgccga ccgtggcaat atcgccatgt ccgatatgat aaagtatctg 42780
cgaattcatg atcggatggg cagcgtcaat cgggtgatcc ggcgcaggca aaccgaaatc 42840
ggtgccatcg aacccggcca gcttgaacac tttttggata taggccgagg tttcctcttt 42900
cgaggtgaac ttggtgccga gctgcaacat ccattgcggt gtcggtttgc cgtcgatgaa 42960
tttcggataa tagtggtaac cccggcgtgt gctgtgatgc accgagacag catgatgcac 43020
ggcatccacc gccacgtcgc accctgaatt accagcaccg atcaccagga cccgtttgcc 43080
cgcgatctgt gacgggttct tgtaatcggc tgtgtgcaac acctcccctg aaaaggttcc 43140
cggatacggt ggtttcgggt agtgcggcac ccgctgcgcc ccgttgcaga cagcaacaat 43200
gtcataccgg cgggttgccc ctgtcgacag ctccacattc cagccgtcgc cgtccggttc 43260
gatccaagtg acgccagtat tgcaatgggc gtggtcataa accccaaaat gccgcgcata 43320
ggaccggata tagtccagca tcatcttgtg attggggtag gccggataat gatccggcat 43380
cgggaaatcc ggcacttgtg tattgaactt cggcgaaatc aggtgaagcg agggataagt 43440
tcttccgcag ggcgcatcgg tattccagac accgccaaga tcgctttctt gttcataaag 43500
gtcatagtca atcccgcctt cggacaattc gcgccccaga cctatcccca agggcccgcc 43560
gccaataacg caaaccgaaa gagccgatgc ccgcgttgcc gtcatgcctc aacgccctcc 43620
cattgaatgt tctctggaag cgctccaagg gacagtgaaa actcccgcaa gatcatgagc 43680
ggtgtccctt gcggatcata aacggtgacg tcaacgttca agtatcccgg atccggatcg 43740
gatagacgca ccacttcaaa gtgcacgtcc gaggtcagcg gtgctgtgct tgccagcgtc 43800
atcagcgaag ccggccaagc aacttgcgcg gtctccagat ccgaaaggca ctgcacggaa 43860
ttccagatgg cccgcaagac ccgcacatca aaaactgcgg gtgcagacaa tcctttcatg 43920
ttcccgacaa gccgcccctc atccccgtag agggctgcta ctccctgcgg ggcggaaaca 43980
ggtttgagac cacctcgcaa tcgcggcagc cggacaggtg ccggaaagct ggaacacggt 44040
gcgccggcct gggctaatag ggccagtgcg tcagttgttc cggcggcttc caccgccacg 44100
agcccctgat cggcagacaa gatgcagatt tcgttcggat ccggtcgaat ttcagaactt 44160
tgcggagctc cccagacaat ccgggacagg gtctgaacgt cacggttcag cacatttgat 44220
gcggccccgc gggcggcctc cagcatatcc aaaccaggag agaggtccga aactcccgaa 44280
acgggcggat gcgcaggcgt gtctggctct ggcagtggtt tgacatacgg cccaattgcg 44340
ggggcaggcc gggcctctgg cgcgtcaatc cagcagcgat cgcgttcgaa cacatagccg 44400
ggcagattga tccgccgcag actgcacggg aacagattga cccagggtat cggatgcccc 44460
tgacaaaaga gttcggccaa ttcatgcaga gcttcacggc tctgcgcctt ctccagaagt 44520
ccggaaatct gttgcgacat atccggcaga tcaggttctt ccgggacgtg tccgcggtaa 44580
cctggtgttg aatcaaatgc ttccaactgc cgggcggcat cttgcagatc cttgacgacc 44640
agcgcgagcc tgtgggtgaa tgcatgccga ccggtcaaca gggtcaggga aatggctgcc 44700
agctgttgat ccgccgcctc gggacttttc agataagctg ccaacttgct agccatggct 44760
tgcaaggacg attctgtctt cgccgacaag gaaataacat agttccgctc ctcagacggt 44820
agctgcgcag gcgagtccgg agcatcctcg atcagcagat ttacattggt tccactgatc 44880
ccgaatgcgc tgaccgaaat caggcgactc cggccggcat gcgggcgagg ccaatcgcgg 44940
ctctgagtat tcacataaag cggagttttc tgccatccaa gcattggact gggttggtta 45000
tggttcaggc tggcgggcag acggtcatgc tgcaaagcat gtacagcccc tatggcactg 45060
accagaccag atgccgcgaa cgtgtgaccg aagttaccct tggtcgtggt cacggcaatg 45120
ctgtttggtt cccgttccgc cccggaaaag acatcgcgca gcgcatgggc ttcaaccaaa 45180
tcgcccaatt ctgtgcccgt gccatgggcg atgacccagt cgatttcgtg aggttttact 45240
ccggcctgtg cctggacccg gcgcaacaaa tccacttgtg actgtccgct tggggccgtg 45300
atgccatttg tatggccatc atagttggtg ccgcttgtgc ggatcaccgc ctgtatcggg 45360
tcaccgtcct cacgcgcccg cgccagagat ttcagcacca gtaccgcaac cgcttcgccc 45420
ggaaccatgc cgttggcgcg gacatcgaac gtgtagcatt tgccatctgg cgagagcatg 45480
ccggcttgtc ccatgccgat gtaggcatcc tgcgagacca tcaggttcac cccagcggcc 45540
agtgccacat cgcattcacc tgcgcgcaaa ctctggcagg ccatatgggc ggccatcaat 45600
ccggaggaac aggctgtatt gagggccagt gcgggaccat ccaacccgag aaaatacgat 45660
agccgtgctg ccagaaccgc attatgcgcg cctgtcaggc taatctgatc ggaccgcttt 45720
atgtaatcac tgccatcttc aacgccgaca aaacttccaa cccgttggct ggccaggtgt 45780
tctggaccga gggcggcact ttcgagcgca agccagcttt cctgcagcag gtgacgctgc 45840
cgcggatcca tccgctcagc ctccagcgga gatatttcga aaaacagcgg atcgaactca 45900
ctcagaccgg gaacttgtcc gcaccatctg ctgttggtct tacctggtac cggcggtgtt 45960
ttggcttcgt aaattctgcg ccaatcgaac cgctccgggg tcacttcctc aaccgcctcc 46020
cggccctggt ccagaatatt ccataagcca cctacatcac gcgcgcccgg aaagcggccg 46080
cttgttccaa tgattgcaat tgcatcgtca gaaacagctc tgggctgggc aaatgttcgc 46140
ggctgagtgc tctccggtgt cgttactccc acaccaattt cggacaggtg cgcagcaagc 46200
ttgccaagtg tcgcgtgact gaaaaaaact gatggtgcca agtcgatatc aaagcacgtg 46260
ccaatggacc gggcaaattc tgaaagagcg atggaatcaa atccgaaaga ggcgaggttc 46320
ttatgcgagc caatctctcc cgatgacatt ttcagttgat ccgccgctag agacttcaac 46380
acggtgagaa catcacccgt ctcggcggag ggtttggact tctgcggtgt gccggcaagg 46440
tggtcgagcc gttcggcgtt ccctgaaaga actagggttc gggtccggcc ggtaaagacc 46500
gccgtttcca gcgcctgcat ggcctgttcg ccttccagcg gcacttgacc gctgctcgcc 46560
agatacaggc tctccgactc cgcatcggca agccctctgg cacgccagag cggccattcc 46620
accgccagaa ctggaagcgt ttcgttattg tgctcggctg caaaggcgct ttggaaacga 46680
ttggccattg cataatcgcc tgaccccagg tctcccagca ctgccgagct tgaagaaaag 46740
agacacagga aatcggctcc tgaatttgtc agtacctcat gaaggttctt cgtgccttgc 46800
aatttggggg caagcacact gtcaaacccg gaagccttag cctcaatcag cggagctgcg 46860
ccgcttcttc cggccagatg gaacgctcca tccagtctgt cccaacggga gaaaatttga 46920
tcacgcacag tatgaagtgc ggcgatgtcg gtcacatcgg ctggtagata acaaacatct 46980
gcaccaaggg cgcatagctc atcaatcagc gcccgatcct caggccctcg gccactcagt 47040
acaagccgcg cggacacggt gcgagccagg tgccgcgcca aaactgaccc gaccgccccg 47100
gagccgccga caatccaata aacaccgcga tgccgccacg gagtttgaac atccggcggt 47160
gctttcaacg cccgcgaggc acaaatttgc ctctcttcgc cacgataacg aacacaaaca 47220
ccggctccgg cggtcatttc agcgagcgca tggcgcacca tgacagtcag actggtgccg 47280
ctgccaaaga caatcgacac gttcagatca ggtagtgctg agcggcaaga acgttgcacg 47340
ccaaccaagg catccagcca agcgagatct tcaggagttt ctgcatgacc acatatcatc 47400
aaagactgcg ggcgctgccg gccttgcgcc aacgcttgaa ggaggtggat gattgggccg 47460
gccacgcggt cttcatcccc cagcaacaag agcacatgtg aggctggttc tagccaggac 47520
agcaaccgtg cagctgcctc gctgttttga aggtcttccg gctcgggcgt cagccataag 47580
agatcttccc cagcgttcag gtcggcatcg gccgccgaca tgctttttgg cgccagaacc 47640
agtacccgtc caaccggccc tgaacccggt tccagtaagg gtgacggctc ccattcttcc 47700
gcaaactgac gaactgaagg gagtgcggca gcagcatctg gcacatggag cgcttctggg 47760
ctctctgacc caatccaatg cgttatccgc tcgaacggat agcccggcag ttcgatcctc 47820
cgcccctcac gtttcggcgc cacctgggcc caatccagat cagcgcctgc gacccaagcc 47880
ttcagaactc gagacaactg ccctttggcc agccagactt caatgagatc tggcaagtct 47940
tcagacagtg cgatacctgt gatttcctct gtttcaccca gggtcacatt ttccggaacc 48000
tgcccttgcg caacagtttc aagcaactgg atcgtctcgg tcagactcga tgtttcaaag 48060
gccagacgtg ctggcaaccg cgcccggcca acccgcagcg tgtgcgctac atcgctgaga 48120
cacaaggtgt cctggtttgc ccgcagatgc tgcgcaagat cacctgccat ctgcgcccga 48180
atttcgggtg tgcgcgcaga caatattatg atttcggctt ccgctggcga actgcctggc 48240
aatccaggtt ccgtatcagt cgccggctct tccaatacaa gatgcgcatt cgacccgccg 48300
accccgaagc tgcttaaacc ggcacgtcgc ggtgccgggc ctgacggcca atcgaggctg 48360
ccgcgcacca gagacaaggg agtttcatcc agatccagat agggattggg gtcacgtaga 48420
tgcggatttc ctgcgatccg attgtgtcgg agcatcaaga gcagttttat caatgagaca 48480
acgcctgcag cagcctccgt gtgtccgaca ttcgccttga cggaccccag ccagattggc 48540
ccgtcccggg cgtcgagccc caactccgaa agggcagctt ttaggccgtt gacttcaacc 48600
gggtcgccca actcggttcc ggtgccgtgg gcttcgaaat agccaatcga agccggatcg 48660
atcccggccc tgcgaacgac atcaacaatc agttcttttt gagcagttgc attgggtgcg 48720
gtcggtgagg atgcacgccc gccatgattc tccccactgg cgcgaatgac gccaagcacg 48780
cgatcaccat cacgctgagc atctgcaaga ggtttcaata agaccgcgcc aacaccttcg 48840
gaacgcacat aaccgttcgc acgggcatca aaactcatgc accggccgtc ctcgcttaac 48900
attccggctc ggctggaggc taaagtgatg cgtggtgttg cgagtatgtt taccccgcca 48960
gccagcgcca tgtcgcacat accggccctc aagctttcag tcgcgcggtg aatggcgatc 49020
agcgaagaag agcaagccgt atcgattgtc tcgctcggac cgtgaagatt gaagaaatat 49080
gaggcgcgat tggcaacgag aaaagaaaat ggctctgctg ccgaacgcaa atgcccggcc 49140
tcccgggcct ttgccagaag ttccgaatag tcgcaggtcg caactccggt gaagaccccc 49200
gttcgactgc ccgaaacaga atcgggtgca acacccgcat tttcaagcgt ggcccagaga 49260
gtttcgagca tgagacgtaa ctgcggatcg agcacttcag cttcagcagg cgagatgccg 49320
aagtgtgcgt gatcgaaaca cgccatatcg gcaaggaaac caccccattt cagcgcagat 49380
ttatcttcat cgggaccgct ttgaaatgcg cgccagtccc aacggtctgc cggcacttct 49440
gagataagat cccggcctgc atccagagcg cgccagaacg cgtcaaggct ctgaacccct 49500
ggcagtttcg ctgccatgcc aatcaccgca ataggctcgg ccgtgtccat cccccggttt 49560
accgaagggg ctttgccaat tgaaaccgaa ccgtcgaaac cggcgctgga ccgaaccggc 49620
ttctcctggt ctacaactgc ccgcgctggt gcaggcgatg taacagaaga cggccttttt 49680
tctggctcca gagttacact gtgatccttg gccagcttgt ctgccaaagc cgccagatcg 49740
ggtatctcaa aaaagaccgt cggcattaac cgcaggccaa acgcggaatt cacctcattc 49800
gccagttctg tgaagctgat ggaatcgaaa ccatagtcag atagcggttt gtaccgcgtg 49860
accttttgaa ccgggatatg ctgaactttg gcaaccagat cgcgaagccg ggtctccagc 49920
tctgattgat cagcttgttg ttcaacagcg gcgggctcca aaacgttgtt ccctgccgga 49980
tattcaaatc ccaggaaccg ttcgcgaatt tcctcaggca ggccataggc gacaacgagc 50040
cgggtttcgc cgcttgccag agcacgttcc agcgcctcaa ttcccgtccc atccggcatc 50100
ggcaccattc cggtacctgt ccgcatcata cgggcgtttt catccgtcat cgccatgcca 50160
ccgccttgcc agaggggcca ggcaactgaa agactttggc catggcgttg tccgttcaag 50220
acttggcctt gccgcagttc ggcaaacaca tccagatacg cgttggcgca cgcatagtcc 50280
gcttgcccaa cattccccag tacgccggcg acagaggaac ataacacgaa ggccttgagc 50340
ggcagttcgg ccgtggcttc gtccagcgcc cgggttcccg ccagttttgg agcaagaacg 50400
cgcgccgccg attcttgccc tttatcgcgc aataatccgt cttcaatcag cccagctgca 50460
tggatcaccg catcaagacg gccatgcttc gccaagatgt cccgcgccaa caatgtcgcg 50520
gtactgcaat ctgtgacatc gccttgcaag tagagcgcgc cggtttccgt gagaaatgct 50580
tccgctccgg acggcggtgc cgaacgcccc gtgaggacaa cccgttgtcc ggcagatgca 50640
taatgccttg ccaggatacg cccaatcccg ccaagaccgc cggtgatcca gatcacgtca 50700
ccagcagcga agtatgccgt tcgggaagga agtggaattt cgcggaccca accgttttgt 50760
ggtccgctct ctgtcaatcg ggacaacatg ggcagctgtc ctgagttcaa tacctgcttt 50820
aggcctgacg tcagagcgcg atcagataga cttccaggaa ccagcaccgc ctgcgcacag 50880
ctggcgggat gttcaagacg aaggcaccgc atgaacccag acagcgacga agccagactt 50940
tgatcgggga caatgagcag gaccggccgg gcaccccgta caggatcatt cgattggaca 51000
aacttcagaa tctctgcgaa cgcgttctcg accgtgtcgg acaggacacg gagatccgcg 51060
cccggaaatg ctgcccgcaa cgtggattgc cgatgcgcgt cggtttgcgt cacgaacagc 51120
accggatcca ccggcgcagt accgttcatc agcggtggac tgatttcttg ccagcacgga 51180
cctgcaaaca gcagctgatt ggggcccggc aattgctgct tttcagacca gacaagttct 51240
agaccgcgaa gcgccagaaa gaccgaaccg ttgtcgtcac acagatccaa atcgagagtt 51300
acgcgatccg cccccggtgg gcctttccgt gccgggcgca gatccacaag caccttgtcc 51360
ggcagggtag gggtgaattg cgtcaaagag ccgatcccat aaggcatcgg caaagtggac 51420
tcttctcgct gggtctgaca ccagacgaca gctgccagga gagccccatt cagcactgcc 51480
acgcgccggc gcgcccccat ttctgcggac tgcacccggg caagcgcgcc actcgggcca 51540
ttacgttgct cggccaagct catcagggac gggccgtggg tagactgcaa tacggcatcg 51600
catgcgcggg atgtcagaac gaatggcgtc tccgtccggc gggcgtcgag atctacaggc 51660
ctcgggcgcg tgaaagcagt atctgagccc ttctcatggt ctgcctggca gtaacgtacc 51720
ccatcaagag tgatttccaa ccgcccaccg gtttgttgca atagcgcagt ggcccggccc 51780
tcgttgatac ggagcggttg cggaaagacg atattgcaca gtgcgccgtc gccttcgagg 51840
tccagcagcc ggtcaagaaa gaacgcgacc ggaacaatgc ccgagtggtc tttcaaaaac 51900
gggtcctgcg catccaatgc gatttcagta accgcgggtt tggcaacgct gatgggccgg 51960
gagtacagcc cgcgcatttg caacgctgat gtcccattgg gcaacagaat ttgcaggtcc 52020
accaagccct cgcgccgttg cgccgcgacc agaaccggac cctcccgagc ggggcatgaa 52080
ggtccagcgt ttcaagtgaa aatggcaaag cagccggtgc cgggttattt ggatccgcta 52140
gcgacaatgc cagtgtcgcc tgccaggcgc catcgagaag cgcaattggc ataacaccac 52200
tttccgccgt cccgggcagg ttcaactctg ccagaatttc gtccggcgtt gcccagactc 52260
gtccaatgga ttttagtgcc ggtccatgaa caacacctgc ttcattcaat gcaccgtata 52320
tggcatccac cgccatctca tgggctgaga gccgcgcgcg aattgatggt aaatccaccg 52380
ctggcggagg gccttccaac ggtatcaacc gcccttggtg atgcacctgg ctcgttccgt 52440
ccggcgcaag actggacaac gcgtaggatc cgtcctgatc aaagcttttt gcctcaatct 52500
ccagatccac cggagcctca acggtcagcg gtaccggcca taccaaatcc tcaaaccgcc 52560
agcccgtgtt ccgcgctcct gtcaaccggg ccaaggccaa ggcaggataa gcaacaccgg 52620
gcacgacagg ccggccggca atccggtgat cacgcaacca ggattcttcg ccgttcaagt 52680
ggagtgtatc atgaccggat ttgtccctat cctggtcctg cctatcagat cgccaatacc 52740
gttccttggc gaacggatac ccaggcagat ggcagcgctg tccgcgccac ccctgatgca 52800
gcgcaacgcc ggaccagtcg atcggagcgc ccgcgaccca ggcttccgct tgcatggata 52860
ggacggctgt actagacggc gcttcaggct gcggcccggc acgcgccgtc catttggagg 52920
gcacttcccc tgaccaatct gccgccagtg ttcctgccgc caaaccttta aaacggtcca 52980
acagttcggt ccgggttgtc acaagaaacg ccgcacggca ttccatcgcc atccggccag 53040
tccgcagagt atgtgcaata tccgccagga gcaggtccgg cacattttcg atcttccgtg 53100
ccagagcccc ggcttgcaac tgcaggcgtt ccacatcctt ggccgaaagc aggatcaact 53160
cctgctgcgg gtcgccgacg ctaacagttg gcgaaacccg caattcgggc gcttcctcga 53220
tgacaagatg cgcgttggtt ccgctgtgcc cgaaggaatt taatgccgcc aaaaggggct 53280
ggccatcacg ccgggtccaa tccgacgtct ccgtcaaagg atagaaagga gccccttcca 53340
ggttgatcag cggattgagc gatttaaagt gcctcaactc aggcattttg cggtgtttca 53400
tggccatgag cacggcaatc aacccacaaa cccctgctgc cgcggcgcta tgaccgatat 53460
ggcttttgac acttccaagg gcgcagctgc ctggtgtcaa atcatgcggc tgaaaggcct 53520
tgaccagcgc attcgcttcg accgggtctc ccaatttggt gccggttcca tgggtttcga 53580
catatgaaat ccgccgcgga tctatgtcga aacggctttg gacatcggaa atcagtgccg 53640
cctgagctgc accgctgggc gccgttatac cgttgctggc accatcttga ttggtaccag 53700
aggctcggat gaccccatga atcgggtcac cgtcgtgcac cgccgcagac aggggtttga 53760
gcaccaccat gccggccgct tcggacatca ccatgccgtc cgcttcggca tcgaaagtcc 53820
ggcaatggcc ggtacgggtc agcatctcgg tctgggccag cccgatgaga atgttctcgc 53880
ccatcaccgc gaaggcccca ccagccagcg ccagatcgca ttctccattc cgcaagctct 53940
cgcaagccaa atgcagagcc acaccggaag aagagcaccc tgtgttgacc acataggcag 54000
ggcctttgag atccaggaaa taggatatcc gcgaggcaac aatcgcgtcg gatgccccag 54060
tgaatgtgtc gtgcacatac ccgctgggct cgcacccgac aaagacccct gtgcggcttt 54120
cggccagccc gcccggatcg atcccagcat cttctagggc atgccagctt tccagcagga 54180
ttaggcgctg gtgcggattc atagacgccg cttcacgcgg agataacctg aagaatagcg 54240
gatcaaatgc atcacggtct tcaagtatcc cgccccaacg gcagtaggat tttccaggtt 54300
ctttgtcttg tgacaccttt tcaggacgca tgtaccgccc tggcagcgga accacaggat 54360
ccaccccgtc gatcatattg cgccagagcg tgtcgacgtc agcagcgccg ggaaactgtc 54420
cggccatccc gatgaccgca ataccatcgt cccagcgctc aagtttccgc tgaggatcgg 54480
tagttacctt tggctcaata tctgtttcag acattgcacc cccgacggct ggatggtgtt 54540
gttcctcaat aaagctgcac aaccgtgcca cagtcgtatg atcaaacaaa tcagtggttt 54600
ggagcgtgat gctcagccgc gcaccaattt ctcgaacgaa cccgacaccc aggattgaat 54660
caacgccata atcggagaat ggtacatccg aagcgatctc atcacggtcg atgtccaatg 54720
cggcggccaa ggcgtcttcg atttcggcgc gaattgcttc atttgaaagc agcccgcgac 54780
ctcgtacttg tgtcccgctg tgtatttcct cctccgaaac agaattgtca tctgtcgtgc 54840
cgtgctcaag agggccagga tgtacaacct ccacctcaaa cggctctgac acggcaaccc 54900
ggccatcgct ttggccaact acaatttgct ggcccaaccc atgctgggcc tcggctggaa 54960
actgcacatg ctgcaatccc tccaaagcaa acactgtttc ccaggtttcg ggataaagcc 55020
cggggctgcc gggaatcctg aagtgacggt cttcggccaa tgaccagccg tcgatcaacc 55080
cgaacaggac tgaagcaaaa acagttttgt cgctgatatc attcgcaatg aggacgccgc 55140
cagacttcag caacgctttc gcgttacgga ccgtttcccg tatatcgcgg gtggcgtgca 55200
gcacatttgt tcccagaaca atgtcgtagg ccccaatatc taacccttgg gccgcgggcg 55260
cggcttcgac gttgaaaagt tcgaaacgca tgtagggagc gctttgcccg aaccggcggc 55320
gcgcatgcgt gaagaacgat ttcgacaagt ctgtatagca gtattccgcg attgcttcgg 55380
accagcgggc cagacgcggc accagagtgg ccgtcgttcc gcctgtaccg gctccgatct 55440
ccagaattcg aagttttgcc tcaggatcct gagcacgccg cgcagttatc accgcgtcta 55500
cagtatcggc aacgaccgag ttgaagaagt cgcaaatccg gttgttgcta tacagacctt 55560
cgatcttttc catctttcca gctggaaaga gaatgtccgt cacgagagct tgtcctcgca 55620
ggatttgcgg caaggctttc agacaatctg ttgtcagaat ggcaagaacc cgcgtatccg 55680
gagtctcgag gaaggcttgc tgcgcctttt cccactcggc ccagaccgtg tccggtgaaa 55740
gaagatcatc tcctaggaga gtaacagctc cggccgcatc ccgggagatg ctgccttgtt 55800
cctccagaat gttcagcgct tcgtcccacc acggacggaa tttggccaaa atggcaaatg 55860
tctcgaactc gatcttgcga gacaggcctg gacgatcaaa gacgtccatt ttccgcaatt 55920
gtgccagaag caggcggccc agccactgat ccaatgccgc agcctcgcgt gcaggttccg 55980
gtggcgcttc cctcgtaacg acctggggca ataccggcaa agccgtaccg gacaggggct 56040
tcattcgagg cgtttccaag acggtctcaa tccggtccgg ccgtgttgtt cgactgattg 56100
caatttgcgg ctgcttcatt gcaagggcag tttcaaacag cgccattcca gcttcgggat 56160
cgattgggac aactccgcgc cgggccgcca aagccctcag actgtcagtc acccggacac 56220
cgccgccaat gtcccagtag ccccaattaa caacagtcac tgggcaggag tgtgacctgc 56280
caagcgcaaa ggccgcagcc tccgatgcct ggcatccggc aacataggcg gccatcccgg 56340
ctggttttcc gcatgatgcc agtgacgaaa acagcgctac gaaatctggt gtgggaacgc 56400
ccatcagcgc tttgtccagc gcggaaacaa cattcaggcg ggtcgacagg atatcctgaa 56460
acagagtttc ggacatttcg gcaatcgact tgtcatattc tgcgagggtg gaaacaatta 56520
ccccgtcaag cttctcgtac cggttgcgaa tatccgcgat tgcgtcagcc agctctcccg 56580
ggttgcgggc atcggccgag tgatagctaa cggcaccatc ataggcagcc atattctgtc 56640
ttatctgcgc agaaagtgcc gagcggccca accagacaac ttgcgctgaa acacgttgca 56700
aaagatgcgt ggtccagacc cgtcccagag cgccggcgcc ccctaaaacc aaatagacgc 56760
cattcttccg ataggggatt tccggcggca cctctggtag atcgcaggga atcaggcgcg 56820
gtctcagcca ttgtccctga cgccgggcaa atccaatctg accgccttca agcggcagag 56880
tatcaagcaa gttgggaaac agtggctctg ccgggtgtag atccattgcg cgcaatgtcc 56940
aaccgggcag ttcctgagcc agaaccgcca agcagccttg tattgccgct tgctctggat 57000
cagcgggctc agcgtcaaaa gcaaagccat tccgggtgac gagtgtcaag ttaccagagg 57060
ccggaccggt ttcgatcagc gccttggcaa agcggaaaaa tgttagcgga gccgcccccg 57120
gctctgccaa ccaaaggacc gtcccccagt tttctcttag tttttttggt gcctcgtccg 57180
gcggtacaaa ttgggcatca gggtatgcgt tcgccaattg atcccggctc gcgccagtcg 57240
cgccgattgc caggacaggt ccgatcaacg gggcaggttt gtccgtaggt gaaacacttt 57300
cccaatacgg gctgaacgta acatgttcag ggactggatc aggggcgttg ggattttctg 57360
cgttgtcttc ggtgacaacc tcatcgaacc acaggcggtg ggtatcaaat ggataaagtg 57420
gcaagccaat gcgccgcgcg cccgccattc cagccagcga ggaccaatcg atttcttgcc 57480
cgctaaccca agcctggaca atttcatcca gggtgccgtt attctgagat cgcagccgcg 57540
acgacccgat agcctcttcc cttggcccag tctctgaaag gttgacccgc ccgcgtgcgc 57600
ctttatccgg aatgcccccg tcttcgacaa ttctcagctg cgtcagcaaa tcctgatgat 57660
cctgcaccaa gaatgccgcc cgttcggcca tagcttcgcg ccccgtttga agggttagag 57720
caatgtcgcg caaatcgggc aattctgttc tgctctccag ccaaacgcgg agattacagg 57780
caactttttt cagctgtgac gatgttcgag ccgtaagcgg gatcagaact ggcccggatt 57840
taaacgagcg cggtttggaa ggtgtcgcct gatattcttc gaccaccaca tgtgcattgg 57900
ctccgccggc ccgaaggaag atatgcccgc gcggcgcggc ttgtcgtccg caggtgtcca 57960
ctcggtcaat accgtcggaa ctcgaaacgg ggtgttcccg aagtcaatgg cggggtttac 58020
tgcatctgca tgcaatgagg gtgcgatttg cccagcgcgc atttgcatca gaaccttggt 58080
caagccggcg agacctgcag cggcctccag gtgaccgaca ttggatttca ccgaccccaa 58140
ccagcattgg cctggtaaca cgttacccga agcgaaggct tcgaccagac cgtccacttc 58200
gattggatcc cccaaaggcg ttccggtgcc atgagcctca acatagccga ttgtgtccgc 58260
atctattccg gccttgttca gcgccgaccg aaccagtgcc gcctgcgcac gcgggttggg 58320
cacggtatac ccatgggtgt gcccaccatg gttgaccgca gtggaacgga tcacaccgtg 58380
aattcgatca ccatcctgct ctgcttcaga caggcgtttg agcaccgcgg ccccaacgcc 58440
ttcaccgggg acatacccat ctgcatcagc tccgaaactg cggcaccgtc cactgcgcga 58500
caacatatag gcggaacaca attcagcgta gttggacgaa tgcaggtaca aattgactgc 58560
accagcaatc gcgagattcg tactgcgatc caacagcgcc gcacaggcct ggtggatcgc 58620
cgtcagccct gaagagcaca tggtgtcgat gggcatactg ggcccatgca gatccagaac 58680
gtaagaaacc cgattggcta tggagccaaa agaagtgtgc ggaaaggcca ctttgcctgc 58740
cgcccgctgt gcaggaccgt aaaggtcaaa acctgtcttg gtgacaccgg caaaaacacc 58800
cacattctgg tcgtagtgct ccttcaggtc ctttcgggtc agtgccgcgt cttccagcgc 58860
gtgccagaca cactgcaaaa atattcgttc ttgcgggtcg atatcacgtg cctcacgagg 58920
agacatgttg aagaacaggg gatcgaaatc tgcaaaccct tccaggaaac cgccccactt 58980
ggagtaactt ttcccttgag caacagcccg agtttcatcc ggttcgaaaa aaccatccag 59040
ccgccagcgt tcttccggaa tttcggtgat gcagtcgcgc ccctgcgcca gattctgcca 59100
gaatccctcc agggaatccg atcccggata ccgaccggcg aggccgatga tggcaatgga 59160
ctctgatttc tcagcgcggg catgtgctgg cgaagagatg ctttctgttg cggaaagctg 59220
tgtggtgccg gttggacgga cagaggtggt attcgaattc tgaggcgtta tggctgcagc 59280
ttctttgatc cattcgtgac aggctgcgcc ataggttttt gcaagatgct ccgccaggct 59340
tcggatggtt gagaaccgga acagcagtgt ttgagcgccc ggcccggcca gagattgaag 59400
atcgcgcgcg atccgggtga ttgtgatcga atcgatgccg taatgctgca atggctcaac 59460
cggattgagc gcttcggcat cccgccctag aattggccca ataagggcct ttagccggtg 59520
ctccaggcgc tggggcaaat caccaaccgt gttttgtggc ccactttgtt ttggcccgcc 59580
ggcatccgaa ctcagccaac tcaacgcttt gtcttgattg ccatagaaga cggcagcctc 59640
cgtcagcccc tgctgaagcg cactgtccaa cgccttgagg gcaattccgg caggtatggg 59700
gcaaagtccc gtattctggc gcatggccat ttctgtgtcg gcatccggcg gacgcatgcc 59760
accatcgtcc caaagaggcc agtgcagggc caaactttga ccgaaccgct cgcctgccgc 59820
gacagcctga gcccgtttcc gggcgaaact gtctagaaag ccgtttgcca agcaatatgc 59880
ggcttgtccc gggctcccgc gcaacgtggc aacggacgac gccatcacaa acaggtccaa 59940
atccagacct gctgtggcct ggtccaaagc ccgagcacca atcactttgg gcgctaacat 60000
cgcatcgcat tggcgttcca agtccgaggc cagcaagccg tccccattca cacctgccaa 60060
atgcaatact ccatgcagcg cgccgaattt tttcagaacc tgctggattg cactattcac 60120
ttccccggga ttaccaaggt cgcagcggat aaccgtggca tcacaccctg tatgccttaa 60180
cgaggccaac ctttcgggat caatcgcaga gcgggctaat aaaatcagcc gcgcgccttc 60240
agcggcgtga gcaatgtggc gggccaaatg cagaccgatt ccgcctgcgc cgccactgag 60300
cacataaact cctccggtac gccaggggct ttgcccttcc agcgtaaaca gggtttgcgc 60360
atgccagacc ggagtgagag gtgcgccctc cgtcagctgc cgatgcagcg ggccgtcaaa 60420
attagcctca ctcctcaatg cgccagccaa gtcctgaacc tgtatggcct cagggacttg 60480
taggacttga acgcgcaggt ccgggatctc ctgcgccagg gtggcaaaaa aactggtaca 60540
cccggtcccc gagcgtccaa tacaatctgc aacagtccag ctccaccctc caaagccaga 60600
tcacgggctt tcgccaaaag agcccgcgac aacttcatgt aatgcgacgc cggatcggcc 60660
ccggactcgc cgggcaaatc cgttatccgg gcatctggca gcaattccga caatgtttgc 60720
tggtgctgtc ccagggctcc catgagccaa accttttgga cccctgccgg tgctgatacc 60780
ggtattcgat tcgcgacctg cctatcttgc gtcagcagca ggctttgcat tgagcctgca 60840
gatggctgtg cccccggctt gccgggccaa aagatctcct tggcaaacgg ataagtaggc 60900
aagctcaccc ggcgccttgg cccagtgtgc aattgcgtcc agtcgacttc agtgcctccg 60960
gtccaggctt ccgcgacacg atcaagttgt cgcgttgcca gccagtgctc catcagcaca 61020
ctcatttctt gcgacttgag ttttggcatt gaagccgcgg gctggtcttc gagcaattct 61080
gctgtagaca agcaagcctt caattcagcg cgcagttcat ccagaccgga cacgacaaag 61140
gctttccggt acaccatatg ccggcgcccg gtttgcagtg tgtaggcaat atccgcgagc 61200
ggcgcctccg ccttgtcttc gacaaccgcc aaaagccggg ataaaagctg ccgcaagccg 61260
tcttgcgttc gcgctgaaac cggaacgatc tgcgaagacg gctctgctac cggcgaaacc 61320
ggcatagcag actccggctg gaactcctcg acaatcgcat gagcattggt gccgccaatg 61380
ccaaatgcac tgatccccgc acgtctggga gaacctgagg tttccggcca accctggcga 61440
atggcggcca cctccaatcc ggcatcttca aaatcaattt ccggatttgg cgtttcgaaa 61500
tttatcgagg gcggtatctc accggttttg accgccatga ccgccttgat cagtcccacc 61560
agtccggctg cagtatcaag atggcctatg ttgggtttga gcgaaccaat acgaaccggc 61620
tgcggcgctc ccgcggcgcg gccataaaca gattgaagac caaggatctc gactgggtca 61680
cccagtcggg tgccggtccc atgtgcctcg atatacccaa ttgaagccgg atcaaccttc 61740
gcgctttcga gagcacgccg gattgcttca gactgacctt gcaccgatgg cgcaaagaag 61800
cctgccttat cggccccgtc attgctgata ccaacgccct taatcaatgc gtgaatgtgg 61860
tcgccatcgg cctgggcatc gctgagcctt tttacaagca caacgcccag cccttctcca 61920
gcaacaagtc catcagcttt cgcgtcgaag gcgcggcaat ggccgtcact ggaaacattc 61980
aatccgggct ggtgcaagta tcctgcccct ggcacggcat aaaccgacgc cgctccgatc 62040
aaagctgcgc gggcttcccc ggccaacaat gcctgccggg cttgatgcag ggcaaccaaa 62100
cccgaagaac agttggaatg gactgccatg ctcggcccgg taaggcccaa ctgataggac 62160
agcatggttg gaacagtccc gccctgcccc gcgatccagg cactataaaa ctcatcatca 62220
gacactgcct gacagtcatg cagaagtgtc ttatagtgtc cgtggctcac cgccgtgaaa 62280
acggcggttt ttggtaggct tgcggtgctg tgtccggcct cttccatggc tttccaggcg 62340
tgctgcagca gcaaccggga ttggggatcc atatgaagcg cggcgcgcgc tgaaatgttg 62400
aaaaaccctg gatcgaaaca ggcccgctcg gccaacggaa atgccacagg tacgaaatca 62460
ggttgagaca actgggcgtc cggcacgcca gcggcacgca actcctcagg ggtcaaaacc 62520
tcccgcgcct ctcgcccatc aagcaggttt tgccaaaaac tctgcaaatc caaagcacca 62580
ggcaccgcgc aagacaggcc gatcaccgcc aaaggttcgt cgtccagccg ctgagcaaga 62640
gagggggctg caaaatggtt cagcttcggt gcctcatgcg cagctgtcac ctgtttttgc 62700
gatgccggca ccacatccga tgtgccggcg cccagatgcc tggcttgggc ccggattgtc 62760
ggaaaccgaa acagatcgga tacgcgcaac tccactccaa agcgctcgga aatccgggcc 62820
gccaacactg cggcagttac cgagttgccg cccgcctcga aaaaaccgat gtcccggcca 62880
attccggtac tgtccaacac gtccgaccag agcgccagga cctctttctc aaggtccata 62940
tccggtggac caggctctat ttccggtgag gcagatcgat cgtgacccag atctacttgc 63000
cgggccgcca gcgccatgcg atcgatcttg cccgccggcg ttaacggcag gtttgctaag 63060
gatatgatga gatccggcaa catataagct ggaaggtctt ccctcaaaca tgcacgcaat 63120
tctaccgcgg gaacagcctc tctttctgga acaacatagg ccacaagttg tgcttccggc 63180
ccgcttttgc gcaaaacaac tgcgctctcg cgcagctcct tgtgccgatc cagaacacat 63240
tcgatttctg ccagttcgat gcggtggccg cgcaatttga tctgctggtc acgccggccg 63300
tgatgaatca gaccgcctga cggactccag gaggcgaggt ccccggtttt gtaaagacgc 63360
tctcctgaac ggtacggatg tgcgatgaag gattgcgcgg tgcggtcggc ctgttgccaa 63420
tatccatccg ccaaccccgc cccggagatg tacaattctc cctgttcacc gacaggcaca 63480
agctgcaagt actcatccag aaccagcact tcggtgaagg caatcggcat gccgatcgtg 63540
acggtgtcct ggctgccggt caccgggccg caagtcgacc agattgtggt ttcggtcgga 63600
ccatacatat tccaggcatc aagcttggaa ttctgaaaca agctattcaa acggtccggc 63660
ataggctcac cgccgcacaa ggccttgagg ccgtccggag gctgccaacc agcagcaaag 63720
agcatggtcc aaaccgaggc cgtcgcttgc aagatatcag gctttactcg ggaaatctcc 63780
gacgccaggg catcaggatc ctgggcaatt tcttccggac aaatatgaac cgacccaccg 63840
ctggtaattg gcagcaaaag ctccagcagc gagatatcaa aggcaaacgt ggtcacggct 63900
agaagccggt ctccagtgcc cgctccaggg cgttgcgcca tggcttgcag gaagttcgcc 63960
aaagcccgat gcggaacctg tacccctttt ggacgcccgg tgctgcccga ggtgtagatc 64020
agataggcgg gatcgccgcc cttcagcccg acaggctgcg gttcaggagc gcacgaaagg 64080
gcgtcaaccc taaccatggt gcaatcaggt tcagccagtt gggtcgccat ggcatctgtg 64140
ctgacgtctg ccagtatcgc tcgcggcgca caatcttcca gaatatgtct cagacgcgct 64200
tttggatggg ccggatccaa tgggacaaag actgcccccg cccgcaatgt ccccagaagg 64260
gccgcagaat aattcctcct gcgcccgagg cagagcgcga cacggtcgcc gggacgaact 64320
ccggcctgtt gtatcgccgc cgcgacccgc aagctttcct gatccagctg ctcataagtc 64380
caagcgccat cgcaatcgac aacagctgtc tcagccgaat gcatatcggt ctgcctttgc 64440
acgagctgca tcacggtatc agcactgaac tccggcttag gcccggtgcc ccaggccaga 64500
agtttggcac gatctgaagt gccaacgata tcgaaactgt cgaggttggc ctcaggatcg 64560
gccaacgcct gttgagccaa atttgttagt gcttcaagcc acccctgcac ccgttgttcg 64620
ctataaagat ccgggttgta tttcatgcaa agtgacaacg tgtccgaggt ttcccgtacc 64680
tccagtacca gttcgtattc accctcttgc cgcagatctt cgaccagagt cagatcacct 64740
gtgacctgca atctctggtg aagagcaggc agggcatcat gggaaaatgc gttttgatat 64800
tcaaaagcca cccgaaagac cggcggctca cctggaccgg agcttaatcc cagatcgcga 64860
accatttgcg caaacggata ggcggcgtga tccagggcat cggcaacctc cccctgtaag 64920
tgatatgcga gatcacgcaa tgttcggccg gccaatccct gcatgcgaat cggcagcata 64980
ttaaccaggt atccgacggt ttccgcataa cgtggatcat ggcgcccgtg gtcgggcata 65040
ccgacgatga tatcgtcatc accacttagg cgatgcagca gcgtggcgaa tagcgcgaga 65100
caaagcgatg agagagggca ccgttcagcc cttgaataac tgcgcatcgc gccagccacg 65160
gacgctggca acggtaaggt aagatgcgcc ccttcgaaca accgagctgt gtttcgcggc 65220
ttatccggtg tcagagacag gcacggtaac tgtccttcga gccgcctggc ccaaaaagca 65280
cgggcatcac gcatttcact gccggatgcg gccgccttcg ccgtagcaac aaaagccgcc 65340
tgatcggcac ctttgttcgg caatatggtg gcttcagctc gcaaagattt gcccaattcg 65400
gcgtcatatg cgtccagaaa cgtctgcatg aagagccaaa acgatccacc atcaaagacg 65460
atgtgatgaa atgtaatcaa aaggtaggac ggtgtgccct gttggccgaa gattgttgcc 65520
cggactggaa ggtcacgcgc cagatcaaaa ggagatttcg ccgcatgcct caaggttgca 65580
agagggtctt cctgcggcaa gtcgagctgg cgcacatata aagtggcccc gtggttttca 65640
tcccgcaacg gaccacggcg gccaactcgg aacgtactgg tcagaaccgg atattgaacc 65700
agacatttat tcaaggccga ctgcacggcg gttgtgtcaa acccttcacg gctatgcaaa 65760
cagaccggca ggttatatgc gctggtacca ggctgcgcct gcgcaatggc ccaaagccct 65820
gcctgacctt gcgacaaggg caaatcgcgg gcatgtcccc ggtcttcgca gacctcgacc 65880
gcctgcggct ccggatccac tgccaatgcg gggagttgag ttgtgtaata ctccgctagg 65940
gcatcaatac tctgatgttc catcaggtcg cggccgcgca cagtgatccc gaacgtccgt 66000
gcgacggccc gcaagagctg catagcgaac aaggaatcca caccgaaatc gtagagatgt 66060
tgtttggtat ctatagaggc tgccggcaga tctagtacac cggcaatttg atcaatcaga 66120
aacggtttga tcccgatttg cgctgaggtg tccggcgcgc gctccagaac cggcttcacc 66180
cagtgtggcc ggcaatcaaa tgcgtaaccg ggcaatcgaa tacgccgggc actttgatcc 66240
tcaaggtccg gccaagactg atcgactcca gtcacccaag cgcgagccaa ggcctcaagc 66300
ccggtaactg tttcctcagc ttgtattccg gaccctgccg ttccccgaaa caccggccaa 66360
tccgatgttg cctggcccct tgtttccacc tccaaggcct caatcagggc tgcggtgtct 66420
ggcacaaccc aggcaattct atatgccaag gcgtcgcgcc cctgctgtag ggttttcgcc 66480
acatcacaca accgttcagg ttgttgttgc agatgcttca gaagattagc gatcatccgc 66540
tcaagacttg aaggcgaagc ggctgacaga acgattacct gagggtccgc cggagcgtct 66600
tgaggacgcg caaccgattt gcaaggcggt tcctgcaaca gaatgtgcgc atttacaccg 66660
ctcatcgcat ggcagtgaat tccagcgtga cgcggtgtac cgcttcttgg ccacggtgtg 66720
tcatttaccg ccagggcgca agctgcgcca tcttcgcgga tttcgggatg cacctgatca 66780
aatcctgcaa tgccgaagat gcggtccgct gcgaaactgt ggaccacctt tagcagcgct 66840
gcgagccccg aagcggcttc catgtggcca aaggctggtt tcaacgtact gacgagacac 66900
ttcgcatgag ggccgctgcc cccgcttctt gcccaaagcg cttcattgcc cggttgaagg 66960
attcccattc ggcgatatcc gacagcgggt tccccatgcc ttgcgcttcg atcacgccca 67020
cctgaccagg gccgatacca acgcttcgat aacaatcggc aatcaattcg gcatgacgtg 67080
tcacgctggg ggccgccaat gatgccgcgc cgcggccatt gaaatttacg gaagtctggc 67140
ggatcactgc ataaacgctg tccccgtccg ccacagcctc agacaacggt ttgagcacaa 67200
cgcacagtgc agcctcggca cgcacatgac ctgcggcagt ggcgccaaag ggagaaacct 67260
tgccatccag gctgagttgc ccagtttcgg caaggtgccg gaacggccct ggtgtgagca 67320
tcaaattgac acccgcaaca agcgcctggg aaatttcgcc ctgacgtagg gcctgcactg 67380
cccgatgcag cgccacgccg gcgctggcac attgcgcctc gatcacttcg ctggggccat 67440
caaaatcgta gaagtatgac aggcggttgg ccaagagaca tgattgtgca tatccggcat 67500
ccgggtcatg ccctaggctg gcacaaagcc ggtcatattc gttgtcttga gccgcgacga 67560
aaacaccggt acggctaccc cgtaaattgc gcgatgcgta gcctgcatcg tacattgccc 67620
cgagtgcggc catcagcaac agccgctgtc gcggatccat ctgatccgcc tcacttttcg 67680
ggatgtcgaa aaacccggcg tcaaagccgg ccggatccgg aacgaaaccg ccatagacaa 67740
agggcgcatc ggccgcaggc gccgacaacc gctctccgag tgatctttct gcccgttttt 67800
caataaggca ggcgccggtt tccaacgcag cgtaaaatgc tttcagatcc tcacagccag 67860
gaagcatgcc tgatgcgcca acaatggcaa tcggagcggg ctctcgcgcc gctccgtcat 67920
gatcttgcgg tggagtatta ctaaacttgt cctggcattg catggatgcg aggattgccg 67980
cctcaatttc gttccatgct tcgtcagaat tcatgacacg ctttccatac atcaatattc 68040
aaaaaccgga cacaatcctg gccatcaata gcctgagcaa ggctttttcg cccttgcctc 68100
gcgccgttag ccaagcatct gcctgctacc cagcagtcgc agaattgtgt tgagccgaat 68160
tacaatcggc gggccgtaat catggtgtat ccgaggtttt ctgccatata ttcaaataga 68220
tagtaccagt tgtcgacggc tttttctgcc tgatctccca tgagccggac cacgtcactc 68280
cacttttcct gcacggcttc acgcaacttg gtttccagcc atggcatgac gttttcggaa 68340
atgtcctcaa tgttcagaag ttcaaatccg gcatctgcca tcaaggcggg atagcgatct 68400
tctggaacaa agaccgaatg gatatgctca tggacaaagt ccatgaattc aggtgtcgtg 68460
tgaggcagag ttggcaggtc ggtcaggaca aggcctgcgc cgggtttcaa aagccgggcg 68520
gcttcgccca aagcttctgc atgacccatg tgaaaaatcg attcaaaaaa ccagccgcca 68580
tcaaaactct tgtctggcaa tgggacgctg cgggcatcgg cttgtaaaaa atccaatctg 68640
tcggagaacc ctgcctgtgc cgctttctcg cctgcaatac gatgctggta gccactaatc 68700
gtcactccgg tgacatgaca acttcgagct tgagcaagtt tcaaggcggg atggccaata 68760
ccacaaccca gatcgacaaa ccgttcaccg ggaccaattt cggtccgatc gatcattcga 68820
tgacacatgg cttccgctgc ggcaccgaaa cttgcatccc gactgtcttc gtcccaataa 68880
ccccagtgta agtgttcatc aaacaggatc ggtcccagtc gcagagccgg tgagtcataa 68940
tgatcttcga ccgtatcatt gctagcgccg gtagtctcca aagtactgcg ggacat 68996
<210> 3
<211> 80
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 3
Met Ser Gln Thr Asp Pro Phe Glu Thr Val Lys Arg Asn Val Gln Glu
1 5 10 15
Val Leu Pro Glu Leu Glu Pro Asp Met Ile Gln Pro Glu Ser Ile Leu
20 25 30
Val Asp Leu Gly Ala Asn Ser Val Asp Arg Met Asp Val Ile Thr Leu
35 40 45
Ser Met Glu Asp Met Gly Ile Ala Ile Pro Leu Met Ser Phe Ala Lys
50 55 60
Ala Val Thr Leu Arg Asp Leu Ala Glu Ile Leu Ala Ala Ser Lys Val
65 70 75 80
<210> 4
<211> 425
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 4
Met Asn Thr Ala Gly Ile Glu Ala Val Gly Val Tyr Gly Gly Ser Val
1 5 10 15
Tyr Leu Asp Val Ser Glu Leu Ala Gln Tyr Arg Gly Met Asp Leu Gln
20 25 30
Arg Phe Glu Asn Leu Leu Ile Arg Gln Lys Ser Ala Ala Leu Pro Tyr
35 40 45
Glu Asp Ala Val Ser Leu Gly Val Asn Ala Ala Lys Pro Val Ile Asp
50 55 60
Ala Leu Ser Gln Ala Glu Arg Asp Gln Ile Glu Leu Leu Ile Thr Cys
65 70 75 80
Thr Glu Ser Gly Leu Asp Phe Gly Lys Ser Leu Ser Thr Tyr Ile His
85 90 95
His Tyr Leu Gly Leu Ser Arg Asn Cys Arg Leu Phe Glu Ile Lys Gln
100 105 110
Ala Cys Tyr Ser Gly Thr Ala Gly Tyr Gln Met Ala Leu Asn Phe Ile
115 120 125
Leu Ser Gln Thr Ser Pro Gly Ala Lys Ala Leu Val Val Ala Thr Asp
130 135 140
Leu Ser Arg Val Leu Val Asp Glu Thr Ser Asp Glu Leu Thr Met Asp
145 150 155 160
Trp Glu Tyr Phe Glu Pro Ser Gly Gly Ala Gly Ala Val Ala Leu Leu
165 170 175
Val Ser Asp Gln Pro Arg Ile Phe Gln Ser Asp Ile Gly Ala Asn Gly
180 185 190
Thr Tyr Cys Phe Glu Val Met Asp Thr Cys Arg Pro Met Pro Asp Ser
195 200 205
Glu Ala Gly Asp Ser Asp Leu Ser Leu Leu Ser Tyr Leu Asp Cys Cys
210 215 220
Glu Gln Ser Phe Ala Ala Tyr Arg Ala Arg Val Glu Gly Val Ser Tyr
225 230 235 240
Gln Asp Ser Phe Asn Tyr Leu Ala Phe His Thr Pro Phe Gly Gly Met
245 250 255
Val Lys Gly Ala His Arg His Met Met Arg Arg Leu Leu Arg Ser Arg
260 265 270
Pro Asp Glu Ile Asp Val Asp Phe Glu Thr Arg Val Ala Pro Gly Leu
275 280 285
Arg Leu Cys Gln Arg Ile Gly Asn Ile Met Gly Ala Thr Val Leu Leu
290 295 300
Ser Leu Thr Gly Ala Val Leu Tyr Gly Asp Tyr Arg Thr Pro Gln Arg
305 310 315 320
Ile Gly Cys Phe Ser Tyr Gly Ser Gly Cys Ala Ser Glu Phe Tyr Ser
325 330 335
Gly Val Ser Thr Ala Asp Gly Gln Arg Arg Leu Gln Asp Ala Pro Ile
340 345 350
Gln Lys Ala Leu Asp Leu Arg His Lys Leu Thr Met Pro Gln Tyr Glu
355 360 365
Ala Leu Leu Glu Gly Cys Lys Ala Val Pro Phe Gly Thr Arg Asn His
370 375 380
Gln Pro Asp Leu Asp Gln Val Pro Asp Met Lys Ser Cys Ile Ala Asp
385 390 395 400
Gln Ser Ala Gln Leu Gly Tyr Gln Arg Leu Phe Leu Lys Glu Ile Lys
405 410 415
Asn Phe His Arg Glu Tyr Asp Val Leu
420 425
<210> 5
<211> 1166
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 5
Met Thr Gly Cys Gln Ser Lys Arg Ala Gly Leu Ser Pro Leu Ala Leu
1 5 10 15
Leu Leu Asn Ala Ala Gly Arg Gly Leu Phe Pro Ala Ala Gly Val Thr
20 25 30
Phe Arg Pro Asp Cys Arg Ala Glu Asp Leu Glu Ala Ser Leu Glu Pro
35 40 45
Ala Asp Phe Asn Ile Arg Pro Ala Ala Val Asp Asp Ile Asp Thr Leu
50 55 60
His Met Leu Glu Thr Val Cys Trp Pro Lys Glu Leu Gln Thr Pro Thr
65 70 75 80
Lys Thr Leu Ala Ser Arg Val Ala Ile Asp Pro Asn Gly Gln Leu Val
85 90 95
Leu Thr Leu Asp Gly Ser Pro Cys Gly Val Ile Tyr Ser Gln Arg Ile
100 105 110
Asn Ser Val Glu Ala Leu Thr Ser Ser Asp Met Asp Lys Val Asp Ser
115 120 125
Leu Arg Asp Pro Ser Gly Ser Ile Leu His Phe Leu Ala Ile Asn Ile
130 135 140
Leu Pro Ser Val Gln Asp Arg Gly Leu Gly Asp Ala Leu Leu Glu Phe
145 150 155 160
Ile Leu His Tyr Ala Ala Leu Ala Pro Gly Ile Lys Ser Ala Ala Ala
165 170 175
Val Thr Leu Cys Arg Asp Phe Thr Gly Arg Thr Leu Ser Asp Leu Asn
180 185 190
Glu Tyr Leu Arg Arg Lys Thr Pro Leu Gly Thr Val Ala Asp Pro Val
195 200 205
Leu Arg Phe His Glu Leu His Gly Gly Arg Ile Gln His Pro Val Pro
210 215 220
Asn Tyr Arg Ala Arg Asp Thr Arg Asn Leu Gly Ala Gly Val Leu Val
225 230 235 240
Thr Tyr Asp Leu Asn Lys Arg Arg Arg Ser His Ala Pro Gln Pro Arg
245 250 255
Gln Lys Ile Ala Arg Thr Asp Ile Ala Asn Arg Val Asn Ser Ala Ile
260 265 270
Arg Ser Ala Leu Gly Ser Ser Ser Asp Gln Phe Glu Lys Asp Thr Pro
275 280 285
Leu Ile Ser Met Gly Leu Asp Ser Ala Ala Ile Leu Gly Leu Ala Asp
290 295 300
Cys Leu Gln Ala Glu Cys Gly Ser Thr Leu Thr Ala Ala Gln Leu Phe
305 310 315 320
Lys His Asn Thr Ala Glu Lys Ile Ile Ala Phe Leu His Asn Glu Leu
325 330 335
Pro Ser Ser Gly Leu Ser Lys Pro Thr Leu Leu Pro Ala Gln Thr Ser
340 345 350
Cys Pro Ala Asp Gly Gly Ser Asp Gln Ser Val Ala Ile Ile Gly Val
355 360 365
Ser Leu Arg Met Pro Gly Gly Ile Glu Thr Pro Gln Ala Leu Trp Glu
370 375 380
Leu Leu Asp Leu Gly Gly Thr Val Ile Thr Pro Val Pro Ser Asp Arg
385 390 395 400
Trp Ser Trp Pro Asp Gly Phe Arg Pro Gln Gly Ala Ala Tyr Gly Gly
405 410 415
Phe Leu Gln Asp Pro Ala Arg Phe Asp Ala Ala Phe Phe Arg Ile Ser
420 425 430
Pro His Glu Ala Glu Ala Met Asp Pro Gln Gln Arg Ile Leu Leu Glu
435 440 445
Leu Ala Trp His Gly Leu Glu Asp Ala Gly Leu Ser Ala Thr Lys Leu
450 455 460
Ala Gly Ser Ser Thr Gly Val Phe Val Gly Ala Ser Gly Ser Asp Tyr
465 470 475 480
Gln Arg Ala Met Asp Ala Ala Gly Val Pro Val Gln Pro His His Ser
485 490 495
Thr Gly Ala Ala Leu Ser Val Ile Ala Asn Arg Leu Ser Tyr Ala Leu
500 505 510
Asp Phe Thr Gly Pro Ser Leu Val Val Asp Thr Ala Cys Ser Ser Ser
515 520 525
Leu Val Ala Val His Gln Ala Val Ala Ala Leu Gln Glu Arg Thr Cys
530 535 540
Gly Leu Ala Leu Ala Ala Gly Ile Asn Leu Ile Leu His Pro Ala Thr
545 550 555 560
Ser Gln Ala Tyr Gln Ser Ala Gly Met Leu Ser Pro Ser Gly Leu Cys
565 570 575
Arg Ser Phe Gly Ser Gly Ala Asp Gly Tyr Val Arg Ser Glu Gly Ala
580 585 590
Val Leu Leu Val Leu Lys Pro Leu Ala Gln Ala Leu Ala Glu Gly Cys
595 600 605
Arg Val His Ala Val Ile Arg Gly Ser Ala Cys Asn His Gly Gly Met
610 615 620
Thr Ser Gly Leu Thr Val Pro Ser Pro Asp Lys Gln Thr Glu Leu Leu
625 630 635 640
Ser Ala Ala Trp His Asn Ala Asp Ile Lys Pro Ala Asp Leu Asp Tyr
645 650 655
Leu Glu Ala His Gly Thr Gly Thr Lys Leu Gly Asp Pro Ile Glu Ile
660 665 670
Glu Gly Met Lys Thr Ala Leu Ala Glu Phe Asp Asp Ser Gln Pro Asn
675 680 685
Pro Pro Glu Gln His Ala Cys Leu Thr Gly Ser Val Lys Ser Asn Leu
690 695 700
Gly His Leu Glu Ala Ala Ala Gly Leu Ala Gly Leu Cys Lys Val Met
705 710 715 720
Leu Ala Leu Arg His Glu Arg Leu Pro Ala Ser Leu Asn Ala Ser Pro
725 730 735
Gln Asn Pro Glu Ile Ser Leu Asn Gly Ser Asn Leu Ala Ile Ala Asp
740 745 750
Thr Ala Arg Asp Trp Pro Lys Gly Asn Arg Pro Arg Ile Ser Gly Val
755 760 765
Ser Ser Phe Gly Ser Gly Gly Thr Asn Ala His Ile Val Val Ala Glu
770 775 780
Pro Pro Asp Ala Pro Asp Gly Val Ile Asp Thr Gly Pro Gln Leu Phe
785 790 795 800
Val Leu Ser Ala Asn Thr Pro Glu Arg Leu Met Ala Leu Ala Val His
805 810 815
Trp Gln Glu Trp Leu Lys Lys Gln Pro His Asp Leu Asn Ile Pro Ala
820 825 830
Leu Cys His Ala Ser Arg His Arg Arg Ala Ala Leu Pro Ala Arg Phe
835 840 845
Ala Thr Lys Val Ser Ser Arg Ala Asp Leu Glu Lys Ala Leu His Gln
850 855 860
Ala Ala Gln Lys Asn Pro Ala Ser Ser Gln Ala Lys Pro Lys Phe Leu
865 870 875 880
Glu His Leu Lys Gly Asp Ala Gly Gln Ala Phe Leu Gln Ala Leu Ala
885 890 895
Lys Glu Gly Asp Leu Ser Ala Leu Ala Asp Leu Trp Cys Ala Gly Val
900 905 910
Pro Val Asp Trp Ser Leu Ile Asp Ser Thr Pro Pro Glu Gln Pro Val
915 920 925
Pro Trp Ile Asp Leu Pro Leu Tyr Pro Phe Asp Lys Thr Arg Phe Trp
930 935 940
Ala Leu Gly Lys Ala Pro Ala Val Pro Gln Asp Arg Ala Ala Ala Thr
945 950 955 960
Ala Glu Leu Tyr Ala Pro Val Trp Gln Glu Leu Ala Ala Ser Lys Thr
965 970 975
Gln Met Pro Glu Pro Asp Leu Leu Ser Gly Pro Phe Ala Leu Lys Ala
980 985 990
Ala Gln Leu Leu Lys Leu Asp Pro Ser Glu Ser Arg Asn Ser Glu Thr
995 1000 1005
Asn Ala Ile Gly Glu Asn Met His Val Leu Trp Ser Ser Ala Pro Arg
1010 1015 1020
Pro Ser Asp Ser Gly Glu Thr Leu Glu Glu Phe Arg Glu Phe Gln Asp
1025 1030 1035 1040
Phe Val Ala Gly Leu Pro Arg Gln Leu Ser Arg Leu Arg Leu Thr Val
1045 1050 1055
Val Thr Trp Asn Gly Gln Ala Val Tyr Gly Asn Glu Pro Val Asp Ala
1060 1065 1070
Glu Ala Ala Ala Ile Ser Ala Phe Thr His Val Leu Ala Gln Glu Lys
1075 1080 1085
Pro Glu Trp Asp Ile Arg Thr Phe Asp Leu Asp Ser Cys Asp Pro Pro
1090 1095 1100
Ser Trp Ser Ser Leu Ala Glu Ser Asn Glu Thr Arg Ser Ala Val Arg
1105 1110 1115 1120
Ala Gly Lys Ala Tyr Gly Leu Arg Leu Ala Met Ala Asp Pro Leu Pro
1125 1130 1135
Asp Thr Gly Gln Ser His Leu Arg Glu Asp Gly Val Tyr Val Val Ile
1140 1145 1150
Gly Gly Ala Gly Ala Leu Ala Arg Pro Gly Val Lys Arg Phe
1155 1160 1165
<210> 6
<211> 3219
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 6
Met Ile His Ala Ile Thr Gly Pro Ser Asp Gln Pro Ile Leu Asp Ser
1 5 10 15
Glu Pro Glu Asn Leu Thr Arg Val Met Ala Ala Lys Thr His Gly Leu
20 25 30
Ile Gln Thr Ala His Thr Phe Ala Ala Leu Asp Leu Asp Phe Phe Leu
35 40 45
Val Phe Ser Ser Ile Ile Ser Leu Glu Gln Pro Gly Gly Phe Gly Gly
50 55 60
Tyr Ala Ala Ser Cys Ala Phe Ala Asp Ala Phe Val Arg Gly Leu Asp
65 70 75 80
Ser Gln Thr Pro Tyr Pro Val Arg Cys Leu Asn Trp Gly His Trp Asp
85 90 95
Val Gly Val Ala Arg Asn Leu Pro Glu Ala Thr Lys Ile Arg Leu Asp
100 105 110
Asn Ala Gly Val Val Pro Ile Thr Ala Gln Asp Ala Leu Lys His Cys
115 120 125
Asp Thr Ala Leu Asn Ala Pro Leu Pro Gln Leu Ala Ile Leu Lys Trp
130 135 140
Asn Asp Pro Ala Arg His Pro Leu Val Asp Ser Gln Val His Met Arg
145 150 155 160
Leu Ser Arg Lys Ala Pro Ala Arg Ser Leu Pro Ala Ala Thr Asn Glu
165 170 175
Leu Asn Thr Arg Leu Gln Glu Ile Glu Arg His Gly Leu Phe Ala His
180 185 190
Pro Glu Leu Glu Ala Ala Leu Pro Gly Ala Ile Ala Ala Glu Leu Asp
195 200 205
Arg His Gly Leu Arg Thr Ser Leu Pro Asp Thr Ala Pro Trp Tyr Leu
210 215 220
Arg Arg Trp His Lys Ala Thr Lys Arg Leu Leu Ala Gln Gly Asn Thr
225 230 235 240
Gly Glu Asn Trp Asp Ala Thr Ala Arg Arg Leu Arg Ala Asp Ala Asp
245 250 255
Leu Ala Pro Ala Ile Asn Leu Val Thr Ala Cys Leu Ala Arg Leu His
260 265 270
Glu Val Leu Thr Gly Gln Thr Pro Ala Thr Asp Val Leu Phe Pro Gly
275 280 285
Ala Ser Leu Asp Leu Leu Glu Pro Val Tyr Arg Gly Thr Ala Ser Ala
290 295 300
Asp Leu Leu Asn Asp Val Leu Ala Asp Thr Leu Ala Glu Thr Leu Arg
305 310 315 320
Ala Asp Leu Arg Asp Gln Pro Glu Asn Thr Ser Leu Arg Val Leu Glu
325 330 335
Ile Gly Ala Gly Thr Gly Gly Thr Thr Ala Arg Val Leu Pro Cys Leu
340 345 350
Ser Glu Leu Ala Gly Gln Ile Glu Thr Tyr Asp Tyr Thr Asp Leu Ser
355 360 365
Arg Ala Phe Leu Gln His Ala Gln Gln Ala Phe Ala Pro Ser Ala Pro
370 375 380
Phe Leu Lys Ser Leu Arg Phe Asp Val Glu Lys Ser Pro Glu Ser Gln
385 390 395 400
Gly Leu Gln Pro Gly Ser Tyr Asp Ala Val Leu Ala Thr Asn Val Leu
405 410 415
His Ala Thr Pro Asp Ile Arg Gln Thr Leu Arg His Thr His Ala Leu
420 425 430
Leu Lys Pro Gly Gly Val Leu Leu Leu Asn Glu Ile Val Thr Pro Ser
435 440 445
Val Phe Ala His Ala Thr Phe Gly Leu Leu Glu Gly Trp Trp Lys Ser
450 455 460
Cys Asp Pro Gly Leu Arg His Pro Asp Thr Pro Leu Leu Ser Ala Glu
465 470 475 480
Ser Trp Glu Lys Leu Leu Leu Ala Asn Gly Phe Thr Ala Val Glu Met
485 490 495
Leu Leu Asn Ser Ser Thr Ala Leu Gly Gln Gln Val Phe Ala Ala Arg
500 505 510
Ser Asp Gly Cys Phe Glu Tyr Arg Lys Ala Glu Ile Asp Thr Thr Arg
515 520 525
Arg Gln Pro Glu Thr Leu Glu Pro Arg Ile Leu Lys Asn Thr Val Ser
530 535 540
Glu Leu Pro Leu Glu Asp Leu Glu Asn Pro Gln Ala Ala Ala Ala Arg
545 550 555 560
Leu Leu Thr Glu Ile Val Ala Ser Ala Leu Gln Ile Thr Glu Asp Gln
565 570 575
Leu Asp Pro Trp Thr Pro Leu Gly Asp Tyr Gly Leu Asp Ser Ile Leu
580 585 590
Asn Ala Gln Val Thr Ala Arg Leu Arg Glu Leu Val Pro Asp Leu Asp
595 600 605
Thr Thr Phe Leu Tyr Gln Tyr Gln Thr Ile Ala Asp Leu Ser Gln Ala
610 615 620
Leu Val Gln Lys His Pro Glu Ala Phe Glu Gln Ile Gly His Thr Thr
625 630 635 640
Cys Gly Glu Ala Asp Val Ala Ser Pro Ser Thr Val Ser Ala Ser Lys
645 650 655
Arg Thr Ala Gly Asn Glu Gln Gln Asp Ile Ala Ile Val Gly Met Ser
660 665 670
Phe Arg Phe Pro Lys Ala Asp Thr Pro Glu Glu Phe Trp Thr Leu Leu
675 680 685
Ser Gln Gly Gln Ser Ala Val Thr Glu Ile Pro Pro Asp Arg Trp Gln
690 695 700
Leu Asp Gly Phe Tyr Glu Ser Asp Pro Asp Lys Ala Val Asp Gly Trp
705 710 715 720
Lys Ser Tyr Ser Lys Trp Gly Ala Phe Leu Glu Arg Val Thr Ala Phe
725 730 735
Asp Pro Leu Phe Phe Gly Ile Asn Pro Lys Glu Ala Ala Ala Ile Asp
740 745 750
Pro Gln Glu Arg Leu Phe Leu Gln Thr Ala Trp Ala Ala Leu Glu Asp
755 760 765
Ala Gly Phe Pro Arg Gln Arg Leu Ala Asp Glu Leu Ala Arg Ser Val
770 775 780
Gly Val Phe Val Gly Ile Thr Arg Thr Gly Phe Asp Leu Phe Gly Pro
785 790 795 800
Asp Leu Trp Gln Ala Gly Gln Lys Val Tyr Pro His Thr Ser Phe Ser
805 810 815
Ser Ala Ala Asn Arg Leu Ser Trp Phe Leu Asp Ala Asp Gly Pro Ser
820 825 830
Met Pro Val Asp Thr Met Cys Ser Ser Ser Leu Thr Ala Leu His Gln
835 840 845
Ala Cys Ala Ser Leu Lys Thr Gly Glu Cys Arg Leu Ala Ile Ala Gly
850 855 860
Gly Val Asn Leu Phe Leu His Pro Thr Ser Tyr Ile Gly Leu Ser Ala
865 870 875 880
Met Arg Met Leu Ser Pro Asp Gly Arg Cys Ser Ser Phe Gly Ala Gly
885 890 895
Gly Asn Gly Phe Val Pro Gly Glu Gly Val Ala Ala Leu Val Leu Arg
900 905 910
Pro Leu Ala Glu Ala Gln Ala Ala Gly Asp Gln Val Ile Gly Val Ile
915 920 925
Arg Gly Ser Ala Val Asn His Gly Gly Arg Thr Asn Gly Phe Thr Val
930 935 940
Pro Asn Pro Arg Ala Gln Ser Ser Leu Val Arg Glu Ala Met Ser Arg
945 950 955 960
Ala Gly Leu Glu Pro Gly Gln Ile Ser Tyr Leu Glu Ala His Gly Thr
965 970 975
Gly Thr Glu Met Gly Asp Pro Ile Glu Ile Thr Gly Leu Thr Glu Ala
980 985 990
Phe Ala Gly Arg Glu Gln Gly Leu Ala Pro Cys Ala Ile Gly Ser Ile
995 1000 1005
Lys Thr Asn Ile Gly His Leu Glu Ala Thr Ala Gly Leu Ala Gly Val
1010 1015 1020
Ile Lys Val Leu Leu Gln Met Arg His Arg Gln Ile Val Pro Ser Leu
1025 1030 1035 1040
His Ser Ser Ser Leu Asn Pro Lys Ile Asp Phe Glu His Ala Pro Phe
1045 1050 1055
Arg Val Ala Gln Asp Leu Thr Pro Trp Ser Pro Ala Lys Gly Arg Arg
1060 1065 1070
Ile Ala Gly Val Ser Ser Phe Gly Ala Gly Gly Thr Asn Ala His Val
1075 1080 1085
Ile Leu Glu Glu Ala Pro Asp Ile Pro Glu Lys Ser Ala Thr Asp Pro
1090 1095 1100
Ala Pro Asn Glu Pro Ile Ala Leu Val Leu Ser Ala His Asp Glu Pro
1105 1110 1115 1120
Arg Leu Arg Ala Tyr Ala Ala Arg Leu Ala Lys Phe Leu Thr Ser Pro
1125 1130 1135
Asn Ala Pro Pro Leu Ala Leu Ala Ala Gln Ser Leu Gln Leu Gly Arg
1140 1145 1150
Glu Pro Met Arg His Arg Met Ala Ala Val Val Ser Asp Lys Ala Gln
1155 1160 1165
Ala Val Ala Val Leu Gln Ala Val Ala Glu Asn Arg Pro Leu Pro Asp
1170 1175 1180
Lys Thr Phe Leu Arg Asp Thr Arg Arg Tyr Lys Gly Gln Cys Pro Ser
1185 1190 1195 1200
Ser Val Glu Ser Glu Asp Leu Gly Glu Leu Thr Asp Ala Trp Ser Lys
1205 1210 1215
Gly Ser Lys Ile Asp Trp Ala Lys Leu His Gln Arg Arg Gln Thr Val
1220 1225 1230
Ser Leu Pro Thr Tyr Pro Phe Asp Glu Lys Pro Tyr Trp Phe Ala Asp
1235 1240 1245
Thr Ala Pro Val Gly Gly Pro Met Asp Val Pro Ser Ser Glu Asp Ala
1250 1255 1260
Phe Arg Glu Leu Lys Pro Ala Ser Arg Pro Ser Pro Val Arg Arg Thr
1265 1270 1275 1280
Leu Pro Arg Leu Asp Thr Ala Pro Ala Gln Phe Glu Pro His Arg Arg
1285 1290 1295
Ser Gln Lys Leu Arg Leu Ser Ser Leu Asn Pro Ala Ser Glu Thr Pro
1300 1305 1310
Pro Ala Glu Ile Glu Leu Asp Ile Asn Gly Ile Gly Arg Val Arg Leu
1315 1320 1325
Glu Pro Ala Ser Pro Pro Pro Asn Leu Ser Thr Gly Asn Ala Met Lys
1330 1335 1340
Val Leu Val Val Glu Gly Leu Gln His Trp Asn Gly Asp Arg Leu Gly
1345 1350 1355 1360
Leu Leu His Glu Leu Asp Gln Leu Ser Gln Pro Val Ile Leu Thr Val
1365 1370 1375
Ser Ala Ser Ser Leu Pro Pro Ile Pro Asp Thr Leu Leu Thr Ala Pro
1380 1385 1390
Ala Phe Glu Gln Ala Gln Glu Met Ala Asn Ala Thr Ala Arg Cys Pro
1395 1400 1405
Ala Ala Thr Leu Ala Thr Leu Lys Asn His Ile Arg Asn Gln Pro Ser
1410 1415 1420
Trp Pro Asp Ile Ala Gly Ile Pro Ala Glu Trp Met Ala Gly Ser Gly
1425 1430 1435 1440
Trp Pro Val Ser Ser Pro Glu Pro Ala Pro Ser Gly Gly Ala Ile Pro
1445 1450 1455
Leu Gln Ser Glu Val Val Gln Leu His Asp Met Gly Gly Gly Val Ala
1460 1465 1470
Gln Ile Thr Met Ala Glu Arg Asp Ala Gln Asn Thr Phe Thr Pro Ala
1475 1480 1485
Phe Val Thr Gly Val Leu Glu Ala Phe Asp Lys Val Glu Ser Ser Ala
1490 1495 1500
Ala Phe Lys Val Val Val Leu Thr Gly Tyr Glu Ala Tyr Phe Ala Cys
1505 1510 1515 1520
Gly Gly Thr Arg Glu Gly Leu Leu Ala Ile Gln Asn Gly Gln Ala Arg
1525 1530 1535
Phe Thr Asp Glu Gln Ser Tyr Ala Arg Pro Leu Arg Cys Pro Ile Pro
1540 1545 1550
Val Ile Ala Ala Met Gln Gly His Gly Ile Gly Ala Gly Trp Ala Met
1555 1560 1565
Gly Leu Tyr Cys Asp Leu Ala Ile Tyr Ser Glu Glu Ser Cys Tyr Gln
1570 1575 1580
Ser Pro Tyr Met Leu Tyr Gly Phe Thr Pro Gly Ala Gly Ala Thr Thr
1585 1590 1595 1600
Leu Phe Pro Ala Arg Leu Gly Arg Gln Leu Ala Asn Glu Ile Leu Phe
1605 1610 1615
Thr Ala Gln Ser Phe Pro Gly His Ile Leu Ala Gln Lys Gly Leu Thr
1620 1625 1630
Ala Pro Val Leu Pro Arg Glu Glu Val Leu Pro Gln Ala His Ala Leu
1635 1640 1645
Ala Arg Ser Ile Ala Gln Asn Pro Arg Glu Thr Leu Met Ala Arg Lys
1650 1655 1660
Ser Thr Gln Thr Ala Glu Phe Leu His Met Leu Pro Arg Leu Phe Glu
1665 1670 1675 1680
Ala Glu Leu Ala Leu His Glu Ser Thr Phe Val Gly Asn Ser Asp Val
1685 1690 1695
Leu Glu Gln Ile Ser Glu His Phe Ala Asp Lys Gln Met Thr Gln Lys
1700 1705 1710
Pro Gly Ala Ser Gln Lys Glu Ala Arg Asn Thr Ser Ala Leu Lys Thr
1715 1720 1725
Gln Leu Arg Met Met Leu Ala Glu Glu Leu Asp Ile Pro Pro Asp Arg
1730 1735 1740
Ile Asp Asp Asp Thr Pro Phe Val Asp Leu Gly Leu Glu Ser Ile Ala
1745 1750 1755 1760
Ala Val Ile Trp Val Arg Lys Ile Gly Glu Glu Leu Gly Ala Gln Ile
1765 1770 1775
Gly Ala Thr Ser Val Tyr Ser His Pro Asn Leu Ala Ala Phe Thr Glu
1780 1785 1790
Leu Val Ala Glu Lys Gly Gly Gln Leu Ala Glu Ala Val Asn Lys Thr
1795 1800 1805
Thr Ala Pro Pro Ser Glu Pro Pro Lys Ala Ala Ile Pro Ala Asp Pro
1810 1815 1820
Glu Glu Arg Leu Leu Pro Ser Asp Ser Ser Asp Leu Phe Val Trp Leu
1825 1830 1835 1840
Gln Ala Ser Leu Glu Thr Glu Leu Ser Ile Pro Ser Gly Thr Leu Asp
1845 1850 1855
Pro Asp Arg Pro Phe Val Glu Leu Gly Leu Asp Ser Val Thr Ala Val
1860 1865 1870
Thr Trp Ile Arg Gln Val Asn Asp Ala Leu Gly Thr Lys Glu Thr Gly
1875 1880 1885
Thr Val Val Tyr His His Thr Asn Leu Thr Glu Leu Ala Ala Tyr Leu
1890 1895 1900
Ala Gly Ile Ala Gly Lys Thr Pro Thr Thr Arg Thr Thr Ser Leu Pro
1905 1910 1915 1920
Tyr Lys Leu Glu Ala Pro Val Arg Ser Ala Leu Pro Arg Leu Glu Asn
1925 1930 1935
Leu Ala Pro Phe Gln Asp Glu Arg Pro Gly Ile Ala Ile Val Gly Met
1940 1945 1950
Ala Gly Arg Phe Pro Glu Ala Pro Asn Val Ser Ser Phe Trp Gln Asn
1955 1960 1965
Val Leu Ala Gly Arg Asp Cys Val Tyr Glu Ile Pro Ala Thr Arg Trp
1970 1975 1980
Ser Ile Asp Ala Tyr Tyr Asp Pro Asp Arg Gln Ala Pro Gly Lys Thr
1985 1990 1995 2000
Val Cys Arg Arg Met Gly Ala Ile Glu Asp Ile Asp Ala Phe Asp Ser
2005 2010 2015
Leu Phe Phe Gly Ile Ser Pro Ala Glu Ala Glu Leu Met Asp Pro Gln
2020 2025 2030
Gln Arg Leu Phe Leu Glu Thr Ala Trp Glu Ala Ile Glu Asp Ala Gly
2035 2040 2045
His Ala Pro Ser Thr Leu Ala Gly Thr Arg Cys Gly Leu Phe Val Gly
2050 2055 2060
Thr Glu Asn Gly Asp Tyr Ala Arg Ile Ala Gly Asp Ala Lys Pro Glu
2065 2070 2075 2080
Ala Leu Ala Leu Thr Gly Arg Ser Val Ala Met Leu Pro Ala Arg Ala
2085 2090 2095
Ala Tyr Ala Leu Asp Leu Gln Gly Pro Cys Leu Ala Ile Asp Thr Ala
2100 2105 2110
Cys Ser Ala Ser Leu Val Ala Ile Ala Gln Ala Cys Ala Ser Leu His
2115 2120 2125
Asp Arg His Cys Asp Ser Ala Leu Ala Gly Gly Val Asn Val Leu Thr
2130 2135 2140
Gly Pro Glu Ile His Val Ala Met Ser His Ala Gly Met Leu Ser Pro
2145 2150 2155 2160
Ser Gly Lys Cys Asn Ser Phe Asp Ser Arg Ala Asp Gly Phe Val Pro
2165 2170 2175
Gly Glu Gly Val Gly Ala Leu Leu Leu Lys Arg Leu Glu Asp Ala Gln
2180 2185 2190
Ala Asn Gly Asp Asp Val Tyr Ala Val Ile Arg Gly Trp Gly Val Asn
2195 2200 2205
Gln Asp Gly Arg Thr Asn Gly Ile Thr Ala Pro Asn Pro Ala Ala Gln
2210 2215 2220
Thr Arg Leu Gln Thr Glu Leu Tyr His Arg Phe His Ile Asp Pro Ala
2225 2230 2235 2240
Arg Ile Gly Met Val Glu Ala His Gly Thr Gly Thr Ala Leu Gly Asp
2245 2250 2255
Pro Ile Glu Val Glu Ala Leu Lys Arg Ser Phe Ala Gln Phe Thr Asp
2260 2265 2270
Arg Lys Asn Tyr Cys Ala Leu Gly Ser Val Lys Ser Asn Ile Gly His
2275 2280 2285
Leu Ala Thr Ala Ala Gly Val Ala Gly Ala Ile Lys Ala Thr Leu Ala
2290 2295 2300
Leu Lys His Arg Lys Ile Pro Ala Ser Ile His His Asp Gln Leu Asn
2305 2310 2315 2320
Pro His Ile Asp Leu Lys Asp Ala Pro Phe Tyr Val Pro Arg Thr Ala
2325 2330 2335
Ala Asp Trp Thr Ala Gly Pro Asp Ala Pro Gln Tyr Ala Ala Val Ser
2340 2345 2350
Ser Phe Gly Tyr Ser Gly Thr Asn Ala His Leu Val Leu Glu Ala Ala
2355 2360 2365
Pro Ala Arg Pro Val Pro Val Thr Gln Thr Gln Ala Val Ile Val Pro
2370 2375 2380
Val Ser Ala Arg Ser Leu Glu Cys Leu Thr Glu Ala Val Thr Arg Leu
2385 2390 2395 2400
Ser Thr Tyr Leu Gly Thr Gly Ala Gly Gln Thr Val Pro Leu Ala Asp
2405 2410 2415
Leu Ala Leu Thr Tyr Gln Thr Gly Arg Asp Thr Phe Asp Gln Arg Val
2420 2425 2430
Ala Phe Leu Ala Asp Ser His Asp Ser Leu Arg Ala Gly Leu Glu Gln
2435 2440 2445
Phe Leu Asn Glu Pro Glu His Ala Gly Gly Val Val Tyr Ser Asn Asp
2450 2455 2460
Met Pro Pro Thr Leu Arg Asp Thr Ala Thr Ala Trp Ile Glu Gly Lys
2465 2470 2475 2480
Thr Ile Ala Trp Pro Val Val Ala Gly Ala Ser Arg Arg His Gly Cys
2485 2490 2495
Pro Thr Tyr Pro Phe Ala Lys Glu Arg His Trp Val Ser Asp Ala Pro
2500 2505 2510
Val Glu Leu Pro Glu Ala Ala Pro Ile Pro Ser Lys Glu Thr Pro Leu
2515 2520 2525
Gln Pro Glu Ala Glu Asp Thr Ala Val Asp Pro Asp Trp Arg Glu Arg
2530 2535 2540
Leu Lys Gln Arg Phe Ala Arg Pro Ile Thr Leu Leu Ser Asp Asp Pro
2545 2550 2555 2560
Lys Trp Ile Gly Ser Met Ala Ser Leu Leu Ser Ala Leu Gly Ala Ala
2565 2570 2575
Pro Gly Gly Pro Gly Gln Pro Asp Leu Arg Ile Lys Ser Asn Leu Arg
2580 2585 2590
Glu Ala Glu Gly Ser Val Phe Cys Asp Thr His Leu Gly Thr Arg Leu
2595 2600 2605
Pro Gly Asn Glu Gln Val Asp Leu Leu Ile Leu Thr Glu Leu Pro Ser
2610 2615 2620
Asp Pro Gly Leu Ile Pro Gln His Ala Leu Ile Val Ser Asp Asp Asn
2625 2630 2635 2640
Arg Asp Asp Ile Glu Ser His Cys Gln Arg Leu Ile Gln Glu Trp Leu
2645 2650 2655
Arg Leu Glu Pro Asp Gly Ser Lys Asp Thr Leu His Val Gln Phe Arg
2660 2665 2670
Asn Gly Arg Arg Leu Val Ala Ala Lys Pro Leu Asp Pro Ala Asp Gly
2675 2680 2685
Ala Cys Ile Leu Arg Lys Thr Trp Gln Arg Thr Pro Leu Ala Asp Gln
2690 2695 2700
Lys Thr Ala Pro Ser Asp Lys Asn Val Cys Leu Ile Gly Arg Gly Pro
2705 2710 2715 2720
Lys Phe Glu Ala Leu Ala Ser Gly Leu Glu Ala His Phe Gln Ser Val
2725 2730 2735
Thr Leu Arg Asp Thr Pro Pro Glu Gly Ala Met Ala Ala Trp Asp Val
2740 2745 2750
Phe Ile Asp Ala Ala Ala Leu Thr Glu Val Arg Asp Asn Asp Pro Asp
2755 2760 2765
Asp Pro Asp Arg Arg His Trp Ile Gln Ser Leu Met Arg Glu Gly Arg
2770 2775 2780
Asp Leu Asn Leu Leu His Leu Thr Cys Asp Val Ile Pro Phe Arg Ser
2785 2790 2795 2800
Val Ser Arg Asn Leu Ala Gly Ala Arg Gln Ala Gly Leu Val Lys Asn
2805 2810 2815
Leu Arg Ala Glu Tyr Arg Phe Ala Glu Ser Arg Trp Leu Asp Leu Asp
2820 2825 2830
Met Ala Gln Val Ala Asp Thr Ala Gly Leu Ala Lys Leu Ile Ala Ala
2835 2840 2845
Glu Cys Ala Ser Ala Gly Pro Val Ser Glu Val Cys Tyr Arg Gly Gly
2850 2855 2860
Ala Arg Phe Ala Pro Val Leu Glu Ala Pro Glu Pro Val Ala Ser Pro
2865 2870 2875 2880
Ser Val His Leu Asn Ala Glu Gly Leu Tyr Leu Ile Ser Gly Gly Thr
2885 2890 2895
Arg Gly Val Gly Leu Thr Leu Ala Gln Asp Leu Ala Ala Gln Gly Ala
2900 2905 2910
Arg His Leu Ala Leu Ile Gly Glu Thr Pro Leu Pro Pro Met Gln Asp
2915 2920 2925
Trp Pro Ser Leu Ile Ala Ala Ala Asp Thr Pro Ala Glu Ile Arg Ser
2930 2935 2940
Gln Leu Ser Ile Leu Gln Ala Leu Ser Asp Gln Leu Glu Thr Leu Glu
2945 2950 2955 2960
Ile Leu His Ala Cys Val Ser Asp Ala Ala Lys Val Ser Ala Trp Leu
2965 2970 2975
Ser Ser Leu Arg Lys Arg Gly Leu Pro Leu Ser Gly Val Ile His Ala
2980 2985 2990
Ala Gly Arg Tyr Ser Glu Val Asp Pro Pro Gly Phe Ala Ala Lys Ser
2995 3000 3005
Ala Asp His Met Arg Ala Val Leu Thr Ala Lys Ala Asp Gly Leu Glu
3010 3015 3020
Thr Leu His Ser Leu Thr Lys Asn Asp Pro Leu Ser Phe Leu Leu Val
3025 3030 3035 3040
Leu Thr Ser Ile Thr Gly Leu Val Pro His Phe Ala Arg Gly Ala Leu
3045 3050 3055
Asp Tyr Ala Met Ala Asn Ala Tyr Ala Asp Leu Phe Ala Ala Lys Ala
3060 3065 3070
His Glu Leu Asp Gly Gly Arg Thr Arg Ser Thr Ile Leu Ser Asp Trp
3075 3080 3085
Thr Gln Ser Gly Ala Phe Cys Arg Val Arg Pro Glu Lys Ala Lys Ser
3090 3095 3100
Val Gln Lys Asn Phe Asp Gln Ile Gly Leu Lys Thr Leu Ser Asp Ala
3105 3110 3115 3120
Glu Gly Cys Ala Leu Ile Arg Arg Ala Leu Ser Pro Thr Ala Glu Thr
3125 3130 3135
Gly Thr Ile Leu Gly Leu Ile Ala Glu Asp Arg Phe Ala Ala Ala Arg
3140 3145 3150
Pro Gly Leu Leu Leu Ala Gly Thr Leu Asn Asp Glu Ala Leu Asp Met
3155 3160 3165
Asn Thr Gln Leu Ala Arg Trp Glu Lys Ile Arg Ser Arg Gly Asp Leu
3170 3175 3180
Val Thr Ile Glu Asp Val Thr Ser Val Ile Gly Leu Glu Gln Ile Arg
3185 3190 3195 3200
Glu Leu Pro Pro Arg Lys Cys Phe Ala Ser Thr Gly Ser Cys Leu Ala
3205 3210 3215
Pro Leu Lys
<210> 7
<211> 97
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 7
Met Leu Arg Leu His Arg Ile Met Leu Gly Pro Thr Glu Val Val Pro
1 5 10 15
Pro Glu Ala Glu Asp Glu Ser Leu Pro Asp Met Ile Ala Gly Ile Val
20 25 30
Cys Asn Val Leu Lys Leu Lys Glu Ile Asp His Asn Thr Pro Leu Gln
35 40 45
Asn Tyr Gly Leu Asp Ser Ile Ser Gly Met Ile Leu Ser Thr Arg Leu
50 55 60
Glu Ile Ala Leu Asp Met Thr Val Asp Pro Arg Thr Leu Ile Asp His
65 70 75 80
Pro Ser Ile Ala Ala Leu Ser Ala Tyr Ile Gln Lys Ala Arg Glu Ala
85 90 95
Ala
<210> 8
<211> 373
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 8
Met Ser Gln Ser Ile Glu Glu Leu Leu Gly Val Asp Thr Leu Pro Lys
1 5 10 15
Pro Ser Arg Arg Gln Asn Met Arg Phe Ser Cys Leu Phe Phe Ser Asp
20 25 30
Val Arg Thr Asp Ile Ser Tyr Ala Glu Lys Tyr Arg Phe Leu Gly Asp
35 40 45
Val Thr Arg Phe Ala Asp Gln Thr Gly Phe Glu Ala Val Tyr Phe Pro
50 55 60
Glu Arg His Phe His Glu Phe Gly Ser Val Phe Ala Asn Pro Ala Ile
65 70 75 80
Ala Ala Ala His Leu Ile Pro Gln Thr Gln Asn Ile Arg Phe Arg Thr
85 90 95
Ala Gly Val Thr Ile Pro Leu His His Pro Ala Glu Ile Val Glu Trp
100 105 110
Trp Ala Met Asn Asp Val Leu Ser Gly Gly Arg Val Asp Leu Gly Phe
115 120 125
Gly Ser Gly Trp Ala Lys Gly Asp Phe Ile Tyr Ala Pro Glu Asn Phe
130 135 140
Glu Asp Arg Arg Lys Ile Cys Ser Asp Gly Ile Glu Thr Ile Lys Arg
145 150 155 160
Leu Trp Arg Gly Glu Thr Leu Ala Phe Pro Gly Pro Gly Gly Asp Val
165 170 175
Val Asp Ile Thr Val Tyr Pro Arg Pro Ile Gln Ser Asp Leu Ala Val
180 185 190
Trp Leu Leu Ile Thr Gln Asn Glu Asp Ala Phe Ile His Ala Gly Lys
195 200 205
Met Gly Tyr Asn Val Phe Thr Met Leu Tyr Gly Thr Asn Leu Glu Asn
210 215 220
Leu Ser Gln Lys Ile Ala Leu Tyr Arg Lys Ala Arg Gln Glu Ala Gly
225 230 235 240
His Asp Pro Val Ser Gly Arg Val Thr Leu Thr Leu His Thr Leu Leu
245 250 255
Leu Asp Thr Met Asp Ser Val Leu Ala Ala Ile Glu Val Pro Phe Arg
260 265 270
Gln Tyr Ile Gln Ser Ser Leu Asn Ala His Val Asn Ala Gly Ala Val
275 280 285
Thr Gly Ala Ser Ala Asp Leu Ser Asp Ala Asp Arg Ala Lys Val Leu
290 295 300
Asp Tyr Ala Tyr Gln Arg Tyr Val Arg Thr Gly Ala Leu Phe Gly Thr
305 310 315 320
Pro Asp Thr Ala Lys Asp Met Val Asp Glu Val Ile Ala Ala Asp Val
325 330 335
Asp Glu Ile Ala Cys Leu Met Asp Phe Gly Ala Asp Tyr Asp Ile Val
340 345 350
Arg His Gly Phe Thr His Leu Ala Gln Leu Ala Gln His Tyr Ser Ser
355 360 365
Pro Leu Leu Thr Pro
370
<210> 9
<211> 318
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 9
Met Ala Ser Glu Leu Lys Asp Leu Arg Gln Arg Leu Val Asp Arg Leu
1 5 10 15
Ser Ala Thr Val Glu Gln Lys Ile Ser Ser Ile Gly Tyr Val Pro Glu
20 25 30
Asp Leu Val Arg Ile Ala Gly Ser Gly Val Pro Ala Glu Pro Ser His
35 40 45
Asp Glu Val Tyr Lys Ala Pro Glu Asp Leu Lys Glu Ala Ile Asn Glu
50 55 60
His Tyr Asp Phe Ser Phe Tyr Ala Arg Glu Thr Ile Trp Ala Asp Met
65 70 75 80
Leu Ala Gly Thr His Phe Arg Asn Ile Gly Tyr Trp Asp Ala Asn Thr
85 90 95
Glu Ser Leu Asp Gln Ala Gly Arg Asn Leu Gln Asp Gln Leu Leu Ala
100 105 110
Leu Leu Pro Gln Lys Thr Gly Arg Ile Leu Asp Val Ala Cys Gly Met
115 120 125
Gly Ala Ser Thr Lys Arg Leu Leu Asp Thr Tyr Arg Pro Glu Asp Val
130 135 140
Trp Ala Ile Asn Ile Ser Ala Lys Gln Ile Glu Thr Thr Ser Gln Asn
145 150 155 160
Ala Pro Gly Cys Asn Ala Gln Val Met Ser Ala Thr Glu Met Thr Phe
165 170 175
Glu Asp Asn Phe Phe Asp Ala Val Glu Cys Ile Glu Ala Ala Phe His
180 185 190
Phe Asp Thr Arg Arg Lys Phe Leu Glu Asp Thr Leu Arg Ile Leu Lys
195 200 205
Pro Gly Gly Arg Leu Val Met Ser Asp Val Leu Met Thr Ser Gly Ala
210 215 220
Arg Leu Glu Gln Tyr Pro Val Phe Pro Asn Pro Glu Asn His Ile Ala
225 230 235 240
Thr Ile Glu Asp Tyr Lys Ser Val Leu Glu Glu Ile Gly Tyr Glu Asn
245 250 255
Ile Thr Ile Ser Asp Glu Arg Asn Asn Ile Trp Lys Ser His Phe Met
260 265 270
Ala Thr Thr Asn Arg Ile His Glu Gly Phe Leu Ala Arg Lys Tyr Asn
275 280 285
Ile Val Glu Val Thr Asp Met Ile Trp Thr Tyr Tyr Glu Leu Asp Ala
290 295 300
Ile Thr Gly Pro Cys Pro Ile Leu Gly Ala Ser Lys Pro Arg
305 310 315
<210> 10
<211> 414
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 10
Met Ser Val Pro Glu Glu Thr Asp Thr Asp Trp Trp Thr Met Leu Ala
1 5 10 15
Asp Pro Asp Phe Leu Ala Asp Pro His Asp Arg Leu Asp Val Leu Arg
20 25 30
Ala Glu Asn Pro Ile His Phe Asp Pro Ala Ser Gly Cys Tyr Phe Ile
35 40 45
Leu Gly His Ala Glu Phe Ser Glu Ala Met Arg Asn Lys Ala Ile Gly
50 55 60
Arg Asp Ser Arg Asn Trp Lys Gly Gly Trp His Ser Asp Pro Gly Phe
65 70 75 80
Arg Glu Arg Asp Pro Val Ala Phe Arg Leu Phe Ser Leu Phe Gln Pro
85 90 95
Gln Met Ile Asn Val Asp Gly Ile Asp His Ala Arg Met Arg Gly Val
100 105 110
Tyr Glu Pro Ala Phe Arg Ala Gln Ala Val Ala Gln Leu Glu Gly Met
115 120 125
Val Arg Glu Glu Thr Glu Arg Leu Ile Ala Ala Leu Pro Ser Asp Gly
130 135 140
Arg Pro Val Asn Leu Ile Asp Ala Tyr Ala Gln Pro Met Pro Leu Asn
145 150 155 160
Val Leu Cys Arg Leu Phe Asp Ile Pro Arg Asp Met Ala Asp Thr Val
165 170 175
Ser Asp Trp Ser Lys Lys Leu Ile Gln Ile Gly Asp Leu Met Leu Thr
180 185 190
Asp Gln Gln Lys Ser Asp Gly Leu Glu Ala Leu Thr Ala Phe Lys Ser
195 200 205
Tyr Leu Arg Glu Gln Leu Ser Val Ser Ser Thr Gly Thr Glu Gly Ser
210 215 220
Leu Met Arg Leu Ala Leu Gln Gly Leu Asp Asn Gly Thr Leu Asp Glu
225 230 235 240
Glu Glu Thr Leu Thr Asn Leu Val Ala Leu Leu Ile Ala Gly His Glu
245 250 255
Thr Thr Val Thr Leu Ile Gly Ile Gly Leu Lys Leu Leu Leu Glu His
260 265 270
Pro Lys Glu Met Glu Arg Leu Arg Ala Gln Pro Asp Leu Ala Arg Asn
275 280 285
Ala Ala Asp Glu Thr Leu Arg Tyr Asp Pro Gly Gly Asn Phe Leu Leu
290 295 300
Arg Val Ala Ala Gln Ser Cys Glu Ile Gly Gly Val Lys Ile Pro Gln
305 310 315 320
Gly Ala Pro Val Ile Gly Leu Leu Arg Ala Thr Asn Arg Asp Pro Ala
325 330 335
Arg Phe Lys Asp Pro His Arg Phe Asp Ile Thr Arg Thr Gly Asn Ala
340 345 350
His His Thr Phe Gly Gly Gly Ala His Phe Cys Leu Gly Ala Pro Leu
355 360 365
Ala Arg Met Glu Gly Arg Leu Ala Phe Gln Cys Leu Leu Ser Ala Phe
370 375 380
Ala Asp Ile Glu Leu Gln Glu Pro Pro Arg Trp Leu Asn Met Gly Thr
385 390 395 400
Asn Ala Arg Ser Leu Glu Ser Leu Ile Val Thr Leu Lys Arg
405 410
<210> 11
<211> 455
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 11
Met Ile Ala Ala Gly His Leu Gly Ser Ala Ala Phe Arg Asp Asp Tyr
1 5 10 15
Gly Val Ser His Ala Tyr Met Ala Gly Ala Met Val Lys Gly Ile Ala
20 25 30
Ser Ala Asp Leu Val Ile Arg Met Ala Gln Ala Arg Leu Leu Ala Ile
35 40 45
Tyr Gly Ser Gly Gly Val Pro Ile Glu Asp Ala Ala Val Gln Ile Arg
50 55 60
Arg Ile Lys Glu Thr Val Pro Pro Gly Ser Val Phe Gly Val Asn Val
65 70 75 80
Leu Ala Asp Pro Leu His Pro Arg Arg Glu Met Leu Met Val Asp Arg
85 90 95
Leu Leu Gln Leu Gly Ile Arg Val Ile Glu Ala Ser Ala Phe Met Glu
100 105 110
Val Thr Glu Ala Leu Val Lys Tyr Arg Leu Lys Gly Ala Lys Leu Arg
115 120 125
Asp Gly Ala Leu Asp Val Pro Asn Arg Val Phe Ala Lys Val Ser His
130 135 140
Pro Gly Val Ala Ser Ala Phe Leu Ala Pro Ala Thr Pro Glu Leu Ile
145 150 155 160
Gln Arg Leu Leu Ser Gln Gly Leu Ile Thr Glu Glu Glu Ala Ser Leu
165 170 175
Ala Pro Gly Ile Pro Val Ala Ser Asp Leu Thr Val Glu Ala Asp Ser
180 185 190
Gly Gly His Thr Asp Arg Gly Val Thr Ser Ala Leu Leu Pro Ala Met
195 200 205
Ile Ala Leu Arg Asp Ala Gln Gln Ala Gln His Ser Phe Ala Gln Pro
210 215 220
Ser Arg Val Gly Ser Ala Gly Gly Ile Gly Thr Pro Gln Ala Ala Ala
225 230 235 240
Thr Ala Phe Leu Leu Gly Ala Asp Tyr Ile Ala Thr Gly Ser Ile Asn
245 250 255
Gln Cys Thr Pro Glu Ala Gly Thr Ser Glu Ala Val Lys Glu Val Leu
260 265 270
Gln Arg Thr Gly Val Gln Asp Thr Ala Tyr Ala Pro Ala Gly Asp Met
275 280 285
Phe Glu Leu Gly Ala Lys Val Gln Val Leu Lys Lys Gly Leu Leu Phe
290 295 300
Pro Ala Arg Ala Asn Lys Leu Tyr Asp Leu Trp Arg Ala His Pro Gly
305 310 315 320
Leu Glu Ala Leu Pro Val Ala Ile Arg Lys Glu Ile Glu Asp Lys Tyr
325 330 335
Phe Arg Arg Ser Phe Glu Asp Val Tyr Ala Glu Thr Arg Ser Phe Tyr
340 345 350
Asp Lys Ala Ala Pro Glu Glu Ile Glu Arg Ala Glu Arg Asn Pro Lys
355 360 365
Val Lys Met Ala Leu Ile Phe Arg Trp Tyr Phe Ile His Ser Met Arg
370 375 380
Leu Ala Leu Ala Gly Glu Thr Gly Gln Lys Thr Asp Trp Gln Val Tyr
385 390 395 400
Cys Gly Pro Ala Leu Gly Ala Phe Asn Thr Tyr Val Ala Gly Thr Asp
405 410 415
Leu Glu Lys Trp Gln Asn Arg His Val Asp Tyr Ile Gly Leu His Leu
420 425 430
Met Asp Gln Thr Ala Ser Tyr Leu Gly Ala Gln Phe Asn Ala Leu Arg
435 440 445
Gln Thr Gly Thr Ala Leu Ser
450 455
<210> 12
<211> 337
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 12
Met Asn Ala Phe Ser His Pro Trp Pro Thr Asp Leu Ala Pro Asp Pro
1 5 10 15
Val Ile Trp Met Phe Ala Gly Gln Gly Ala Gln Tyr Phe Gln Met Gly
20 25 30
Arg Gly Leu Tyr Asp Ala His Pro Val Phe Arg Ala Ser Met Leu Arg
35 40 45
Met Glu Glu Ala Leu Gln Pro Tyr Leu Asp His Pro Val Thr Asp Val
50 55 60
Leu Tyr Asp Asp Phe Ala His Val Gly Asp Thr Phe Asp Gln Leu Thr
65 70 75 80
Asp Thr His Pro Ala Leu Phe Met Val Gln Val Ala Leu Ala Glu Thr
85 90 95
Leu Ile Ala Glu Gly Leu Pro Lys Pro Asn Leu Leu Leu Gly Val Ser
100 105 110
Leu Gly Glu Tyr Val Ala Ala Ala Val Ser Gly Ala Ile Ser Pro Glu
115 120 125
Glu Val Leu Pro Ala Leu Leu Arg Gln Ala Trp Thr Ile Gln Ser Lys
130 135 140
Ala Glu Pro Gly Ala Met Leu Met Val Leu Asp Asp Leu Ala Gln Phe
145 150 155 160
Glu Ala Asp Pro Ile Tyr Arg Arg Gly Ser Ser Glu Leu Ala Gly Val
165 170 175
Val Phe Asp Arg Cys Phe Val Ile Thr Gly Pro Thr Asn Gly Ile Asn
180 185 190
Asp Ile Ala Asp Asp Leu Arg Ala Arg Asp Ile Ser His His Arg Leu
195 200 205
Pro Val Arg Tyr Ala Phe His Gly Ser Gly Ile Glu Ala Ile Glu Thr
210 215 220
Ser Phe Arg Ala Ala Leu Arg Ala Phe Ser Trp Gly Ala Ala Gln Ile
225 230 235 240
Pro Val Ile Gly Ala Ser Asp Gly Thr Gly Arg Pro Phe Asp Pro Val
245 250 255
Glu Arg Asp Trp Trp Lys Val Val Arg Gly Pro Ile Arg Leu His Glu
260 265 270
Thr Leu Leu Ala Leu Asn Ala Gln Tyr Pro Lys Ala Thr Tyr Ile Asp
275 280 285
Cys Gly Pro Ala Gly Asn Leu Arg Thr Ala Cys Leu Tyr Gly Leu Gly
290 295 300
Asp Asp Leu Arg Ala Arg Ser Phe Ala Val Met Thr Pro Phe Gly Ala
305 310 315 320
Asp Thr Gln Asn Leu Ser Ala Leu Lys Asn His Leu Gly Glu Ala Val
325 330 335
Gly
<210> 13
<211> 375
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 13
Met Lys Ala Phe Leu Phe Pro Gly Gln Gly Ser Gln His Ile Gly Met
1 5 10 15
Gly Glu Gly Leu Phe Glu Arg Tyr Ser Glu Met Thr Glu Ala Ala Asp
20 25 30
Thr Val Leu Gly Tyr Ser Ile Ala Asp Leu Cys Leu Arg Asp Pro Asp
35 40 45
Lys Gln Leu Thr Gln Thr Glu Phe Thr Gln Pro Ala Leu Phe Val Val
50 55 60
Asn Ala Met Met Ala Arg Ala Gln Gln Asp Asp Ser Gly Ala Pro Asp
65 70 75 80
Ile Ala Ala Gly His Ser Val Gly Glu Tyr Asn Ala Leu His Gln Ala
85 90 95
Gly Val Val Asn Phe Glu Asp Gly Leu Arg Leu Val Gln Lys Arg Gly
100 105 110
Ala Leu Met Ser Thr Ala Pro Lys Gly Gly Met Ala Ala Val Ile Gly
115 120 125
Leu Thr Pro Asp Arg Ile Ala Thr Val Leu Gln Asp Asn Gly Phe Ala
130 135 140
Ser Ile Asp Val Ala Asn Leu Asn Ser Asp Lys Gln Thr Ile Ile Ser
145 150 155 160
Gly Leu Ile Glu Asp Ile Ser Ala Val Glu Pro Phe Phe Ser Asp Ala
165 170 175
Gly Ala Met Tyr Ile Pro Leu Asn Val Ser Gly Ala Phe His Ser Arg
180 185 190
Tyr Met Ala Pro Val Gln Glu Glu Phe Glu Ala Phe Leu Gly Glu Phe
195 200 205
Arg Phe Glu Ala Pro Gly Ile Pro Val Ile Ala Asn Val Asp Ala Arg
210 215 220
Pro Tyr Gln Asp Gly Cys Thr Ala Gln Met Leu Ala Gln Gln Leu Thr
225 230 235 240
Ser Pro Val Arg Trp Gln Glu Ser Ile Gly Tyr Met Leu Asn Leu Gly
245 250 255
Val Gly His Phe Phe Glu Thr Gly Pro Gly Asn Val Leu Ser Lys Leu
260 265 270
Val Ala Gly Ile Arg Lys Gln His Val Val Thr Pro Val Glu Thr Glu
275 280 285
Leu Pro Pro Gln Ala Gly Ser Pro Pro Val Leu Gln Glu Glu Thr Gln
290 295 300
Ala Gln Glu Ala Lys Thr Pro Val Gln Ile Val Glu Asp Trp Asn Thr
305 310 315 320
Gln His Ser Ala Gly Ile Asp Val Gln Val Asn Gly Tyr Asp Gly Val
325 330 335
Met Lys Thr Arg Ser Glu Ala Ile Leu Leu Phe Gly His Arg Pro Ala
340 345 350
Val Tyr Met Glu Gly Tyr Ser Gly Tyr Phe Ala Leu Ser Asp Val Thr
355 360 365
Pro Ile Glu Ala Gln Leu Ser
370 375
<210> 14
<211> 245
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 14
Met Leu Ser Pro Leu Ser Ile Thr Gln Asn Gly Arg Ser Ser Thr Leu
1 5 10 15
Trp Phe Asp Arg Pro Glu Ser Gly Asn Thr Ile Thr Glu Ala Leu Val
20 25 30
Glu Asp Ala His Ala Ala Leu Asp Arg Ala Glu Glu Ala Gly Cys Thr
35 40 45
Ala Ile Ile Leu Arg Gly Ser Gln Thr Val Phe Cys Thr Gly Ala Asp
50 55 60
Phe Gly Gly Gly Asp Pro Val Asp Pro Glu Arg Leu Tyr His Leu Trp
65 70 75 80
Glu Arg Leu Ala Leu Gly Pro Phe Val Ser Leu Ser Val Val Glu Gly
85 90 95
Gln Ala Thr Ala Gly Gly Ile Gly Phe Val Ala Ala Ser Asp Met Val
100 105 110
Leu Ala Gly Pro Asp Ala Arg Phe Thr Leu Pro Glu Leu Leu Phe Gly
115 120 125
Leu His Pro Ala Cys Val Leu Pro Phe Leu Thr Arg Arg Ile Gly Ala
130 135 140
His Ala Ala Ser Tyr Leu Thr Leu Ser Thr Gln Ser Ile Asn Ala Glu
145 150 155 160
Gln Ala Leu Ser Leu His Leu Val Asp Ser Ile Leu Pro Glu Ile Glu
165 170 175
Leu Gly Leu Ala Gln His Ile Arg Arg Ile Glu Arg Leu Asp Pro Gln
180 185 190
Ala Ile Arg Arg Phe Lys Ala Tyr Arg Ala Asp Leu Asp Lys Ser Leu
195 200 205
Gly Gln Ser Arg Asp Lys Ala Ile Ala Glu Asn Arg Ser Leu Phe Gly
210 215 220
Asp Ser Ser Ile Arg Ala Asn Leu Gln Arg Tyr Ala Thr Glu Gln Lys
225 230 235 240
Phe Pro Trp Glu Leu
245
<210> 15
<211> 411
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 15
Met Thr Asp Arg Thr Val His Cys Met Gly Ile Gly Leu Ala Cys Gly
1 5 10 15
Tyr Gly Phe Gly Lys Ser Ser Ala Leu Gln Gly Val Leu Thr Gly Lys
20 25 30
Asn Leu Phe Arg Pro Leu Glu Arg Glu Gly Arg Gln Val Ala Gly Asn
35 40 45
Pro Pro Phe Ile Gly Ile Glu Leu Pro Asp Ser Val Pro Gln Val Leu
50 55 60
Ser Arg Arg Ala Ser Arg Thr Thr Gly Leu Thr Gly Gln Val Cys Ala
65 70 75 80
Ala Val Ala Ala Glu Ala Trp Gln Asp Ala Gly Phe Gly Asp Pro Gly
85 90 95
Glu His Arg Leu Ser Gly Arg Thr Gly Val Ile Leu Gly Gly Ser Asn
100 105 110
Leu Gln Ser Arg Glu Met Glu Leu Ile Arg Asn Lys Leu Leu Asn Thr
115 120 125
Ser Pro Asn Leu Ala Pro Pro Arg Leu Gly His Ser Phe Leu Asp Thr
130 135 140
Asp Val Ala Ala Leu Ile Ser Glu Glu Leu Val Leu Asp Gly Pro Ile
145 150 155 160
Met Ser Val Gly Gly Ala Ser Ala Ser Gly Ala Leu Ala Val His Leu
165 170 175
Ala Ala Ala Ala Ile Arg Ser Gly Glu Leu Asp Ile Cys Leu Val Ile
180 185 190
Gly Pro Leu Gln Asp Met Ser Trp Leu Glu Leu Gln Ala Leu Arg Asn
195 200 205
Leu Gly Ala Met Gly Pro His Leu Ser Asp Glu Ser Gly Asp Leu Met
210 215 220
Pro Glu Pro Arg Cys Arg Pro Phe Asp Ala Ala Gly Thr Gly Phe Leu
225 230 235 240
Phe Gly Glu Ser Ala Ala Ala Leu Val Leu Ala Arg Ser Asp Leu Gly
245 250 255
Pro Gln Ser Tyr Gly Arg Ile Ser Gly Leu Gly Arg Val Gln Ala Gln
260 265 270
Thr Arg Gly Pro Glu Pro Ser Gln Asn Ala Leu Gln Glu Ala Ile Thr
275 280 285
Ala Ala Leu Thr Asp Ala Gly Ile Pro Pro Ser Ser Leu Asp Phe Ile
290 295 300
Ser Ala His Ala Thr Gly Thr Pro Arg Gly Asp Ala Ala Glu Ala Gln
305 310 315 320
Ala Leu Val Ala Gln Leu Leu Asn Ser Val His Val Thr Ala Pro Lys
325 330 335
Ser Ala Leu Gly His Gly Val Ala Ala Ala Gly Ala Val Glu Ile Ala
340 345 350
Leu Ala Phe Leu Gln Met Glu Ala Gly Gln Ile Ala Pro Ile His Gly
355 360 365
Leu Val Gln Pro Thr Leu Pro Asp Leu Asn Tyr Val Leu Asp Asn Pro
370 375 380
Glu Ser Gly Arg Phe Asn Ser Ala Met Cys Leu Ser Ser Gly Phe Gly
385 390 395 400
Gly Phe Asn Leu Ala Thr Val Leu Ser Ser Asp
405 410
<210> 16
<211> 5897
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 16
Met Pro Asp Gly Arg Glu Phe Glu Asp Thr Val Gly Asp Val Val Ala
1 5 10 15
Ala Cys Leu Lys Ile Pro Ser Asp Arg Phe Asp Thr Leu Ser Pro Leu
20 25 30
Ser Arg Phe Gly Val Asp Ser Ile Ile Val Thr Glu Ile Met Lys Arg
35 40 45
Leu Ser Asp Met Leu Gly Val Ser Ile Ala Pro Thr Val Phe Phe Glu
50 55 60
Ala Lys Asn Ala Lys Glu Leu Ala Gln Ile Leu Asp Gly Arg Tyr Arg
65 70 75 80
Arg Glu Ala Asp Arg Val Pro Gln Ser Gln Lys Ala Pro Gln Asn Pro
85 90 95
Leu Ala Leu Pro Asp Arg Arg Ala Glu Lys Arg Ala Pro Lys Glu Thr
100 105 110
Ser Arg Thr Val Pro Ala Ser Arg Ser Lys Lys Ala Ala Ser Trp Ile
115 120 125
Ala Ser Ala Lys Ala Ala Leu Ala Gln Pro Gly Gln Phe Arg Thr Asp
130 135 140
Gln Glu Asp Met Gly Ala Val Glu Thr Pro His Val Ser Gly Ser Ala
145 150 155 160
Phe Glu Pro Ile Ala Val Leu Ala Met Asp Gly Arg Phe Ala Gln Ser
165 170 175
Ala Asp Leu Gly Glu Leu Gln Ser His Leu Glu Gln Gly Asp Asp Cys
180 185 190
Ile Thr Glu Ile Pro Ala Glu Arg Trp Asp Trp Arg Gln Ile Tyr Asp
195 200 205
Asp Pro Gly Lys Gly Glu Phe Thr Lys Val Lys Tyr Gly Gly Val Ala
210 215 220
Pro Ala Val Asp Gln Phe Asp Pro Leu Tyr Phe Gly Leu Ser Pro Arg
225 230 235 240
Glu Ala Glu Leu Met Asp Pro Gln His Arg Leu Phe Ile Gln Ser Ala
245 250 255
Tyr Arg Leu Leu Gly Glu Ala Gly Tyr Ala Pro Ser Ser Ile Ala Gly
260 265 270
Arg Pro Val Gly Val Phe Ile Gly Val Asn Leu Gln Asp Tyr Ala His
275 280 285
Met Ile Asp Arg Ala Gly Ser Ile Glu Ala Leu His Leu Thr Ser Leu
290 295 300
Gly His Met Phe Cys Pro Asn Arg Leu Ser Phe Met Leu Asp Ile Thr
305 310 315 320
Gly Pro Ser Gln Val Ile Asp Thr Ala Cys Ser Ser Ser Leu Ile Ala
325 330 335
Val His Arg Ala Val Leu Ala Leu Gln His Glu Gly Cys Glu Met Ala
340 345 350
Ile Ala Gly Gly Ala Asn Leu Met Leu Thr Pro Asp Met His Ile Met
355 360 365
Tyr Ser Lys Val Gly Met Leu Cys Glu Asp Gly Arg Cys Lys Thr Phe
370 375 380
Ser Ala Arg Ala Asn Gly Tyr Val Arg Gly Asp Gly Val Gly Ala Val
385 390 395 400
Leu Leu Lys Pro Leu Ser Ala Ala Glu Arg Asp Gly Asp Thr Ile Leu
405 410 415
Ala Val Ile Arg Gly Ser Ser Glu Asn His Gly Gly Gln Ser Thr Ser
420 425 430
Leu Thr Ala Pro Asn Pro Leu Ala Gln Ala Arg Leu Ile Ala Glu Ala
435 440 445
His Gly His Ala Gly Gly Asp Pro Arg Arg Val Gly Tyr Ile Glu Cys
450 455 460
His Gly Thr Gly Thr Glu Leu Gly Asp Pro Ile Glu Ile Asn Gly Leu
465 470 475 480
Lys Gln Ala Phe Thr Ser Leu Tyr Asp Ala Leu Gly Lys Thr Pro Glu
485 490 495
Gly Ala Pro His Cys Gly Leu Gly Ser Ile Lys Ser Asn Ile Gly His
500 505 510
Ala Glu Thr Ala Ala Gly Ile Ala Gly Leu Ile Lys Ala Val Ile Gly
515 520 525
Leu Arg Ser Gly Arg Tyr Phe Pro Thr Leu His Ser Glu Asp Gln Asn
530 535 540
Pro Leu Ile Ser Leu Glu Gln Thr Pro Phe Phe Ile Ser Arg Lys Gly
545 550 555 560
Ser Asp Trp Pro Arg Pro Val Leu Asp Gly Gln Thr Phe Pro Arg Arg
565 570 575
Ala Gly Val Ser Ser Phe Gly Ala Gly Gly Ser Asn Ala His Val Val
580 585 590
Val Glu Glu Tyr Leu Pro Glu Thr Arg Thr Ala Ala Val Gly Arg Pro
595 600 605
Asp Arg Pro Met Leu Ile Pro Leu Ser Ala Arg Thr Glu Ala Gln Leu
610 615 620
Asp Gln Val Ile Leu Asp Leu Leu Ala His Leu Glu Gly Phe Ala Gly
625 630 635 640
Asp Glu Leu Pro Ser Leu Glu Gln Ile Ala Tyr Thr Leu Gln Thr Gly
645 650 655
Arg Asp Pro Met Ala Phe Arg Leu Ala Phe Val Ala Asp Thr Val Gly
660 665 670
Ser Leu Val Ala Ser Leu Arg Arg Leu Arg Asp Gly Asp Gln Ala Gly
675 680 685
Phe Ala Lys Gly Cys Val Lys Thr Arg Arg Arg Ser Arg Glu Glu Thr
690 695 700
Thr Pro Ala Asp Leu Ser Gln Pro Leu Pro Asp Leu Ala Glu Ala Trp
705 710 715 720
Val Ser Gly Ala Leu Leu Asp Trp Ser Ala Leu His Glu Asn Arg Pro
725 730 735
Ala Lys Val Arg Leu Pro Ala Tyr Pro Phe Glu Lys Arg Arg Cys Trp
740 745 750
Ile Pro Ala Pro Ala Gly Glu Met Pro Leu Arg Arg Arg Ser Ser Ala
755 760 765
Val Phe Arg Lys Lys Ser Gly Phe Gly Leu Ala Ala His Lys Asn Glu
770 775 780
Pro Gly Glu Gly Arg Tyr Asp Leu Thr Leu Thr Gly Ala Glu Arg Phe
785 790 795 800
Leu Lys Asp His Val Val Val Gly Val Pro Met Leu Pro Gly Ala Ala
805 810 815
Tyr Leu Glu Ile Ala Arg Ala Ala Ala Ala Gln Phe Leu Asp Val Ser
820 825 830
His Arg Glu Ala Trp Arg Phe Asp Lys Ile Val Trp Val Gln Pro Cys
835 840 845
Thr Val Thr Glu Gly Ser Thr Asp Leu Thr Val His Cys Thr Gly Arg
850 855 860
Pro Asp Gly Ser Val Glu Phe Arg Ile Thr Ser Met Pro Gly Ser Gln
865 870 875 880
Leu His Cys Gln Gly Val Val Arg Pro Gly Glu Thr Gly Asn Gly Ser
885 890 895
Gly Gln Thr Val Pro Ala Thr Glu Pro Ala Asn Thr Thr Ala Pro Val
900 905 910
Leu Asp Lys Ala Gln Cys Tyr Asn Arg Phe Ser Glu Leu Gly Leu Ser
915 920 925
Tyr Gly Pro Ser His Arg Gly Leu Gln Gln Ile Trp Arg Gly Pro Asp
930 935 940
Gly Glu Ala Tyr Ala Glu Ile Asn Arg Pro Asp Glu Ala Asp Asp Gln
945 950 955 960
Gly Phe Leu Leu Asp Pro Ala Met Leu Asp Cys Val Leu Gln Ser Cys
965 970 975
Leu Gly Leu Ala Glu Lys Asp Thr Asp Ser Ser Ala Ser Leu Pro Phe
980 985 990
Glu Leu Gly Thr Leu Glu Leu Phe Gly Thr Val Pro Asp Gln Leu Arg
995 1000 1005
Val Cys Val Arg Val Gly Pro Gln Asn Thr Arg Leu Pro Arg Ile Asp
1010 1015 1020
Leu Asp Val Thr Gly Pro Asp Gly Arg Leu Val Met Arg Leu Gln Gly
1025 1030 1035 1040
Phe Ala Asn Arg Glu Leu Asp Pro Ala Leu Gly Gln Glu Thr Ser Asn
1045 1050 1055
Asp Thr Val Leu Arg Ala Arg Pro Val Trp His Pro Val Thr Pro Gly
1060 1065 1070
Ala Ala Thr Pro Ser Ala Val Arg Gln Leu Val Cys Gly Met Ala His
1075 1080 1085
Gly His Ser Gly Ala Gly Glu Thr Ala Arg Val Val His Val Ser Gly
1090 1095 1100
Asn Ala Val Ala Asp Tyr Leu Arg Ala Ala Lys Thr Ile Phe Ser Asp
1105 1110 1115 1120
Phe Lys Ala Ala Val Thr Leu Gly Glu Gly Thr Gly Phe Leu Gln Ile
1125 1130 1135
Val Val Pro Gln Ser Asp Glu Ala Tyr Gly Thr Ala Gly Leu Phe Ser
1140 1145 1150
Gly Leu Ala Gly Leu Val Ala Thr Ala Asn Lys Glu Ser Thr Arg Leu
1155 1160 1165
Gln Ala Gln Leu Val Glu Cys Pro Gly Asp Leu Ala Ala Leu Glu Leu
1170 1175 1180
Pro Ala Leu Leu Ser Gln Ala Ala Arg Val Thr Gly Ala Ser His Leu
1185 1190 1195 1200
Arg Leu Ser Ser Lys Gly Ile Leu Ala Arg Gly Trp Glu Lys Leu Lys
1205 1210 1215
Val Glu Gly Glu Gly Ser Pro Trp Arg Asn Asp Gly Ile Tyr Leu Ile
1220 1225 1230
Thr Gly Gly Thr Gly Gly Leu Gly Gln Arg Phe Ala Glu Arg Ile Ala
1235 1240 1245
Gln Glu Thr Ser Ala Ala Thr Val Ile Leu Ala Ala Arg Ser Thr Ala
1250 1255 1260
Asp Ala Asp Leu Val Val Arg Leu Gln Asp Leu Gly Leu Lys Val Asp
1265 1270 1275 1280
Ser Thr Ser Cys Asp Leu Gly Asp Pro Asp Ala Val Gln Ala Met Val
1285 1290 1295
Arg Ser Val Val Ala Arg His Gly Arg Ile Asp Gly Ile Leu His Ala
1300 1305 1310
Ala Gly Val Leu Lys Asp Gly Phe Ile Ala Asp Lys Ala Glu Ala Asp
1315 1320 1325
Phe Asp Leu Val Gly Arg Ala Lys Leu Ala Gly Thr Trp Ala Leu Asp
1330 1335 1340
Gln Ala Ser Val Asp Leu Pro Leu Asp Phe Phe Ala Thr Phe Gly Ser
1345 1350 1355 1360
Ala Ser Ala Val Trp Gly Ser Ala Gly Gln Thr Asp Tyr Ala Ala Ala
1365 1370 1375
Asn Gly Phe Leu Glu Ala Phe Ala Leu Trp Arg Ser Arg Lys Ala Ala
1380 1385 1390
Gln Gly Glu Arg Phe Gly Val Ser Leu Asn Ile Ala Trp Pro Pro Trp
1395 1400 1405
Gln Asp Gly Gly Met Arg Met Ala Pro Glu Ala Leu Ala Arg Met Gln
1410 1415 1420
Glu Ser Thr Gly Leu Gly Val Leu Ala Thr Ala Ala Gly Ile Asp Glu
1425 1430 1435 1440
Phe Glu Ala Ala Leu Leu Ser Gly Gly Pro Gln Gln Val Val Met Cys
1445 1450 1455
Gly Thr Gln Leu Ala Ile Asp Asp Ile Leu Thr Pro Pro Ala Ala Pro
1460 1465 1470
Val Ser Ala Gln Pro Val Ser Gln Arg Thr Glu Ser Asp Gly Leu Gln
1475 1480 1485
Leu Ala Ala Glu Glu Leu Leu Leu Glu His Ile Ala Glu His Met Gly
1490 1495 1500
Phe Glu Arg Gln Asp Leu Asp Ala Glu Ser Glu Trp Ser Asp Leu Gly
1505 1510 1515 1520
Phe Asp Ser Ile Thr Met Thr Thr Phe Ser Asn Arg Leu Asn Glu Ala
1525 1530 1535
His Gly Met Asp Leu Thr Pro Thr Val Phe Phe Glu Tyr Val Thr Ile
1540 1545 1550
Ala Asp Met Ala Gly Phe Leu Ala Gln Thr Tyr Glu Ser Cys Leu Ser
1555 1560 1565
Gly Leu Leu Pro Glu Asn Pro Val Arg His Thr Ala Lys Ile Thr Glu
1570 1575 1580
Lys Pro Leu Pro Asp Gln Pro Asp Pro Thr Ser Pro Pro Asp Ala Glu
1585 1590 1595 1600
Ala Ile Ala Ile Ile Gly Met Ala Gly Arg Phe Pro Asp Ala Pro Asp
1605 1610 1615
Leu Glu Thr Phe Trp Glu Asn Leu Arg Ser Gly Arg Ala Cys Leu Arg
1620 1625 1630
Glu Ile Pro Glu Asp Arg Trp Asp Trp Arg Ala Leu Lys Ala Ala Gly
1635 1640 1645
Leu Thr Asp Val Asn Arg Ala Gly Phe Ile Asp Gly Ile Ala Glu Phe
1650 1655 1660
Asp Ala Arg His Phe Gly Ile Ser Arg Arg Glu Ala Ala Leu Met Asp
1665 1670 1675 1680
Pro Ala Gln Arg Leu Leu Met Glu Tyr Val Trp Arg Ala Ile Glu Asp
1685 1690 1695
Ala Gly Tyr Ala Pro Ser Ser Leu Ala Gly Ser Asp Thr Ala Val Ile
1700 1705 1710
Ile Gly Thr Ala Pro Ser Gly Tyr Gly Ala Arg Met Ala Glu Asn Gly
1715 1720 1725
Ile Gly Ile Asp Ser His Ser Ser Thr Gly Ser Val Gly Ser Val Gly
1730 1735 1740
Pro Asn Arg Ile Ser Tyr Leu Leu Asp Leu His Gly Pro Ser Glu Pro
1745 1750 1755 1760
Val Glu Thr Ala Cys Ser Ser Ala Leu Val Ala Leu His Arg Ala Ile
1765 1770 1775
Ser Ala Met Arg Ala Gly Asp Cys Ser Gln Ala Ile Val Gly Gly Val
1780 1785 1790
Asn Leu Val Leu Ser Pro Glu Thr His Ile Ser Phe Ser Lys Ala Gly
1795 1800 1805
Met Leu Ser Pro Asp Gly Arg Cys Lys Thr Phe Ser Ala Gln Ala Asp
1810 1815 1820
Gly Tyr Gly Arg Gly Glu Gly Val Gly Met Leu Phe Leu Lys Pro Leu
1825 1830 1835 1840
Thr Ala Ala Glu Arg Asp Gly Asp Phe Val His Gly Ile Ile Leu Gly
1845 1850 1855
Ser Ala Glu Asn His Gly Gly Lys Ala Asn Ser Leu Thr Ala Pro Asn
1860 1865 1870
Pro Arg Ala Gln Ala Ala Leu Val Glu Thr Ala Val Arg Arg Ala Gly
1875 1880 1885
Ile Ala Pro Gln Ser Leu Ser Tyr Met Glu Ala His Gly Thr Gly Thr
1890 1895 1900
Glu Leu Gly Asp Pro Ile Glu Ile Glu Gly Leu Lys Thr Ala Phe Asp
1905 1910 1915 1920
Ala Leu Glu Ala Gly Gln Glu Ala Arg Cys Ala Ile Gly Ser Val Lys
1925 1930 1935
Thr Asn Ile Gly His Leu Glu Leu Ala Ala Gly Val Ala Gly Val Leu
1940 1945 1950
Lys Val Leu Leu Gln Met Arg Asn Arg Thr Leu Ala Pro Ser Leu Pro
1955 1960 1965
Glu Glu Val Asn Pro Tyr Leu Lys Leu Lys Asp Ser Pro Phe Tyr Leu
1970 1975 1980
Val Pro Gln Ala Gln Glu Trp Arg Arg Pro Val Asp Ala Val Gly Lys
1985 1990 1995 2000
Glu Ile Pro Arg Arg Ala Gly Val Ser Ser Phe Gly Phe Gly Gly Val
2005 2010 2015
Asn Ala His Val Val Leu Glu Glu Pro Ala Gln Thr Ile Arg Ala Asp
2020 2025 2030
Met Pro Glu Ile Pro Glu Leu Ile Val Leu Ser Ala Arg Asp Arg Glu
2035 2040 2045
Gly Leu Ala Ala Ser Ala Asp Ala Leu Ala Lys Ala Leu Thr Pro Tyr
2050 2055 2060
Ala Asn Thr Gly Gly Ala Leu Glu Pro Thr Ile Glu Ser Arg Leu Cys
2065 2070 2075 2080
Ala Cys Leu Ala Asp Ile Leu Glu Ile Asp Ile Asp Glu Val Glu Pro
2085 2090 2095
Leu Thr Lys Leu Asp Asp Leu Gly Val Glu Pro Val His Arg Pro Leu
2100 2105 2110
Leu Arg Arg Ser Val Glu Lys Val Leu Gly Leu Thr Ile Asp His Asp
2115 2120 2125
Leu Val His Arg Ala Gly Ser Ile Arg Glu Ile Ser Ser Ala Phe Gln
2130 2135 2140
Ser Leu Pro Glu His Ser Gly Met Glu Ala Ala Pro Leu Leu Arg Asp
2145 2150 2155 2160
Ile Ala Phe Thr Leu Arg Ala Gly Arg Asp Ala Met Thr Glu Arg Val
2165 2170 2175
Ala Phe Ala Ala Gln Ser Leu Lys Glu Leu Val Asp Arg Leu Arg Ile
2180 2185 2190
Leu Ala Ala Thr Arg Asp Asn Leu Thr Gly Gln Asp Gly Phe Trp His
2195 2200 2205
Gly Arg Val Pro Tyr Lys Thr Arg Arg His Asn Lys Val Thr Gln Ser
2210 2215 2220
Pro Lys Asp Val Pro Leu Glu Glu Leu Ala Arg Leu Trp Val Gly Gly
2225 2230 2235 2240
Ala Ala Tyr Asp Trp Glu Ala Glu Arg Asp Gly Arg Asp Leu Arg Arg
2245 2250 2255
Val Pro Leu Pro Gly Thr Ser Phe Lys Lys Glu Arg Ile Trp Phe Asp
2260 2265 2270
Thr Leu Asn Gly Lys Pro Ser Ala Ala Val Pro Gln Ile Lys Asp Thr
2275 2280 2285
Ser Leu Pro Ser Gly Met Ala Leu Thr Arg Lys Ser Asp Gly Val Phe
2290 2295 2300
Glu Val Ser Leu Ser Gly Asp Glu Phe Phe Leu Arg Asp His Ile Val
2305 2310 2315 2320
Gln Gly Gln Pro Val Leu Pro Gly Val Ala Tyr Leu Glu Leu Ala Arg
2325 2330 2335
Ser Ala Gly Cys Leu His Leu Gln Ser Arg Asp Leu Ala Leu Lys Asp
2340 2345 2350
Val Val Trp Val Gln Pro Ala Val Ile Ser Glu Pro Gln Thr Leu Gln
2355 2360 2365
Val Val Leu Gly Ser Pro Gly Pro Gly Gln Glu Tyr Pro Phe Arg Ile
2370 2375 2380
Leu Ser His Gly Asp Ser Gly Glu Arg Leu His Cys Arg Gly Ala Ile
2385 2390 2395 2400
Ala His Leu Pro Glu Val Pro Pro Glu Ile Ile Asn Asn Asp Ala Ile
2405 2410 2415
Pro Ser Gly Arg Arg Ile Pro Ser Asn Glu Ile Tyr Ser Leu Phe Glu
2420 2425 2430
Thr Ala Gly Leu His Tyr Gly Pro Gly His Gln Cys Leu Asn Trp Leu
2435 2440 2445
Val Ser Asp Gly Ser Arg Val Val Ala Asp Leu Ser Leu Pro Glu Ile
2450 2455 2460
Cys Gly Ser Ala Val Glu Pro Phe Val Leu His Pro Ser Leu Met Asp
2465 2470 2475 2480
Gly Ala Leu Gln Ala Ala Ile Gly Phe Gly Leu Ala Gly Glu Glu Gln
2485 2490 2495
Ser Gly Asp Leu Ala Leu Pro Phe Ala Ile Glu Ser Leu Gln Cys Leu
2500 2505 2510
Thr Ala Asn Lys Ser Arg Met Arg Val His Leu Glu Arg Arg Ser Val
2515 2520 2525
Ala Ser Ala Ala His Gly Ile Glu Lys Ile Asp Ile Ala Leu Cys Asp
2530 2535 2540
Glu Ser Gly Gln Val Leu Thr Arg Ile Asn Gly Phe Ser Thr Arg Arg
2545 2550 2555 2560
Val Ala Leu Pro Glu Ala Gly Lys Thr Pro Ala His Gln Ala Leu Gly
2565 2570 2575
Ala Gln Asp Pro Val Asn Val Pro Ala Gln Asp Gly Leu Lys Asp Ala
2580 2585 2590
Ala Ala Ala Tyr Phe Lys Arg Leu Leu Ser Glu Ala Leu Ala Cys Pro
2595 2600 2605
Pro Asp Glu Ile Asp Leu Asp Glu Pro Leu Glu Tyr Tyr Gly Phe Asp
2610 2615 2620
Ser His Met Val Met Glu Leu Thr Ala Val Leu Glu Lys Glu Phe Gly
2625 2630 2635 2640
Thr Leu Ser Lys Thr Leu Phe Phe Glu His Gln Thr Leu Gly Ala Val
2645 2650 2655
Leu Asp His Phe Ile Glu Ala His Gly Pro Ser Leu Thr Thr Val Val
2660 2665 2670
Arg Lys Gly Arg Gly Ala Ala Gly Thr Pro Ala Ser Val Asp Ala Ala
2675 2680 2685
Ala Lys Pro Arg Thr Glu Pro Lys Thr Gly Gly Leu Asp Ile Ala Val
2690 2695 2700
Ile Gly Leu Ala Gly Arg Tyr Pro Gln Ala Tyr Asp Ile Ala Gly Phe
2705 2710 2715 2720
Trp Asp Asn Leu Arg Asn Gly Arg Asp Gly Ile Thr Glu Val Pro Ala
2725 2730 2735
Asp Arg Trp Lys Trp Gln Asp Tyr Phe Ser Thr Asp Arg Ser Arg Ile
2740 2745 2750
Asp Ala His Phe Ser Lys Trp Gly Gly Phe Ile Asp Asp Val Ala Ala
2755 2760 2765
Phe Asp Pro Leu Phe Phe Asn Ile Ser Pro Gly Met Ala Glu Ala Met
2770 2775 2780
Asp Pro Gln Glu Arg Leu Phe Leu Glu His Ala Trp Thr Ala Met Glu
2785 2790 2795 2800
Asp Ala Gly Tyr Arg Pro Gly Asp Leu Gln Ala Gln Ser Val Asp Glu
2805 2810 2815
Asp Gly Leu Pro Gly Gln Val Gly Val Tyr Ala Gly Val Met Tyr Gly
2820 2825 2830
Glu Tyr Gln Leu Leu Gly Leu Gln Gly Ser Leu Ala Gly Glu Pro Met
2835 2840 2845
Ser Thr Ala Ser Tyr Tyr Ala Gly Val Ala Asn Arg Val Ser Tyr Ala
2850 2855 2860
Leu Asn Leu His Gly Pro Ser Met Ala Val Asp Thr Met Cys Ser Ser
2865 2870 2875 2880
Ser Leu Thr Ala Ile His Leu Ala Cys Ala Asp Leu Ala Leu Gly Arg
2885 2890 2895
Val Arg Met Ala Phe Ala Gly Gly Val Asn Leu Asn Leu His Pro Asn
2900 2905 2910
Lys Tyr Ser Leu Leu Ser Lys Gly Gln Phe Ile Ser Ser Asn Gly Arg
2915 2920 2925
Cys Gln Ser Phe Gly Ser Glu Gly Asp Gly Tyr Val Pro Ala Glu Gly
2930 2935 2940
Val Gly Val Val Leu Leu Lys Arg Leu Ala Asp Ala Glu Ala Asp Gly
2945 2950 2955 2960
Asp His Ile Tyr Gly Val Ile Lys Gly Ser Ala Leu Asn His Gly Gly
2965 2970 2975
Arg Ala Asn Gly Tyr Thr Val Pro Asn Pro Glu Ala Gln His His Val
2980 2985 2990
Ile Ala Arg Ala Leu Arg Glu Ala Gly Val Asp Pro Arg Ala Ile Gly
2995 3000 3005
Tyr Val Glu Ala His Gly Thr Gly Thr Lys Leu Gly Asp Pro Ile Glu
3010 3015 3020
Ile Lys Gly Leu Asn Asp Gly Tyr Gly Pro Val Leu Glu Gly Pro Cys
3025 3030 3035 3040
Trp Ile Gly Ser Ala Lys Ser Asn Ile Gly His Gly Glu Ala Val Ser
3045 3050 3055
Gly Leu Ala Gly Leu Thr Lys Val Leu Leu Gln Leu Lys Ala Gly Glu
3060 3065 3070
Ile Ala Pro Ser Leu His Ala Glu Thr Leu Asn Pro Asn Ile Asp Phe
3075 3080 3085
Ala Ala Thr Pro Phe Arg Val Asn Thr Ser Leu Arg Thr Trp Asp Ala
3090 3095 3100
Pro Val His Glu Gly Lys Thr Leu Pro Arg Val Ser Ala Val Ser Ser
3105 3110 3115 3120
Phe Gly Ala Gly Gly Ser Asn Ala His Leu Val Val Glu Glu His Cys
3125 3130 3135
Pro Pro Pro Ser Val Glu Pro Tyr Ser Tyr Gly Pro Val Leu Ile Thr
3140 3145 3150
Leu Ser Ala Lys Ala Glu Asp Arg Leu Lys Ala Tyr Ala Cys Ala Leu
3155 3160 3165
Ala Asp Trp Ala Glu Asn Ala Pro Ala Glu Thr Ser Leu Arg Asp Leu
3170 3175 3180
Ala Tyr Thr Leu Gln Val Gly Arg Glu Pro Met Pro His Arg Ile Gly
3185 3190 3195 3200
Val Gln Val Ser Thr Val Glu Glu Leu Ala Arg Tyr Leu Arg Gln Phe
3205 3210 3215
Leu Ala Gly Arg Asp Gly Pro Val Arg Ser Gly Arg Ala Arg Val Val
3220 3225 3230
Ser Asn Pro Thr Val Glu Asn Pro Asp Gly Leu Ala Ala Glu Val Leu
3235 3240 3245
Leu Asp Gly Trp Met Gln Gly Thr Val Tyr Asp Trp Arg Lys Ile Tyr
3250 3255 3260
Gly Gly Glu Ala Arg Arg Leu Ser Leu Pro Thr Tyr Pro Phe Ala Arg
3265 3270 3275 3280
Glu Ile Tyr Trp Pro Asp Thr Thr Ala Gln Pro Ala Pro Ile Ala Leu
3285 3290 3295
Arg Thr Ala Ala Thr Thr Ala Lys Thr Thr Glu Thr Arg Ala Leu Glu
3300 3305 3310
Ala Lys Ser Thr Gly His Thr Ser Val Leu His Thr Asp Leu Leu Leu
3315 3320 3325
Leu Arg Pro Gln Trp Lys Asp Leu Pro Leu Thr Ala Pro Ser Ile Asp
3330 3335 3340
Pro Ala Leu Arg Arg Val Ala His Ile Gly Pro Met Arg Asn Leu Gln
3345 3350 3355 3360
Glu His Ala Gln Leu Ala Leu Pro Ala Ser Asp Pro Ala Asp Pro Asn
3365 3370 3375
Thr Phe Thr Asp Gln Ala Leu Ala Leu Leu Arg Asp Leu Lys Glu Leu
3380 3385 3390
Ala Leu Gln Ser Ser Asp Gln Lys Val His Tyr Gln Val Val Leu Pro
3395 3400 3405
Ala Ser Tyr Ser Gln Ser Ala Ala Leu Ala Gly Met Leu Asp Ser Ala
3410 3415 3420
Ala Arg Glu Leu Pro Arg Leu Thr Cys Gln Val Leu Cys Phe Asp Thr
3425 3430 3435 3440
Asp Asp Pro Ala Ser Gly Pro Leu Glu Ala Asp Leu Lys Ala Val Ala
3445 3450 3455
Ala Trp Pro Gly Lys Ser Arg Leu Arg Lys Lys Asp Gly Arg Trp Gln
3460 3465 3470
Ala Leu Thr Trp Gln Glu Glu Gln Asp Val Ala Asp Ala Gln Pro Gly
3475 3480 3485
Gly Gly Trp Arg Glu Gly Gly Arg Tyr Leu Ile Val Gly Gly Cys Gly
3490 3495 3500
Gly Leu Gly Ala Ile Val Ala Arg His Leu Ala Gln Thr Leu Ser Arg
3505 3510 3515 3520
Val Ser Leu Val Leu Thr Gly Arg Ser Pro Ser Gly Pro Lys Gln Asn
3525 3530 3535
Ala Leu Leu Gln Glu Leu Arg Ser Lys Gly Ala His Ala Asp Tyr Leu
3540 3545 3550
Ala Thr Asp Leu Gly Asp Ala Ala Ala Val Arg Ser Met Ile Arg Gln
3555 3560 3565
Thr Thr Asp Gln Gly Ser Leu His Gly Val Ile His Cys Gly Gly Val
3570 3575 3580
Leu Ser Asp Ala Leu Ile Leu Arg Lys Thr Glu Glu Asp Leu Arg Arg
3585 3590 3595 3600
Val Phe Ala Pro Lys Val Thr Gly Val Ala Asn Leu Asp Arg Ala Thr
3605 3610 3615
Asp Gly Leu Asp Leu Asp Leu Phe Leu Val Phe Ser Ser Ile Ala Gly
3620 3625 3630
Thr Met Gly Asn Pro Gly Gln Ala Asp Tyr Ala Ala Ala Asn Ala Tyr
3635 3640 3645
Leu Asp Gln Tyr Val Glu Glu Arg Asn Arg Arg Ala Leu Ser Pro Gly
3650 3655 3660
Gly Pro Arg Gly Met Ala Leu Ser Val Ala Trp Pro Tyr Trp Ala Asp
3665 3670 3675 3680
Gly Gly Met Thr Leu Asp Ala Ala Ala Val Asn Ala Met Arg Asp Gly
3685 3690 3695
Ala Gly Leu Val Pro Leu Ser Thr Ala Arg Gly Leu Glu Ala Leu Asp
3700 3705 3710
Arg Ile Val Arg Ala Gly Trp Pro Gln Thr Met Val Leu Glu Gly Asp
3715 3720 3725
Gly Asp Arg Leu Ala Ala Leu Ile Ala Ala Ala Asp Ala Gly Gln Pro
3730 3735 3740
Ala Gly Ala Pro Ala Gly Pro Glu Pro Ala Pro Pro Pro Ser Ser Phe
3745 3750 3755 3760
His Leu Gln Asp Ala Val Glu Glu Tyr Leu Ala Glu Glu Leu Ala Lys
3765 3770 3775
Val Leu Arg Ile Ser Pro Gln Arg Leu Glu Ala Asp Val Pro Leu Val
3780 3785 3790
Asp Tyr Gly Val Asp Ser Val Ala Ile Met Ala Leu Thr Ala Ser Ile
3795 3800 3805
Glu Thr Val Thr Gly Pro Leu Pro Ala Thr Leu Phe Phe Glu Asn Pro
3810 3815 3820
Thr Ile Glu Ala Ala Ala Gly Ala Leu Thr Asp Leu Ala Ser Gln Ser
3825 3830 3835 3840
Leu Met Glu Ala Leu His Val Pro Glu Pro Thr Val Asp Leu Leu Glu
3845 3850 3855
Pro Ala Pro Gly Gly Thr Ala Glu Asp Gln Ala Pro Ser Glu Asp Pro
3860 3865 3870
Leu Leu Asp Asn Asn Ala Lys Pro Val Arg Ala Glu Ala Ala Val Pro
3875 3880 3885
Asp Thr Gln Ser Ala Gly Ser Gly Asp Ile Ala Ile Ile Ala Met Glu
3890 3895 3900
Gly Arg Phe Pro Gly Ala Glu Asp Leu Glu Glu Phe Trp Asp Asn Leu
3905 3910 3915 3920
Val Asn Gly Arg Asn Ser Ile Thr Glu Val Pro Lys Asp Arg Trp Asp
3925 3930 3935
Ala Glu Ser Leu Phe Asp Pro Asp Gly Ala Tyr Glu Gly Lys Ala Arg
3940 3945 3950
Cys Lys Trp Gly Gly Phe Leu Ser Asp Val Asp Gly Phe Asp Ala Arg
3955 3960 3965
Phe Phe Arg Ile Thr Pro Asp Glu Ala Glu Leu Leu Asp Pro Gln Glu
3970 3975 3980
Arg Leu Phe Leu Glu Thr Ala Trp Ala Leu Met Glu Lys Ala Gly Tyr
3985 3990 3995 4000
Met Gly Pro Ala Leu Arg Val Asp Leu Glu Ser Ala Val Gly Val Phe
4005 4010 4015
Ala Gly Ser Met Thr Gln Gln Tyr His Ala Val Arg Ser Asp Pro Leu
4020 4025 4030
Arg Glu Ala Leu Thr Val Leu Ser Ser Pro Ser Ser Ile Ala Asn Arg
4035 4040 4045
Val Ser Asn Val Leu Asp Leu Asn Gly Pro Ser Leu Ala Val Asp Thr
4050 4055 4060
Met Cys Ser Ser Gly Ile Val Ala Ile His Met Ala Cys Glu Ser Leu
4065 4070 4075 4080
Arg Ala Gly Ala Cys Arg Ala Ala Ile Ala Gly Gly Val Asn Val Ser
4085 4090 4095
Ile His Pro Lys Lys Tyr Ile Gly Leu Ser Ala Ser Gln Phe Ile Gly
4100 4105 4110
Ser Arg Arg Asp Ser Thr Ser Phe Arg Asp Gly Asp Gly Tyr Leu Pro
4115 4120 4125
Ala Glu Gly Val Gly Ala Val Leu Leu Arg Pro Leu Asp Asp Ala Val
4130 4135 4140
Ala Ala Gly Asp Arg Val Leu Ala Leu Ile Lys Ser Thr Gly Ile Asn
4145 4150 4155 4160
His Ser Gly Arg Ser Asn Gly Tyr Arg Val Pro Ser Val Ala Ala Gln
4165 4170 4175
Ala Lys Leu Ile Gly Asp Thr Ile Arg Gln Ala Gly Val Pro Val Asn
4180 4185 4190
Thr Ile Thr Tyr Ala Glu Ala Ala Ala Asn Gly Ala Ala Met Gly Asp
4195 4200 4205
Ser Ile Glu Leu Ala Ala Phe Arg Gln Ala Phe Gln Asp Leu Thr Pro
4210 4215 4220
Glu Gln Lys Phe Cys Ala Ile Gly Ser Val Lys Ser Asn Ile Gly His
4225 4230 4235 4240
Ala Glu Ser Ala Ser Gly Leu Ser Gln Leu Ala Lys Val Val Leu Gln
4245 4250 4255
Met Gln Ala Glu Thr Leu Val Pro Thr Leu Gly Thr Asp Ala Leu Asn
4260 4265 4270
Pro Lys Leu Asp Phe Ser Ser Gly Pro Phe Arg Leu Gln Ser Glu Leu
4275 4280 4285
Gln Ala Trp Ala Arg Pro Ile Gly Ser Asp Ala Ala Ser Gly Gly Ser
4290 4295 4300
Asn Gln Pro Leu Arg Ala Ile Leu Asn Ser Val Gly Ala Gly Gly Thr
4305 4310 4315 4320
Asn Ala Cys Met Val Leu Glu Glu Pro Pro Lys Thr Ser Ala Pro Pro
4325 4330 4335
Ala Ala Val Ala Gln Asp Gln Tyr Leu Ile Pro Leu Ser Ala Arg Asp
4340 4345 4350
Glu Ala Asp Leu Arg Val Leu Ala Gly Arg Leu Lys Thr Tyr Leu Glu
4355 4360 4365
Thr Arg Pro Glu Thr Arg Met Ala Asp Leu Ala Leu Thr Leu Gln Thr
4370 4375 4380
Gly Arg Ser Gln Leu Asp Gln Arg Ala Ala Met Ile Ser Arg Asp Val
4385 4390 4395 4400
Pro Ala Leu Leu His Gln Leu Glu Ala Leu Ala Glu Gly Leu Glu Ala
4405 4410 4415
Asp Gly Leu Val Thr Gly Asn Thr Met Thr Gly Gln Asp Ala Leu Ser
4420 4425 4430
Gly Leu Leu Thr Gly Lys Thr Gly Ala Glu Ile Val Ser Leu Leu Leu
4435 4440 4445
Arg His Arg Asn Leu Arg Lys Leu Ala Val Ala Trp Val His Gly Ala
4450 4455 4460
Arg Leu Asn Trp Ser Pro Leu Gln Ala Glu Gly Ala Gln Arg Leu Ala
4465 4470 4475 4480
Leu Pro Ala Tyr Pro Phe Arg Arg Thr Arg Tyr Trp Leu Gly Gly Ile
4485 4490 4495
Asp Ala Arg Glu Ala Val Ser Gln Leu Glu Pro Asp Thr Arg Ser Asp
4500 4505 4510
Thr Thr Asp Pro Glu Thr Cys Ile Arg Asp Tyr Leu Ile Asn Asp Leu
4515 4520 4525
Arg Ile Ala Pro Glu Glu Ile Asp Phe Arg Arg Ser Ala Leu Asp His
4530 4535 4540
Gly Leu Asn Ser Val Met Leu Met Pro Leu Cys Gln Ala Leu Glu Ala
4545 4550 4555 4560
Arg Cys Gly Leu Thr Val Gly Leu Gly Asp Ile Met Glu Ser Lys Ser
4565 4570 4575
Leu Ala Thr Leu Leu Ser Arg Ile Ala Gly Lys Asp Gly Tyr Ala Pro
4580 4585 4590
Met Asp Asn Pro Lys His Ala Gln Pro Gly Thr Ser Asp Ala Val Asn
4595 4600 4605
Thr Ala Leu Pro Leu Thr Lys Gly Gln Ile Ala Leu Trp Leu His Asp
4610 4615 4620
Gln Lys Thr Pro Gly Asp Ala Gly Tyr Thr Val Pro Met Ala Leu Arg
4625 4630 4635 4640
Leu Ala Gly Ser Leu Asp Lys Asp Met Leu Arg Ala Ala Phe Ala Asp
4645 4650 4655
Leu Leu Lys Arg His Pro Val Leu Thr Ser Val Phe Thr Ala Asn Gly
4660 4665 4670
Gly Met Pro Gln Arg Ile Val Gln Asp Gly Ile Ser Tyr Pro Ile Glu
4675 4680 4685
Glu Leu Asp Leu Ser Gly Ala Pro Ala Ser Val Ile Glu Asn Glu Leu
4690 4695 4700
His Ala Phe Ala Gly Leu Pro Phe Asp Leu Thr Asn Gly Pro Leu Val
4705 4710 4715 4720
Arg Ser Leu Leu Ile Gln Glu Ala Ala Asp Arg His Val Leu Ile Ile
4725 4730 4735
Cys Val His His Ile Val Phe Asp Gly Gln Ser Ala Met Ile Leu Ile
4740 4745 4750
Asp Asp Leu Met Arg Leu Tyr Glu Ala Arg Leu Gln Gly Val Arg Leu
4755 4760 4765
Pro Arg Pro Ile Gly Ser Ser Phe Asp Ala Phe Gln Arg Trp Gln Glu
4770 4775 4780
Arg Leu Leu Thr Ser Glu Arg Gly Thr Asn Ile Arg Ala Phe Trp Arg
4785 4790 4795 4800
Asp Glu Leu Glu Gly His Asn Glu Leu Cys Leu Pro Gly Asp Trp Asp
4805 4810 4815
Ala Asp Leu Glu Cys Ala Ser Lys Ala Gly Ser His Val Leu Trp Ile
4820 4825 4830
Asp Lys Asp Thr Ala Arg Arg Ile Thr Glu Ala Ser Thr Ala His Gly
4835 4840 4845
Ala Thr Pro Ala Gln Phe Met Met Ala Ala Phe Val Leu Ile Leu His
4850 4855 4860
Arg Leu Thr Gly Ser His Asp Leu Leu Ile Gly Leu Pro Val Leu Gly
4865 4870 4875 4880
Arg Pro Asp Arg Ser Phe Asp His Thr Val Gly Tyr Phe Ala Asn Leu
4885 4890 4895
Leu Pro Leu Arg Ile Arg Leu Ser Asp Gln Val Ser Ile Arg Asp Leu
4900 4905 4910
Val Arg Glu Thr Arg Gln Thr Met Leu Asn Ala Leu Glu His Gly Asp
4915 4920 4925
Leu Pro Leu Ser Glu Met Gly Glu Val Ser Gly Thr Gly Arg Leu Leu
4930 4935 4940
Met Pro Arg Val Gln Phe Ala Phe Gln Ser Leu Val Gly Pro Gln Asn
4945 4950 4955 4960
Thr Asp Arg Gly Ser Leu Glu Val Ser Val Val Asp Gly Ile Asp Gln
4965 4970 4975
Gln Gly Val Gln Asp Leu Ala Leu Glu Val Tyr Pro Gly Pro Glu Gly
4980 4985 4990
Met Arg Cys Arg Phe Ala Tyr Asn Ala Arg Gln Phe Lys Ser Asp Thr
4995 5000 5005
Val Ser Ala Leu Ala Asp Ala Tyr Gln Lys Val Leu Ser Thr Phe Leu
5010 5015 5020
Ala Asp Pro Gly Gly Ala Leu Val Asp Val Ser Leu Ala Gly Ala Asp
5025 5030 5035 5040
Asp Glu Val Leu Thr Asp Trp Gly His Gly Gly Pro Pro Ala Pro Asp
5045 5050 5055
Glu Ala Leu Ile Pro Ala Trp Arg Ala Gln Val Arg Met Ala Pro Asp
5060 5065 5070
Ala Pro Ala Val Ile Cys Gly Asp Thr Val Leu Thr Asn Ala Ala Leu
5075 5080 5085
Glu Gln Asn Ala Gly Asp Leu Ala Ala Arg Leu Val Asp Ala Gly Val
5090 5095 5100
Gln Pro Gly Asp Val Val Ala Ser Cys Leu Ala Arg Ser Ala Asn Ser
5105 5110 5115 5120
Leu Val Ala Val Leu Ala Thr Trp Trp Val Gly Ala Val His Met Pro
5125 5130 5135
Leu Ser Pro Val Gln Ser Ser Ser Arg Leu Asp Asp Met Ile Ala Asp
5140 5145 5150
Gly Ala Pro Val Leu Ala Leu Thr Asp Ala Lys Thr Ala Ser Leu Leu
5155 5160 5165
Ser Ile Arg Gln Met Arg Val Asp Glu Arg Thr Glu Ile Ser Lys Ala
5170 5175 5180
Thr Ala Gly Val Leu Pro Thr Pro Val Ile Gln Asp Pro Ala Ala Ala
5185 5190 5195 5200
Ala Tyr Ile Leu Phe Thr Ser Gly Ser Ser Gly Arg Pro Lys Gly Val
5205 5210 5215
Gln Val Pro His His Ala Leu Ala His His Ile Gln Ala Met Ala Asn
5220 5225 5230
Leu Phe Ala Val Asn Asp Gln Asp Arg Val Leu Gln Phe Val Glu Thr
5235 5240 5245
Ser Phe Asp Ala Ala Phe Glu Gln Trp Leu Thr Thr Leu Val Arg Gly
5250 5255 5260
Ala Thr Val Val Met Arg Pro Glu Gly Leu Trp Ser Ala Leu Asp Phe
5265 5270 5275 5280
Ala Glu Ala Val Gln Arg Trp Ala Val Thr Val Ala Asp Leu Pro Pro
5285 5290 5295
Ala Phe Leu Asp Glu Val Leu Arg Asp Leu Gly Arg Ser Asp Asp Trp
5300 5305 5310
Gln Leu Leu Gln Ser Leu Arg Thr Val Val Thr Gly Gly Glu Ala Leu
5315 5320 5325
Thr Glu Asn Thr Leu Ser Thr Trp Cys Asp Ser Pro Leu Ala Asp Arg
5330 5335 5340
Ala Leu Val Asn Val Tyr Gly Pro Thr Glu Thr Thr Ile Gly Ser Thr
5345 5350 5355 5360
Ala Phe Val Tyr Arg Ala Gln Met Asp Gly Pro Glu Arg Arg Leu Pro
5365 5370 5375
Ile Gly Arg Pro Leu Pro Gly Glu Asn Val Phe Val Leu Asp Val Ala
5380 5385 5390
Asp Gln Pro Leu Pro Ala Gly Leu Ile Gly Glu Leu Ala Ile Gly Gly
5395 5400 5405
Val Gly Leu Ala Asp Gly Tyr Ile Ala Ala Gln Asn Lys Gln Gly Gly
5410 5415 5420
Phe Ser Ser Gly Pro Gly Gly Lys Ala Asp Arg Leu Tyr Lys Thr Gly
5425 5430 5435 5440
Asp Leu Ala Arg Trp Arg Thr Asp Gly Gln Leu Glu Phe Leu Gly Arg
5445 5450 5455
Arg Asp Asn Gln Val Asn Val Arg Gly Phe Arg Val Glu Leu Ala Glu
5460 5465 5470
Val Glu Ala Gly Leu Glu Arg Ile Asp Gly Val Leu Arg Ala Ala Val
5475 5480 5485
Thr Val Ser Asp Arg Lys Pro Asp Thr Thr Leu Gln Ala Tyr Val Thr
5490 5495 5500
Val Ser Asp Pro Asp Leu Glu Pro Ala Ala Ile Ser Arg Ala Leu Lys
5505 5510 5515 5520
Ser Ser Leu Pro Asp Tyr Met Trp Pro Ser Glu Ile Arg Val Val Thr
5525 5530 5535
Ala Leu Pro Gln Thr Ile Ala Gly Lys Leu Asp Arg Gln Ser Leu Asn
5540 5545 5550
Gly Ala Pro Ala Pro Ser Val Ser Ile Pro Glu Gly Pro Leu Ser Arg
5555 5560 5565
Ile Glu Lys Val Leu Ala Ser Leu Trp Ala Glu Leu Leu Asp Cys Pro
5570 5575 5580
Ser Val Pro Val Thr Ala Asn Ile Phe Glu Leu Gly Ala His Ser Leu
5585 5590 5595 5600
Leu Leu Ile Arg Phe Ala Gly Glu Ile Arg Ser Arg Leu Gly Ala Glu
5605 5610 5615
Leu Ser Val Ala Gln Leu Phe Gln Ala Pro Thr Val Ala Asp Gln Ala
5620 5625 5630
Val Leu Ile Glu Arg Ala Lys Gly Asn Arg Ser Ser Val Val Asn Leu
5635 5640 5645
Gln Ala Gly Ser Gly Pro Gly Leu Val Leu Val His Gly Gly Val Gly
5650 5655 5660
Thr Leu Leu Cys Tyr Arg Thr Leu Met Lys His Leu Asp Pro Arg Phe
5665 5670 5675 5680
Ser Ile Leu Gly Leu Glu Met Asn Arg Leu Asp Arg Trp Asn Ser Ile
5685 5690 5695
Pro Asp Ala Ala Thr Ala Tyr Leu Ala Asp Leu Glu Phe Asp Gln Gly
5700 5705 5710
Gln Ala Pro Leu His Leu Ala Gly Trp Ser Ser Gly Gly Ile Val Ala
5715 5720 5725
Trp Glu Met Ala Arg Gln Ile Glu Arg Ser Gly Gly Glu Leu Ala Ser
5730 5735 5740
Leu Thr Leu Ile Asp Ser Tyr Pro Pro Ala Val Leu Ser His Ile Asp
5745 5750 5755 5760
Asn Arg Ile Gln Pro His Asp His Glu Lys Ala Leu Leu Ala Gly Phe
5765 5770 5775
Ala Arg Asp Met Gly Leu Ala Ala Glu Leu Pro Ser Ala Glu Pro Lys
5780 5785 5790
Gly Ala Pro Glu Lys Tyr Leu Gln Asn Met Ala Glu Asn Thr Gly Glu
5795 5800 5805
Asp Phe Gln Val Leu Leu Thr Leu Phe Asn Asn Tyr Lys His Ile Ala
5810 5815 5820
Lys Ala Val Asp Gly Tyr Thr Pro Glu Pro Val Ser Val Ala Ala Ser
5825 5830 5835 5840
Val Phe His Ala Glu Gly Ala Glu Ile Ser Ser Ala Met Arg Gly Trp
5845 5850 5855
Pro Ala Glu Ala Gly Val Leu Asp Ile Gln Pro Val Pro Gly Gly His
5860 5865 5870
Leu Ser Met Leu Glu Gly Glu His Ser Arg Phe Leu Ala Asn Leu Leu
5875 5880 5885
Asn Gly Lys Leu Thr Thr Ala His Asp
5890 5895
<210> 17
<211> 437
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 17
Met Thr Ala Thr Arg Ala Ser Ala Leu Ser Val Cys Val Ile Gly Gly
1 5 10 15
Gly Pro Leu Gly Ile Gly Leu Gly Arg Glu Leu Ser Glu Gly Gly Ile
20 25 30
Asp Tyr Asp Leu Tyr Glu Gln Glu Ser Asp Leu Gly Gly Val Trp Asn
35 40 45
Thr Asp Ala Pro Cys Gly Arg Thr Tyr Pro Ser Leu His Leu Ile Ser
50 55 60
Pro Lys Phe Asn Thr Gln Val Pro Asp Phe Pro Met Pro Asp His Tyr
65 70 75 80
Pro Ala Tyr Pro Asn His Lys Met Met Leu Asp Tyr Ile Arg Ser Tyr
85 90 95
Ala Arg His Phe Gly Val Tyr Asp His Ala His Cys Asn Thr Gly Val
100 105 110
Thr Trp Ile Glu Pro Asp Gly Asp Gly Trp Asn Val Glu Leu Ser Thr
115 120 125
Gly Ala Thr Arg Arg Tyr Asp Ile Val Ala Val Cys Asn Gly Ala Gln
130 135 140
Arg Val Pro His Tyr Pro Lys Pro Pro Tyr Pro Gly Thr Phe Ser Gly
145 150 155 160
Glu Val Leu His Thr Ala Asp Tyr Lys Asn Pro Ser Gln Ile Ala Gly
165 170 175
Lys Arg Val Leu Val Ile Gly Ala Gly Asn Ser Gly Cys Asp Val Ala
180 185 190
Val Asp Ala Val His His Ala Val Ser Val His His Ser Thr Arg Arg
195 200 205
Gly Tyr His Tyr Tyr Pro Lys Phe Ile Asp Gly Lys Pro Thr Pro Gln
210 215 220
Trp Met Leu Gln Leu Gly Thr Lys Phe Thr Ser Lys Glu Glu Thr Ser
225 230 235 240
Ala Tyr Ile Gln Lys Val Phe Lys Leu Ala Gly Phe Asp Gly Thr Asp
245 250 255
Phe Gly Leu Pro Ala Pro Asp His Pro Ile Asp Ala Ala His Pro Ile
260 265 270
Met Asn Ser Gln Ile Leu Tyr His Ile Gly His Gly Asp Ile Ala Thr
275 280 285
Val Gly Asp Val Ala Gly Phe Asp Asp Leu Thr Val Arg Phe Lys Asp
290 295 300
Gly His Glu Ala Glu Ile Asp Ile Ile Val Tyr Ala Thr Gly Tyr Asp
305 310 315 320
Arg His Phe Pro Phe Ile Asp Pro Asp Ile Leu Asp Trp Lys Asp Gly
325 330 335
Ile Pro Asp Leu Phe Ile His Ile Val Pro Arg Asn Leu Asn Asn Leu
340 345 350
Phe Phe Phe Gly Phe Val Asn Ala Ala Ala Gly Leu Gly Asp Gly Met
355 360 365
Arg Leu Gln Gly Gln Phe Val Arg Ser Tyr Val Arg Ala Phe Glu Asn
370 375 380
Gln Thr Leu Gly Tyr Gln Lys Phe Val Ala Ala Lys Ala Gln Asp Asp
385 390 395 400
Pro Asp Leu Gly Gln Asp Tyr Phe Val Asp Ser Arg Arg His Thr Trp
405 410 415
Glu Val Asp Phe Trp Lys Phe Ile Arg His Ala Arg Tyr Tyr Arg Glu
420 425 430
Met Leu Asp Asp Asp
435
<210> 18
<211> 2764
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 18
Met Lys Asp His Ser Gly Ile Val Pro Val Ala Phe Phe Leu Asp Arg
1 5 10 15
Leu Leu Asp Leu Glu Gly Asp Gly Ala Leu Cys Asn Ile Val Phe Pro
20 25 30
Gln Pro Leu Arg Ile Asn Glu Gly Arg Ala Thr Ala Leu Leu Gln Gln
35 40 45
Thr Gly Gly Arg Leu Glu Ile Thr Leu Asp Gly Val Arg Tyr Cys Gln
50 55 60
Ala Asp His Glu Lys Gly Ser Asp Thr Ala Phe Thr Arg Pro Arg Pro
65 70 75 80
Val Asp Leu Asp Ala Arg Arg Thr Glu Thr Pro Phe Val Leu Thr Ser
85 90 95
Arg Ala Cys Asp Ala Val Leu Gln Ser Thr His Gly Pro Ser Leu Met
100 105 110
Ser Leu Ala Glu Gln Arg Asn Gly Pro Ser Gly Ala Leu Ala Arg Val
115 120 125
Gln Ser Ala Glu Met Gly Ala Arg Arg Arg Val Ala Val Leu Asn Gly
130 135 140
Ala Leu Leu Ala Ala Val Val Trp Cys Gln Thr Gln Arg Glu Glu Ser
145 150 155 160
Thr Leu Pro Met Pro Tyr Gly Ile Gly Ser Leu Thr Gln Phe Thr Pro
165 170 175
Thr Leu Pro Asp Lys Val Leu Val Asp Leu Arg Pro Ala Arg Lys Gly
180 185 190
Pro Pro Gly Ala Asp Arg Val Thr Leu Asp Leu Asp Leu Cys Asp Asp
195 200 205
Asn Gly Ser Val Phe Leu Ala Leu Arg Gly Leu Glu Leu Val Trp Ser
210 215 220
Glu Lys Gln Gln Leu Pro Gly Pro Asn Gln Leu Leu Phe Ala Gly Pro
225 230 235 240
Cys Trp Gln Glu Ile Ser Pro Pro Leu Met Asn Gly Thr Ala Pro Val
245 250 255
Asp Pro Val Leu Phe Val Thr Gln Thr Asp Ala His Arg Gln Ser Thr
260 265 270
Leu Arg Ala Ala Phe Pro Gly Ala Asp Leu Arg Val Leu Ser Asp Thr
275 280 285
Val Glu Asn Ala Phe Ala Glu Ile Leu Lys Phe Val Gln Ser Asn Asp
290 295 300
Pro Val Arg Gly Ala Arg Pro Val Leu Leu Ile Val Pro Asp Gln Ser
305 310 315 320
Leu Ala Ser Ser Leu Ser Gly Phe Met Arg Cys Leu Arg Leu Glu His
325 330 335
Pro Ala Ser Cys Ala Gln Ala Val Leu Val Pro Gly Ser Leu Ser Asp
340 345 350
Arg Ala Leu Thr Ser Gly Leu Lys Gln Val Leu Asn Ser Gly Gln Leu
355 360 365
Pro Met Leu Ser Arg Leu Thr Glu Ser Gly Pro Gln Asn Gly Trp Val
370 375 380
Arg Glu Ile Pro Leu Pro Ser Arg Thr Ala Tyr Phe Ala Ala Gly Asp
385 390 395 400
Val Ile Trp Ile Thr Gly Gly Leu Gly Gly Ile Gly Arg Ile Leu Ala
405 410 415
Arg His Tyr Ala Ser Ala Gly Gln Arg Val Val Leu Thr Gly Arg Ser
420 425 430
Ala Pro Pro Ser Gly Ala Glu Ala Phe Leu Thr Glu Thr Gly Ala Leu
435 440 445
Tyr Leu Gln Gly Asp Val Thr Asp Cys Ser Thr Ala Thr Leu Leu Ala
450 455 460
Arg Asp Ile Leu Ala Lys His Gly Arg Leu Asp Ala Val Ile His Ala
465 470 475 480
Ala Gly Leu Ile Glu Asp Gly Leu Leu Arg Asp Lys Gly Gln Glu Ser
485 490 495
Ala Ala Arg Val Leu Ala Pro Lys Leu Ala Gly Thr Arg Ala Leu Asp
500 505 510
Glu Ala Thr Ala Glu Leu Pro Leu Lys Ala Phe Val Leu Cys Ser Ser
515 520 525
Val Ala Gly Val Leu Gly Asn Val Gly Gln Ala Asp Tyr Ala Cys Ala
530 535 540
Asn Ala Tyr Leu Asp Val Phe Ala Glu Leu Arg Gln Gly Gln Val Leu
545 550 555 560
Asn Gly Gln Arg His Gly Gln Ser Leu Ser Val Ala Trp Pro Leu Trp
565 570 575
Gln Gly Gly Gly Met Ala Met Thr Asp Glu Asn Ala Arg Met Met Arg
580 585 590
Thr Gly Thr Gly Met Val Pro Met Pro Asp Gly Thr Gly Ile Glu Ala
595 600 605
Leu Glu Arg Ala Leu Ala Ser Gly Glu Thr Arg Leu Val Val Ala Tyr
610 615 620
Gly Leu Pro Glu Glu Ile Arg Glu Arg Phe Leu Gly Phe Glu Tyr Pro
625 630 635 640
Ala Gly Asn Asn Val Leu Glu Pro Ala Ala Val Glu Gln Gln Ala Asp
645 650 655
Gln Ser Glu Leu Glu Thr Arg Leu Arg Asp Leu Val Ala Lys Val Gln
660 665 670
His Ile Pro Val Gln Lys Val Thr Arg Tyr Lys Pro Leu Ser Asp Tyr
675 680 685
Gly Phe Asp Ser Ile Ser Phe Thr Glu Leu Ala Asn Glu Val Asn Ser
690 695 700
Ala Phe Gly Leu Arg Leu Met Pro Thr Val Phe Phe Glu Ile Pro Asp
705 710 715 720
Leu Ala Ala Leu Ala Asp Lys Leu Ala Lys Asp His Ser Val Thr Leu
725 730 735
Glu Pro Glu Lys Arg Pro Ser Ser Val Thr Ser Pro Ala Pro Ala Arg
740 745 750
Ala Val Val Asp Gln Glu Lys Pro Val Arg Ser Ser Ala Gly Phe Asp
755 760 765
Gly Ser Val Ser Ile Gly Lys Ala Pro Ser Val Asn Arg Gly Met Asp
770 775 780
Thr Ala Glu Pro Ile Ala Val Ile Gly Met Ala Ala Lys Leu Pro Gly
785 790 795 800
Val Gln Ser Leu Asp Ala Phe Trp Arg Ala Leu Asp Ala Gly Arg Asp
805 810 815
Leu Ile Ser Glu Val Pro Ala Asp Arg Trp Asp Trp Arg Ala Phe Gln
820 825 830
Ser Gly Pro Asp Glu Asp Lys Ser Ala Leu Lys Trp Gly Gly Phe Leu
835 840 845
Ala Asp Met Ala Cys Phe Asp His Ala His Phe Gly Ile Ser Pro Ala
850 855 860
Glu Ala Glu Val Leu Asp Pro Gln Leu Arg Leu Met Leu Glu Thr Leu
865 870 875 880
Trp Ala Thr Leu Glu Asn Ala Gly Val Ala Pro Asp Ser Val Ser Gly
885 890 895
Ser Arg Thr Gly Val Phe Thr Gly Val Ala Thr Cys Asp Tyr Ser Glu
900 905 910
Leu Leu Ala Lys Ala Arg Glu Ala Gly His Leu Arg Ser Ala Ala Glu
915 920 925
Pro Phe Ser Phe Leu Val Ala Asn Arg Ala Ser Tyr Phe Phe Asn Leu
930 935 940
His Gly Pro Ser Glu Thr Ile Asp Thr Ala Cys Ser Ser Ser Leu Ile
945 950 955 960
Ala Ile His Arg Ala Thr Glu Ser Leu Arg Ala Gly Met Cys Asp Met
965 970 975
Ala Leu Ala Gly Gly Val Asn Ile Leu Ala Thr Pro Arg Ile Thr Leu
980 985 990
Ala Ser Ser Arg Ala Gly Met Leu Ser Glu Asp Gly Arg Cys Met Ser
995 1000 1005
Phe Asp Ala Arg Ala Asn Gly Tyr Val Arg Ser Glu Gly Val Gly Ala
1010 1015 1020
Val Leu Leu Lys Pro Leu Ala Asp Ala Gln Arg Asp Gly Asp Arg Val
1025 1030 1035 1040
Leu Gly Val Ile Arg Ala Ser Gly Glu Asn His Gly Gly Arg Ala Ser
1045 1050 1055
Ser Pro Thr Ala Pro Asn Ala Thr Ala Gln Lys Glu Leu Ile Val Asp
1060 1065 1070
Val Val Arg Arg Ala Gly Ile Asp Pro Ala Ser Ile Gly Tyr Phe Glu
1075 1080 1085
Ala His Gly Thr Gly Thr Glu Leu Gly Asp Pro Val Glu Val Asn Gly
1090 1095 1100
Leu Lys Ala Ala Leu Ser Glu Leu Gly Leu Asp Ala Arg Asp Gly Pro
1105 1110 1115 1120
Ile Trp Leu Gly Ser Val Lys Ala Asn Val Gly His Thr Glu Ala Ala
1125 1130 1135
Ala Gly Val Val Ser Leu Ile Lys Leu Leu Leu Met Leu Arg His Asn
1140 1145 1150
Arg Ile Ala Gly Asn Pro His Leu Arg Asp Pro Asn Pro Tyr Leu Asp
1155 1160 1165
Leu Asp Glu Thr Pro Leu Ser Leu Val Arg Gly Ser Leu Asp Trp Pro
1170 1175 1180
Ser Gly Pro Ala Pro Arg Arg Ala Gly Leu Ser Ser Phe Gly Val Gly
1185 1190 1195 1200
Gly Ser Asn Ala His Leu Val Leu Glu Glu Pro Ala Thr Asp Thr Glu
1205 1210 1215
Pro Gly Leu Pro Gly Ser Ser Pro Ala Glu Ala Glu Ile Ile Ile Leu
1220 1225 1230
Ser Ala Arg Thr Pro Glu Ile Arg Ala Gln Met Ala Gly Asp Leu Ala
1235 1240 1245
Gln His Leu Arg Ala Asn Gln Asp Thr Leu Cys Leu Ser Asp Val Ala
1250 1255 1260
His Thr Leu Arg Val Gly Arg Ala Arg Leu Pro Ala Arg Leu Ala Phe
1265 1270 1275 1280
Glu Thr Ser Ser Leu Thr Glu Thr Ile Gln Leu Leu Glu Thr Val Ala
1285 1290 1295
Gln Gly Gln Val Pro Glu Asn Val Thr Leu Gly Glu Thr Glu Glu Ile
1300 1305 1310
Thr Gly Ile Ala Leu Ser Glu Asp Leu Pro Asp Leu Ile Glu Val Trp
1315 1320 1325
Leu Ala Lys Gly Gln Leu Ser Arg Val Leu Lys Ala Trp Val Ala Gly
1330 1335 1340
Ala Asp Leu Asp Trp Ala Gln Val Ala Pro Lys Arg Glu Gly Arg Arg
1345 1350 1355 1360
Ile Glu Leu Pro Gly Tyr Pro Phe Glu Arg Ile Thr His Trp Ile Gly
1365 1370 1375
Ser Glu Ser Pro Glu Ala Leu His Val Pro Asp Ala Ala Ala Ala Leu
1380 1385 1390
Pro Ser Val Arg Gln Phe Ala Glu Glu Trp Glu Pro Ser Pro Leu Leu
1395 1400 1405
Glu Pro Gly Ser Gly Pro Val Gly Arg Val Leu Val Leu Ala Pro Lys
1410 1415 1420
Ser Met Ser Ala Ala Asp Ala Asp Leu Asn Ala Gly Glu Asp Leu Leu
1425 1430 1435 1440
Trp Leu Thr Pro Glu Pro Glu Asp Leu Gln Asn Ser Glu Ala Ala Ala
1445 1450 1455
Arg Leu Leu Ser Trp Leu Glu Pro Ala Ser His Val Leu Leu Leu Leu
1460 1465 1470
Gly Asp Glu Asp Arg Val Ala Gly Pro Ile Ile His Leu Leu Gln Ala
1475 1480 1485
Leu Ala Gln Gly Arg Gln Arg Pro Gln Ser Leu Met Ile Cys Gly His
1490 1495 1500
Ala Glu Thr Pro Glu Asp Leu Ala Trp Leu Asp Ala Leu Val Gly Val
1505 1510 1515 1520
Gln Arg Ser Cys Arg Ser Ala Leu Pro Asp Leu Asn Val Ser Ile Val
1525 1530 1535
Phe Gly Ser Gly Thr Ser Leu Thr Val Met Val Arg His Ala Leu Ala
1540 1545 1550
Glu Met Thr Ala Gly Ala Gly Val Cys Val Arg Tyr Arg Gly Glu Glu
1555 1560 1565
Arg Gln Ile Cys Ala Ser Arg Ala Leu Lys Ala Pro Pro Asp Val Gln
1570 1575 1580
Thr Pro Trp Arg His Arg Gly Val Tyr Trp Ile Val Gly Gly Ser Gly
1585 1590 1595 1600
Ala Val Gly Ser Val Leu Ala Arg His Leu Ala Arg Thr Val Ser Ala
1605 1610 1615
Arg Leu Val Leu Ser Gly Arg Gly Pro Glu Asp Arg Ala Leu Ile Asp
1620 1625 1630
Glu Leu Cys Ala Leu Gly Ala Asp Val Cys Tyr Leu Pro Ala Asp Val
1635 1640 1645
Thr Asp Ile Ala Ala Leu His Thr Val Arg Asp Gln Ile Phe Ser Arg
1650 1655 1660
Trp Asp Arg Leu Asp Gly Ala Phe His Leu Ala Gly Arg Ser Gly Ala
1665 1670 1675 1680
Ala Pro Leu Ile Glu Ala Lys Ala Ser Gly Phe Asp Ser Val Leu Ala
1685 1690 1695
Pro Lys Leu Gln Gly Thr Lys Asn Leu His Glu Val Leu Thr Asn Ser
1700 1705 1710
Gly Ala Asp Phe Leu Cys Leu Phe Ser Ser Ser Ser Ala Val Leu Gly
1715 1720 1725
Asp Leu Gly Ser Gly Asp Tyr Ala Met Ala Asn Arg Phe Gln Ser Ala
1730 1735 1740
Phe Ala Ala Glu His Asn Asn Glu Thr Leu Pro Val Leu Ala Val Glu
1745 1750 1755 1760
Trp Pro Leu Trp Arg Ala Arg Gly Leu Ala Asp Ala Glu Ser Glu Ser
1765 1770 1775
Leu Tyr Leu Ala Ser Ser Gly Gln Val Pro Leu Glu Gly Glu Gln Ala
1780 1785 1790
Met Gln Ala Leu Glu Thr Ala Val Phe Thr Gly Arg Thr Arg Thr Leu
1795 1800 1805
Val Leu Ser Gly Asn Ala Glu Arg Leu Asp His Leu Ala Gly Thr Pro
1810 1815 1820
Gln Lys Ser Lys Pro Ser Ala Glu Thr Gly Asp Val Leu Thr Val Leu
1825 1830 1835 1840
Lys Ser Leu Ala Ala Asp Gln Leu Lys Met Ser Ser Gly Glu Ile Gly
1845 1850 1855
Ser His Lys Asn Leu Ala Ser Phe Gly Phe Asp Ser Ile Ala Leu Ser
1860 1865 1870
Glu Phe Ala Arg Ser Ile Gly Thr Cys Phe Asp Ile Asp Leu Ala Pro
1875 1880 1885
Ser Val Phe Phe Ser His Ala Thr Leu Gly Lys Leu Ala Ala His Leu
1890 1895 1900
Ser Glu Ile Gly Val Gly Val Thr Thr Pro Glu Ser Thr Gln Pro Arg
1905 1910 1915 1920
Thr Phe Ala Gln Pro Arg Ala Val Ser Asp Asp Ala Ile Ala Ile Ile
1925 1930 1935
Gly Thr Ser Gly Arg Phe Pro Gly Ala Arg Asp Val Gly Gly Leu Trp
1940 1945 1950
Asn Ile Leu Asp Gln Gly Arg Glu Ala Val Glu Glu Val Thr Pro Glu
1955 1960 1965
Arg Phe Asp Trp Arg Arg Ile Tyr Glu Ala Lys Thr Pro Pro Val Pro
1970 1975 1980
Gly Lys Thr Asn Ser Arg Trp Cys Gly Gln Val Pro Gly Leu Ser Glu
1985 1990 1995 2000
Phe Asp Pro Leu Phe Phe Glu Ile Ser Pro Leu Glu Ala Glu Arg Met
2005 2010 2015
Asp Pro Arg Gln Arg His Leu Leu Gln Glu Ser Trp Leu Ala Leu Glu
2020 2025 2030
Ser Ala Ala Leu Gly Pro Glu His Leu Ala Ser Gln Arg Val Gly Ser
2035 2040 2045
Phe Val Gly Val Glu Asp Gly Ser Asp Tyr Ile Lys Arg Ser Asp Gln
2050 2055 2060
Ile Ser Leu Thr Gly Ala His Asn Ala Val Leu Ala Ala Arg Leu Ser
2065 2070 2075 2080
Tyr Phe Leu Gly Leu Asp Gly Pro Ala Leu Ala Leu Asn Thr Ala Cys
2085 2090 2095
Ser Ser Gly Leu Met Ala Ala His Met Ala Cys Gln Ser Leu Arg Ala
2100 2105 2110
Gly Glu Cys Asp Val Ala Leu Ala Ala Gly Val Asn Leu Met Val Ser
2115 2120 2125
Gln Asp Ala Tyr Ile Gly Met Gly Gln Ala Gly Met Leu Ser Pro Asp
2130 2135 2140
Gly Lys Cys Tyr Thr Phe Asp Val Arg Ala Asn Gly Met Val Pro Gly
2145 2150 2155 2160
Glu Ala Val Ala Val Leu Val Leu Lys Ser Leu Ala Arg Ala Arg Glu
2165 2170 2175
Asp Gly Asp Pro Ile Gln Ala Val Ile Arg Thr Ser Gly Thr Asn Tyr
2180 2185 2190
Asp Gly His Thr Asn Gly Ile Thr Ala Pro Ser Gly Gln Ser Gln Val
2195 2200 2205
Asp Leu Leu Arg Arg Val Gln Ala Gln Ala Gly Val Lys Pro His Glu
2210 2215 2220
Ile Asp Trp Val Ile Ala His Gly Thr Gly Thr Glu Leu Gly Asp Leu
2225 2230 2235 2240
Val Glu Ala His Ala Leu Arg Asp Val Phe Ser Gly Ala Glu Arg Glu
2245 2250 2255
Pro Asn Ser Ile Ala Val Thr Thr Thr Lys Gly Asn Phe Gly His Thr
2260 2265 2270
Phe Ala Ala Ser Gly Leu Val Ser Ala Ile Gly Ala Val His Ala Leu
2275 2280 2285
Gln His Asp Arg Leu Pro Ala Ser Leu Asn His Asn Gln Pro Ser Pro
2290 2295 2300
Met Leu Gly Trp Gln Lys Thr Pro Leu Tyr Val Asn Thr Gln Ser Arg
2305 2310 2315 2320
Asp Trp Pro Arg Pro His Ala Gly Arg Ser Arg Leu Ile Ser Val Ser
2325 2330 2335
Ala Phe Gly Ile Ser Gly Thr Asn Val Asn Leu Leu Ile Glu Asp Ala
2340 2345 2350
Pro Asp Ser Pro Ala Gln Leu Pro Ser Glu Glu Arg Asn Tyr Val Ile
2355 2360 2365
Ser Leu Ser Ala Lys Thr Glu Ser Ser Leu Gln Ala Met Ala Ser Lys
2370 2375 2380
Leu Ala Ala Tyr Leu Lys Ser Pro Glu Ala Ala Asp Gln Gln Leu Ala
2385 2390 2395 2400
Ala Ile Ser Leu Thr Leu Leu Thr Gly Arg His Ala Phe Thr His Arg
2405 2410 2415
Leu Ala Leu Val Val Lys Asp Leu Gln Asp Ala Ala Arg Gln Leu Glu
2420 2425 2430
Ala Phe Asp Ser Thr Pro Gly Tyr Arg Gly His Val Pro Glu Glu Pro
2435 2440 2445
Asp Leu Pro Asp Met Ser Gln Gln Ile Ser Gly Leu Leu Glu Lys Ala
2450 2455 2460
Gln Ser Arg Glu Ala Leu His Glu Leu Ala Glu Leu Phe Cys Gln Gly
2465 2470 2475 2480
His Pro Ile Pro Trp Val Asn Leu Phe Pro Cys Ser Leu Arg Arg Ile
2485 2490 2495
Asn Leu Pro Gly Tyr Val Phe Glu Arg Asp Arg Cys Trp Ile Asp Ala
2500 2505 2510
Pro Glu Ala Arg Pro Ala Pro Ala Ile Gly Pro Tyr Val Lys Pro Leu
2515 2520 2525
Pro Glu Pro Asp Thr Pro Ala His Pro Pro Val Ser Gly Val Ser Asp
2530 2535 2540
Leu Ser Pro Gly Leu Asp Met Leu Glu Ala Ala Arg Gly Ala Ala Ser
2545 2550 2555 2560
Asn Val Leu Asn Arg Asp Val Gln Thr Leu Ser Arg Ile Val Trp Gly
2565 2570 2575
Ala Pro Gln Ser Ser Glu Ile Arg Pro Asp Pro Asn Glu Ile Cys Ile
2580 2585 2590
Leu Ser Ala Asp Gln Gly Leu Val Ala Val Glu Ala Ala Gly Thr Thr
2595 2600 2605
Asp Ala Leu Ala Leu Leu Ala Gln Ala Gly Ala Pro Cys Ser Ser Phe
2610 2615 2620
Pro Ala Pro Val Arg Leu Pro Arg Leu Arg Gly Gly Leu Lys Pro Val
2625 2630 2635 2640
Ser Ala Pro Gln Gly Val Ala Ala Leu Tyr Gly Asp Glu Gly Arg Leu
2645 2650 2655
Val Gly Asn Met Lys Gly Leu Ser Ala Pro Ala Val Phe Asp Val Arg
2660 2665 2670
Val Leu Arg Ala Ile Trp Asn Ser Val Gln Cys Leu Ser Asp Leu Glu
2675 2680 2685
Thr Ala Gln Val Ala Trp Pro Ala Ser Leu Met Thr Leu Ala Ser Thr
2690 2695 2700
Ala Pro Leu Thr Ser Asp Val His Phe Glu Val Val Arg Leu Ser Asp
2705 2710 2715 2720
Pro Asp Pro Gly Tyr Leu Asn Val Asp Val Thr Val Tyr Asp Pro Gln
2725 2730 2735
Gly Thr Pro Leu Met Ile Leu Arg Glu Phe Ser Leu Ser Leu Gly Ala
2740 2745 2750
Leu Pro Glu Asn Ile Gln Trp Glu Gly Val Glu Ala
2755 2760
<210> 19
<211> 1949
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 19
Met Pro Asp Leu Arg Asp Ile Ala Leu Thr Leu Gln Thr Gly Arg Glu
1 5 10 15
Ala Met Ala Glu Arg Ala Ala Phe Leu Val Gln Asp His Gln Asp Leu
20 25 30
Leu Thr Gln Leu Arg Ile Val Glu Asp Gly Gly Ile Pro Asp Lys Gly
35 40 45
Ala Arg Gly Arg Val Asn Leu Ser Glu Thr Gly Pro Arg Glu Glu Ala
50 55 60
Ile Gly Ser Ser Arg Leu Arg Ser Gln Asn Asn Gly Thr Leu Asp Glu
65 70 75 80
Ile Val Gln Ala Trp Val Ser Gly Gln Glu Ile Asp Trp Ser Ser Leu
85 90 95
Ala Gly Met Ala Gly Ala Arg Arg Ile Gly Leu Pro Leu Tyr Pro Phe
100 105 110
Asp Thr His Arg Leu Trp Phe Asp Glu Val Val Thr Glu Asp Asn Ala
115 120 125
Glu Asn Pro Asn Ala Pro Asp Pro Val Pro Glu His Val Thr Phe Ser
130 135 140
Pro Tyr Trp Glu Ser Val Ser Pro Thr Asp Lys Pro Ala Pro Leu Ile
145 150 155 160
Gly Pro Val Leu Ala Ile Gly Ala Thr Gly Ala Ser Arg Asp Gln Leu
165 170 175
Ala Asn Ala Tyr Pro Asp Ala Gln Phe Val Pro Pro Asp Glu Ala Pro
180 185 190
Lys Lys Leu Arg Glu Asn Trp Gly Thr Val Leu Trp Leu Ala Glu Pro
195 200 205
Gly Ala Ala Pro Leu Thr Phe Phe Arg Phe Ala Lys Ala Leu Ile Glu
210 215 220
Thr Gly Pro Ala Ser Gly Asn Leu Thr Leu Val Thr Arg Asn Gly Phe
225 230 235 240
Ala Phe Asp Ala Glu Pro Ala Asp Pro Glu Gln Ala Ala Ile Gln Gly
245 250 255
Cys Leu Ala Val Leu Ala Gln Glu Leu Pro Gly Trp Thr Leu Arg Ala
260 265 270
Met Asp Leu His Pro Ala Glu Pro Leu Phe Pro Asn Leu Leu Asp Thr
275 280 285
Leu Pro Leu Glu Gly Gly Gln Ile Gly Phe Ala Arg Arg Gln Gly Gln
290 295 300
Trp Leu Arg Pro Arg Leu Ile Pro Cys Asp Leu Pro Glu Val Pro Pro
305 310 315 320
Glu Ile Pro Tyr Arg Lys Asn Gly Val Tyr Leu Val Leu Gly Gly Ala
325 330 335
Gly Ala Leu Gly Arg Val Trp Thr Thr His Leu Leu Gln Arg Val Ser
340 345 350
Ala Gln Val Val Trp Leu Gly Arg Ser Ala Leu Ser Ala Gln Ile Arg
355 360 365
Gln Asn Met Ala Ala Tyr Asp Gly Ala Val Ser Tyr His Ser Ala Asp
370 375 380
Ala Arg Asn Pro Gly Glu Leu Ala Asp Ala Ile Ala Asp Ile Arg Asn
385 390 395 400
Arg Tyr Glu Lys Leu Asp Gly Val Ile Val Ser Thr Leu Ala Glu Tyr
405 410 415
Asp Lys Ser Ile Ala Glu Met Ser Glu Thr Leu Phe Gln Asp Ile Leu
420 425 430
Ser Thr Arg Leu Asn Val Val Ser Ala Leu Asp Lys Ala Leu Met Gly
435 440 445
Val Pro Thr Pro Asp Phe Val Ala Leu Phe Ser Ser Leu Ala Ser Cys
450 455 460
Gly Lys Pro Ala Gly Met Ala Ala Tyr Val Ala Gly Cys Gln Ala Ser
465 470 475 480
Glu Ala Ala Ala Phe Ala Leu Gly Arg Ser His Ser Cys Pro Val Thr
485 490 495
Val Val Asn Trp Gly Tyr Trp Asp Ile Gly Gly Gly Val Arg Val Thr
500 505 510
Asp Ser Leu Arg Ala Leu Ala Ala Arg Arg Gly Val Val Pro Ile Asp
515 520 525
Pro Glu Ala Gly Met Ala Leu Phe Glu Thr Ala Leu Ala Met Lys Gln
530 535 540
Pro Gln Ile Ala Ile Ser Arg Thr Thr Arg Pro Asp Arg Ile Glu Thr
545 550 555 560
Val Leu Glu Thr Pro Arg Met Lys Pro Leu Ser Gly Thr Ala Leu Pro
565 570 575
Val Leu Pro Gln Val Val Thr Arg Glu Ala Pro Pro Glu Pro Ala Arg
580 585 590
Glu Ala Ala Ala Leu Asp Gln Trp Leu Gly Arg Leu Leu Leu Ala Gln
595 600 605
Leu Arg Lys Met Asp Val Phe Asp Arg Pro Gly Leu Ser Arg Lys Ile
610 615 620
Glu Phe Glu Thr Phe Ala Ile Leu Ala Lys Phe Arg Pro Trp Trp Asp
625 630 635 640
Glu Ala Leu Asn Ile Leu Glu Glu Gln Gly Ser Ile Ser Arg Asp Ala
645 650 655
Ala Gly Ala Val Thr Leu Leu Gly Asp Asp Leu Leu Ser Pro Asp Thr
660 665 670
Val Trp Ala Glu Trp Glu Lys Ala Gln Gln Ala Phe Leu Glu Thr Pro
675 680 685
Asp Thr Arg Val Leu Ala Ile Leu Thr Thr Asp Cys Leu Lys Ala Leu
690 695 700
Pro Gln Ile Leu Arg Gly Gln Ala Leu Val Thr Asp Ile Leu Phe Pro
705 710 715 720
Ala Gly Lys Met Glu Lys Ile Glu Gly Leu Tyr Ser Asn Asn Arg Ile
725 730 735
Cys Asp Phe Phe Asn Ser Val Val Ala Asp Thr Val Asp Ala Val Ile
740 745 750
Thr Ala Arg Arg Ala Gln Asp Pro Glu Ala Lys Leu Arg Ile Leu Glu
755 760 765
Ile Gly Ala Gly Thr Gly Gly Thr Thr Ala Thr Leu Val Pro Arg Leu
770 775 780
Ala Arg Trp Ser Glu Ala Ile Ala Glu Tyr Cys Tyr Thr Asp Leu Ser
785 790 795 800
Lys Ser Phe Phe Thr His Ala Arg Arg Arg Phe Gly Gln Ser Ala Pro
805 810 815
Tyr Met Arg Phe Glu Leu Phe Asn Val Glu Ala Ala Pro Ala Ala Gln
820 825 830
Gly Leu Asp Ile Gly Ala Tyr Asp Ile Val Leu Gly Thr Asn Val Leu
835 840 845
His Ala Thr Arg Asp Ile Arg Glu Thr Val Arg Asn Ala Lys Ala Leu
850 855 860
Leu Lys Ser Gly Gly Val Leu Ile Ala Asn Asp Ile Ser Asp Lys Thr
865 870 875 880
Val Phe Ala Ser Val Leu Phe Gly Leu Ile Asp Gly Trp Ser Leu Ala
885 890 895
Glu Asp Arg His Phe Arg Ile Pro Gly Ser Pro Gly Leu Tyr Pro Glu
900 905 910
Thr Trp Glu Thr Val Phe Ala Leu Glu Gly Leu Gln His Val Gln Phe
915 920 925
Pro Ala Glu Ala Gln His Gly Leu Gly Gln Gln Ile Val Val Gly Gln
930 935 940
Ser Asp Gly Arg Val Ala Val Ser Glu Pro Phe Glu Val Glu Val Val
945 950 955 960
His Pro Gly Pro Leu Glu His Gly Thr Thr Asp Asp Asn Ser Val Ser
965 970 975
Glu Glu Glu Ile His Ser Gly Thr Gln Val Arg Gly Arg Gly Leu Leu
980 985 990
Ser Asn Glu Ala Ile Arg Ala Glu Ile Glu Asp Ala Leu Ala Ala Ala
995 1000 1005
Leu Asp Ile Asp Arg Asp Glu Ile Ala Ser Asp Val Pro Phe Ser Asp
1010 1015 1020
Tyr Gly Val Asp Ser Ile Leu Gly Val Gly Phe Val Arg Glu Ile Gly
1025 1030 1035 1040
Ala Arg Leu Ser Ile Thr Leu Gln Thr Thr Asp Leu Phe Asp His Thr
1045 1050 1055
Thr Val Ala Arg Leu Cys Ser Phe Ile Glu Glu Gln His His Pro Ala
1060 1065 1070
Val Gly Gly Ala Met Ser Glu Thr Asp Ile Glu Pro Lys Val Thr Thr
1075 1080 1085
Asp Pro Gln Arg Lys Leu Glu Arg Trp Asp Asp Gly Ile Ala Val Ile
1090 1095 1100
Gly Met Ala Gly Gln Phe Pro Gly Ala Ala Asp Val Asp Thr Leu Trp
1105 1110 1115 1120
Arg Asn Met Ile Asp Gly Val Asp Pro Val Val Pro Leu Pro Gly Arg
1125 1130 1135
Tyr Met Arg Pro Glu Lys Val Ser Gln Asp Lys Glu Pro Gly Lys Ser
1140 1145 1150
Tyr Cys Arg Trp Gly Gly Ile Leu Glu Asp Arg Asp Ala Phe Asp Pro
1155 1160 1165
Leu Phe Phe Arg Leu Ser Pro Arg Glu Ala Ala Ser Met Asn Pro His
1170 1175 1180
Gln Arg Leu Ile Leu Leu Glu Ser Trp His Ala Leu Glu Asp Ala Gly
1185 1190 1195 1200
Ile Asp Pro Gly Gly Leu Ala Glu Ser Arg Thr Gly Val Phe Val Gly
1205 1210 1215
Cys Glu Pro Ser Gly Tyr Val His Asp Thr Phe Thr Gly Ala Ser Asp
1220 1225 1230
Ala Ile Val Ala Ser Arg Ile Ser Tyr Phe Leu Asp Leu Lys Gly Pro
1235 1240 1245
Ala Tyr Val Val Asn Thr Gly Cys Ser Ser Ser Gly Val Ala Leu His
1250 1255 1260
Leu Ala Cys Glu Ser Leu Arg Asn Gly Glu Cys Asp Leu Ala Leu Ala
1265 1270 1275 1280
Gly Gly Ala Phe Ala Val Met Gly Glu Asn Ile Leu Ile Gly Leu Ala
1285 1290 1295
Gln Thr Glu Met Leu Thr Arg Thr Gly His Cys Arg Thr Phe Asp Ala
1300 1305 1310
Glu Ala Asp Gly Met Val Met Ser Glu Ala Ala Gly Met Val Val Leu
1315 1320 1325
Lys Pro Leu Ser Ala Ala Val His Asp Gly Asp Pro Ile His Gly Val
1330 1335 1340
Ile Arg Ala Ser Gly Thr Asn Gln Asp Gly Ala Ser Asn Gly Ile Thr
1345 1350 1355 1360
Ala Pro Ser Gly Ala Ala Gln Ala Ala Leu Ile Ser Asp Val Gln Ser
1365 1370 1375
Arg Phe Asp Ile Asp Pro Arg Arg Ile Ser Tyr Val Glu Thr His Gly
1380 1385 1390
Thr Gly Thr Lys Leu Gly Asp Pro Val Glu Ala Asn Ala Leu Val Lys
1395 1400 1405
Ala Phe Gln Pro His Asp Leu Thr Pro Gly Ser Cys Ala Leu Gly Ser
1410 1415 1420
Val Lys Ser His Ile Gly His Ser Ala Ala Ala Ala Gly Val Cys Gly
1425 1430 1435 1440
Leu Ile Ala Val Leu Met Ala Met Lys His Arg Lys Met Pro Glu Leu
1445 1450 1455
Arg His Phe Lys Ser Leu Asn Pro Leu Ile Asn Leu Glu Gly Ala Pro
1460 1465 1470
Phe Tyr Pro Leu Thr Glu Thr Ser Asp Trp Thr Arg Arg Asp Gly Gln
1475 1480 1485
Pro Leu Leu Ala Ala Leu Asn Ser Phe Gly His Ser Gly Thr Asn Ala
1490 1495 1500
His Leu Val Ile Glu Glu Ala Pro Glu Leu Arg Val Ser Pro Thr Val
1505 1510 1515 1520
Ser Val Gly Asp Pro Gln Gln Glu Leu Ile Leu Leu Ser Ala Lys Asp
1525 1530 1535
Val Glu Arg Leu Gln Leu Gln Ala Gly Ala Leu Ala Arg Lys Ile Glu
1540 1545 1550
Asn Val Pro Asp Leu Leu Leu Ala Asp Ile Ala His Thr Leu Arg Thr
1555 1560 1565
Gly Arg Met Ala Met Glu Cys Arg Ala Ala Phe Leu Val Thr Thr Arg
1570 1575 1580
Thr Glu Leu Leu Asp Arg Phe Lys Gly Leu Ala Ala Gly Thr Leu Ala
1585 1590 1595 1600
Ala Asp Trp Ser Gly Glu Val Pro Ser Lys Trp Thr Ala Arg Ala Gly
1605 1610 1615
Pro Gln Pro Glu Ala Pro Ser Ser Thr Ala Val Leu Ser Met Gln Ala
1620 1625 1630
Glu Ala Trp Val Ala Gly Ala Pro Ile Asp Trp Ser Gly Val Ala Leu
1635 1640 1645
His Gln Gly Trp Arg Gly Gln Arg Cys His Leu Pro Gly Tyr Pro Phe
1650 1655 1660
Ala Lys Glu Arg Tyr Trp Arg Ser Asp Arg Gln Asp Gln Asp Arg Asp
1665 1670 1675 1680
Lys Ser Gly His Asp Thr Leu His Leu Asn Gly Glu Glu Ser Trp Leu
1685 1690 1695
Arg Asp His Arg Ile Ala Gly Arg Pro Val Val Pro Gly Val Ala Tyr
1700 1705 1710
Pro Ala Leu Ala Leu Ala Arg Leu Thr Gly Ala Arg Asn Thr Gly Trp
1715 1720 1725
Arg Phe Glu Asp Leu Val Trp Pro Val Pro Leu Thr Val Glu Ala Pro
1730 1735 1740
Val Asp Leu Glu Ile Glu Ala Lys Ser Phe Asp Gln Asp Gly Ser Tyr
1745 1750 1755 1760
Ala Leu Ser Ser Leu Ala Pro Asp Gly Thr Ser Gln Val His His Gln
1765 1770 1775
Gly Arg Leu Ile Pro Leu Glu Gly Pro Pro Pro Ala Val Asp Leu Pro
1780 1785 1790
Ser Ile Arg Ala Arg Leu Ser Ala His Glu Met Ala Val Asp Ala Ile
1795 1800 1805
Tyr Gly Ala Leu Asn Glu Ala Gly Val Val His Gly Pro Ala Leu Lys
1810 1815 1820
Ser Ile Gly Arg Val Trp Ala Thr Pro Asp Glu Ile Leu Ala Glu Leu
1825 1830 1835 1840
Asn Leu Pro Gly Thr Ala Glu Ser Gly Val Met Pro Ile Ala Leu Leu
1845 1850 1855
Asp Gly Ala Trp Gln Ala Thr Leu Ala Leu Ser Leu Ala Asp Pro Asn
1860 1865 1870
Asn Pro Ala Pro Ala Ala Leu Pro Phe Ser Leu Glu Thr Leu Asp Leu
1875 1880 1885
His Ala Pro Leu Gly Arg Val Arg Phe Trp Ser Arg Arg Asn Gly Ala
1890 1895 1900
Arg Ala Trp Trp Thr Cys Lys Phe Cys Cys Pro Met Gly His Gln Arg
1905 1910 1915 1920
Cys Lys Cys Ala Gly Cys Thr Pro Gly Pro Ser Ala Leu Pro Asn Pro
1925 1930 1935
Arg Leu Leu Lys Ser His Trp Met Arg Arg Thr Arg Phe
1940 1945
<210> 20
<211> 875
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 20
Met Ala Gly Ala Leu Arg Ser Glu Ala Asn Phe Asp Gly Pro Leu His
1 5 10 15
Arg Gln Leu Thr Glu Gly Ala Pro Leu Thr Pro Val Trp His Ala Gln
20 25 30
Thr Leu Phe Thr Leu Glu Gly Gln Ser Pro Trp Arg Thr Gly Gly Val
35 40 45
Tyr Val Leu Ser Gly Gly Ala Gly Gly Ile Gly Leu His Leu Ala Arg
50 55 60
His Ile Ala His Ala Ala Glu Gly Ala Arg Leu Ile Leu Leu Ala Arg
65 70 75 80
Ser Ala Ile Asp Pro Glu Arg Leu Ala Ser Leu Arg His Thr Gly Cys
85 90 95
Asp Ala Thr Val Ile Arg Cys Asp Leu Gly Asn Pro Gly Glu Val Asn
100 105 110
Ser Ala Ile Gln Gln Val Leu Lys Lys Phe Gly Ala Leu His Gly Val
115 120 125
Leu His Leu Ala Gly Val Asn Gly Asp Gly Leu Leu Ala Ser Asp Leu
130 135 140
Glu Arg Gln Cys Asp Ala Met Leu Ala Pro Lys Val Ile Gly Ala Arg
145 150 155 160
Ala Leu Asp Gln Ala Thr Ala Gly Leu Asp Leu Asp Leu Phe Val Met
165 170 175
Ala Ser Ser Val Ala Thr Leu Arg Gly Ser Pro Gly Gln Ala Ala Tyr
180 185 190
Cys Leu Ala Asn Gly Phe Leu Asp Ser Phe Ala Arg Lys Arg Ala Gln
195 200 205
Ala Val Ala Ala Gly Glu Arg Phe Gly Gln Ser Leu Ala Leu His Trp
210 215 220
Pro Leu Trp Asp Asp Gly Gly Met Arg Pro Pro Asp Ala Asp Thr Glu
225 230 235 240
Met Ala Met Arg Gln Asn Thr Gly Leu Cys Pro Ile Pro Ala Gly Ile
245 250 255
Ala Leu Lys Ala Leu Asp Ser Ala Leu Gln Gln Gly Leu Thr Glu Ala
260 265 270
Ala Val Phe Tyr Gly Asn Gln Asp Lys Ala Leu Ser Trp Leu Ser Ser
275 280 285
Asp Ala Gly Gly Pro Lys Gln Ser Gly Pro Gln Asn Thr Val Gly Asp
290 295 300
Leu Pro Gln Arg Leu Glu His Arg Leu Lys Ala Leu Ile Gly Pro Ile
305 310 315 320
Leu Gly Arg Asp Ala Glu Ala Leu Asn Pro Val Glu Pro Leu Gln His
325 330 335
Tyr Gly Ile Asp Ser Ile Thr Ile Thr Arg Ile Ala Arg Asp Leu Gln
340 345 350
Ser Leu Ala Gly Pro Gly Ala Gln Thr Leu Leu Phe Arg Phe Ser Thr
355 360 365
Ile Arg Ser Leu Ala Glu His Leu Ala Lys Thr Tyr Gly Ala Ala Cys
370 375 380
His Glu Trp Ile Lys Glu Ala Ala Ala Ile Thr Pro Gln Asn Ser Asn
385 390 395 400
Thr Thr Ser Val Arg Pro Thr Gly Thr Thr Gln Leu Ser Ala Thr Glu
405 410 415
Ser Ile Ser Ser Pro Ala His Ala Arg Ala Glu Lys Ser Glu Ser Ile
420 425 430
Ala Ile Ile Gly Leu Ala Gly Arg Tyr Pro Gly Ser Asp Ser Leu Glu
435 440 445
Gly Phe Trp Gln Asn Leu Ala Gln Gly Arg Asp Cys Ile Thr Glu Ile
450 455 460
Pro Glu Glu Arg Trp Arg Leu Asp Gly Phe Phe Glu Pro Asp Glu Thr
465 470 475 480
Arg Ala Val Ala Gln Gly Lys Ser Tyr Ser Lys Trp Gly Gly Phe Leu
485 490 495
Glu Gly Phe Ala Asp Phe Asp Pro Leu Phe Phe Asn Met Ser Pro Arg
500 505 510
Glu Ala Arg Asp Ile Asp Pro Gln Glu Arg Ile Phe Leu Gln Cys Val
515 520 525
Trp His Ala Leu Glu Asp Ala Ala Leu Thr Arg Lys Asp Leu Lys Glu
530 535 540
His Tyr Asp Gln Asn Val Gly Val Phe Ala Gly Val Thr Lys Thr Gly
545 550 555 560
Phe Asp Leu Tyr Gly Pro Ala Gln Arg Ala Ala Gly Lys Val Ala Phe
565 570 575
Pro His Thr Ser Phe Gly Ser Ile Ala Asn Arg Val Ser Tyr Val Leu
580 585 590
Asp Leu His Gly Pro Ser Met Pro Ile Asp Thr Met Cys Ser Ser Gly
595 600 605
Leu Thr Ala Ile His Gln Ala Cys Ala Ala Leu Leu Asp Arg Ser Thr
610 615 620
Asn Leu Ala Ile Ala Gly Ala Val Asn Leu Tyr Leu His Ser Ser Asn
625 630 635 640
Tyr Ala Glu Leu Cys Ser Ala Tyr Met Leu Ser Arg Ser Gly Arg Cys
645 650 655
Arg Ser Phe Gly Ala Asp Ala Asp Gly Tyr Val Pro Gly Glu Gly Val
660 665 670
Gly Ala Ala Val Leu Lys Arg Leu Ser Glu Ala Glu Gln Asp Gly Asp
675 680 685
Arg Ile His Gly Val Ile Arg Ser Thr Ala Val Asn His Gly Gly His
690 695 700
Thr His Gly Tyr Thr Val Pro Asn Pro Arg Ala Gln Ala Ala Leu Val
705 710 715 720
Arg Ser Ala Leu Asn Lys Ala Gly Ile Asp Ala Asp Thr Ile Gly Tyr
725 730 735
Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile Glu Val
740 745 750
Asp Gly Leu Val Glu Ala Phe Ala Ser Gly Asn Val Leu Pro Gly Gln
755 760 765
Cys Trp Leu Gly Ser Val Lys Ser Asn Val Gly His Leu Glu Ala Ala
770 775 780
Ala Gly Leu Ala Gly Leu Thr Lys Val Leu Met Gln Met Arg Ala Gly
785 790 795 800
Gln Ile Ala Pro Ser Leu His Ala Asp Ala Val Asn Pro Ala Ile Asp
805 810 815
Phe Gly Asn Thr Pro Phe Arg Val Pro Thr Val Leu Thr Glu Trp Thr
820 825 830
Pro Ala Asp Asp Lys Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Pro
835 840 845
Ala Glu Pro Met His Met Trp Trp Ser Lys Asn Ile Arg Arg His Leu
850 855 860
Pro Asn Arg Ala Arg Leu Asn Pro Gly Gln Phe
865 870 875
<210> 21
<211> 2142
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 21
Met Glu Ala Ala Ser Gly Leu Ala Ala Leu Leu Lys Val Val His Ser
1 5 10 15
Phe Ala Ala Asp Arg Ile Phe Gly Ile Ala Gly Phe Asp Gln Val His
20 25 30
Pro Glu Ile Arg Glu Asp Gly Ala Ala Cys Ala Leu Ala Val Asn Asp
35 40 45
Thr Pro Trp Pro Arg Ser Gly Thr Pro Arg His Ala Gly Ile His Cys
50 55 60
His Ala Met Ser Gly Val Asn Ala His Ile Leu Leu Gln Glu Pro Pro
65 70 75 80
Cys Lys Ser Val Ala Arg Pro Gln Asp Ala Pro Ala Asp Pro Gln Val
85 90 95
Ile Val Leu Ser Ala Ala Ser Pro Ser Ser Leu Glu Arg Met Ile Ala
100 105 110
Asn Leu Leu Lys His Leu Gln Gln Gln Pro Glu Arg Leu Cys Asp Val
115 120 125
Ala Lys Thr Leu Gln Gln Gly Arg Asp Ala Leu Ala Tyr Arg Ile Ala
130 135 140
Trp Val Val Pro Asp Thr Ala Ala Leu Ile Glu Ala Leu Glu Val Glu
145 150 155 160
Thr Arg Gly Gln Ala Thr Ser Asp Trp Pro Val Phe Arg Gly Thr Ala
165 170 175
Gly Ser Gly Ile Gln Ala Glu Glu Thr Val Thr Gly Leu Glu Ala Leu
180 185 190
Ala Arg Ala Trp Val Thr Gly Val Asp Gln Ser Trp Pro Asp Leu Glu
195 200 205
Asp Gln Ser Ala Arg Arg Ile Arg Leu Pro Gly Tyr Ala Phe Asp Cys
210 215 220
Arg Pro His Trp Val Lys Pro Val Leu Glu Arg Ala Pro Asp Thr Ser
225 230 235 240
Ala Gln Ile Gly Ile Lys Pro Phe Leu Ile Asp Gln Ile Ala Gly Val
245 250 255
Leu Asp Leu Pro Ala Ala Ser Ile Asp Thr Lys Gln His Leu Tyr Asp
260 265 270
Phe Gly Val Asp Ser Leu Phe Ala Met Gln Leu Leu Arg Ala Val Ala
275 280 285
Arg Thr Phe Gly Ile Thr Val Arg Gly Arg Asp Leu Met Glu His Gln
290 295 300
Ser Ile Asp Ala Leu Ala Glu Tyr Tyr Thr Thr Gln Leu Pro Ala Leu
305 310 315 320
Ala Val Asp Pro Glu Pro Gln Ala Val Glu Val Cys Glu Asp Arg Gly
325 330 335
His Ala Arg Asp Leu Pro Leu Ser Gln Gly Gln Ala Gly Leu Trp Ala
340 345 350
Ile Ala Gln Ala Gln Pro Gly Thr Ser Ala Tyr Asn Leu Pro Val Cys
355 360 365
Leu His Ser Arg Glu Gly Phe Asp Thr Thr Ala Val Gln Ser Ala Leu
370 375 380
Asn Lys Cys Leu Val Gln Tyr Pro Val Leu Thr Ser Thr Phe Arg Val
385 390 395 400
Gly Arg Arg Gly Pro Leu Arg Asp Glu Asn His Gly Ala Thr Leu Tyr
405 410 415
Val Arg Gln Leu Asp Leu Pro Gln Glu Asp Pro Leu Ala Thr Leu Arg
420 425 430
His Ala Ala Lys Ser Pro Phe Asp Leu Ala Arg Asp Leu Pro Val Arg
435 440 445
Ala Thr Ile Phe Gly Gln Gln Gly Thr Pro Ser Tyr Leu Leu Ile Thr
450 455 460
Phe His His Ile Val Phe Asp Gly Gly Ser Phe Trp Leu Phe Met Gln
465 470 475 480
Thr Phe Leu Asp Ala Tyr Asp Ala Glu Leu Gly Lys Ser Leu Arg Ala
485 490 495
Glu Ala Thr Ile Leu Pro Asn Lys Gly Ala Asp Gln Ala Ala Phe Val
500 505 510
Ala Thr Ala Lys Ala Ala Ala Ser Gly Ser Glu Met Arg Asp Ala Arg
515 520 525
Ala Phe Trp Ala Arg Arg Leu Glu Gly Gln Leu Pro Cys Leu Ser Leu
530 535 540
Thr Pro Asp Lys Pro Arg Asn Thr Ala Arg Leu Phe Glu Gly Ala His
545 550 555 560
Leu Thr Leu Pro Leu Pro Ala Ser Val Ala Gly Ala Met Arg Ser Tyr
565 570 575
Ser Arg Ala Glu Arg Cys Pro Leu Ser Ser Leu Cys Leu Ala Leu Phe
580 585 590
Ala Thr Leu Leu His Arg Leu Ser Gly Asp Asp Asp Ile Ile Val Gly
595 600 605
Met Pro Asp His Gly Arg His Asp Pro Arg Tyr Ala Glu Thr Val Gly
610 615 620
Tyr Leu Val Asn Met Leu Pro Ile Arg Met Gln Gly Leu Ala Gly Arg
625 630 635 640
Thr Leu Arg Asp Leu Ala Tyr His Leu Gln Gly Glu Val Ala Asp Ala
645 650 655
Leu Asp His Ala Ala Tyr Pro Phe Ala Gln Met Val Arg Asp Leu Gly
660 665 670
Leu Ser Ser Gly Pro Gly Glu Pro Pro Val Phe Arg Val Ala Phe Glu
675 680 685
Tyr Gln Asn Ala Phe Ser His Asp Ala Leu Pro Ala Leu His Gln Arg
690 695 700
Leu Gln Val Thr Gly Asp Leu Thr Leu Val Glu Asp Leu Arg Gln Glu
705 710 715 720
Gly Glu Tyr Glu Leu Val Leu Glu Val Arg Glu Thr Ser Asp Thr Leu
725 730 735
Ser Leu Cys Met Lys Tyr Asn Pro Asp Leu Tyr Ser Glu Gln Arg Val
740 745 750
Gln Gly Trp Leu Glu Ala Leu Thr Asn Leu Ala Gln Gln Ala Leu Ala
755 760 765
Asp Pro Glu Ala Asn Leu Asp Ser Phe Asp Ile Val Gly Thr Ser Asp
770 775 780
Arg Ala Lys Leu Leu Ala Trp Gly Thr Gly Pro Lys Pro Glu Phe Ser
785 790 795 800
Ala Asp Thr Val Met Gln Leu Val Gln Arg Gln Thr Asp Met His Ser
805 810 815
Ala Glu Thr Ala Val Val Asp Cys Asp Gly Ala Trp Thr Tyr Glu Gln
820 825 830
Leu Asp Gln Glu Ser Leu Arg Val Ala Ala Ala Ile Gln Gln Ala Gly
835 840 845
Val Arg Pro Gly Asp Arg Val Ala Leu Cys Leu Gly Arg Arg Arg Asn
850 855 860
Tyr Ser Ala Ala Leu Leu Gly Thr Leu Arg Ala Gly Ala Val Phe Val
865 870 875 880
Pro Leu Asp Pro Ala His Pro Lys Ala Arg Leu Arg His Ile Leu Glu
885 890 895
Asp Cys Ala Pro Arg Ala Ile Leu Ala Asp Val Ser Thr Asp Ala Met
900 905 910
Ala Thr Gln Leu Ala Glu Pro Asp Cys Thr Met Val Arg Val Asp Ala
915 920 925
Leu Ser Cys Ala Pro Glu Pro Gln Pro Val Gly Leu Lys Gly Gly Asp
930 935 940
Pro Ala Tyr Leu Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly
945 950 955 960
Val Gln Val Pro His Arg Ala Leu Ala Asn Phe Leu Gln Ala Met Ala
965 970 975
Gln Arg Pro Gly Ala Gly Thr Gly Asp Arg Leu Leu Ala Val Thr Thr
980 985 990
Phe Ala Phe Asp Ile Ser Leu Leu Glu Leu Leu Leu Pro Ile Thr Ser
995 1000 1005
Gly Gly Ser Val His Ile Cys Pro Glu Glu Ile Ala Gln Asp Pro Asp
1010 1015 1020
Ala Leu Ala Ser Glu Ile Ser Arg Val Lys Pro Asp Ile Leu Gln Ala
1025 1030 1035 1040
Thr Ala Ser Val Trp Thr Met Leu Phe Ala Ala Gly Trp Gln Pro Pro
1045 1050 1055
Asp Gly Leu Lys Ala Leu Cys Gly Gly Glu Pro Met Pro Asp Arg Leu
1060 1065 1070
Asn Ser Leu Phe Gln Asn Ser Lys Leu Asp Ala Trp Asn Met Tyr Gly
1075 1080 1085
Pro Thr Glu Thr Thr Ile Trp Ser Thr Cys Gly Pro Val Thr Gly Ser
1090 1095 1100
Gln Asp Thr Val Thr Ile Gly Met Pro Ile Ala Phe Thr Glu Val Leu
1105 1110 1115 1120
Val Leu Asp Glu Tyr Leu Gln Leu Val Pro Val Gly Glu Gln Gly Glu
1125 1130 1135
Leu Tyr Ile Ser Gly Ala Gly Leu Ala Asp Gly Tyr Trp Gln Gln Ala
1140 1145 1150
Asp Arg Thr Ala Gln Ser Phe Ile Ala His Pro Tyr Arg Ser Gly Glu
1155 1160 1165
Arg Leu Tyr Lys Thr Gly Asp Leu Ala Ser Trp Ser Pro Ser Gly Gly
1170 1175 1180
Leu Ile His His Gly Arg Arg Asp Gln Gln Ile Lys Leu Arg Gly His
1185 1190 1195 1200
Arg Ile Glu Leu Ala Glu Ile Glu Cys Val Leu Asp Arg His Lys Glu
1205 1210 1215
Leu Arg Glu Ser Ala Val Val Leu Arg Lys Ser Gly Pro Glu Ala Gln
1220 1225 1230
Leu Val Ala Tyr Val Val Pro Glu Arg Glu Ala Val Pro Ala Val Glu
1235 1240 1245
Leu Arg Ala Cys Leu Arg Glu Asp Leu Pro Ala Tyr Met Leu Pro Asp
1250 1255 1260
Leu Ile Ile Ser Leu Ala Asn Leu Pro Leu Thr Pro Ala Gly Lys Ile
1265 1270 1275 1280
Asp Arg Met Ala Leu Ala Ala Arg Gln Val Asp Leu Gly His Asp Arg
1285 1290 1295
Ser Ala Ser Pro Glu Ile Glu Pro Gly Pro Pro Asp Met Asp Leu Glu
1300 1305 1310
Lys Glu Val Leu Ala Leu Trp Ser Asp Val Leu Asp Ser Thr Gly Ile
1315 1320 1325
Gly Arg Asp Ile Gly Phe Phe Glu Ala Gly Gly Asn Ser Val Thr Ala
1330 1335 1340
Ala Val Leu Ala Ala Arg Ile Ser Glu Arg Phe Gly Val Glu Leu Arg
1345 1350 1355 1360
Val Ser Asp Leu Phe Arg Phe Pro Thr Ile Arg Ala Gln Ala Arg His
1365 1370 1375
Leu Gly Ala Gly Thr Ser Asp Val Val Pro Ala Ser Gln Lys Gln Val
1380 1385 1390
Thr Ala Ala His Glu Ala Pro Lys Leu Asn His Phe Ala Ala Pro Ser
1395 1400 1405
Leu Ala Gln Arg Leu Asp Asp Glu Pro Leu Ala Val Ile Gly Leu Ser
1410 1415 1420
Cys Ala Val Pro Gly Ala Leu Asp Leu Gln Ser Phe Trp Gln Asn Leu
1425 1430 1435 1440
Leu Asp Gly Arg Glu Ala Arg Glu Val Leu Thr Pro Glu Glu Leu Arg
1445 1450 1455
Ala Ala Gly Val Pro Asp Ala Gln Leu Ser Gln Pro Asp Phe Val Pro
1460 1465 1470
Val Ala Phe Pro Leu Ala Glu Arg Ala Cys Phe Asp Pro Gly Phe Phe
1475 1480 1485
Asn Ile Ser Ala Arg Ala Ala Leu His Met Asp Pro Gln Ser Arg Leu
1490 1495 1500
Leu Leu Gln His Ala Trp Lys Ala Met Glu Glu Ala Gly His Ser Thr
1505 1510 1515 1520
Ala Ser Leu Pro Lys Thr Ala Val Phe Thr Ala Val Ser His Gly His
1525 1530 1535
Tyr Lys Thr Leu Leu His Asp Cys Gln Ala Val Ser Asp Asp Glu Phe
1540 1545 1550
Tyr Ser Ala Trp Ile Ala Gly Gln Gly Gly Thr Val Pro Thr Met Leu
1555 1560 1565
Ser Tyr Gln Leu Gly Leu Thr Gly Pro Ser Met Ala Val His Ser Asn
1570 1575 1580
Cys Ser Ser Gly Leu Val Ala Leu His Gln Ala Arg Gln Ala Leu Leu
1585 1590 1595 1600
Ala Gly Glu Ala Arg Ala Ala Leu Ile Gly Ala Ala Ser Val Tyr Ala
1605 1610 1615
Val Pro Gly Ala Gly Tyr Leu His Gln Pro Gly Leu Asn Val Ser Ser
1620 1625 1630
Asp Gly His Cys Arg Ala Phe Asp Ala Lys Ala Asp Gly Leu Val Ala
1635 1640 1645
Gly Glu Gly Leu Gly Val Val Leu Val Lys Arg Leu Ser Asp Ala Gln
1650 1655 1660
Ala Asp Gly Asp His Ile His Ala Leu Ile Lys Gly Val Gly Ile Ser
1665 1670 1675 1680
Asn Asp Gly Ala Asp Lys Ala Gly Phe Phe Ala Pro Ser Val Gln Gly
1685 1690 1695
Gln Ser Glu Ala Ile Arg Arg Ala Leu Glu Ser Ala Lys Val Asp Pro
1700 1705 1710
Ala Ser Ile Gly Tyr Ile Glu Ala His Gly Thr Gly Thr Arg Leu Gly
1715 1720 1725
Asp Pro Val Glu Ile Leu Gly Leu Gln Ser Val Tyr Gly Arg Ala Ala
1730 1735 1740
Gly Ala Pro Gln Pro Val Arg Ile Gly Ser Leu Lys Pro Asn Ile Gly
1745 1750 1755 1760
His Leu Asp Thr Ala Ala Gly Leu Val Gly Leu Ile Lys Ala Val Met
1765 1770 1775
Ala Val Lys Thr Gly Glu Ile Pro Pro Ser Ile Asn Phe Glu Thr Pro
1780 1785 1790
Asn Pro Glu Ile Asp Phe Glu Asp Ala Gly Leu Glu Val Ala Ala Ile
1795 1800 1805
Arg Gln Gly Trp Pro Glu Thr Ser Gly Ser Pro Arg Arg Ala Gly Ile
1810 1815 1820
Ser Ala Phe Gly Ile Gly Gly Thr Asn Ala His Ala Ile Val Glu Glu
1825 1830 1835 1840
Phe Gln Pro Glu Ser Ala Met Pro Val Ser Pro Val Ala Glu Pro Ser
1845 1850 1855
Ser Gln Ile Val Pro Val Ser Ala Arg Thr Gln Asp Gly Leu Arg Gln
1860 1865 1870
Leu Leu Ser Arg Leu Leu Ala Val Val Glu Asp Lys Ala Glu Ala Pro
1875 1880 1885
Leu Ala Asp Ile Ala Tyr Thr Leu Gln Thr Gly Arg Arg His Met Val
1890 1895 1900
Tyr Arg Lys Ala Phe Val Val Ser Gly Leu Asp Glu Leu Arg Ala Glu
1905 1910 1915 1920
Leu Lys Ala Cys Leu Ser Thr Ala Glu Leu Leu Glu Asp Gln Pro Ala
1925 1930 1935
Ala Ser Met Pro Lys Leu Lys Ser Gln Glu Met Ser Val Leu Met Glu
1940 1945 1950
His Trp Leu Ala Thr Arg Gln Leu Asp Arg Val Ala Glu Ala Trp Thr
1955 1960 1965
Gly Gly Thr Glu Val Asp Trp Thr Gln Leu His Thr Gly Pro Arg Arg
1970 1975 1980
Arg Val Ser Leu Pro Thr Tyr Pro Phe Ala Lys Glu Ile Phe Trp Pro
1985 1990 1995 2000
Gly Lys Pro Gly Ala Gln Pro Ser Ala Gly Ser Met Gln Ser Leu Leu
2005 2010 2015
Leu Thr Gln Asp Arg Gln Val Ala Asn Arg Ile Pro Val Ser Ala Pro
2020 2025 2030
Ala Gly Val Gln Lys Val Trp Leu Met Gly Ala Leu Gly Gln His Gln
2035 2040 2045
Gln Thr Leu Ser Glu Leu Leu Pro Asp Ala Arg Ile Thr Asp Leu Pro
2050 2055 2060
Gly Glu Ser Gly Ala Asp Pro Ala Ser His Tyr Met Lys Leu Ser Arg
2065 2070 2075 2080
Ala Leu Leu Ala Lys Ala Arg Asp Leu Ala Leu Glu Gly Gly Ala Gly
2085 2090 2095
Leu Leu Gln Ile Val Leu Asp Ala Arg Gly Pro Gly Val Pro Val Phe
2100 2105 2110
Leu Pro Pro Trp Arg Arg Arg Ser Arg Thr Cys Ala Phe Lys Ser Tyr
2115 2120 2125
Lys Ser Leu Arg Pro Tyr Arg Phe Arg Thr Trp Leu Ala His
2130 2135 2140
<210> 22
<211> 377
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 22
Met Asn Ser Asp Glu Ala Trp Asn Glu Ile Glu Ala Ala Ile Leu Ala
1 5 10 15
Ser Met Gln Cys Gln Asp Lys Phe Ser Asn Thr Pro Pro Gln Asp His
20 25 30
Asp Gly Ala Ala Arg Glu Pro Ala Pro Ile Ala Ile Val Gly Ala Ser
35 40 45
Gly Met Leu Pro Gly Cys Glu Asp Leu Lys Ala Phe Tyr Ala Ala Leu
50 55 60
Glu Thr Gly Ala Cys Leu Ile Glu Lys Arg Ala Glu Arg Ser Leu Gly
65 70 75 80
Glu Arg Leu Ser Ala Pro Ala Ala Asp Ala Pro Phe Val Tyr Gly Gly
85 90 95
Phe Val Pro Asp Pro Ala Gly Phe Asp Ala Gly Phe Phe Asp Ile Pro
100 105 110
Lys Ser Glu Ala Asp Gln Met Asp Pro Arg Gln Arg Leu Leu Leu Met
115 120 125
Ala Ala Leu Gly Ala Met Tyr Asp Ala Gly Tyr Ala Ser Arg Asn Leu
130 135 140
Arg Gly Ser Arg Thr Gly Val Phe Val Ala Ala Gln Asp Asn Glu Tyr
145 150 155 160
Asp Arg Leu Cys Ala Ser Leu Gly His Asp Pro Asp Ala Gly Tyr Ala
165 170 175
Gln Ser Cys Leu Leu Ala Asn Arg Leu Ser Tyr Phe Tyr Asp Phe Asp
180 185 190
Gly Pro Ser Glu Val Ile Glu Ala Gln Cys Ala Ser Ala Gly Val Ala
195 200 205
Leu His Arg Ala Val Gln Ala Leu Arg Gln Gly Glu Ile Ser Gln Ala
210 215 220
Leu Val Ala Gly Val Asn Leu Met Leu Thr Pro Gly Pro Phe Arg His
225 230 235 240
Leu Ala Glu Thr Gly Gln Leu Ser Leu Asp Gly Lys Val Ser Pro Phe
245 250 255
Gly Ala Thr Ala Ala Gly His Val Arg Ala Glu Ala Ala Leu Cys Val
260 265 270
Val Leu Lys Pro Leu Ser Glu Ala Val Ala Asp Gly Asp Ser Val Tyr
275 280 285
Ala Val Ile Arg Gln Thr Ser Val Asn Phe Asn Gly Arg Gly Ala Ala
290 295 300
Ser Leu Ala Ala Pro Ser Val Thr Arg His Ala Glu Leu Ile Ala Asp
305 310 315 320
Cys Tyr Arg Ser Val Gly Ile Gly Pro Gly Gln Val Gly Val Ile Glu
325 330 335
Ala Gln Gly Met Gly Asn Pro Leu Ser Asp Ile Ala Glu Trp Glu Ser
340 345 350
Phe Asn Arg Ala Met Lys Arg Phe Gly Gln Glu Ala Gly Ala Ala Ala
355 360 365
Leu Met Arg Ser Val Ser Ser Val Arg
370 375
<210> 23
<211> 278
<212> БЕЛОК
<213> Labrenzia sp. PHM005
<400> 23
Met Ser Arg Ser Thr Leu Glu Thr Thr Gly Ala Ser Asn Asp Thr Val
1 5 10 15
Glu Asp His Tyr Asp Ser Pro Ala Leu Arg Leu Gly Pro Ile Leu Phe
20 25 30
Asp Glu His Leu His Trp Gly Tyr Trp Asp Glu Asp Ser Arg Asp Ala
35 40 45
Ser Phe Gly Ala Ala Ala Glu Ala Met Cys His Arg Met Ile Asp Arg
50 55 60
Thr Glu Ile Gly Pro Gly Glu Arg Phe Val Asp Leu Gly Cys Gly Ile
65 70 75 80
Gly His Pro Ala Leu Lys Leu Ala Gln Ala Arg Ser Cys His Val Thr
85 90 95
Gly Val Thr Ile Ser Gly Tyr Gln His Arg Ile Ala Gly Glu Lys Ala
100 105 110
Ala Gln Ala Gly Phe Ser Asp Arg Leu Asp Phe Leu Gln Ala Asp Ala
115 120 125
Arg Ser Val Pro Leu Pro Asp Lys Ser Phe Asp Gly Gly Trp Phe Phe
130 135 140
Glu Ser Ile Phe His Met Gly His Ala Glu Ala Leu Gly Glu Ala Ala
145 150 155 160
Arg Leu Leu Lys Pro Gly Ala Gly Leu Val Leu Thr Asp Leu Pro Thr
165 170 175
Leu Pro His Thr Thr Pro Glu Phe Met Asp Phe Val His Glu His Ile
180 185 190
His Ser Val Phe Val Pro Glu Asp Arg Tyr Pro Ala Leu Met Ala Asp
195 200 205
Ala Gly Phe Glu Leu Leu Asn Ile Glu Asp Ile Ser Glu Asn Val Met
210 215 220
Pro Trp Leu Glu Thr Lys Leu Arg Glu Ala Val Gln Glu Lys Trp Ser
225 230 235 240
Asp Val Val Arg Leu Met Gly Asp Gln Ala Glu Lys Ala Val Asp Asn
245 250 255
Trp Tyr Tyr Leu Phe Glu Tyr Met Ala Glu Asn Leu Gly Tyr Thr Met
260 265 270
Ile Thr Ala Arg Arg Leu
275
<---
название | год | авторы | номер документа |
---|---|---|---|
ВАРИАНТЫ ПОЛИПЕПТИДОВ, РАСЩЕПЛЯЮЩИХ ФУЗАРИОТОКСИНЫ, СОДЕРЖАЩАЯ ИХ ДОБАВКА, ИХ ПРИМЕНЕНИЕ И СПОСОБ РАСЩЕПЛЕНИЯ ФУЗАРИОТОКСИНОВ | 2015 |
|
RU2720517C2 |
НОВЫЕ СЛИТЫЕ БЕЛКИ, СПЕЦИФИЧЕСКИЕ В ОТНОШЕНИИ CD137 И GPC3 | 2020 |
|
RU2814653C2 |
СПОСОБ УДАЛЕНИЯ СМОЛИСТЫХ ВЕЩЕСТВ ИЗ РАСТИТЕЛЬНОГО МАСЛА И ЕГО РАФИНИРОВАНИЯ | 2018 |
|
RU2772452C2 |
ДИСПЛЕЙ ИНТЕГРАЛЬНОГО МЕМБРАННОГО БЕЛКА НА ВНЕКЛЕТОЧНЫХ ОБОЛОЧЕЧНЫХ ВИРИОНАХ ПОКСВИРУСА | 2017 |
|
RU2759846C2 |
КОНЬЮГАТ АНТИТЕЛА К КЛАУДИНУ И ЛЕКАРСТВЕННОГО СРЕДСТВА И ЕГО ФАРМАЦЕВТИЧЕСКОЕ ПРИМЕНЕНИЕ | 2020 |
|
RU2826119C1 |
БИСПЕЦИФИЧЕСКИЕ 2+1 КОНТОРСТЕЛА | 2018 |
|
RU2797305C2 |
СКРИНИНГ УЧАСТКОВ ПРИСОЕДИНЕНИЯ С ФИКСИРОВАННОЙ ТОЧКОЙ В КОНЪЮГАТЕ ЦИСТЕИН-МОДИФИЦИРОВАННОЕ АНТИТЕЛО-ТОКСИН (TDC) | 2018 |
|
RU2816510C2 |
КОМБИНАЦИЯ АНТИТЕЛА ПРОТИВ HGFR И HEGFR ДЛЯ ЛЕЧЕНИЯ ОПУХОЛИ И/ИЛИ МЕТАСТАЗА | 2019 |
|
RU2788606C2 |
АНТИ-CD39 АНТИТЕЛА, КОМПОЗИЦИИ, СОДЕРЖАЩИЕ АНТИ-CD39 АНТИТЕЛА, И СПОСОБЫ ПРИМЕНЕНИЯ АНТИ-CD39 АНТИТЕЛ | 2018 |
|
RU2795348C2 |
ХИМЕРНЫЕ РЕЦЕПТОРЫ АНТИГЕНОВ | 2015 |
|
RU2745705C2 |
Изобретение относится к соединению общей формулы I или его стереоизомеру, в котором R1 выбран из водорода и незамещенного C1-C6 алкила; R2 и R3, каждый независимо, выбран из водорода и –C(=O)Ra; R4 выбран из водорода и -C(=O)Ra; Ra представляет собой незамещенный C1-C6 алкил. Изобретение также относится к способу получения соединения формулы I посредством культивирования штамма РНМ005 морских бактерий дикого типа в соответствующих условиях, а также к фармацевтической композиции на его основе. Технический результат – получены новые соединения и фармацевтическая композиция на их основе, которые могут найти применение в медицине для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы. 5 н. и 11 з.п. ф-лы, 10 ил., 2 табл., 8 пр.
1. Соединение общей формулы I или его стереоизомер
I
где:
R1 выбран из водорода и незамещенного C1-C6 алкила;
R2 и R3, каждый независимо, выбран из водорода и –C(=O)Ra;
R4 выбран из водорода и -C(=O)Ra;
Ra представляет собой незамещенный C1-C6 алкил.
2. Соединение по п.1, также имеющее общую формулу III или его стереоизомер
III
где R1, R2, R3 и R4 имеют значения, определенные для формулы I в п.1.
3. Соединение по п.1 или 2, где R1 выбран из водорода и метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила.
4. Соединение по п.3, где R1 выбран из водорода и метила.
5. Соединение по любому из предшествующих пунктов, где R2 выбран из водорода и –C(=O)Ra, где Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила.
6. Соединение по п.5, где R2 выбран из водорода и ацетила.
7. Соединение по любому из предшествующих пунктов, где R3 и R4 независимо выбраны из водорода и –C(=O)Ra, где Ra в каждом случае независимо выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила.
8. Соединение по п.7, где R3 и R4 независимо выбраны из водорода и ацетила.
9. Соединение по п.1 формулы:
, или или его стереоизомер.
10. Соединение по п.9 формулы:
или
или его стереоизомер.
11. Фармацевтическая композиция для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы, содержащая терапевтически эффективное количество соединения, определенного в любом из предшествующих пунктов, или его стереоизомер и фармацевтически приемлемый носитель или разбавитель.
12. Соединение, определенное в любом из пп.1-10, или его стереоизомер, или композиция, определенная в п.11, для применения для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы.
13. Применение соединения, определенного в любом из пп.1-10 или его стереоизомера при получении лекарственного средства для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы.
14. Способ лечения пациента, а именно человека, страдающего злокачественным новообразованием, выбранным из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы, который включает введение страдающему человеку, нуждающемуся в этом, терапевтически эффективного количества соединения, определенного в любом из пп.1-10 или его стереоизомера.
15. Способ получения соединения формулы II или его стереоизомера
,
где
R1 выбран из водорода и незамещенного C1-C6 алкила;
R2, и R3, каждый независимо, выбран из водорода и –C(=O)Ra;
R4 выбран из водорода и -C(=O)Ra;
Ra представляет собой незамещенный C1-C6 алкил;
где способ включает стадии:
- культивирование штамма PHM005 морских бактерий дикого типа или их мутантов в соответствующих условиях для продуцирования соединений 1 и/или 2 формулы:
, ;
- выделение соединений 1 или 2; и, при необходимости,
- превращение соединений 1 или 2 в другое соединение формулы II.
16. Способ по п.15, где соединение формулы II имеет также формулу IV
IV
или его стереоизомер;
где R1, R2, R3, и R4 имеют значения, определенные для формулы II в п.15.
NARQUIZIAN R et al., "The Pederin Family of Antitumor Agents: Structures, Synthesis and Biological Activity" | |||
The Role of Natural Products in Drug Discovery, no.32, 2000, pp | |||
Видоизменение пишущей машины для тюркско-арабского шрифта | 1923 |
|
SU25A1 |
FANGHUI WU et al., Fngewandte Chemie International Edition, vol.50, no.5, 2011, pp.1131-1134 | |||
WO 2003044186 A2, 30.05.2003 | |||
WO 2013016120 A1, 31.01.2013 | |||
0 |
|
SU289203A1 |
Авторы
Даты
2022-05-30—Публикация
2018-03-16—Подача