СПОСОБ ПОЛУЧЕНИЯ (-)-АМБРОКСИДА, ПРОДУКТ РЕАКЦИИ, СОДЕРЖАЩИЙ (-)-АМБРОКСИД, И ЕГО ПРИМЕНЕНИЕ Российский патент 2020 года по МПК C12P17/04 C12N9/90 C07D307/92 C11D3/50 A61Q13/00 A61K8/49 

Описание патента на изобретение RU2727641C2

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к производным фермента сквален-гопен-циклазы (Squalene Hopene Cyclase)/гомофарнезол-амброксид-циклазы (Homofarnesol Ambrox Cyclase) (SHC/HAC), модифицированным по отношению к исходному белку SHC/HAC, к аминокислотным последовательностям, составляющим производные ферментов SHC/HAC, нуклеотидным последовательностям, кодирующим производные SHC/HAC, векторам, содержащим нуклеотидные последовательности, кодирующие производные SHC/HAC, и к рекомбинантным клеткам-хозяевам, содержащим нуклеотидные последовательности, кодирующие производные SHC/HAC. Настоящее изобретение также относится к средствам для функциональной экспрессии нуклеотидных последовательностей, кодирующих производные SHC/HAC, и к способам применения рекомбинантных микроорганизмов, содержащих нуклеотидные последовательности, кодирующие производные SHC/HAC и SHC/HAC дикого типа (WT), для получения амброксида, предпочтительно (-)-амброксида.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Сквален-гопен-циклазы (SHC, ЕС 5.4.99.17) представляют собой мембраносвязанные прокариотические ферменты, действующие в качестве биокатализаторов реакции циклизации линейного тритерпеноида, представляющего собой сквален, с образованием гопена и гопанола. Ранние работы по SHC были сосредоточены на характеризации SHC термофильной и ацидофильной бактерии Alicyclobacillus acidocaldarius (ранее Bacillus acidocaldarius) (см. Neumann & Simon 1986, Biol Chem Hoppe-Seyler 367, 723-729; Seckler & Poralla 1986, Biochem Biophys Act 356-363 и Ochs et al 1990, J Bacteriol 174, 298-302). Однако позднее другие SHC были очищены из Zymomonas mobilis и Bradyrhizobium japonicum и охарактеризованы в отношении их природных (например, сквалена) и неприродных субстратов (например, гомофарнезола и цитраля) (см., например, WO 2010/139710, WO 2012/066059 и Seitz et al 2012, J. Molecular Catalysis B: Enzymatic 84, 72-77).

В более ранней работе авторов Neumann и Simon (1986 - цитируется выше) раскрыто, что гомофарнезол является дополнительным субстратом для SHC Alicyclobacillus acidocaldarius (AacSHC). Однако, согласно публикациям, доля циклизации неприродного гомофарнезола очищенным AacSHC, как сообщили Neumann и Simon (1986), составляла лишь 3% от доли циклизации природного субстрата - сквалена. Доля образования амброксида (продукт 2b) увеличивалась с повышением концентрации гомофарнезола (продукт 1b) с 0,25 мМ до 2,0 мМ и несколько уменьшалась в присутствии 4 мМ продукта 1b. Это различие в долях циклизации может отчасти объясняться тем, что природный субстрат SHC сквален в два раза превышает по размеру (С30-углеродное соединение) неприродный гомофарнезол, который представляет собой С16-углеродное соединение.

В (JP 2009060799 - Као) также раскрыт способ получения амброксида из гомофарнезола с использованием SHC из A. acidocadarius. В то время как в JP 2009060799 сообщается о возможности использования микроорганизмов, содержащих SHC, для синтеза амброксида, в JP 2009060799 раскрыто получение амброксида из гомофарнезола только с использованием жидкого экстракта SHC, приготовленного из рекомбинантного микроорганизма, экспрессирующего ген SHC, но не с помощью целых клеток рекомбинантных микроорганизмов, экспрессирующих ген SHC. Процентная доля конверсии гомофарнезола в амброксид с использованием жидкого экстракта SHC была указана как 17,5% при проведении реакции при температуре 60°С в течение 14 часов при рН 5,2-6,0, но лишь 6,8% при проведении реакции при рН 6,6. Сообщалось, что процентная доля конверсии 3Е,7Е-гомофарнезола в амброксид с использованием жидкого экстракта SHC при 60°С при рН 5,6 в течение 64 часов составляет 63% при использовании концентрации субстрата гомофарнезола 0,2% (2 г/л).

В WO 2010/139719А2 и ее эквивалентной заявке на патент США (US 2012/0135477 A1) описаны по меньшей мере три экстракта фермента SHC, обладающих активностью циклазы гомофарнезола до амброксида. Сообщается, что доли конверсии гомофарнезола ферментами SHC Zymomonas mobilis (Zmo) и SHC Bradyrhizobium japonicum (Bjp) составляли 41% при 16 ч реакции и 22% при использовании концентрации гомофарнезола 10 мМ (2,36 г/л), соответственно, при этом доля конверсии ферментом AacSHC согласно сообщениям составляла лишь 1,2% (предположительно при той же концентрации гомофарнезола), однако подробное описание эксперимента не приведено. Экстракты ферментов ZmoSHC и BjpSHC были приготовлены из рекомбинантного микроорганизма, экспрессирующего ген SHC, путем разрушения клеток-хозяев Е. coli, продуцирующих ферменты SHC, и отделения растворимых фракций SHC.

В публикации Seitz и соавт. (2012 - цитируется выше) описана функциональная экспрессия и биохимическая характеризация трех ферментов SHC: двух из Z. mobilis (ZmoSHC1 и ZmoSHC2) и одного из A. acidocaldarius. Согласно публикации, «эффективную» конверсию (22,95%) гомофарнезола в амброксид наблюдали при использовании ZmoSHC1 дикого типа, при этом при использовании WT ZmoSHC2 конверсия гомофарнезола в амброксид не происходила, а при использовании AacSHC была обнаружена относительно низкая конверсия (3,4%) гомофарнезола в амброксид при использовании концентрации гомофарнезола 10 мМ (2,36 г/л). Склонность к относительно низкой конверсии гомофарнезола в амброксид, наблюдаемая для AacSHC, согласовывалась с результатами, полученными авторами Neumann и Simon (1986 - цитируется выше) и обсуждаемыми в WO 2010/139719 А2, что также обсуждается выше. Три фермента SHC использовали в формате клеточной суспензии (посредством частичного разрушения клеток-хозяев Е. coli с использованием циклов замораживания и оттаивания) и в виде частично очищенных мембраносвязанных фракций.

В WO 2012/066059 раскрыты мутанты с циклазной активностью и их применение в способе биокаталитической конверсии терпенов, например, в частности, для получения изопулегола путем реакции циклизации цитронеллаля; в способе получения ментола и в способах биокаталитической конверсии других соединений со структурными мотивами терпенового типа. При выравнивании последовательностей различных SHC идентифицировано, что фенилаланин-486 (F486) является сильно консервативным аминокислотным остатком, и создана серия вариантов замен в ферменте SHC Zymomonas mobilis. Некоторые из этих замен приводили к утрате активности, тогда как другие приводили в результате к образованию нового терпеноидного продукта (изопулеголов) из терпеновых субстратов, таких как цитронеллаль.

В диссертации на соискание степени PhD Seitz (http://elib.uni-stuttgart.de/handle/11682/1400) в 2012 г. указано, что мутация F486Y в ZmoSHC1 обеспечила снижение показателя биотрансформации гомофарнезола приблизительно в 1,5 раза, с 34,8% (WT ZmoSHC1) до 23,9% (мутантный ZmoSHC1 F486Y). При тестировании мутантного эквивалента (Y420C) в AacSHC полагали, что ферментативная активность по отношению к субстратам большего размера будет снижаться, а активность, направленная на субстраты большего размера, будет повышаться. При тестировании этого мутанта в таких же условиях, как и дикого типа, и сравнении их ферментативной активности обнаружили, что мутант вообще не осуществлял какую-либо конверсию субстрата гомофарнезола. Таким образом, был сделан вывод о том, что аминокислотный остаток Y420 является критическим для активности AacSHC по отношению ко всем субстратам.

Другие исследования сайт-направленного мутагенеза SHC в данной области техники (например, Hoshino and Sato 2002, Chem Commun 291-301) были сосредоточены на действии мутаций в высоко консервативных участках (например, F601), и в большей степени на их действии на природные субстраты (т.е. на сквален или аналоги сквалена), чем на неприродные субстраты, такие как гомофарнезол.

Подводя итог вышесказанному, ограниченные сведения из уровня техники, относящиеся к способам биоконверсии для успешной конверсии гомофарнезола в амброксид, относятся только к относительно низким концентрациям/объемам субстрата гомофарнезола (в диапазоне концентраций от 0,25 мМ до 2 мМ до 10 мМ или около 0,06 г/л - 2,36 г/л) с использованием полипептида SHC дикого типа с активностью гомофарнезол-амброксид-циклазы (НАС). Источниками ферментов SHC с активностью НАС были либо: (i) жидкие экстракты, полученные путем разрушения клеток-хозяев Е. coli, содержащих ферменты SHC, и отделения нерастворимой фракции от растворимой жидкой фракции SHC; либо (ii) частично очищенные мембранные фракции; либо (iii) рекомбинантные целые клетки, экспрессирующие ген WT SHC и продуцирующие фермент SHC, для применения в реакциях биоконверсии гомофарнезола в амброксид с использованием солюбилизирующих агентов, включающих либо: (i) Тритон Х-100 в реакционной смеси (см. Neumann и Simon, 1986, цитируемый выше Seitz et al 2012, цитируемый выше JP 2009060799); либо (ii) тауродезоксихолат (как описано в US 2012/0135477 A1).

При использовании этих экстрактов WT SHC и/или целых рекомбинантных клеток микроорганизмов, экспрессирующих ген SHC, было обнаружено, что получаемые доли конверсии изменяются в зависимости от источника фермента SHC, количества исходного вещества гомофарнезола и используемых реакционных условий. При использовании фермента SHC дикого типа 100% конверсия гомофарнезола в амброксид при указанных задействованных концентрациях (0,06-2,36 г/л) до сих пор не достигнута. Кроме того, в предварительных исследованиях с использованием производных SHC, полученных путем сайт-направленного мутагенеза, были только получены скорее отрицательные (т.е. сниженные доли конверсии гомофарнезола), чем положительные (т.е. улучшенные доли конверсии) результаты. Кроме того, в опубликованных исследованиях использовали только очищенные экстракты фермента SHC, или мембраносвязанные фракции фермента SHC, или целые рекомбинантные клетки микроорганизмов, экспрессирующих ген WT SHC в определенных реакционных условиях, при которых используются солюбилизирующие агенты, такие как Тритон Х-100 или тауродезоксихолат. До сих пор не продемонстрировано, что рекомбинантный микроорганизм, содержащим либо WT, либо мутантный SHC, может обеспечить более эффективную и экономически результативную биоконверсию гомофарнезола в амброксид при использовании оптимизированных реакционных условий. Соответственно, желательно усовершенствовать цитируемые выше известные способы получения амброксида из гомофарнезола за счет по меньшей мере улучшения скорости, специфичности, выхода, производительности реакции и снижения затрат (за счет, например, упрощения способа при использовании либо рекомбинантных целых клеток микроорганизмов или при осуществлении метода «реакции, протекающей в одном реакционном сосуде», объединяющего стадии биокаталитического получения и биоконверсии).

КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

В различных аспектах настоящего изобретения предложены производные SHC/HAC, аминокислотные последовательности, составляющие производные фермента SHC/HAC, нуклеотидные последовательности, кодирующие производные фермента SHC/HAC, рекомбинантные клетки-хозяева, содержащие векторы с нуклеотидными последовательностями, кодирующими производные фермента SHC/HAC и применение рекомбинантных клеток-хозяев, содержащих либо производные фермента SHC/HAC, либо WT SHC/HAC, используемые в определенных реакционных условиях, в способах получения материалов амброксида, которые содержат изомер амброксида, обозначаемый как (-)-амброксид, и подобные амброксиду молекулы (в качестве побочных продуктов). В отличие от сведений предшествующего уровня техники, относящихся к AacSHC, автор изобретения впервые продемонстрировал, что цельноклеточный рекомбинантный микроорганизм, экспрессирующий ген производного SHC, можно использовать для биоконверсии гомофарнезола в амброксид. Кроме того, цельноклеточный рекомбинантный микроорганизм, экспрессирующий ген WT SHC и/или продуцирующий ферменты SHC, можно использовать для биоконверсии гомофарнезола в амброксид в определенных реакционных условиях, не раскрытых в предшествующем уровне техники.

Также было неожиданно обнаружено, что включение в аминокислотную последовательность эталонной последовательности WT SHC дикого типа вплоть до пяти аминокислотных изменений, раскрытых в настоящем описании, приводит к получению производных фермента SHC/HAC, которые обладают значительно лучшей долей конверсии гомофарнезола в амброксид по сравнению с немодифицированными эталонными ферментами SHC/HAC, как раскрыто в настоящем описании. Эти новые производные ферментов SHC/HAC полезны сами по себе и в комбинации для получения материалов амброксида, в частности (-)-амброксида, из субстратов гомофарнезола.

Дополнительное неожиданное открытие состоит в том, что, кроме одного мутанта (F601Y), производные фермента SHC, раскрытые в настоящем описании, как правило, содержат неконсервативные замены в положениях аминокислот в неконсервативном участке эталонной полипептидной последовательности SHC. Это открытие является неожиданным, поскольку изменения в консервативной области фермента более вероятно нарушают функцию фермента (по меньшей мере в отношении его природного субстрата), чем изменения в неконсервативной области белка.

Следующее неожиданное открытие состоит в том, что охарактеризованные производные ферменты SHC по настоящему изобретению оптимальнее работают (на неприродном субстрате, таком как гомофарнезол) при температуре около 35°С, чем при температуре около 60°С, которая является обычной реакционной температурой для термофильных микроорганизмов, таких как AacSHC. Применение производных SHC по настоящему изобретению в способах получения амброксида из гомофарнезола при пониженных реакционных температурах обладает значимыми экономическими преимуществами для цикла получения амброксида в промышленном масштабе.

Другое преимущество настоящего изобретения состоит в том, что производные фермента SHC по настоящему изобретению катализируют эффективный процесс биоконверсии, который при оптимизации с относительно высокой (например, около 50-кратной) концентрацией субстрата гомофарнезола по сравнению с концентрациями, ранее описанными в предшествующем уровне техники (например, ЕЕН при 125 г/л) может приводить к 100% конверсии субстрата гомофарнезола, тогда как эталонный белок WT SHC конвертирует только приблизительно 10% того же субстрата даже при высокой концентрации фермента/клеток. Цитированные документы предшествующего уровня техники относятся к применению очищенных мембранных экстрактов, содержащих SHC, или очищенных экстрактов SHC (полученных из микроорганизмов, экспрессирующих гены SHC), или к применению рекомбинантного микроорганизма, экспрессирующего ген WT SHC, в определенных реакционных условиях биоконверсии (например, с использованием определенных солюбилизирующих агентов). Но и теперь нигде не описана 100% конверсия гомофарнезола при значительно более низкой концентрации ЕЕН. Также нигде не описана «реакция, протекающая в одном реакционном сосуде», где на первой стадии рекомбинантные клетки растут и продуцируют фермент SHC и впоследствии конвертируют ЕЕН в (-)-амброксид в одном и том же реакторе. Дополнительное преимущество настоящего изобретения состоит в том, что, рекомбинантные клетки-хозяева, продуцирующие производные фермента SHC, демонстрируют высокие начальные скорости реакции, что позволяет получить большое количество продукта за относительно короткий период времени при использовании лишь относительно небольших количеств биокатализатора. Вкратце, отбор и эффективная экспрессия и применение рекомбинантных микроорганизмов, содержащих либо фермент WT SHC/HAC, либо определенные производные фермента SHC/HAC, в определенных реакционных условиях биоконверсии приводит к более эффективному процессу биоконверсии. Конечный продукт ((-)-амброксид) можно отделить и легко очистить. В отличие от цитируемых сведений из предшествующего уровня техники, производные фермента SHC/HAC применяют не в виде чистого фермента, а в цельноклеточном контексте (в качестве биокатализатора), что представляет собой более экономически эффективный, более удобный для использования и благоприятный для окружающей среды подход, поскольку он не требует дополнительных стадий очистки и выделения фермента.

Подводя итог, в настоящем изобретении предложен способ биоконверсии/биотрансформации для получения амброксида в рекомбинантном штамме микроорганизма, который (i) привлекателен с экономической точки зрения, (ii) благоприятен для окружающей среды и (iii) приводит к селективному получению (-)-амброксида в качестве преобладающего соединения, которое в селективных условиях кристаллизации эффективно отделяется от других побочных продуктов, не вносящих вклад в ольфакторное качество конечного продукта.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Используемый в настоящем описании термин «SHC» означает фермент сквален-гопен-циклазу из любого источника из перечисленных в таблицах 10-12. В предпочтительных воплощениях изобретения термин «SHC» включает в себя ферменты SHC из Zymomonas mobilis и ферменты SHC из Alicyclobacillus acidocaldarius, как раскрыто в заявке на патент компании BASF WO 2010/139719, заявке на патент США US 2012/01345477 А1, публикациях Seitz et al (2012, цитируется выше) и Seitz (2012, диссертация PhD, цитируется выше). Для простоты ссылки в настоящем описании используют обозначение «AacSHC» для SHC из Alicyclobacillus acidocaldarius, обозначение «ZmoSHC» для SHC из Zymomonas mobilis и обозначение «BjpSHC» для SHC из Bradyrhizobium japonicum. Процентное значение идентичности этих последовательностей относительно последовательности WT AacSHC и друг друга (которое может изменяться в зависимости от используемого алгоритма) приведено в таблицах 18 и 19.

Выравнивание последовательностей WT SHC, полученное Hoshino и Sato (2002, цитируется выше), указывает на то, что во всех четырех последовательностях было обнаружено множество мотивов, состоящих из коровой последовательности Gln-X-X-X-Gly-X-Trp, которая обнаружена шесть раз в последовательностях SHC обоих микроорганизмов, Z. mobilis и A. acidocaldarius (см. Фиг. 3 публикации Reipen et al 1995, Microbiology 141, 155161). В Hoshino и Sato (2002, цитируется выше) сообщается, что ароматические аминокислоты с необычно высокой частотой встречаются в SHC, и в SHC было отмечено два характеристических мотива: один из которых представляет собой мотив QW, представленный специфическими аминокислотными мотивами [(K/R)(G/A)X2-3(F/Y/W)(L/IV)3X3QX2-5GXW], и альтернативный мотив, представляющий собой DXDDTA. В Wendt et al (1997, Science 277, 1811-1815 and 1999, J Mol Biol 286, 175-187) описан рентгеноструктурный анализ SHC из A. acidocaldarius. Мотив DXDDTA, по-видимому, соответствует активному центру SHC. Выравнивание иллюстративных последовательностей из предшествующего уровня техники демонстрирует множественные повторяющиеся мотивы, как показано на Фиг. 2 (из публикации Hoshino и Sato (2002, цитируется выше)) и на Фиг. 3 (из диссертации Seitz PhD (2012)) в настоящем описании.

Используемый в настоящем описании эталонный (или дикого типа) белок AacSHC относится к белку AacSHC, как изложено в SEQ ID NO: 1. Эталонный фермент AacSHC согласно настоящему описанию обладает активностью гомофарнезол-амброксид-циклазы (HAC), полезной при получении производных амброксида посредством биокаталитического взаимодействия SHC с субстратом гомофарнезолом. Основная реакция эталонного AacSHC состоит в циклизации линейного или нелинейного субстрата, такого как гомофарнезол, с получением амброксида.

Амброксид

При использовании в настоящем описании термин амброксид включает в себя (-)-амброксид формулы (I) либо в стереоизомерно чистой форме, либо в смеси с по меньшей мере одной или более чем одной из следующих молекул формулы (II), (IV) и/или (III).

(-)-Амброксид

(-)-Амброксид известен под торговыми наименованиями Ambrox (Firmenich), Ambroxan (Henkel), Ambrofix (Givaudan), Amberlyn (Quest), Cetalox Laevo (Firmenich), Ambermor (Aromor) и/или Norambrenolide Ether (Pacific).

(-)-Амброксид представляет собой промышленно значимое ароматизирующее соединение и длительное время используется в производстве ароматизирующих веществ. Особые желаемые сенсорные преимущества (-)-амброксида происходят от (-)-стереоизомера скорее, чем от (+)-стереоизомера. Запах (-)-стереоизомера описывают как подобный мускусному, древесному, теплому или янтарному, тогда как энантиомер (+)-амброксид имеет относительно слабую ароматную ноту. Запах и пороги восприятия запаха для продуктов, подобных амброксиду, также различаются. Хотя в продаже имеются различные материалы, обогащенные (-)-амброксидом, желательно получить высоко обогащенные (-)-амброксидом материалы, в идеале - чистый (-)-амброксид.

Получение (-)-амброксида

(-)-Амброксид может быть получен из склареолида в соответствии с описанным ниже способом получения. Склареол представляет собой продукт, экстрагируемый из природного растения шалфея мускатного. Однако, поскольку в этом процессе используется натуральный исходное вещество, существующие потенциальные проблемы заключаются в том, что в нем задействована многостадийная реакция, которая является непрямой, количество и стабильность подачи исходного вещества может не всегда быть удовлетворительной, и реакция может быть неблагоприятной для окружающей среды в связи с использованием на стадии окислительного разложения (+)-склареола окисляющего агента, такого как хромовая кислота или перманганат.

(-)-Амброксид также синтезируют из гомофарнезола, используя различные пути. В качестве примера гомофарнезол может быть получен путем бромирования, цианирования и гидролиза неролидола с получением гомофарнезиловой кислоты с последующим восстановлением. Альтернативно, гомофарнезол может быть получен из фарнезола, фарнезилхлорида, бета-фарнезена или других субстратов. Бета-фарнезен может быть конвертирован непосредственно в Е,Е-гомофарнезол (ЕЕН) или опосредованно в ЕЕН через Е,Е-гомофарнезат, который впоследствии конвертируют в ЕЕН. Обзор по получению (-)-амброксида из различных субстратов можно найти в US 2012/0135477 A1, WO 2010/139719, US 2013/0273619 А1, WO 2013/156398 А1, диссертации PhD Seitz (2012, цитируется выше) и в публикации Schaefer 2011 (Chemie Unserer Zeit 45, 374-388).

Хотя гомофарнезол может присутствовать в виде смеси четырех изомеров, (3Z,7Z), (3E,7Z), (3Z,7E) и (3Е,7Е) изомеров, исходя из литературы кажется, что (-)-амброксид получается только из (3Е,7Е) гомофарнезола (см. Neumann и Simon (1986), цитируется выше). Используемая в настоящем описании ссылка на (3Е,7Е)-гомофарнезол представляет собой ссылку на Е,Е-гомофарнезол, который также обозначается как ЕЕН.

В US 2012/0135477 A1 описана конверсия (3Z,7E) в (-)-амброксид с использованием ZmoSHC (SEQ ID NO: 2) (см. примеры 2-4), однако согласно публикации Schaefer (2011) (цитируется выше), (7Е, 3Z) конвертируется только в 9b-эпи-амброксид (т.е. соединение III), как описано выше, но не конвертируется в (-)-амброксид. Используемая в настоящем описании ссылка на (3Е,7Е)-гомофарнезол представляет собой ссылку на Е,Z-гомофарнезол, который также обозначен как EZH.

В некоторых воплощениях изобретения гомофарнезол предпочтительно содержит смесь (3Е,7Е) и (3Z,7E), обозначаемую в настоящем описании как стереоизомерная смесь EE:EZ (в частности, при ссылки на примеры и таблицу 20).

Стереоизомерная смесь EE:EZ гомофарнезола имеет номер по химическому реферативному журналу (Chemical Abstracts, CAS) 35826-67-6.

Как показано в примерах (например, см. примеры 5, 7, 9, 10, 11, 18, 19 и 20), в некоторых воплощениях изобретения исходное сырье/исходный вещество гомофарнезола представляет собой смесь изомеров.

Соответственно, в некоторых воплощениях изобретения исходное вещество гомофарнезола может также содержать смесь четырех изомеров EE:EZ:ZZ:ZE, которая соответствует (3Е,7Е) и (3Z,7E), (3Z,7Z и 3E,7Z).

В некоторых воплощениях изобретения исходное вещество гомофарнезола предпочтительно выбрано из одной или более из следующих групп: [(3Z,7Z), (3E,7Z), (3Z,7E) и (3Е,7Е)], [(3Z,7E) и (3Е,7Е)], [(3Z,7E), (3E,7Z)] и/или [(3Е,7Е) и (3E,7Z)].

Предпочтительно исходное вещество гомофарнезола выбрано из одной или более из следующих групп: [(3Е,7Е), (3Z,7E)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)].

Соответственно, в некоторых воплощениях изобретения соотношение EEH:EZH составляет приблизительно 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; 60:40; 59:41; 58:42; 57:43; 56:44; 55:45; 54:46; 53:47; 52:48; 51:49; или приблизительно 50:50.

В некоторых воплощениях изобретения исходное вещество гомофарнезола предпочтительно содержит >90% Е,E-гомофарнезола (ЕЕН).

В других воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 86:14.

В некоторых воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 80:20.

В некоторых воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 70:30.

В следующих воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 69:31.

В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из смеси четырех изомеров EE:EZ:ZZ:ZE, которая соответствует (3Е,7Е) и (3Z,7E), (3Z,7Z) и (3E,7Z).

В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из смеси изомеров, выбранных из одной или более из следующих групп: [(3Z,7Z), (3E,7Z), (3Z,7E) и (3Е,7Е)], [(3Z,7E) и (3Е,7Е)], [(3Z,7E), (3E,7Z)] и/или [(3Е,7Е) и (3E,7Z)].

Предпочтительно исходное вещество гомофарнезола состоит или по существу состоит из смеси изомеров, выбранных из одной или более из следующих групп: [(3Е,7Е), (3Z,7E)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)].

Соответственно, в некоторых воплощениях изобретения соотношение изомеров EEH:EZH состоит или по существу состоит из соотношения EEH:EZH приблизительно 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; 60:40; 59:41; 58:42; 57:43; 56:44; 55:45; 54:46; 53:47; 52:48; 51:49; или приблизительно 50:50.

В некоторых воплощениях изобретения исходное вещество гомофарнезола предпочтительно состоит или по существу состоит из >90% E,Е-гомофарнезола (ЕЕН).

В других воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 86:14.

В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 80:20.

В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 70:30.

В следующих воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 69:31.

В воплощениях настоящего изобретения амброксид получают с использованием производного фермента SHC/HAC.

Производное SHC/HAC

Используемый в настоящем описании термин «производное SHC/НАС» означает, что аминокислотная последовательность производного SHC/HAC представляет собой модифицированную аминокислотную последовательность или ее вариант, измененные по сравнению с аминокислотной последовательностью эталонной (или дикого типа) последовательности SHC, которая соответствует по меньшей мере SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4. Как правило, производные SHC/HAC содержат измененные формы SHC, имеющие по меньшей мере одно изменение, которое модифицирует (например, увеличивает) активность фермента по отношению к его субстрату (например, ЕЕН).

Производные SHC/HAC по настоящему изобретению тестируют на их активность гомофарнезол-амброксид-циклазы. Следовательно, эти производные SHC/HAC, которые конвертируют гомофарнезол в амброксид, в настоящем описании называют как производными НАС, так и производные SHC. Хотя в качестве примеров производных SHC/HAC были предложены ферменты, имеющие происхождение из источников, представляющих собой штаммы микроорганизмов Alicyclobacillus acidocaldarius, Zymomonas mobilis, Bradyrhizobium japonicum, настоящее изобретение также охватывает эквивалентные производные SHC/HAC из источников, представляющих собой другие штаммы микроорганизмов, включающих в себя, без ограничений, ферменты SHC/HAC из Methylococcus capsulatus, Frankia alni, Acetobacter pasteurianum и Tetrahymena pyriformis (см., например, WO 2010/139719, US 2012/01345477, WO 2012/066059 и таблицы 10-12).

Используемый в настоящем описании термин «изменение аминокислоты» означает инсерцию одной или более чем одной аминокислоты между двумя аминокислотами, делецию одной или более чем одной аминокислоты или замену (которая может быть консервативной или неконсервативной) одной или более чем одной аминокислоты на одну или более чем одну из других аминокислот относительно аминокислотной последовательности эталонной аминокислотной последовательности (такой как, например, аминокислотная последовательность дикого типа (WT) SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4). Изменения аминокислот могут быть легко идентифицированы путем сравнения аминокислотных последовательностей производного SHC/HAC и эталонной аминокислотной последовательности (такой как, например, аминокислотная последовательность дикого типа (WT) SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4). Примеры выравнивания аминокислотной последовательности WT SHC приведены на Фиг. 1-4 и в таблицах 18 и 19.

Консервативные аминокислотные замены могут быть выполнены, например, на основании подобия полярности, заряда, размера, растворимости, гидрофобности, гидрофильности и/или амфипатической природы задействованных аминокислотных остатков. 20 встречающихся в природе аминокислот, как описано выше, могут быть сгруппированы в шесть следующих стандартных групп аминокислот:

(1) гидрофобные: Met, Ala, Val, Leu, Ile;

(2) нейтральные гидрофильные: Cys, Ser, Thr; Asn, Gln;

(3) кислые: Asp, Glu;

(4) основные: His, Lys, Arg;

(5) остатки, влияющие на ориентацию цепи: Gly, Pro; и

(6) ароматические: Trp, Tyr, Phe.

Соответственно, используемый в настоящем описании термин «консервативные замены» означают замену аминокислоты на другую аминокислоту, включенную в перечень в пределах той же группы из шести стандартных групп аминокислот, представленных выше. Например, в модифицированном таким путем полипептиде замена Asp на Glu сохраняет один отрицательный заряд. Кроме того, глицин и пролин могут быть заменены друг на друга за счет их способности к прерыванию альфа-спиралей. Некоторые предпочтительные консервативные замены в пределах описанных выше шести групп представляют собой обмены внутри следующих подгрупп: (i) Ala, Val, Leu и Ile; (ii) Ser и Thr; (ii) Asn и Gln; (iv) Lys и Arg; и (v) Tyr и Phe. С учетом известного генетического кода и методов рекомбинантных ДНК и синтеза ДНК ученый-специалист сможет легко сконструировать ДНК,кодирующие консервативные варианты аминокислот.

Используемый в настоящем описании термин «неконсервативные замены» или «обмены неконсервативных аминокислот» определяют как обмены аминокислоты с другой аминокислотой, включенной в перечень другой группы из шести стандартных групп аминокислот (1)-(6), представленных выше. Как правило, производные SHC/HAC по настоящему изобретению получают с использованием неконсервативных замен, изменяющих биологическую функцию (например, активность НАС) раскрытых производных SHC/HAC.

Для простоты ссылки ниже указаны однобуквенные символы аминокислот, рекомендованные Комиссией по биохимической номенклатуре IUPAC-IUB. В целях ссылки также приведены трехбуквенные коды.

Изменения аминокислот, такие как аминокислотные замены, можно вводить, используя известные протоколы технологии рекомбинантных генов, включающие полимеразную цепную реакцию (ПЦР), клонирование генов, сайт-направленный мутагенез кДНК, трансфекция клеток-хозяев и транскрипция in-vitro, которые можно использовать для введения таких изменений в последовательность WT SHC с получением в результате производного фермента SHC/HAC. Впоследствии эти производные можно подвергать скринингу на функциональную активность SHC/HAC.

Производные фермента SHC/HAC

В настоящем изобретении предложено производное SHC/HAC и описан фермент, обладающий активностью гомофарнезол-амброксид-циклазы (НАС) и содержащий аминокислотную последовательность, которая имеет от 1 до приблизительно 50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно аминокислотной последовательности эталонной (или дикого типа) последовательности SHC в соответствии с по меньшей мере одной из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4.

В различных воплощениях изобретения мутация или комбинация мутаций усиливает активность производного SHC/HAC для конвертирования гомофарнезола в амброксид в сравнении с эталонными ферментами SHC, которые не демонстрируют эту делецию/добавление. Для направленного получения таких замен, делеций или инсерций в эталонной последовательности SHC можно использовать описанное в настоящем описании моделирование белков. Например, можно создать структурную модель аминокислотной последовательности SHC с использованием координат для AacSHC (как показано, например, на Фиг. 19 и 20). Как продемонстрировано в настоящем описании, такая модель гомологии полезна для направленного усовершенствования конвертирования гомофарнезола в (-)-амброксид ферментами SHC.

Таким образом, в различных воплощениях изобретения производное SHC/HAC может иметь от приблизительно 1 до приблизительно 45 мутаций, от приблизительно 1 до приблизительно 40 мутаций, от приблизительно 1 до приблизительно 35 мутаций, от приблизительно 1 до приблизительно 30 мутаций, от приблизительно 1 до приблизительно 25 мутаций, от приблизительно 1 до приблизительно 20 мутаций, от приблизительно 1 до приблизительно 15 мутаций, от приблизительно 1 до приблизительно 10 мутаций или от приблизительно 1 до приблизительно 5 мутаций относительно аминокислотной последовательности эталонной (или дикого типа) последовательности SHC в соответствии с по меньшей мере одной из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4.

В различных воплощениях изобретения производное SHC/HAC содержит последовательность, имеющую по меньшей мере 5 или по меньшей мере 10 мутаций относительно аминокислотной последовательности эталонной (или дикого типа) последовательности SHC в соответствии с по меньшей мере одной из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, но не более 20 или 30 мутаций. В различных воплощениях изобретения производное SHC может иметь приблизительно 1 мутацию, приблизительно 2 мутации, приблизительно 3 мутации, приблизительно 4 мутации, приблизительно 5 мутаций, приблизительно 6 мутаций, приблизительно 7 мутаций, приблизительно 8 мутаций, приблизительно 9 мутаций, приблизительно 10 мутаций, приблизительно 11 мутаций, приблизительно 12 мутаций, приблизительно 13 мутаций, приблизительно 14 мутаций, приблизительно 15 мутаций, приблизительно 16 мутаций, приблизительно 17 мутаций, приблизительно 18 мутаций, приблизительно 19 мутаций, приблизительно 20 мутаций, приблизительно 21 мутацию, приблизительно 22 мутации, приблизительно 23 мутации, приблизительно 24 мутации, приблизительно 25 мутаций, приблизительно 26 мутаций, приблизительно 27 мутаций, приблизительно 28 мутаций, приблизительно 29 мутаций, приблизительно 30 мутаций, приблизительно 31 мутацию, приблизительно 32 мутации, приблизительно 33 мутации, приблизительно 34 мутации, приблизительно 35 мутаций, приблизительно 36 мутаций, приблизительно 37 мутаций, приблизительно 38 мутаций, приблизительно 39 мутаций, приблизительно 40 мутаций, приблизительно 41 мутацию, приблизительно 42 мутации, приблизительно 43 мутации, приблизительно 44 мутации, приблизительно 45 мутаций, приблизительно 46 мутаций, приблизительно 47 мутаций, приблизительно 48 мутаций, приблизительно 49 мутаций или приблизительно 50 мутаций относительно эталонного SHC (такого как, например, SEQ ID NO: 1, или 2, или 3, или 4.

В этих или в других воплощениях изобретения производное SHC/HAC может содержать аминокислотную последовательность, обладающую по меньшей мере приблизительно 50% идентичностью последовательности, по меньшей мере приблизительно 55% идентичностью последовательности, по меньшей мере приблизительно 60% идентичностью последовательности, по меньшей мере приблизительно 65% идентичностью последовательности, по меньшей мере приблизительно 70% идентичностью последовательности, по меньшей мере приблизительно 75% идентичностью последовательности, по меньшей мере приблизительно 80% идентичностью последовательности, по меньшей мере приблизительно 85% идентичностью последовательности, по меньшей мере приблизительно 90% идентичностью последовательности, по меньшей мере приблизительно 91% идентичностью последовательности, по меньшей мере приблизительно 92% идентичностью последовательности, по меньшей мере приблизительно 93% идентичностью последовательности, по меньшей мере приблизительно 94% идентичностью последовательности, по меньшей мере приблизительно 95% идентичностью последовательности, по меньшей мере приблизительно 96% идентичностью последовательности, по меньшей мере приблизительно 97% идентичностью последовательности, по меньшей мере приблизительно 98% идентичностью последовательности или по меньшей мере приблизительно 99% идентичностью последовательности WT SHC (такой как, например, SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4) или между эталонными последовательностями (см., например, таблицы 18 и 19, где показана идентичность 34-52% между AacSHC (SEQ ID NO: 1) и другими последовательностями SHC (например, ZmoSHC по WO 2010/139719).

В различных воплощениях изобретения вариант SHC обладает более высокой активностью конвертирования гомофарнезола в амброксид, чем фермент дикого типа, например более высокой продуктивностью в отношении (-)-амброксида при приведении в контакт с субстратом гомофарнезолом по сравнению с эталонным ферментом дикого типа (таким как, например, SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4).

Например, производное SHC/HAC может содержать аминокислотную последовательность, обладающую по меньшей мере: приблизительно 50% идентичностью, приблизительно 51% идентичностью, приблизительно 52% идентичностью, приблизительно 53% идентичностью, приблизительно 54% идентичностью, приблизительно 55% идентичностью, приблизительно 56% идентичностью, приблизительно 57% идентичностью, приблизительно 58% идентичностью, приблизительно 59% идентичностью, приблизительно 60% идентичностью, приблизительно 61% идентичностью, приблизительно 62% идентичностью, приблизительно 63% идентичностью, приблизительно 64% идентичностью, приблизительно 65% идентичностью, приблизительно 66% идентичностью, приблизительно 67% идентичностью, приблизительно 69% идентичностью, приблизительно 70% идентичностью, приблизительно 71% идентичностью, приблизительно 72% идентичностью, приблизительно 73% идентичностью, приблизительно 74% идентичностью, приблизительно 75% идентичностью, приблизительно 76% идентичностью, приблизительно 77% идентичностью, приблизительно 78% идентичностью, приблизительно 79% идентичностью, приблизительно 80% идентичностью, приблизительно 81% идентичностью, приблизительно 82% идентичностью, приблизительно 83% идентичностью, приблизительно 84% идентичностью, приблизительно 85% идентичностью, приблизительно 86% идентичностью, приблизительно 87% идентичностью, приблизительно 88% идентичностью, приблизительно 89% идентичностью, приблизительно 90% идентичностью, приблизительно 91% идентичностью, приблизительно 92% идентичностью, приблизительно 93% идентичностью, приблизительно 94% идентичностью, приблизительно 95% идентичностью, приблизительно 96% идентичностью, приблизительно 97% идентичностью, приблизительно 98% идентичностью или приблизительно 99% идентичностью последовательности эталонного SHC (такого как, например, SEQ ID NO: 1, или 2, или 3, или 4) или между эталонными последовательностями (см., например, таблицы 18 и 19, где показана идентичность 34-52% между AacSHC (SEQ ID NO: 1) и другими последовательностями SHC (например, ZmoSHC по WO 2010/139719).

Различные производные SHC/HAC, протестированные на активность фермента SHC, включены в перечень одной или более из таблиц 1-9. Таким образом, в различных воплощениях изобретения производное SHC/HAC может иметь по меньшей мере приблизительно 1, по меньшей мере приблизительно 2, по меньшей мере приблизительно 3, по меньшей мере приблизительно 4, по меньшей мере приблизительно 5, по меньшей мере приблизительно 6, по меньшей мере приблизительно 7, по меньшей мере приблизительно 8, по меньшей мере приблизительно 9 или по меньшей мере приблизительно 10 мутаций, выбранных из одной или более мутаций в таблицах 1-9. В некоторых воплощениях изобретения производное SHC/HAC представляет собой модифицированный полипептид SHC, содержащий аминокислотную последовательность, имеющую вплоть до 4 мутаций по сравнению с аминокислотной последовательностью дикого типа/эталонной аминокислотной последовательностью, соответствующей SEQ ID NO: 1, и содержит по меньшей мере замены F601Y или M132R в комбинации с по меньшей мере одной или более чем одной из замен F129L и/или I432T относительно SEQ ID NO: 1, а также необязательно содержит лидерную последовательность, поддерживающую экспрессию и активность в Е. coli.

В других воплощениях изобретения производное SHC/HAC представляет собой модифицированный полипептид SHC, содержащий аминокислотную последовательность, имеющую вплоть до 8 мутаций по сравнению с аминокислотной последовательностью дикого типа/эталонной аминокислотной последовательностью, соответствующей SEQ ID NO: 1 (или ее копией, модифицированной для экспрессии в Е. coli) и содержит одно или более изменений аминокислот, выбранных из группы, состоящей из положений 77, 92, 129, 132, 224, 432, 579, 601 и 605 относительно SEQ ID NO: 1, где производное SHC/HAC обладает модифицированной (например, повышенной) ферментативной активностью относительно SEQ ID NO: 1.

В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: Т77Х, I92X, F129X, М132Х, А224Х, I432X, Q579X, F601Y и F605W относительно SEQ ID NO: 1, где:

В Т77Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В I92X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F129X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, T, V, W или Y.

В M132X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В А224Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В I432X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В Q579X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F601X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F605X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: Т77А, I92V, F129L, M132R, A224V, I432T, Q579H, F601Y и F605W относительно SEQ ID NO: 1.

В другом воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: S129X, V145X, F182X, Y185X, G282X, I498X, Н646Х, и F698X относительно SEQ ID NO: 2, где:

В S129X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В V145X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F182X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В Y185X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В G282X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В I498X аминокислота X выбрана из: А, В, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В Н646Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, T, V, W или Y.

В F668X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F698X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В одном воплощении изобретения производное SHC содержит одну или более чем одну замен, выбранных из группы мутантов, состоящей из: S129A, V145V, F182L, Y185R, G282V, I498T, Н646Н, F668Y и F698X относительно SEQ ID NO: 2, как показано в таблице 2.

В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: G85X, V100X, F137X, I140X, V233X, I450X, N598X, F620X и F624X относительно SEQ ID NO: 3, где:

В G85X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В V100X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F137X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В I140X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В V233X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В I450X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В N598X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F620X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F624X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: G85A, V100V, F137L, I140R, V233V, I450T, N598H, F620Y и F624W относительно SEQ ID NO: 3, как показано в таблице 3 и в таблице 3а.

В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: А88Х, V104X, F141X, Y144X, V241X, I459X, М607Х, F628X и F658X относительно SEQ ID NO: 4, где:

В А88Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В V104X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F141X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В Y144X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В V241X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В I459X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В М607Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F628X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В F658X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.

В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы, состоящей из: А88А, V104V, F141L, Y144R, V241V, I459T, М607Н, F628Y и F658W относительно SEQ ID NO: 4, как показано в таблице 4.

Комбинации производных SHC

В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: Т77А, F129L, M132R, I92V, A224V, I432T, Q579H и F601Y относительно SEQ ID NO: 1, как показано в таблице 5.

В одном воплощении изобретения производные SHC содержат одну или более чем одну замену, выбранную из группы мутантов, состоящей из: S129A, V145V, F182L, Y185R, G282V, I498T, Н646Н и F668Y относительно SEQ ID NO:

2, как показано в таблице 6.

В одном воплощении изобретения производные SHC содержат одну или более чем одну замену, выбранную из группы мутантов, состоящей из: G85A, V100V, F137L, I140R, V233V, I450T, N598H и F620Y относительно SEQ ID NO: 3, как показано в таблице 7.

В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы, состоящей из: А88А, V104V, F141L, Y144R, V241V, I459T, М607Н, и F628Y относительно SEQ ID NO: 4, как показано в таблице 8.

В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F601Y или M132R в комбинации с по меньшей мере любой одной или более из F129L и/или I432T относительно SEQ ID NO: 1.

Производное SHC, обозначенное как SHC3, предложенное в настоящем изобретении, содержит следующую замену F601Y по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщали, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной КM) и снижением каталитической эффективности/активности (Kcat/КM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y.

Производное SHC, обозначенное как SHC10, предложенное в настоящем изобретении, содержит следующую замену F129L по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как SHC30, предложенное в настоящем изобретении, содержит следующую замену F601Y и F129L по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как SHC26, предложенное в настоящем изобретении, содержит следующую замену M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как 215G2, предложенное в настоящем изобретении, содержит следующую замену M132R, I432T и A224V по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как SHC32, предложенное в настоящем изобретении, содержит следующую замену F601Y, M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как SHC31, предложенное в настоящем изобретении, содержит следующую замену F129L, M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как SHC33, предложенное в настоящем изобретении, содержит следующую замену F601Y, F129L, M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как 101А10, предложенное в настоящем изобретении, содержит следующую замену F601Y и Q579H по сравнению с эталонным белком SHC (SEQ ID NO: 1).

Производное SHC, обозначенное как 111С8, предложенное в настоящем изобретении, содержит следующую замену Т77А + I92V и F129L по сравнению с эталонным белком SHC (SEQ ID NO: 1).

В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F668Y или Y185R в комбинации с по меньшей мере любой одной или более чем одной из F182L и/или I498T относительно SEQ ID NO: 2.

Производное SHC, обозначенное как SHC3ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщалось, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной КM) и снижением каталитической эффективности/активности (Kcat/КM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y. Производное SHC, эквивалентное F601Y в ZmoSHC1, представляет собой F668Y.

Производное SHC, обозначенное как SHC10ZM1, предложенное в настоящем изобретении, содержит следующую замену F182L по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как SHC30ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y и F182L по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как SHC26ZM1, предложенное в настоящем изобретении, содержит следующую замену Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как 215G2ZM1, предложенное в настоящем изобретении, содержит следующую замену Y185R, I498T и G282V по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как SHC32ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y, Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как SHC31ZM1, предложенное в настоящем изобретении, содержит следующую замену F182L, Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как SHC33ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y, F182L, Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как 101A10ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y и Н646Н по сравнению с эталонным белком SHC (SEQ ID NO: 2).

Производное SHC, обозначенное как 111C8ZM1, предложенное в настоящем изобретении, содержит следующую замену S129A + V145V и F182L по сравнению с эталонным белком SHC (SEQ ID NO: 2).

В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F620Y или I140R в комбинации с по меньшей мере любой одной или более чем одной из F137L и/или I450T относительно SEQ ID NO: 3.

Производное SHC, обозначенное как SHC3ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщалось, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной КM) и снижением каталитической эффективности/активности (Kcat/КM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y. Производное SHC, эквивалентное F601Y в ZmoSHC2, представляет собой F620Y.

Производное SHC, обозначенное как SHC10ZM2, предложенное в настоящем изобретении, содержит следующую замену F137L по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как SHC30ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y и F137L по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как SHC26ZM2, предложенное в настоящем изобретении, содержит следующую замену I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как 215G2ZM2, предложенное в настоящем изобретении, содержит следующую замену I140R, I450T и V233V по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как SHC32ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y, I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как SHC31ZM2, предложенное в настоящем изобретении, содержит следующую замену F137L, I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как SHC33ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y, F137L, I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как 101A10ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y и N598H по сравнению с эталонным белком SHC (SEQ ID NO: 3).

Производное SHC, обозначенное как 111C8ZM2, предложенное в настоящем изобретении, содержит следующую замену G85A+V100V и F137L по сравнению с эталонным белком SHC (SEQ ID NO: 3).

В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F628Y или Y144R в комбинации с по меньшей мере любой одной или более чем одной из F141L и/или I459T относительно SEQ ID NO: 4.

Производное SHC, обозначенное как SHC3Bjp, предложенное в настоящем изобретении, содержит следующую замену F628Y по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщалось, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной КM) и снижением каталитической эффективности/активности (Kcat/КM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y. Производное SHC, эквивалентное F601Y в BjpSHC, представляет собой F628Y.

Производное SHC, обозначенное как SHC10Bjp, предложенное в настоящем описании, содержит следующую замену F141L по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как SHC30Bjp, предложенное в настоящем описании, содержит следующую замену F628Y и F141L по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как SHC26Bjp, предложенное в настоящем описании, содержит следующую замену Y144R и I459T по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как 215G2Bjp, предложенное в настоящем описании, содержит следующую замену Y144R, I459T и V241V по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как SHC32Bjp, предложенное в настоящем описании, содержит следующую замену F628Y, Y144R и I459T по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как SHC31Bjp, предложенное в настоящем описании, содержит следующую замену F141L, Y144R и I459T по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как SHC33Bjp, предложенное в настоящем описании, содержит следующую замену F628Y, F141L, Y144R и I459 по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как 101A10Bjp, предложенное в настоящем описании, содержит следующую замену F628Y и М607Н по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Производное SHC, обозначенное как 111C8Bjp, предложенное в настоящем описании, содержит следующую замену А88А + V104V и F141L по сравнению с эталонным белком SHC (SEQ ID NO: 4).

Аминокислотные последовательности

В некоторых воплощениях изобретения производное AacSHC/HAC содержит один или более чем один полипептид, представленный в одной или более чем одной из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 и/или 171.

Предпочтительно производные AacSHC/HAC согласно настоящему описанию имеют аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39 и/или SEQ ID NO: 171.

В других воплощениях изобретения производные ZmoSHC1/HAC содержат один или более чем один полипептид, представленный в одной или более чем одной из SEQ ID NO: 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 и/или 173.

Предпочтительно производные ZmoSHC1/HAC согласно настоящему описанию имеют аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75 и/или SEQ ID NO: 173.

В следующих воплощениях изобретения производные ZmoSHC2/HAC содержат один или более чем один полипептид, представленный в одной или более чем одной из SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111 и/или SEQ ID NO: 175.

В дополнительных воплощениях изобретения производные BjpSHC/HAC содержат один или более чем один полипептид, представленный в одной или более чем одной из: SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147 и/или SEQ ID NO: 177.

Выравнивание последовательностей

В связи с тем, что эталонные последовательности SHC, такие как, например, последовательности полипептидов AacSHC, ZmoSHC1, ZmoSHC2 и BjpSHC, имеют различную длину, аминокислотный остаток в положении X в эталонной последовательности AacSHC (SEQ ID NO: 1) соответствует другому положению аминокислоты В в эталонной последовательности ZmoSHC1 (SEQ ID NO: 2), другому положению аминокислоты J в эталонной последовательности ZmoSHC2 (SEQ ID NO: 3) и другому положению аминокислоты Z в эталонной последовательности BjpSHC (SEQ ID NO: 4). Кроме того, изменение эталонной последовательности SHC может также модифицировать последовательность производного SHC относительно этой эталонной последовательности SHC.

Термин «положение» относится к определенному остатку аминокислоты, находящемуся в эталонном белке SHC, идентифицированному определенной нумерацией аминокислот. Изменение эталонного белка SHC в результате инсерции или делеции аминокислоты приводит к различной нумерации между эталонной аминокислотной последовательностью SHC и аминокислотной последовательностью производного SHC. В качестве примера, в случае инсерции аминокислоты между аминокислотами 509 и 510 эталонного белка SHC, эта аминокислота после инсерции будет иметь номер 511 в белке-производном SHC, тогда как в эталонном белке SHC сохраняется номер 510.

Методы обнаружения активности WT SHC/HAC и производного SHC/HAC

Методы обнаружения и количественного определения активности WT SHC/HAC и/или производного фермента SHC/HAC описаны в настоящем описании и известны на уровне техники. В качестве примера активность WT SHC/HAC и/или производного фермента SHC/HAC можно определить путем инкубирования очищенного фермента SHC/HAC или экстрактов из клеток-хозяев, либо целостного рекомбинантного организма-хозяина, продуцирующего фермент SHC/HAC, с соответствующим субстратом в подходящих условиях и проведения анализа продуктов реакции (например, методом газовой хроматографии (GC) или анализа HPLC (высокоэффективной жидкостной хроматографией)). Дополнительные подробные сведения о количественном определении SHC/HAC и/или ферментативной активности SHC/HAC и анализе продуктов реакции приведены в примерах. Эти методы включают в себя продуцирование производного SHC в рекомбинантных клетках-хозяевах (например, Е. coli).

Используемый в настоящем описании термин «активность» означает способность фермента к взаимодействию с субстратом с получением целевого продукта. Активность может быть определена в тесте, известном как тест на активность, через увеличение количества целевого продукта, уменьшения количества субстрата (или исходных веществ) или через комбинации этих параметров в зависимости от времени. Производные SHC/HAC согласно настоящему описанию характеризуют по их способности к биоконверсии гомофарнезола в (-)-амброксид и демонстрируют биологическую активность, такую как активность НАС.

Используемый в настоящем описании термин «биологическая активность» относится к любой активности, которую может проявлять полипептид, включающей, без ограничений: ферментативную активность; активность связывания с другим соединением (например, связывание с другим полипептидом, в частности связывание с рецептором или связывание с нуклеиновой кислотой), ингибиторную активность (например, ингибиторную активность по отношению к ферменту), активирующую активность (например, активность, активирующую фермент) или токсические действия. Для варианта или производного не требуется, чтобы они проявляли такую активность в той же степени, что и родительский полипептид. Вариант рассматривают как вариант в контексте настоящей заявки, если он проявляет релевантную активность в степени, составляющей по меньшей мере 10% от активности родительского полипептида. Схожим образом производное рассматривают как вариант в контексте настоящей заявки, если он проявляет релевантную биологическую активность в степени, составляющей по меньшей мере 10% от активности родительского полипептида (поскольку термины производное и вариант на протяжении настоящего описания используют взаимозаменяемо).

В других воплощениях изобретения производные SHC/HAC согласно настоящему описанию демонстрируют лучший выход целевого продукта, чем эталонный белок SHC. Термин «выход целевого продукта» относится к количеству граммов извлекаемого продукта на один грамм исходного сырья (которое можно рассчитать как скорость конверсии в молярных процентах).

В дополнительных воплощениях изобретения производные SHC/HAC согласно настоящему описанию проявляют модифицированную (например, повышенную) целевую производительность относительно эталонного белка SHC. Термин «целевая производительность» относится к количеству извлекаемого целевого продукта в граммах на литр ферментационной емкости в час времени биоконверсии (т.е. времени после добавления субстрата).

В следующих воплощениях изобретения производные SHC/HAC согласно настоящему описанию проявляют модифицированный коэффициент выхода целевого продукта, чем эталонный белок SHC. Термин «коэффициент выхода целевого продукта» относится к соотношению между концентрацией полученного продукта и концентрацией производного SHC (например, очищенного фермента SHC или экстракта из рекомбинантных клеток-хозяев, экспрессирующих фермент SHC) в реакционной смеси.

В различных воплощениях изобретения производные SHC согласно настоящему описанию демонстрируют модифицированную (например, повышенную) кратность повышения ферментативной активности (например, модифицированную/повышенную активность гомофарнезол-амброксид-циклазы (НАС)) относительно эталонного белка SHC (например, SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4). Кратность этого повышения активности составляет по меньшей мере: 2, 3, 4, 6, 8, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 и/или 100.

Нуклеотидные последовательности

Настоящее изобретение также относится к изолированным молекулам нуклеиновой кислоты, содержащим нуклеотидную последовательность, кодирующую производное SHC, как описано в настоящем описании.

Используемый в настоящем описании термин «молекула нуклеиновой кислоты» следует конкретно относить к полинуклеотидам согласно описанию, которые могут представлять собой ДНК, кДНК, геномную ДНК, синтетическую ДНК или РНК и могут быть двунитевыми или однонитевыми, смысловой и/или антисмысловой нитью. Термин «молекула нуклеиновой кислоты» следует конкретно применять к описанному(-ым) в настоящем описании полинуклеотиду(-ам), например, в виде полноразмерной нуклеотидной последовательности или ее фрагментов или частей, которые кодируют полипептид, обладающий ферментативной активностью, например фермент метаболического пути или его фрагменты или части, соответственно.

Этот термин также включает в себя отдельную молекулу, такую как кДНК, где соответствующая геномная ДНК имеет интроны и, следовательно, отличающуюся последовательность; геномный фрагмент, в котором отсутствует по меньшей мере один из фланкирующих генов; фрагмент кДНК или геномной ДНК, образующийся в результате полимеразной цепной реакции (ПЦР), и в котором отсутствует по меньшей мере один из фланкирующих генов; фрагмент рестрикции, в котором отсутствует по меньшей мере один из фланкирующих генов; ДНК, кодирующую неприродный белок, такой как слитый белок (например, гистидиновую метку), мутеин или фрагмент данного белка; и нуклеиновую кислоту, представляющую собой вырожденный вариант кДНК или встречающейся в природе нуклеиновой кислоты. Кроме того, он включает в себя рекомбинантную нуклеотидную последовательность, составляющую участок гибридного гена, т.е. гена, кодирующего неприродный слитый белок. В слитых белках к белку может быть присоединена одна или более чем одна аминокислота (такая как, без ограничений, гистидин (His)), обычно на N-конце белка, но также на С-конце белка или в слитом виде внутри участков белка. Такие слитые белки или слитые векторы, кодирующие такие белки, как правило, предназначены для следующих целей: (i) повысить продуцирование рекомбинантных белков; (ii) повысить растворимость рекомбинантного белка; и (iii) способствовать очистке рекомбинантного белка путем обеспечения лиганда для аффинной очистки. Термин «молекула нуклеиновой кислоты» также включает в себя оптимизированные по кодонам последовательности, подходящие для экспрессии в конкретной клетке микроорганизма-хозяина (например, в клетке-хозяине Е. coli). Используемый в настоящем описании термин «оптимизированный по кодонам» означает кодирующую белок последовательность нуклеиновой кислоты, адаптированную для экспрессии в прокариотической или эукариотической клетке-хозяине, в частности в бактериальных клетках-хозяевах, таких как клетки-хозяева Е. coli, путем замены одного или более чем одного, или, предпочтительно, значительного числа кодонов кодонами, который чаще используются в генах бактериальных клеток-хозяев (например, Е. coli). В связи с этим нуклеотидная последовательность, кодирующая эталонные последовательности SEQ ID NO: 1, 2, 3 и/или 4 и все их варианты/производные, может представлять собой исходную последовательность, обнаруживаемую в источнике (например, AacSHC, ZmoSHC1, ZmoSHC2 или BjpSHC, соответственно), или ген, который может быть оптимизирован по кодонам для выбранных организмов-хозяев, таких как, например, Е. coli.

Молекула рибонуклеиновой кислоты (РНК) может быть получена путем транскрипции in vitro. Сегменты молекул ДНК также рассмотрены в пределах объема описания и могут быть получены, например, полимеразной цепной реакцией (ПЦР) или созданы путем обработки одной или более чем одной эндонуклеазой рестрикции. Сегменты молекулы нуклеиновой кислоты могут относиться к ДНК-фрагментам гена, в частности к фрагментам, представляющим собой частичные гены. Фрагмент может также содержать несколько открытых рамок считывания (ОРС), либо повторов одной и той же ОРС, либо различных ОРС. Этот термин следует конкретно относить к кодирующим нуклеотидным последовательностям, но в него также следует включать некодирующие нуклеотидные последовательности, например нетранскрибируемые или нетранслируемые последовательности, или последовательности, кодирующие полноразмерные или частичные полипептиды. Гены, используемые в настоящем описании, например, для сборки, диверсификации или рекомбинации, могут представлять собой либо некодирующие последовательности, либо кодирующие полипептиды последовательности, либо кодирующие белки последовательности или их участки или фрагменты, имеющие достаточную длину последовательности для успешного осуществления событий рекомбинации. Более конкретно, указанные гены имеют минимальную длину 3 пары оснований (п.о.), предпочтительно по меньшей мере 100 п. о., более предпочтительно по меньшей мере 300 п. о.

На основании вышеописанного будет ясно, что ссылка на изолированную ДНК не означает ДНК, находящуюся среди других молекул ДНК в количествах от сотен до миллионов, например, в составе библиотек кДНК, или геномных ДНК, или рестриктных фрагментов геномной ДНК, например в рестрикционной смеси или в пластинке геля на электрофорезе. Изолированная молекула нуклеиновой кислоты согласно настоящему описанию охватывает сегменты, которые сами по себе не обнаруживаются в естественном состоянии.

Используемый в настоящем описании термин «изолированная ДНК» может относиться к (1) ДНК, содержащей последовательность, не идентичную какой-либо встречающейся в природе последовательности, полинуклеотиду или нуклеиновой кислоте, не встречающимся в природе (например, полученным путем искусственного комбинирования (например, искусственных манипуляций с изолированными сегментами нуклеиновых кислот, например, методами генной инженерии) двух обычно разделенных сегментов последовательностей посредством вмешательства человека) или (2) в контексте ДНК, встречающейся в природе последовательности (например, «ДНК или геномной ДНК), ДНК, не содержащей по меньшей мере один из генов, фланкирующих ген, содержащий интересующую ДНК, в геноме организма, в котором в природе встречается ген, содержащий интересующую ДНК.

Используемый в настоящем описании термин «изолированная ДНК», особенно по отношению к последовательности нуклеиновой кислоты, может также относиться к нуклеиновым кислотам или полинуклеотидам, полученным методами рекомбинантных ДНК, например, к конструкции ДНК, содержащей полинуклеотид, гетерологичный для клетки-хозяина, который, возможно, встраивают в клетку-хозяина. Химерная нуклеотидная последовательность может быть, в частности, получена в виде рекомбинантной молекулы. Термин «рекомбинация» конкретно применяют к сборке полинуклеотидов, соединению таких полинуклеотидов или их участков вместе, с рекомбинацией или без рекомбинации, с получением кроссоверного или мозаичного гена. Например, ее осуществляют, чтобы соединить вместе сегменты нуклеиновой кислоты, обладающие требуемыми функциями, для создания требуемой комбинации функций. Рекомбинантный ген, кодирующий описанный в настоящем описании полипептид, включает в себя кодирующую последовательность для этого полипептида, функционально связанную в смысловой ориентации с одной или более регуляторных областей, подходящих для экспрессии этого полипептида. В связи с тем, что многие микроорганизмы способны экспрессировать множественные генные продукты с полицистронной мРНК, при желании множество полипептидов можно экспрессировать под контролем одной регуляторной области для этих микроорганизмов. Кодирующую последовательность и регуляторную область считают функционально связанными, если регуляторная область и кодирующая последовательность расположены так, что регуляторная область эффективно осуществляет регуляцию транскрипции или трансляции этой последовательности.

Используемый в настоящем описании термин «рекомбинантный», особенно по отношению к ферментам, следует относить к ферментам, полученным методами рекомбинантных ДНК, т.е. полученным из клеток, трансформированных экзогенной конструкцией ДНК, кодирующей требуемый фермент. Термин «синтетические ферменты» означает ферменты, полученные путем химического синтеза. Химерный фермент может быть конкретно получен в виде рекомбинантной молекулы. Таким образом, термин «рекомбинантная ДНК» включает в себя рекомбинантную ДНК, встроенную либо в вектор в виде автономно реплицирующейся плазмиды или вируса, либо в геномную ДНК прокариотического или эукариотического организма (или в геном гомологичной клетки в положении, отличающемся от природной хромосомной локализации).

В следующем аспекте молекула (-ы) нуклеиновой кислоты согласно настоящему описанию функционально связана (-ы) с контрольными последовательностями экспрессии, что дает возможность экспрессии в прокариотических и/или эукариотических клетках-хозяевах. Используемый в настоящем описании термин «функционально связанный» означает встраивание в генетическую конструкцию так, чтобы контрольные последовательности экспрессии эффективно контролировали экспрессию интересующей кодирующей последовательности.

Транскрипционные/трансляционные регуляторные элементы, относящиеся к описанному выше, включают, без ограничений, индуцибельные и неиндуцибельные, конститутивные, регулируемые клеточным циклом, метаболически регулируемые промоторы, энхансеры, операторы, сайленсеры, репрессоры и другие элементы, известные специалистам в данной области техники, которые стимулируют или иным образом регулируют экспрессию гена. Такие регуляторные элементы включают, без ограничений, регуляторные элементы, направляющие конститутивную экспрессию или обеспечивающие возможность индуцибельной экспрессии, такие как, например, промотор CUP-1, tet-peпpeccop, используемый, например, в системах tet-on или tet-off, регуляторные элементы lac-системы и trp-системы. В качестве примера, изопропил-β-D-1-тиогалактопиранозид (IPTG) является эффективным индуктором экспрессии генов в диапазоне концентраций от 100 мкМ до 1,0 мМ. Это соединение является молекулярным имитатором аллолактозы, являющейся метаболитом лактозы, который запускает транскрипцию lас оперона и, следовательно, используется для индукции экспрессии гена при нахождении гена под контролем lac оператора. Другим примером регуляторного элемента, который индуцирует экспрессию гена, является лактоза.

Аналогичным образом молекула (-ы) нуклеиновой кислоты согласно настоящему описанию может(гут) образовать участок гибридного гена, кодирующего дополнительные полипептидные последовательности, например последовательность, функционирующую в качестве маркера или репортера. Примеры маркерных и репортерных генов включают гены бета-лактамазы, хлорамфениколацетилтрансферазы (CAT), аденозиндезаминазы (ADA), аминогликозидфосфотрансферазы дигидрофолатредуктазы (DHFR), гигромицин-В-фосфотрансферазы (НРН), тимидинкиназы (ТК), lacZ (кодирующий бета-галактозидазу) и ксантингуанинфосфорибозилтрансферазы (XGPRT). Как и для многих стандартных процедур, связанных с осуществлением на практике изобретения согласно описанию, специалистам в данной области техники известны дополнительные полезные реагенты, например, дополнительные последовательности, которые могут выполнять функцию маркера или репортера.

В некотором воплощении в настоящем описании предложен рекомбинантный полипептид, кодирующий WT SHC или его описанное выше производное, который может быть встроен в вектор для экспрессии и дополнительной очистки. Одним из типов вектора является плазмида, представляющая собой кольцевую двунитевую петлю ДНК, в которой лигируют дополнительные сегменты ДНК. Определенные векторы могут контролировать экспрессию генов, с которыми они функционально связаны. Эти векторы называют «экспрессионными векторами». Обычно экспрессионные векторы, подходящие для методов рекомбинантных ДНК, представляют собой векторы плазмидного типа. Как правило, экспрессионный вектор содержит ген, такой как WT SHC или вариант SHC/HAC, как описано в настоящем описании. В настоящем описании термины «плазмида» и «вектор» используют взаимозаменяемо, поскольку плазмида является наиболее часто используемым типом вектора.

Такие векторы могут включать последовательности ДНК, включающие, без ограничений, последовательности ДНК, которые в природе отсутствуют в клетке-хозяине, последовательности ДНК, которые в нормальных условиях не транскрибируются в РНК или не транслируются в белок (не «экспрессируются»), и другие гены или последовательности ДНК, требуемые для введения в нерекомбинантную клетку-хозяина. Должно быть понятно, что, как правило, геном описанной в настоящем описании рекомбинантной клетки-хозяина дополняют в результате стабильного введения одного или более рекомбинантных генов. Тем не менее, в пределах объема настоящего описания можно также использовать репликативные плазмиды или векторы. Кроме того, настоящее изобретение можно осуществлять на практике с использованием низкокопийной, например однокопийной, или высококопийной плазмиды или вектора (пример, которых приведен в настоящем описании).

В предпочтительном воплощении изобретения вектор согласно настоящему описанию включает в себя плазмиды, фагмиды, фаги, космиды, искусственные бактериальные и искусственные дрожжевые хромосомы, конструкции типа нокаут или нок-ин, синтетические нуклеиново-кислотные последовательности или кассеты, и эти подгруппы могут быть получены в форме линейных полинуклеотидов, плазмид, мегаплазмид, синтетических или искусственных хромосом, таких как искусственные хромосомы растений, бактерий, млекопитающих или дрожжей.

Предпочтительно, чтобы белки, кодируемые встроенным полипептидом, после встраивания в вектор экспрессируются внутри клетки. В плазмиды могут быть встроены гены разнообразных субстратов. Плазмиды часто представляют собой стандартные векторы для клонирования, например бактериальные многокопийные плазмиды. Субстраты могут быть встроены в те же или другие плазмиды. Часто используют по меньшей мере два различных типа плазмид, имеющих различные типы селективных маркеров, что дает возможность отобрать клетки, содержащие по меньшей мере два типа векторов.

Как правило, бактериальные или дрожжевые клетки можно трансформировать любой одной или более чем одной из следующих нуклеотидных последовательностей, как хорошо известно в данной области техники. Для рекомбинации in vivo для трансформации клетки-хозяина используют ген, который должен рекомбинировать с геномом или с другими генами, используя стандартные методы трансформации. В соответствующем воплощении изобретения в конструкцию включают ДНК, обеспечивающую точку начала репликации. Точка начала репликации может быть целесообразно выбрана специалистом в данной области техники. В зависимости от природы генов в том случае, если в генах или в геноме уже присутствуют последовательности, которые могут сами по себе действовать в качестве точек начала репликации, дополнительная точка начала репликации может не требоваться.

Бактериальную или дрожжевую клетку можно трансформировать экзогенной или гетерологичной ДНК, если такая ДНК введена внутрь клетки. Трансформирующая ДНК может быть интегрирована, т.е. ковалентно связана с геномом клетки, или не интегрирована. У прокариот и дрожжей трансформирующая ДНК может сохраняться на эписомном элементе, таком как плазмида. Что касается эукариотических клеток, стабильно трансфицированной клеткой является клетка, в которой произошла интеграция трансфицированной ДНК в хромосому таким образом, что она наследуется дочерними клетками посредством репликации хромосомы. Эта стабильность демонстрируется на основании способности эукариотической клетки основывать клеточные линии или клоны, содержащие популяции дочерних клеток, содержащих трансформирующую ДНК.

Как правило, введенная ДНК исходно не является резидентной для хозяина, который является реципиентом ДНК, но в объем настоящего изобретения входит выделение сегмента ДНК из данного хозяина и последующее введение одной или более дополнительных копий этой ДНК в ту же клетку-хозяина, например, чтобы усилить продуцирование продукта гена или изменить паттерн экспрессии гена. В некоторых случаях введенная ДНК приведет к модификации или даже замене эндогенного гена или последовательности ДНК посредством, например, гомологической рекомбинации или сайт-направленного мутагенеза. Подходящие рекомбинантные клетки-хозяева включают микроорганизмы, растительные клетки и растения.

Признаками настоящего изобретения также являются рекомбинантные клетки-хозяева. Термином «рекомбинантная клетка-хозяин», которую также называют «генетически модифицированной клеткой-хозяином» или «трансгенной клеткой», обозначают клетку-хозяина, содержащую гетерологичную нуклеиновую кислоту, или клетку, геном которой дополнен по меньшей мере одной встроенной последовательностью ДНК. Клетка-хозяин по настоящему изобретению может быть сконструирована методами генной инженерии с полинуклеотидом или вектором, как описано выше.

Клетки-хозяева, которые можно использовать для целей изобретения, включают без ограничений прокариотические клетки, такие как бактерии (например, Е. coli и В. subtilis), которые могут быть трансформированы, например, рекомбинантной ДНК бактериофага, плазмидной ДНК, бактериальной искусственной хромосомой или космидными векторами экспрессии ДНК, содержащими полинуклеотидные молекулы по изобретению; простые эукариотические клетки, такие как дрожжи (например, Saccharomyces и Pichia), которые могут быть трансформированы рекомбинантными дрожжевыми экспрессионными векторами, содержащими полинуклеотидную молекулу по изобретению. В зависимости от клетки-хозяина и соответствующего вектора, используемого для введения полинуклеотида по изобретению, полинуклеотид может быть интегрирован, например, в хромосому или митохондриальную ДНК, либо может поддерживаться экстрахромосомально, например эписомально, либо может только временно содержаться в клетках.

Используемый в настоящем описании термин «клетка», в частности, со ссылкой на генетическое конструирование и включение в клетку одного или более генов или собранного кластера генов или со ссылкой на клетку-продуцент понимают как относящийся к любой прокариотической или эукариотической клетке. Как прокариотические, так и эукариотические клетки-хозяева рассматривают для применения в соответствии с изобретением, включая бактериальные клетки-хозяева, такие как Е. coli или Bacillus sp, дрожжевые клетки-хозяева, такие как S. cerevisiae, клетки-хозяева насекомых, таких как Spodoptora frugiperda, или человеческие клетки-хозяева, такие как клетки HeLa и Jurkat.

Более конкретно, клетка представляет собой эукариотическую клетку, предпочтительно клетку грибов, млекопитающих или растений, или прокариотическую клетку. Подходящие эукариотические клетки включают, например, без ограничений, клетки млекопитающих, дрожжевые клетки или клетки насекомых (включая Sf9), клетки амфибий (включая клетки-меланофоры) или клетки червей, включая клетки Caenorhabditis (включая Caenorhabditis elegans). Подходящие клетки млекопитающих включают, например, без ограничений клетки COS (включая Cos-1 и Cos-7), клетки СНО, клетки HEK293, клетки HEK293T, клетки HEK293 T-RexTM или другие способные к трансфекции эукариотические клеточные линии. Подходящие клетки бактерий включают, без ограничений, Е. coli.

Предпочтительно можно использовать прокариоты, такие как Е. coli, Bacillus, Streptomyces, или клетки млекопитающих, такие как клетки HeLa или клетки Jurkat, или клетки растений, такие как Arabidopsis.

Предпочтительно клетка представляет собой клетку Aspergillus sp.или клетку грибов, предпочтительно она может быть выбрана из группы, состоящей из родов Saccharomyces, Candida, Kluyveromyces, Hansenula, Schizosaccharomyces, Yarrowia, Pichia и Aspergillus.

Предпочтительно клетка-хозяин Е. coli представляет собой клетку-хозяина Е. coli, признанную в промышленности и регулирующими органами (включая, без ограничений, клетку-хозяина Е. coli K12 или, как продемонстрировано в примерах, клетку-хозяина E. coli BL21).

Одна из предпочтительных клеток-хозяев для использования в настоящем изобретении представляет собой клетку Е. coli, которая может быть получена рекомбинантными методами, как описано в настоящем описании. Таким образом, рекомбинантная клетка-хозяин может представлять собой рекомбинантную клетку-хозяина Е. coli. Для Е. coli существуют библиотеки мутантов, плазмид, подробных компьютерных моделей метаболизма и другая информация, позволяющая осуществлять рациональный дизайн различных модулей для повышения выхода продукта. Для получения рекомбинантных микроорганизмов Е. coli можно использовать способы, аналогичные описанным выше для Saccharomyces.

В одном воплощении изобретения рекомбинантный микроорганизм Е. coli содержит нуклеотидные последовательности, кодирующие гены SHC (как раскрыто, например, в любой одной или более чем одной из таблиц 10, 11 и 12 в настоящем описании, или их функциональные эквиваленты/гомологи, включая, без ограничений, их варианты, мутанты гомологов, производные или фрагменты).

Предпочтительно рекомбинантный микроорганизм Е. coli содержит векторную конструкцию, представленную на Фиг. 5 и 21.

В другом предпочтительном воплощении изобретения рекомбинантный микроорганизм Е. coli содержит нуклеотидные последовательности, кодирующие WT SHC/HAC и производные WT SHC/HAC или их функциональные эквиваленты/гомологи, включая без ограничений их варианты, мутанты гомологов, производные или фрагменты, представленные в любой одной или более чем одной из таблицы 13, таблицы 14, таблицы 15, таблицы 16, таблицы 17 и/или таблицы 4а.

Другой предпочтительной клеткой-хозяином для использования в настоящем изобретении является S. cerevisiae, который является широко распространенным организмом-шасси в синтетической биологии. Таким образом, рекомбинантная клетка-хозяин может представлять собой S. cerevisiae. Для S. cerevisiae существуют библиотеки мутантов, плазмид, подробных компьютерных моделей метаболизма и другая информация, позволяющая осуществлять рациональный дизайн различных модулей для повышения выхода продукта. Известны способы создания рекомбинантных микроорганизмов S. cerevisiae.

Культивирование клеток осуществляют традиционным способом. Питательная среда для культивирования содержит источник углерода, по меньшей мере один источник азота и неорганические соли, а также к ней добавляют витамины. Компоненты этой питательной среды могут представлять собой компоненты, традиционно используемые для культивирования рассматриваемого вида микроорганизмов.

Источники углерода, используемые в настоящем способе, включают любую молекулу, которая может метаболизироваться рекомбинантной клеткой-хозяином, содействуя росту и/или продуцированию (-)-амброксида. Примеры приемлемых источников углерода включают, без ограничений, сахарозу (например, находящуюся в мелассах), фруктозу, ксилозу, глицерин, глюкозу, целлюлозу, крахмал, целлобиозу или другой содержащий глюкозу полимер.

В воплощениях изобретения, в которых используют дрожжи в качестве хозяина, приемлемы, например, источники углерода, такие как сахароза, фруктоза, ксилоза, этанол, глицерин и глюкоза. Организм-хозяин может обеспечиваться источником углерода на протяжении всего периода культивирования или, альтернативно, организм можно выращивать в течение некоторого периода времени в присутствии другого источника энергии, например белка, а затем обеспечивать его источником углерода только во время фазы подпитки.

Приемлемость рекомбинантного микроорганизма-хозяина для использования в способах по настоящему изобретению можно определить с помощью простых методик тестирования, используя хорошо известные методы. Например, тестируемый микроорганизм можно размножать в богатой питательной среде (например, в среде LB, среде с бакто-триптоном и дрожжевым экстрактом, питательной среде и т.п.) в условиях pH, температуры и аэрации, обычно используемых для размножения этого микроорганизма. После отбора рекомбинантных микроорганизмов (т.е. рекомбинантных клеток-хозяев), продуцирующих желаемые продукты биоконверсии, эти продукты, как правило, получают с использованием линии-продуцента клеток-хозяев в крупном масштабе с помощью подходящих экспрессионных систем и ферментации, например, путем продуцирования микроорганизмами в клеточной культуре.

В одном воплощении настоящего изобретения для культивирования клеток используют определенную минимальную питательную среду, такую как М9А.

Компоненты питательной среды М9А включают: 14 г/л KH2PO4, 16 г/л K2HPO4, 1 г/л Na3цитрат.2H2O, 7,5 г/л (NH4)2SO4, 0,25 г/л MgSO4.7H2O, 0,015 г/л CaCl2.2H2O, 5 г/л глюкозы и 1,25 г/л дрожжевого экстракта).

В другом воплощении настоящего изобретения использовали питательную среду, обогащенную питательными веществами, такую как среду LB. Компоненты питательной среды LB включают: 10 г/л триптона, 5 г/л дрожжевого экстракта, 5 г/л NaCl.

Другие примеры минеральной питательной среды и минеральная питательная среда М9 раскрыты, например, в патенте США US 6524831 B2 и в заявке на патент США US 2003/0092143 A1.

Рекомбинантный микроорганизм можно выращивать в периодической культуре, периодической культуре с подпиткой или в непрерывном процессе, либо использовать их комбинацию. Как правило, рекомбинантный микроорганизм выращивают в ферментере при определенной (-ых) температуре (-ах) в присутствии приемлемого источника питательных веществ, например источника углерода, в течение требуемого периода времени для получения достаточного количества фермента для биоконверсии гомофарнезола в амброксид и для получения желаемого количества амброксида, включая (-)-амброксид.

Рекомбинантные клетки-хозяева можно культивировать любым приемлемым способом, например, путем периодического культивирования или периодического культивирования с подпиткой.

Используемый в настоящем описании термин «периодическое культивирование» представляет собой способ культивирования, при котором не добавляют питательную среду для культивирования и не удаляют ее в процессе культивирования.

Используемый в настоящем описании термин «периодическое культивирование с подпиткой» представляет собой способ культивирования, при котором питательную среду для культивирования добавляют в процессе культивирования, но среду для культивирования не удаляют.

В одном воплощении настоящего изобретения предложен способ получения амброксида в клеточной системе, включающий экспрессию WT SHC или производных SHC/HAC в приемлемых условиях в клеточной системе, подачу в клеточную систему гомофарнезола, конвертирование гомофарнезола в амброксид с использованием WT SHC или производных SHC/HAC, полученных с использованием клеточной системы и, возможно, выделение вещества (-)-амброксида из системы. Для улучшения этого способа можно использовать экспрессию других нуклеотидных последовательностей. Способ биоконверсии может включать дополнительную экспрессию других нуклеотидных последовательностей в клеточной системе. Экспрессия других нуклеотидных последовательностей может усиливать биохимический путь биоконверсии для получения (-)-амброксида.

Следующее воплощение настоящего изобретения представляет собой способ биоконверсии для получения (-)-амброксида, включающий выращивание клеток-хозяев, содержащих гены WT SHC/HAC или производных SHC/HAC, продуцирование WT SHC/HAC или производных SHC/HAC в клетках-хозяевах, подачу гомофарнезола (например, ЕЕН) к клеткам-хозяевам, инкубацию клеток-хозяев в условиях pH, температуры и в присутствии солюбилизирующего агента, подходящих для стимуляции конвертирования гомофарнезола в амброксид и сбор (-)-амброксида. Продуцирование WT SHC/HAC и/или производных SHC/HAC в клетках-хозяевах обеспечивает способ получения (-)-амброксида при добавлении гомофарнезола к клеткам-хозяевам при подходящих реакционных условиях. Достижение конвертирования можно усилить путем добавления к реакционной смеси дополнительного количества биокатализатора и додецилсульфата натрия (SDS).

Рекомбинантную клетку-хозяина микроорганизма можно культивировать различными путями с целью обеспечения клеток, экспрессирующих WT SHC или производные SHC/HAC в приемлемых количествах для последующей стадии биоконверсии. Поскольку микроорганизмы, применяемые для стадии биоконверсии, широко варьируют (например, дрожжи, бактерии и грибы), условия культивирования, которые хорошо известны и документированы, несомненно, регулируют в соответствии со специфичными потребностями каждого биологического вида. Для получения клеток, полезных для использования на последующей стадии биоконверсии по настоящему изобретению, можно использовать любой из известных в данной области техники способов выращивания клеток рекомбинантного микроорганизма-хозяина. Как правило, клетки выращивают до определенной плотности (измеряемой как оптическая плотность (OD)), чтобы получить достаточное количество биомассы для реакции биоконверсии.

На количество получаемых клеток (биомассу) влияют не только выбранные условия культивирования, но также качество условий культивирования, влияющее на превращение биомассы в биокатализатор. Рекомбинантную клетку-хозяина микроорганизма, экспрессирующую ген WT SHC или производного SHC/HAC и продуцирующую ферменты WT SHC или производных SHC/HAC, называют биокатализатором, приемлемым для использования в реакции биоконверсии. В некоторых воплощениях изобретения биокатализатор представляет собой рекомбинантную целую клетку, продуцирующую WT SHC или производные SHC/HAC, либо он может находиться в суспензии или в иммобилизованном формате. В других воплощениях изобретения биокатализатор представляет собой мембранную фракцию или жидкую фракцию, приготовленную из рекомбинантных целых клеток, продуцирующих WT SHC или производное SHC/HAC (как раскрыто, например, в публикации Seitz et al 2012, цитируемой выше).

Рекомбинантная целая клетка, продуцирующая WT SHC или производные SHC/HAC, включает целые клетки, собранные из ферментера (для реакции биоконверсии), или клетки в ферментере (которые впоследствии используют в реакции, протекающей в одном реакционном сосуде). Рекомбинантная целая клетка, продуцирующая WT SHC или производные SHC/HAC, может включать интактную рекомбинантную целую клетку и/или клеточный дебрис. В любом случае WT SHC или производное SHC/HAC некоторым образом ассоциированы с мембраной (такой как клеточная мембрана) с целью приема субстрата (например, гомофарнезола) и/или взаимодействия с ним, где мембрана (такая как клеточная мембрана) может составлять часть или содержать целую клетку (например, рекомбинантную целую клетку). WT SHC или производные SHC/HAC могут также находиться в иммобилизованной форме (например, ассоциированы с носителем фермента), которая обеспечивает возможность взаимодействия WT SHC или производных SHC/HAC с субстратом (например, гомофарнезолом). WT SHC или производные SHC/HAC можно также использовать в растворимой форме.

В одном воплощении изобретения биокатализатор получают в достаточных количествах (для создания достаточной биомассы), собирают и промывают (и, возможно, хранят (например, в замороженном или лиофилизированном виде)) до стадии биоконверсии.

В следующем воплощении изобретения клетки получают в достаточных количествах (для создания достаточной биомассы), а затем регулируют реакционные условия без необходимости в сборе и промывании биокатализатора для реакции биоконверсии. Этот одностадийный способ (или способ реакции, протекающей в одном реакционном сосуде) обладает преимуществом, поскольку он упрощает процесс, при этом снижая затраты. Питательная среда для культивирования, используемая для выращивания клеток, также приемлема для использования в реакции биоконверсии при условии регулирования реакционных условий таким образом, чтобы способствовать реакции биоконверсии.

Оптимум pH для выращивания клеток находится в диапазоне 6,0-7,0. Оптимум pH для реакции биоконверсии зависит от типа используемого фермента SHC/HAC в реакции биоконверсии. pH регулируют, используя методы, хорошо известные специалистам в данной области техники.

Как показано в примере 9, для биоконверсии гомофарнезола в (-)-амброксид использовали способ «реакции, протекающей в одном реакционном сосуде», с коэффициентом конверсии 100%. Как показано в примере 18, для биоконверсии гомофарнезола в (-)-амброксид использовали способ «реакции, протекающей в одном реакционном сосуде», с коэффициентом конверсии 99%.

При использовании в настоящем описании любая ссылка на коэффициент конверсии 99%/100% для субстрата гомофарнезола в (-)-амброксид представляет собой ссылку на 99%/100% коэффициент конверсии 99%/100% для изомера гомофарнезола (т.е. ЕЕН), способного к конверсии в (-)-амброксид с использованием фермента, представляющего собой WT SHC/HAC или производное SHC/HAC.

Хотя в настоящем описании термины «смесь» или «реакционная смесь» можно использовать взаимозаменяемо с термином «питательная среда» (особенно по отношению к «реакции, протекающей в одном реакционном сосуде»), следует отметить, что для выращивания клеток для создания достаточного количества биомассы требуется питательная/ферментационная среда для культивирования клеток, а для стадии биоконверсии питательная среда не требуется, поскольку для реакции достаточно буферного раствора при подходящем pH.

Способы биоконверсии по настоящему изобретению осуществляют в условиях времени, температуры, pH и в присутствии солюбилизирующего агента, что обеспечивает превращение исходного сырья гомофарнезола в (-)-амброксид. pH реакционной смеси может находиться в диапазоне 4-8, предпочтительно от 5 до 6,5, более предпочтительно 4,8-6,0 для производных фермента SHC/HAC и в диапазоне для pH от приблизительно 5,0 до pH приблизительно 7,0 для фермента WT SHC, и его можно поддерживать путем добавления к реакционной смеси буферных растворов. Примером буферного раствора для этой цели является буферный раствор лимонной кислоты. Предпочтительная температура составляет от приблизительно 15°C до приблизительно 45°C, предпочтительно от приблизительно 20°C до приблизительно 40°C, хотя для термофильных организмов она может быть выше, вплоть до 55°C, особенно при использовании фермента WT (например, WT SHC/HAC) из термофильного микроорганизма. Температуру можно поддерживать постоянной или изменять в процессе биоконверсии.

Автор изобретения продемонстрировал, что может быть полезным включение в реакцию биоконверсии солюбилизирующего агента (например, поверхностно-активного вещества (ПАВ), детергента, усилителя растворимости, смешиваемого с водой органического растворителя и т.п.). Используемый в настоящем описании термин «поверхностно-активное вещество» означает компонент, который снижает поверхностное натяжение (или межфазное натяжение) между двумя жидкостями или между жидкостью и твердым веществом. Поверхностно-активные вещества могут действовать как детергенты, смачивающие вещества, эмульгаторы, пенообразующие средства и диспергирующие средства. Примеры поверхностно-активных веществ включают, без ограничений, Тритон Х-100, Твин 80, тауродезоксихолат, тауродезоксихолат натрия, додецилсульфат натрия (SDS) и/или лаурилсульфат натрия (SLS).

Хотя Тритон Х-100 можно использовать для частичной очистки фермента WT SHC/HAC или производного SHC/HAC (в растворимой или мембранной фракции/суспензионной форме), его также можно использовать в реакции биоконверсии (см., например, описание Seitz (2012, диссертация PhD, цитируется выше), а также описание в публикации Neumann и Simon (1986, цитируется выше) и JP 2009060799.

Однако неожиданно, как показано в примере 14, автор изобретения выбрал и идентифицировал SDS как особенно предпочтительное солюбилизирующее средство из большого перечня других солюбилизирующих средств, используемых реже. В частности, автор изобретения идентифицировал SDS как значительно лучшее солюбилизирующее средство, чем, например, Тритон Х-100, в отношении скорости реакции и выхода реакции биоконверсии гомофарнезола в (-)-амброксид (при использовании ЕЕН как при 4 г/л, так и при 125 г/л). Как показывают сравнительные данные в примере 12, автор изобретения продемонстрировал, что максимальная активность по меньшей мере одного производного SHC/HAC для биоконверсии гомофарнезола в (-)-амброксид с Тритоном Х-100 (в диапазоне концентрации от около 0,005% до 0,48%) в реакции составляла лишь около 20% активности, полученной с SDS (при концентрации около 0,07%).

Не желая ограничиваться теорией, считают, что применение SDS с рекомбинантными клетками-хозяевами микроорганизма может обладать преимуществом в связи с тем, что SDS может взаимодействовать преимущественно с мембраной клетки-хозяина, что делает фермент SHC (который является мембраносвязанным ферментом) более доступным для субстрата гомофарнезола. Кроме того, включение SDS в реакционную смесь в подходящей концентрации может улучшить свойства эмульсии (гомофарнезол в воде) и/или улучшить доступ субстрата гомофарнезола для фермента SHC внутри клетки-хозяина, в то же время предотвращая разрушение, например денатурацию фермента SHC (WT или производного SHC/HAC).

На концентрацию солюбилизирующего агента (например, SDS), используемого в реакции биоконверсии, влияет количество биомассы и концентрация субстрата (EEH). Таким образом, существует некоторая степень взаимозависимости между концентрацией солюбилизирующего агента (например, SDS), количеством биомассы и концентрацией субстрата (ЕЕН). В качестве примера, при повышении концентрации субстрата гомофарнезола для эффективного протекания реакции биоконверсии требуются достаточные количества биокатализатора и солюбилизирующего агента (например, SDS). Например, в случае слишком низкой концентрации солюбилизирующего агента (например, SDS) может наблюдаться субоптимальная конверсия гомофарнезола. С другом стороны, например, при слишком высокой концентрации солюбилизирующего агента (например, SDS) может быть риск повреждения биокатализатора за счет разрушения интактной клетки микроорганизма и/или денатурации/инактивации фермента SHC/HAC.

Выбор приемлемой концентрации SDS в контексте количества биомассы и концентрации субстрата (ЕЕН) находится в пределах компетенции специалистов в данной области техники. В качестве примера, специалистам в данной области техники доступна прогностическая модель определения приемлемой концентраций SDS, субстрата (ЕЕН) и биомассы. В качестве дополнительного примера, в примере 3 показано, что концентрация SDS в диапазоне 0,010-0,075% является подходящей при использовании 4 г/л ЕЕН и биокатализатора при OD 10,0 (650 нм). В примере 7 показано, что при использовании 125 г/л ЕЕН с 2-кратной массой сырой биомассы приемлема скорректированная концентрация SDS (1,55%). Тем не менее исследование процентной доли конверсии ЕЕН в (-)-амброксид с использованием различных значений отношения SDS/клетки показало, что правильный выбор соотношения биокатализатора, субстрата гомофарнезола и солюбилизирующего агента (например, SDS) способствует разработке надежной системы реакции биоконверсии, которая демонстрирует определенную степень толерантности к диапазону концентраций SDS (см., например, Фиг. 17) и диапазонам pH (см. пример 15, Фиг. 18).

Температура реакции биоконверсии для фермента WT SHC (например, AacSHC) составляет приблизительно 45-60°C, предпочтительно 55°C.

Диапазон pH реакции биоконверсии для фермента WT SHC (например, AacSHC) составляет от приблизительно 5,0 до 7,0, более предпочтительно от приблизительно 5,6 до приблизительно 6,2, даже более предпочтительно приблизительно 6,0.

Температура реакции биоконверсии для производного фермента SHC/HAC составляет от приблизительно 34°C до приблизительно 50°C, предпочтительно приблизительно 35°C.

pH реакции биоконверсии для производного фермента SHC/HAC составляет приблизительно 4,8-6,4, предпочтительно приблизительно 5,2-6,0.

Предпочтительно солюбилизирующий агент, используемый в реакции биоконверсии, представляет собой SDS.

Концентрация SDS, используемая в реакции биоконверсии для фермента WT SHC (например, AacSHC), находится в диапазоне приблизительно 0,010-0,075%, предпочтительно приблизительно 0,030% при использовании приблизительно 4 г/л ЕЕН.

Концентрация SDS, используемая в реакции биоконверсии для производного фермента SHC/HAC, находится в диапазоне приблизительно 0,0025-0,090%, предпочтительно приблизительно 0,050% при использовании приблизительно 4 г/л ЕЕН.

При загрузке в реакционную смесь гомофарнезола при концентрации ЕЕН приблизительно 4 г/л ЕЕН биокатализатор загружают в реакционную смесь при OD 10,0 (650 нм)

Отношение [SDS]/[клетки] находится в диапазоне приблизительно 10:1-20:1, предпочтительно приблизительно 15:1-18:1, предпочтительно приблизительно 16:1, когда отношение количества биокатализатора к количеству гомофарнезола ЕЕН составляет приблизительно 2:1.

Концентрация SDS в реакции биоконверсии для варианта фермента SHC находится в диапазоне приблизительно 1-2%, предпочтительно в диапазоне приблизительно 1,4-1,7%, еще более предпочтительно приблизительно 1,5% при концентрации гомофарнезола, составляющей приблизительно 125 г/л ЕЕН, и концентрации биокатализатора, составляющей 250 г/л (соответствующей OD приблизительно 175 (650 нм)).

Отношение биокатализатора к субстрату гомофарнезолу ЕЕН находится в диапазоне приблизительно 0,5:1-2:1, в некоторых воплощениях изобретения 2:1, предпочтительно приблизительно 1:1 или 0,5:1.

В некоторых воплощениях изобретения амброксид получают с помощью биокатализатора, к которому добавляют субстрат гомофарнезол. Субстрат можно добавлять путем подачи с использованием известных средств (например, перистальтического насоса, инфузионного шприца и т.п.). Гомофарнезол является маслорастворимым соединением и предоставляется в масляной форме. С учетом того, что биокатализатор (клетки микроорганизмов, такие как интактная рекомбинантная целая клетка и/или клеточный дебрис и/или иммобилизованный фермент) находится в водной фазе, при добавлении гомофарнезола к реакционной смеси биоконверсии реакцию биоконверсии можно рассматривать как трехфазную систему (содержащую водную фазу, твердую фазу и масляную фазу). Это происходит даже в случае присутствия SDS. В качестве пояснения, при использовании в качестве биокатализатора растворимого WT SHC или SHC/HAC эту систему рассматривают как двухфазную.

Число присутствующих изомеров гомофарнезола может влиять на скорость реакции. Как показано в примере 11, производное фермента SHC/HAC способно к биоконверсии Е,E-гомофарнезола в (-)-амброксид из сложной смеси изомеров гомофарнезола (например, EE:EZ:ZE:ZZ). Тем не менее, как правило, наблюдается снижение коэффициента конверсии, что согласуется с точкой зрения, что изомеры гомофарнезола, отличающиеся от ЕЕН, могут конкурировать с ЕЕН за доступ к производным фермента SHC/HAC и, следовательно, могут действовать как конкурентные ингибиторы конверсии ЕЕН в (-)-амброксид и/или также действовать в качестве альтернативных субстратов.

Соответственно, предпочтительно субстрат гомофарнезола содержит стереоизомерную смесь из 2-4 изомеров, предпочтительно из двух изомеров.

Соответственно, предпочтительно субстрат гомофарнезола состоит или по существу состоит из стереоизомерной смеси из 2-4 изомеров, предпочтительно из двух изомеров.

Предпочтительно субстрат гомофарнезола содержит стереоизомерную смесь EE:EZ.

Предпочтительно субстрат гомофарнезола состоит или по существу состоит из стереоизомерной смеси EE:EZ.

Как показано в примере 9, 100% конверсию смеси EE:EZ в массовом отношении 87:13 наблюдали в реакции ферментации и биоконверсии, «протекающей в одном реакционном сосуде», которую проводят в течение периода 22,5 дня. За этот период времени приблизительно 10 г ЕЕН претерпевало превращение.

Как подробно описано в примере 7, в предпочтительном воплощении изобретения используют ферментер для выращивания рекомбинантной клетки-хозяина, экспрессирующей ген производного SHC/HAC и продуцирующей активные производные ферментов SHC/HAC, до достаточной концентрации биомассы, приемлемой для использования в качестве биокатализатора, который используют в качестве биокатализатора в том же ферментере, который используют для конверсии источника гомофарнезола в (-)-амброксид в смеси с одним или более чем одним из побочных продуктов (II), (IV) и/или III (как показано, например, на Фиг. 12). Полученный в результате (-)-амброксид можно выделить путем экстракции/дистилляции паром или экстракции органическим растворителем, используя растворитель, не смешиваемый с водой (чтобы отделить продукты реакции и непрореагировавший субстрат от биокатализатора, который остается в водной фазе) с последующим выпариванием растворителя с получением неочищенного продукта реакции, который определяют с помощью анализа методом газовой хроматографии (GC). Способы экстракции/дистилляции паром и экстракции органическим растворителем известны специалистам в данной области техники.

В качестве примера, полученный в результате (-)-амброксид можно экстрагировать из всей реакционной смеси, используя органический растворитель, такой как не смешиваемый с водой растворитель (например, толуол). Альтернативно, полученный в результате (-)-амброксид можно выделить из твердой фазы реакционной смеси (полученной, например, центрифугированием или фильтрованием), используя смешиваемый с водой растворитель (например, этанол) или не смешиваемый с водой растворитель (например, толуол). В качестве следующего примера, (-)-амброксид присутствует в твердой фазе в виде кристаллов или в аморфной форме, и его можно отделить от остальной твердой фазы (клеточного материала или его дебриса) и жидкой фазы также с помощью фильтрования. В качестве следующего примера, при температуре выше температуры плавления (-)-амброксида (около 75°C) (-)-амброксид может образовать масляный слой на поверхности водной фазы, при этом масляный слой можно удалить и собрать. Чтобы обеспечить полное извлечение (-)-амброксида после удаления масляного слоя к водной фазе, содержащей биомассу, для экстракции любого остаточного (-)-амброксида, содержащегося в биомассе или вокруг биомассы, можно добавлять органический растворитель. Органический слой можно объединять с масляным слоем, после чего все вместе подвергают дополнительной обработке для выделения и очистки (-)-амброксида.

(-)-Амброксид можно дополнительно подвергать селективной кристаллизации для удаления побочных продуктов (II), (IV) и (III) и любого непрореагировавшего субстрата гомофарнезола из конечного продукта (-)-амброксида. Термин «селективная кристаллизация» относится к стадии процесса, посредством которого вызывают кристаллизацию (-)-амброксида из растворителя, при этом соединения (II), (III) и (IV) остаются в растворе кристаллизационного растворителя в такой степени, чтобы изолированный кристаллический материал содержал только продукт (-)-амброксид, или в случае содержания в нем каких-либо других соединений (II), (III) или (IV) они присутствовали только в ольфакторно приемлемых количествах.

На стадии селективной кристаллизации можно использовать смешиваемый с водой растворитель, такой как этанол или подобный растворитель. Ольфакторную чистоту конечного продукта (-)-амброксида определяют, используя 10% этанольный экстракт в воде, или путем тестирования кристаллического вещества. Конечный продукт (-)-амброксид тестируют в сравнении с имеющимся в продаже эталонным продуктом (-)-амброксидом в отношении его ольфакторной чистоты, качества и сенсорного профиля. Также проводят тестирование материала (-)-амброксида экспертами в исследованиях применения с целью определения соответствия материала спецификациям в отношении органолептического профиля. Различные применения (-)-амброксида включают, без ограничений, высококачественные ароматизирующие или потребительские продукты, такие как продукты по уходу за тканями, гигиено-косметические продукты, продукты для заботы о красоте и чистящие продукты, включая по существу все продукты, где используют доступные в настоящее время коммерчески применяемые ингредиенты, содержащие амброксид, включающие без ограничений: Ambrox (Firmenich), Ambroxan (Henkel), Ambrofix (Givaudan), Amberlyn (Quest), Cetalox Laevo (Firmenich), Ambermor (Aromor) и/или Norambrebolide Ether (Pacific).

На селективную кристаллизацию (-)-амброксида может влиять присутствие непрореагировавшего субстрата гомофарнезола, а также соотношение количеств (-)-амброксида и других обнаружимых побочных продуктов (II), (III) и/или (IV). Селективная кристаллизация все еще возможна даже в случае получения только 10% конверсии субстрата гомофарнезола в (-)-амброксид (как показано в примере 7 с использованием фермента WT SHC/HAC).

Примеры приемлемых смешиваемых с водой и не смешиваемых с водой органических растворителей, приемлемых для использования в экстракции и/или селективной кристаллизации (-)-амброксида, включают, без ограничений, алифатические углеводороды, предпочтительно имеющие от 5 до 8 атомов углерода, такие как пентан, циклопентан, гексан, циклогексан, гептан, октан или циклооктан, галогенированные алифатические углеводороды, предпочтительно имеющие один или два атома углерода, такие как дихлорметан, хлороформ, тетрахлорид углерода, дихлорэтан или тетрахлорэтан, ароматические углеводороды, такие как бензол, толуол и ксилолы, хлорбензол или дихлорбензол, алифатические ациклические и циклические простые эфиры или спирты, предпочтительно имеющие от 4 до 8 атомов углерода, такие как этанол, изопропанол, диэтиловый эфир, метил-трет-бутиловый эфир, этил-трет-бутиловый эфир, дипропиловый эфир, диизопропиловый эфир, дибутиловый эфир, тетрагидрофуран, или сложные эфиры, такие как этилацетат или н-бутилацетат, или кетоны, такие как метилизобутилкетон или диоксан, или их смеси. Особенно предпочтительно применяемыми растворителями являются упомянутые выше гептан, метил трет-бутиловый эфир (также известный как MTBE, трет-бутилметиловый эфир, третичный бутилметиловый эфир и третВМЕ), диизопропиловый эфир, тетрагидрофуран, этилацетат и/или их смеси.

Предпочтительно смешиваемый с водой растворитель, такой как этанол, используют для экстракции (-)-амброксида из твердой фазы реакционной смеси. Применение этанола обладает преимуществом, поскольку он прост в обращении, нетоксичен и благоприятен для окружающей среды.

Используемый в настоящем описании термин «изолированный» относится к продукту биоконверсии, такому как (-)-амброксид, который был отделен или очищен от сопутствующих ему компонентов. Объект, продуцируемый клеточной системой, отличающейся от источника, из которого она имеет происхождение в природе, является изолированным, поскольку он обязательно будет свободен от компонентов, сопутствующих ему в природе. Степень изоляции или чистоты можно измерить любым подходящим способом, например, с помощью анализа методом газовой хроматографии (GC), высокоэффективной жидкостной хроматографии (HPLC) или ядерного магнитного резонанса (NMR).

В некоторых воплощениях изобретения конечный продукт ((-)-амброксид) выделяют и очищают до однородности (например, по меньшей мере до 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% или 89,5% чистоты или 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 99,5% чистоты).

Желательно, количество продуцируемого (-)-амброксида может составлять от приблизительно 1 мг/л до приблизительно 20000 мг/л (20 г/л) или более, например от приблизительно 20 г/л до приблизительно 200 г/л или 100-200 г/л, предпочтительно приблизительно 125 г/л или 150 г/л или приблизительно 188 г/л.

Как показано в примере 7, по меньшей мере 125 г/л (-)-амброксида получают в реакции биоконверсии с использованием рекомбинантной клетки-хозяина Е. coli, продуцирующей производное фермента SHC/HAC, приблизительно за 2 дня.

Как показано в примере 19, можно проводить реакции биоконверсии при 188 г/л ЕЕН или более при условии достижения эффективного перемешивания, поскольку эффективность перемешивания, по-видимому, является единственным ограничением системы. Кроме того, биокатализатор с улучшенной активностью (например, в отношении вариантов SHC с дополнительно улучшенной активностью или в отношении повышенной производительности фермента SHC) может улучшить или сохранить производительность при использовании меньшего количества биомассы, что обладает преимуществом в отношении эффективности перемешивания.

Например, получают от приблизительно 1 до приблизительно 100 мг/л, от приблизительно 30 до приблизительно 100 мг/л, от приблизительно 50 до приблизительно 200 мг/л, от приблизительно 100 до приблизительно 500 мг/л, от приблизительно 100 до приблизительно 1000 мг/л, от приблизительно 250 до приблизительно 5000 мг/л, от приблизительно 1000 (1 г/л) до приблизительно 15000 мг/л (15 г/л) или от приблизительно 2000 (2 г/л) до приблизительно 10000 мг/л (10 г/л) или от приблизительно 2000 (2 г/л) до приблизительно 25000 мг/л (25 г/л) или от приблизительно 2000 (2 г/л) до приблизительно 25000 мг/л (25 г/л), 26000 мг/л (26 г/л), 27000 мг/л (27 г/л), 28000 мг/л (28 г/л), 29000 мг/л (29 г/л), 30000 мг/л (30 г/л), 40 г/л, 50 г/л, 60 г/л, 70 г/л, 80 г/л, 90 г/л, 100 г/л, 110 г/л, 120 г/л, 125 г/л, 130 г/л, 140 г/л, 150 г/л, 160 г/л, 170 г/л, 180 г/л, 190 г/л, или 200 г/л, или 300 г/л, или 400 г/л, или 500 г/л (-)-амброксида.

Предпочтительно за период времени от 48 до 72 часов получают (-)-амброксид в концентрации по меньшей мере 100 г/л.

Предпочтительно за период времени от приблизительно 48 до 72 часов получают (-)-амброксид в концентрации приблизительно 150 г/л.

Предпочтительно за период времени от приблизительно 48 до 72 часов получают (-)-амброксид в концентрации приблизительно 200 г/л.

Предпочтительно за период времени от приблизительно 48 до 72 часов получают (-)-амброксид в концентрации приблизительно 250 г/л.

Специалисту в данной области техники должно быть понятно, что более высокие совокупные титры продуктивности могут быть достигнуты путем применения непрерывного процесса, такого как извлечение продукта, подача субстрата и добавление или (частичная) замена биомассы.

Предпочтительно биоконверсия ЕЕН в (-)-амброксид в присутствии рекомбинантной клетки-хозяина, содержащей WT SHC/HAC или производное SHC/HAC приводит к выходу амброксида, составляющему 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 молярных процентов от используемого числа моль ЕЕН; особенно предпочтительно выход составляет от 5 до 100, от 10 до 100, 100, от 25 до 100, от 30 до 100, от 35 до 100, в частности, от 40 до 100, от 45 до 100, от 50 до 100, от 60 до 100, от 70 до 100 молярных процентов.

Активность фермента SHC/HAC определяют на основании коэффициента скорости реакции (количество продукта/(количество продукта + количество остаточного исходного материала)) × 100) в молярных процентах. Предпочтительно биоконверсия ЕЕН в (-)-амброксид в присутствии WT SHC/HAC или производного фермента SHC/HAC приводит к выходу (-)-амброксида, составляющему 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 молярных процентов от используемого числа моль ЕЕН; особенно предпочтительно выход составляет от 5 до 100, от 10 до 100, от 20 до 100, от 25 до 100, от 30 до 100, от 35 до 100, в частности, от 40 до 100, от 45 до 100, от 50 до 100, от 60 до 100, от 70 до 100.

В предпочтительном воплощении изобретения выход и/или коэффициент скорости реакции определяют за определенный период времени, например, 4, 6, 8, 10, 12, 16, 20, 24, 36 или 48 часов, в течение которого ЕЕН конвертируется в (-)-амброксид рекомбинантной клеткой-хозяином, содержащей нуклеотидную последовательность, кодирующую WTSHC или производное фермента SHC/HAC согласно настоящему изобретению. В следующем варианте реакцию проводят в точно определенных условиях, например, при 25°C, 30°C, 40°C, 50°C или 60°C. В частности, выход и/или коэффициент скорости реакции определяют путем проведения реакции конверсии ЕЕН в (-)-амброксид производными фермента SHC/HAC согласно изобретению при 35°C за период 24-72 часа.

В следующем воплощении настоящего изобретения рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность, кодирующую производное SHC/HAC, характеризуется тем, что она проявляет 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 19-, 20-, 21-, 22-, 23-, 24-, 25-, 26-, 27-, 28-, 29-, 30-, 31-, 32-, 33-, 34-, 35-, 36-, 37-, 38-, 39-, 40-, 41-, 42-, 43-, 44-, 45-, 46-, 47-, 48-, 49-, 50-, 51-, 52-, 53-, 54-, 55-, 56-, 57-, 58-, 59-, 60-, 61-, 62-, 63-, 64-, 65-, 66-, 67-, 68-, 69-, 70-, 71-, 72-, 73-, 74-, 75-, 76-, 77-, 78-, 79-, 80-, 81-, 82-, 83-, 84-, 85-, 86-, 87-, 88-, 89-, 90-, 91-, 92-, 93-, 94-, 95-, 96-, 97-, 98-, 99-, 100-, 200-, 500-, 1000-кратный или более высокий выход и/или коэффициент скорости реакции в реакции гомофарнезола с получением (-)-амброксида по сравнению с WT SHC или производным фермента SHC/HAC в одинаковых условиях. В данном случае термин «условие» относится к условиям реакции, таким как концентрация субстрата, концентрация фермента, период и/или температура реакции.

Успешная разработка способа биоконверсии для получения (-)-амброксида из гомофарнезола в рекомбинантном штамме Е. coli, содержащем нуклеотидную последовательность, кодирующую WT/эталонный SHC или производное SHC/HAC, может обеспечить снижение затрат и экономичный с промышленной точки зрения процесс производства (-)-амброксида.

Как показано в примере 7, настоящее изобретение обеспечивает 100% конверсию Е,E-гомофарнезола (125 г/л) в (-)-амброксид после 48 часов инкубации с оптимизированным производным SHC/HAC с 8-кратным улучшением выхода при использовании производного AacSHC по сравнению с ферментом WT AacSHC (см. Фиг. 11).

Для использования в получении амброксида в рекомбинантной клетке-хозяине также приемлемы функциональные гомологи полипептидов эталонного WT SHC/HAC или производного SHC/HAC, описанных в настоящем описании. Таким образом, рекомбинантная клетка-хозяин может включать в себя одну или более чем одну гетерологичную нуклеиновую кислоту, кодирующую функциональные гомологи описанных выше полипептидов, и/или гетерологичную нуклеиновую кислоту, кодирующую производное фермента SHC/HAC, как описано в настоящем описании.

Функциональный гомолог представляет собой полипептид, обладающий подобием последовательности с эталонным полипептидом и осуществляющий одну или более биохимических или физиологических функций эталонного полипептида. Функциональный гомолог и эталонный полипептид могут представлять собой встречающиеся в природе полипептиды, и подобие последовательностей может быть результатом конвергентных или дивергентных эволюционных событий. Как таковые, функциональные гомологи иногда обозначают в литературе как гомологи, ортологи или паралоги. Сами варианты встречающихся в природе функциональных гомологов, такие как полипептиды, кодируемые мутантами кодирующей последовательности дикого типа, могут быть функциональными гомологами. Функциональные гомологи можно также создать посредством сайт-направленного мутагенеза кодирующей последовательности для полипептида или комбинирования доменов из кодирующих последовательностей для различных встречающихся в природе полипептидов («замены доменов»). Методы модификации генов, кодирующих описанные выше функциональные гомологи, известны и включают среди прочего методы направленного развития, методы сайт-направленного мутагенеза и методы случайного мутагенеза и могут быть полезны для повышения специфической активности полипептида, изменения субстратной специфичности, изменения уровней экспрессии, изменения субклеточной локализации или модификации взаимодействий между полипептидами требуемым образом. Такие модифицированные полипептиды считают функциональными гомологами. Термин «функциональный гомолог» иногда применяют к нуклеиновой кислоте, кодирующей функционально гомологичный полипептид.

Функциональные гомологи можно идентифицировать с помощью анализа выравнивания нуклеотидных и аминокислотных последовательностей. Например, при проведении поиска нуклеотидных или полипептидных последовательностей в базе данных можно идентифицировать гомологи нуклеиново-кислотных последовательностей, кодирующих полипептиды производных SHC и т.п.

Для идентификации функциональных гомологов и/или в качестве меры гомологии между двумя нуклеотидными последовательностями можно также использовать гибридизацию. В качестве зонда для гибридизации можно использовать нуклеиново-кислотную последовательность, кодирующую любой из раскрытых в настоящем описании белков в соответствии со стандартными методами гибридизации. Гибридизация зонда с ДНК или РНК из тестируемого источника (например, из клетки млекопитающего) является показателем присутствия релевантной ДНК или РНК в тестируемом источнике. Условия гибридизации известны специалистам в данной области техники, и их можно найти в руководстве Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 6.3.1-6.3.6, 1991. Умеренные условия гибридизации определяют как эквивалентные гибридизации в растворе хлорида натрия/цитрата натрия (SSC) при 30°C с последующей отмывкой в , 0,1% SDS при 50°C. Условия высокой степени жесткости определяют как эквивалентные гибридизации в растворе хлорида натрия/цитрата натрия (SSC) при 45°C с последующей отмывкой в , 0,1% SDS при 65°C.

Анализ последовательностей для идентификации функциональных гомологов может также включать в себя анализ неизбыточных баз данных BLAST, Reciprocal BLAST или PSI-BLAST с использованием релевантной аминокислотной последовательности в качестве эталонной последовательности. В некоторых случаях аминокислотную последовательность выводят из нуклеотидной последовательности. Полипептиды в базе данных, имеющие более 40% идентичности последовательности, являются кандидатами для дополнительной оценки на пригодность для применения в реакции биоконверсии SHC/HAC. Подобие аминокислотных последовательностей дает возможность проведения консервативных аминокислотных замен, таких как замена одного гидрофобного остатка другим или замена одного полярного остатка другим. При желании можно проводить проверку таких кандидатов вручную, чтобы сузить число кандидатов для дальнейшей оценки. Проверку вручную можно проводить путем отбора тех кандидатов, в которых выявляются, например, консервативные функциональные домены.

Как правило, полипептиды, обладающие по меньшей мере приблизительно 30% идентичностью аминокислотной последовательности, полезны для идентификации консервативных областей. Консервативные области родственных полипептидов обладают по меньшей мере 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% идентичностью аминокислотной последовательности. В некоторых воплощениях изобретения консервативная область обладает по меньшей мере 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью аминокислотной последовательности. Идентичность аминокислотной последовательности можно определять, как описано выше и ниже.

Продуцируемый фермент WTSHC и/или производное фермента SHC/HAC основан на аминокислотной последовательности SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или их варианте, гомологе, мутанте, производном или фрагменте.

Продуцируемый фермент SHC основан на аминокислотной последовательности, обладающей по меньшей мере 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4.

Кроме того, продуцируемый эталонный SHC основан на аминокислотной последовательности, продуцируемой в Е. coli.

Процент (%) идентичности в отношении нуклеотидной последовательности гена определяют как процентную долю нуклеотидов в последовательности-кандидате ДНК, идентичных нуклеотидам в последовательности ДНК после выравнивания последовательности и при необходимости введения гэпов для достижения максимального процента идентичности последовательности, и не считают какие-либо консервативные замены как часть идентичности последовательности. Выравнивание в целях определения процента идентичности нуклеотидных последовательностей может быть достигнуто различными путями, находящимися в пределах компетенции специалистов в данной области техники, например, при использовании общедоступного компьютерного программного обеспечения. Специалисты в данной области техники могут определить подходящие параметры для измерения выравнивания, включая любые алгоритмы, требующиеся для достижения максимального выравнивания на протяжении всей длины сравниваемых последовательностей.

Термины «полипептид» и «белок» в настоящем описании используют взаимозаменяемо, и они означают любую цепь связанных пептидной связью аминокислот независимо от ее длины и посттрансляционных модификаций.

Используемый в настоящем описании термин «производное» включает, без ограничений, вариант. Термины «производное» и «вариант» в настоящем описании используют взаимозаменяемо

Используемый в настоящем описании термин «вариант» следует понимать как полипептид, который отличается по сравнению с полипептидом, от которого он имеет происхождение, одним или более чем одним изменением в аминокислотной последовательности. Полипептид, от которого имеет происхождение вариант, также известен как исходный или эталонный полипептид. Как правило, вариант конструируют искусственным путем, предпочтительно с использованием генных технологий. Как правило, полипептид, от которого имеет происхождение вариант, представляет собой белок дикого типа или домен белка дикого типа. Однако варианты, которые можно использовать в настоящем изобретении, могут также иметь происхождение от гомологов, ортологов или паралогов родительского полипептида или от искусственно сконструированных вариантов при условии, что этот вариант проявляет по меньшей мере одну биологическую активность родительского полипептида. Изменения в аминокислотной последовательности могут представлять собой замены аминокислот, инсерции, делеции, N-концевые укорочения или С-концевые укорочения или любую комбинацию этих изменений, которые могут встречаться в одном или нескольких сайтах.

В предпочтительных воплощениях изобретения вариант, который можно использовать в настоящем изобретении, характеризуется общим числом изменений в аминокислотной последовательность вплоть до 200 (вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 или 200) (т.е.. замен, инсерций, делеций, N-концевых укорочений и/или С-концевых укорочений). Аминокислотные замены могут быть консервативными и/или неконсервативными. В предпочтительных воплощениях изобретения вариант, который можно использовать в настоящем изобретении, отличается от белка или домена, от которого он имеет происхождение, заменами аминокислот, предпочтительно консервативными заменами аминокислот, в количестве вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 или 100. Варианты могут дополнительно или альтернативно содержать делеции аминокислот, которые могут представлять собой N-концевые укорочения, С-концевые укорочения или внутренние делеции, либо любую их комбинацию. Такие варианты, содержащие N-концевые укорочения, С-концевые укорочения и/или внутренние делеции, в контексте настоящей заявки называют «делеционными вариантами» или «фрагментами». Термины «делеционный вариант» и «фрагмент» в настоящем описании используют взаимозаменяемо. Делеционный вариант может встречаться в природе (например, варианты сплайсинга) или может быть сконструирован искусственно, предпочтительно с помощью средств генных технологий. Как правило, белок или домен белка, от которого имеет происхождение делеционный вариант, представляет собой белок дикого типа. Однако делеционные варианты, которые можно использовать в настоящем изобретении, могут также иметь происхождение от гомологов, ортологов или паралогов родительского полипептида или от искусственно сконструированных вариантов при условии, что делеционные варианты проявляют по меньшей мере одну биологическую активность родительского полипептида. Предпочтительно делеционный вариант (или фрагмент) имеет делецию вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 или 100 аминокислот на его N-конце и/или не его С-конце и/или внутри последовательности по сравнению с родительским полипептидом.

Используемый в настоящем описании «вариант» может быть альтернативно или дополнительно охарактеризован определенной степенью идентичности последовательности с родительским полипептидом, от которого он имеет происхождение. Вариант WT/эталонного SHC/HAC или производного SHC/HAC по настоящему изобретению может обладать по меньшей мере 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности соответствующего эталонного полипептида или соответствующего эталонного полинуклеотида.

Выражение «по меньшей мере 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичности последовательности» на протяжении всего описания используют по отношению к сравнениям полипептидных и полинуклеотидных последовательностей.

Полинуклеотид, принадлежащий к семейству любого из раскрытых в настоящем описании ферментов, или белок можно идентифицировать на основании его подобия релевантному гену или белку соответственно. Например, идентификация может быть основана на идентичности последовательности. В некоторых предпочтительных воплощениях изобретение характеризуется изолированными молекулами нуклеиновой кислоты, по меньшей мере на 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере на 81%, по меньшей мере на 82%, по меньшей мере на 83%, по меньшей мере на 84%, по меньшей мере на 85%, по меньшей мере на 86%, по меньшей мере на 87%, по меньшей мере на 88%, по меньшей мере на 89%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98% или по меньшей мере на 99% идентичными (а) молекуле нуклеиновой кислоты, кодирующей полипептид SEQ ID NO: 5-163 (см. таблицы 14-17 и таблицу 4а, приведенные в настоящем описании); (b) нуклеотидной последовательности SEQ ID NO: 6-168, 169, 170, 172, 174 и 176 (см. таблицы 14-17 и таблицу 4а, приведенные в настоящем описании) и (с) молекуле нуклеиновой кислоты, включающей в себя сегмент из по меньшей мере 30 (например, по меньшей мере 30, 40, 50, 60, 80, 100, 125, 150, 175, 200, 250, 300, 400, 500, 600, 700, 800, 850, 900, 950, 1000 или 1010) нуклеотидов SEQ ID NO: 6-168, 169, 170, 172, 174 и 176 (см. таблицы 14-17 и таблицу 4а, приведенные в настоящем описании).

Предпочтительно рассматриваемый полипептид и эталонный полипептид проявляют указанную идентичность последовательности на протяжении непрерывного отрезка из 20, 30, 40, 45, 50, 60, 70, 80, 90, 100 или более аминокислот. Предпочтительно рассматриваемый полинуклеотид и эталонный полинуклеотид проявляют указанную идентичность последовательности на протяжении непрерывного отрезка из 60, 90, 120, 135, 150, 180, 210, 240, 270, 300 или более нуклеотидов. В случае сравнения двух последовательностей и отсутствия уточненной эталонной последовательности, по сравнению с которой следует определять идентичность последовательности, идентичность последовательности следует рассчитывать по отношению к более длинной из двух подлежащих сравнению последовательностей, если конкретно не указано иное. Если эталонная последовательность указана, идентичность последовательности определяют на основании всей длины эталонной последовательности, указанной SEQ ID NO: 1, 2, 3 и/или 4, если конкретно не указано иное.

Например, пептидная последовательность, состоящая из 130 аминокислот, сравниваемая с аминокислотами полноразмерного эталонного SHC, содержащего 631 аминокислотный остаток, может проявлять максимальный процент идентичности последовательности 20,6% (130/631×100), а последовательность длиной 300 аминокислот может проявлять максимальный процент идентичности последовательности 47,5% (300/631×100). Подобие нуклеотидных и аминокислотных последовательностей, т.е. процент идентичности последовательности, можно определить посредством выравнивания последовательностей. Такие выравнивания можно осуществлять с помощью нескольких известных в данной области техники алгоритмов, предпочтительно с помощью математического алгоритма Karlin и Altschul (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877), с помощью алгоритма hmmalign (пакет программ HMMER, http://hmmer.wustl.edu/) или с помощью алгоритма CLUSTAL (Thompson, J.D., Higgins, D.G. & Gibson, T.J. (1994) Nucleic Acids Res. 22, 4673-80), доступного, например, на сайте http://www.ebi.ac.uk/Tools/clustalw/ или на сайте http://www.ebi.ac.uk/Tools/clustalw2/index.html, или на сайте http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_clustalw.html или с помощью программы GAP (математического алгоритма университета Айовы), которую использовали при выравнивании последовательностей WTSHC, как представлено в таблице 18 настоящего документа, или с помощью математического алгоритма Myers и Miller (1989 - Cabios 4: 11-17), раскрытого и используемого при выравнивании последовательностей WTSHC в таблице 19, представленной в настоящем описании.

Предпочтительно используют параметры по умолчанию, представленные на сайте http://www.ebi.ac.uk/Tools/clustalw/ или http://www.ebi.ac.uk/Tools/clustalw2/index.html.

Степень идентичности последовательностей (совпадения последовательностей) можно рассчитать, используя, например, программы BLAST, BLAT или BlastZ (или BlastX). Подобный алгоритм включен в программы BLASTN и BLASTP Altschul et al (1990) J. Mol. Biol. 215, 403-410. Поиск полинуклеотидов BLAST проводят с помощью программы BLASTN, балл = 100, длина слова = 12, с получением полинуклеотидных последовательностей, гомологичных нуклеиновым кислотам, кодирующим релевантный белок.

Поиск белков BLAST выполняют с помощью программы BLASTP, балл = 50, длина слова = 3, с получением аминокислотных последовательностей, гомологичных полипептиду SrKO. Для получения выравнивания с использованием гэпов в сравнительных целях используют Gapped BLAST, как описано в публикации Altschul et al (1997) Nucleic Acids Res. 25, 3389-3402. При использовании программ BLAST и Gapped BLAST используют параметры соответствующих программ по умолчанию. Анализ совпадения последовательностей может быть дополнен установленными методами картирования по гомологии, такими как Shuffle-LAGAN (Brudno М., Bioinformatics 2003b, 19 Suppl 1:154-162) или метод марковских случайных полей. При ссылке на процент идентичности последовательностей в настоящей заявке эти проценты вычисляют по отношению ко всей длине более длинной последовательности, если конкретно не указано иное. Сенсорный анализ продукта

В результате биоконверсии гомофарнезола в (-)-амброксид в соответствии с настоящим изобретением (-)-амброксид получают в качестве преобладающего соединения, но также могут быть получены соединения, отличающиеся от (-)-амброксида, которые могут придавать или не придавать приятные ольфакторные ноты смеси биоконверсии и, таким образом, могут положительным или отрицательным образом влиять на сенсорный характер конечного продукта (-)-амброксида. Соответственно, проводят сенсорный анализ, используя общепризнанные сенсорные тесты, которые проводят подготовленные эксперты (например, парфюмеры), и, таким образом, это тестирование может способствовать определению ольфакторной релевантности конечного продукта относительно эталонного продукта для химически релевантного целевого продукта. Как показывает сенсорный анализ в примере 22, удаление из (-)-амброксида одного или более соединений, представляющих собой побочные продукты, может улучшить запах остаточного соединения ((-)-амброксида) даже в том случае, когда удаляемые соединения как таковые не имеют запаха. Таким образом, усиление запаха (-)-амброксида наблюдали в отсутствие соединений II, III и IV.

Аспекты изобретения

1. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров, содержащую ЕЕН, конвертируют ферментативным путем в (-)-амброксид или в смесь, содержащую (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC в реакционных условиях, подходящих для получения (-)-амброксида, и где смесь стереоизомеров, содержащая ЕЕН, по существу состоит из изомеров гомофарнезола, выбранных из группы, состоящей из [(3Е,7Е) и [(3Z,7E)] и/или [(3Е,7Е) и (3E,7Z)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ], [EE:ZE] и [EE:EZ:ZE], соответственно.

2. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров, содержащую ЕЕН, ферментативно конвертируют с получением (-)-амброксида или смеси, содержащей (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC в реакционных условиях, подходящих для получения (-)-амброксида, и где в случае проведения реакции в присутствии солюбилизирующего агента, Тритон Х-100 или тауродезоксихолат не используют в комбинации с ферментом SHC/HAC дикого типа.

3. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров, содержащую ЕЕН, конвертируют ферментативным путем в (-)-амброксид или в смесь, содержащую (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC в реакционных условиях, подходящих для получения (-)-амброксида, и где смесь стереоизомеров, содержащая ЕЕН, по существу состоит из изомеров гомофарнезола, выбранных из группы, состоящей из {(3Е,7Е) и [(3Z,7E)] и/или [(3Е,7Е) и (3E,7Z)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ], [EE:ZE] и [EE:EZ:ZE], соответственно, и где реакцию проводят в трехфазной системе, содержащей водную фазу, твердую фазу и масляную фазу.

4. Способ в соответствии с параграфом 1, или с параграфом 2, или с параграфом 3, который осуществляют с использованием полипептидной последовательности фермента SHC/HAC, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3; SEQ ID NO: 4, или производного SHC/HAC, выбранного из таблицы 1, таблицы 5, таблицы 2, таблицы 6, таблицы 3, таблицы 7, таблицы 4, таблицы 8 или таблицы 13, таблицы 14, или выбранного из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 171, 173, 175, 177 и/или 178 или последовательности с по меньшей мере 30% идентичностью, по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4.

5. Способ по любому из параграфов 1-4, где используют рекомбинантные клетки-хозяева, продуцирующие фермент SHC/HAC.

6. Способ в соответствии с параграфом 4 или с параграфом 5, где нуклеотидная последовательность, кодирующая фермент SHC/HAC, выбрана из группы, состоящей из SEQ ID NO: 165, 166, 167, 168, 169 или SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 и/или 170, 172, 174 и/или 176.

7. Способ в соответствии с любым из параграфов 1-6, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°C до 60°C, при pH в диапазоне приблизительно 4-8.

8. Способ в соответствии с любым из параграфов 1-7, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для фермента, представляющего собой SHC/HAC дикого типа или производное фермента SHC/HAC, которые представлены в таблице 24 или в таблице 24а, предпочтительно при pH в диапазоне от 5,0 до 6,2, предпочтительно при температуре 35°C.

9. Способ в соответствии с любым из параграфов 3-8, где соотношение SDS/клетки находится в диапазоне от 10:1 до 20:1, предпочтительно составляет 16:1 при соотношении биокатализатора и ЕЕН, которое составляет приблизительно 2:1.

10. Способ в соответствии с любым из параграфов 3-9, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.

11. Способ в соответствии с любым из параграфов 3-10, где стадии выращивания клеток и реакции биоконверсии осуществляют в одном реакционном сосуде.

12. Способ в соответствии с параграфом 2, где субстрат гомофарнезола содержит один или более чем один стереоизомер гомофарнезола.

13. Способ в соответствии с параграфом 12, где субстрат гомофарнезола содержит или по существу состоит из двух стереоизомеров гомофарнезола.

14. Способ в соответствии с параграфом 13, где субстрат гомофарнезола содержит или по существу состоит из стереоизомеров EE:EZ.

15. Способ в соответствии с параграфом 14, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; и 60:40.

16. Способ в соответствии с параграфом 15, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 92:8; EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.

17. Способ в соответствии с параграфом 15 или с параграфом 16, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовом соотношении 80:20.

18. Способ в соответствии с любым из параграфов 1-17, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

19. Способ в соответствии с любым из параграфов 1-18, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.

20. Способ в соответствии с любым из параграфов 1-19, где (-)-амброксид выделяют из твердой фазы биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром.

21. Способ в соответствии с параграфом 19 или с параграфом 20, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

22. Способ в соответствии с параграфом 21, где (-)-амброксид выделяют из реакционной смеси с использованием этанола или толуола.

23. Способ в соответствии с любым из параграфов 19-22, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

24. Способ в соответствии с параграфом 23, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

25. Способ в соответствии с любым из параграфов 1-24, где (-)-амброксид получают в диапазоне концентраций приблизительно 125-200 г/л.

26. (-)-Амброксид, получаемый способом по любому из параграфов 1-25, где (-)-амброксид имеет порог восприятия запаха от приблизительно 0,1 до приблизительно 0,5 нг/л.

27. (-)-Амброксид по параграфу 26 в твердой форме, предпочтительно в аморфной или кристаллической форме.

28. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по любому из параграфа 26 или параграфа 27.

29. Способ по параграфу 28, где продукт представляет собой ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

30. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащий (-)-амброксид по любому из параграфа 26 или параграфа 27.

31. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 26 или параграфу 27 и один или более чем один дополнительный компонент.

32. Применение (-)-амброксида по параграфу 26 или параграфу 27 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.

33. Способ увеличения, усиления или придания аромата ароматизирующей композиции, включающий стадию смешивания с указанной ароматизирующей композицией продукта, увеличивающего или усиливающего аромат, полученного в соответствии со способом, включающим стадии:

(а) приготовления реакционной смеси, содержащей (-)-амброксид в смеси с одним или более чем одним из соединений побочных продуктов (II), (III) или (IV).

(б) экстрагирования (-)-амброксида в смеси с одним или более чем одним из соединений побочных продуктов (II), (III) или (IV); и

(в) селективной кристаллизации (-)-амброксида из экстракционной смеси;

где (-)-амброксид получают путем ферментативной конверсии (3Е,7Е)-гомофарнезола (ЕЕН) или смеси стереоизомеров, содержащей ЕЕН, с использованием фермента SHC/HAC в реакционных условиях, приемлемых для получения (-)-амброксида, и где смесь стереоизомеров, содержащая ЕЕН, по существу состоит из изомеров гомофарнезола, выбранных из группы, состоящей из [(3Е,7Е) и [(3Z,7E)] и/или [(3Е,7Е) и (3E,7Z)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенную как [EE:EZ], [EE:ZE] и [EE:EZ:ZE], соответственно.

34. Способ по параграфу 33, где реакцию проводят в трехфазной системе, содержащей водную фазу, твердую фазу и масляную фазу.

35. Способ в соответствии с параграфом 33, или с параграфом 34, где процесс осуществляют с использованием фермента SHC/HAC с полипептидной последовательностью, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3; SEQ ID NO: 4, или производного SHC/HAC, выбранного из таблицы 1, таблицы 5, таблицы 2, таблицы 6, таблицы 3, таблицы 7, таблицы 4, таблицы 8 или таблицы 14, или выбранного из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 171, 173, 175 и/или 178 или последовательности с по меньшей мере 30% идентичностью, по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4.

36. Способ по любому из параграфов 33-35, где используют рекомбинантные клетки-хозяева, продуцирующие фермент SHC/HAC.

37. Способ в соответствии с параграфом 35 или с параграфом 36, где нуклеотидная последовательность, кодирующая фермент SHC/HAC, выбрана из группы, состоящей из SEQ ID NO: 165, 166, 167, 168, 169 или SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 и/или 170, 172, 174 и/или 176.

38. Способ в соответствии с любым из параграфов 33-37, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°C до 60°C, при pH в диапазоне приблизительно 4-8.

39. Способ в соответствии с любым из параграфов 33-38, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для фермента SHC/HAC дикого типа или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а, предпочтительно при pH в диапазоне от 5,0 до 6,2, предпочтительно при температуре 35°C.

40. Способ в соответствии с любым из параграфов 34-39, где соотношение SDS/клетки находится в диапазоне от 10:1 до 20:1, предпочтительно составляет 16:1 при соотношении биокатализатора и ЕЕН, которое составляет приблизительно 2:1.

41. Способ в соответствии с любым из параграфов 34-40, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.

42. Способ в соответствии с любым из параграфов 34-41, где стадии выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.

43. Способ в соответствии с любым из параграфов 33-42, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; и 60:40.

44. Способ в соответствии с параграфом 43, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: EE:EZ 92:08; EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.

45. Способ в соответствии с параграфом 43 или с параграфом 44, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовом соотношении 80:20.

46. Способ в соответствии с любым из параграфов 33-45, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

47. Способ в соответствии с любым из параграфов 33-46, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.

48. Способ в соответствии с любым из параграфов 33-47, где (-)-амброксид выделяют из твердой фазы биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром.

49. Способ в соответствии с параграфом 47 или с параграфом 48, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

50. Способ в соответствии с параграфом 49, где (-)-амброксид выделяют из реакционной смеси с использованием этанола или толуола.

51. Способ в соответствии с любым из параграфов 47-49, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

52. Способ в соответствии с параграфом 51, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

53. Способ в соответствии с любым из параграфов 33-52, где (-)-амброксид получают в диапазоне концентраций приблизительно 125-200 г/л.

54. Способ по любому из параграфов 33-53, где (-)-амброксид имеет порог восприятия запаха от приблизительно 0,1 до приблизительно 0,5 нг/л.

Дополнительные аспекты изобретения

1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеции или инсерций, относительно SEQ ID NO: 1.

2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 1.

3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 1.

4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью SEQ ID NO: 1.

5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеции или инсерций относительно SEQ ID NO: 1, где одна или более мутаций, отличающихся от мутации активного центра SHC, локализована/локализованы в домене 2 фермента SHC (Фиг. 19 и/или 20).

6. Производное SHC/HAC в соответствии с любым из параграфов 1-5, где одна или более мутаций относительно SEQ ID NO: 1 выбраны из таблицы 1, где, если выбрана только одна мутация, она представляет собой не F601Y.

7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 1 или таблицы 5.

8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 1 и содержит по меньшей мере замены F601Y или M132R в комбинации с по меньшей мере одной или более из F129L и/или I432T.

9. Производное SHC/HAC в соответствии с параграфом 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 1 и, которое содержит одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 77, 129, 132, 192, 224, 432, 579, 601 и 605 относительно SEQ ID NO: 1, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 1.

10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более замен, выбранных из группы, состоящей из: Т77А, F129L, M132R, I92V, A224V, I432T, Q579H, F601Y и/или F605W относительно SEQ ID NO: 1.

11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F601Y.

12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F129L.

13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F601Y и F129L.

14. Производное SHC/HAC в соответствии с параграфом 10, содержащее M132R и I432T.

15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее аминокислотную замену A224V.

16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F601Y.

17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F129L.

18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F601Y.

19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее Q579H.

20. Производное SHC/HAC в соответствии с параграфом 10, содержащее Т77А, и I92V, и F129L.

21. Производное SHC/HAC в соответствии с любым из параграфов 1-20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 и/или 171.

22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.

23. Изолированная нуклеотидная последовательность в соответствии с любым из параграфов 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 и/или 170.

24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.

25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.

26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.

27. Вектор, содержащий конструкцию по любому из параграфов 24-26.

28. Вектор по параграфу 27, представляющий собой плазмиду.

29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.

32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.

33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.

34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.

35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадию культивирования одной или более чем одной рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.

36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования биокатализатора.

37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 169 или SEQ ID NO: 165, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100 или тауродезоксихолата.

38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в подходящих реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.

39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при подходящих значениях pH, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.

40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°C до 60°C, при pH в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100 или тауродезоксихолата, для фермента WT SHC/HAC.

41. Способ в соответствии с любым из параграфов 37-40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более одного из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.

42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.

43. Способ в соответствии с любым из параграфов 37-42, где стадии выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.

44. Способ в соответствии с любым из параграфов 37-43, где субстрат гомофарнезол содержит один или более стереоизомеров гомофарнезола.

45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.

46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.

47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.

48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.

49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.

50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

51. Способ в соответствии с любым из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром, или выделяют непосредственно кристаллы (-)-амброксида из биоконверсионной реакционной смеси с помощью фильтрования.

52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.

56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.

57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащие (-)-амброксид по параграфу 55 или 56.

59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более чем один дополнительный компонент.

60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического пргодукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.

61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC применяют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.

62. Способ получения (-)-амброксида или смеси стереоизомеров (-)-амброксида, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров (3Е,7Е)-гомофарнезола ферментативно конвертируют с получением (-)-амброксида или смеси стереоизомеров (-)-амброксида, где ферментативную конверсию осуществляют в реакционных условиях, приемлемых для получения (-)-амброксида, и при проведении реакции в присутствии солюбилизирующего агента Тритон Х-100 не используют в комбинации с ферментом WT SHC/HAC.

63. Способ в соответствии с параграфом 62, который осуществляют с использованием фермента SHC/HAC, выбранного из группы, состоящей из AacSHC (SEQ ID NO: 1), Zmo SHC1 (SEQ ID NO: 2), ZmoSHC2, (SEQ ID NO: 3); BjpSHC (SEQ ID NO: 4), производного фермента SHC/HAC, выбранного из таблицы 1, таблицы 5, таблицы 2, таблицы 6, таблицы 3, таблицы 7, таблицы 4 и/или таблицы 8 или последовательности с по меньшей мере 30% идентичностью, по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4.

64. Способ в соответствии с параграфом 63, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°C до 60°C, при pH в диапазоне 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100, для фермента WT SHC.

65. Способ в соответствии с параграфом 64, где реакционные условия для WT SHC/HAC или каждого производного SHC/HAC представлены в таблице 24 или в таблице 24а.

66. Способ в соответствии с любым из параграфов 62-65, включающий (а) культивирование одной или более чем одной рекомбинантной клетки-хозяина, экспрессирующей фермент WT SHC или производное фермента SHC в условиях, обеспечивающих возможность экспрессии полипептида WT SHC или производного SHC/HAC, перед конверсией Е, Е-гомофарнезола в (-)-амброксид.

67. Способ в соответствии с параграфом 66, где стадию культивирования и последующую стадию конверсии проводят в одном и том же реакционном сосуде в различных реакционных условиях.

68. Способ в соответствии с параграфом 67, где стадию культивирования осуществляют в диапазоне pH от приблизительно 6 до приблизительно 7, а стадию конверсии гомофарнезола в (-)-амброксид осуществляют в диапазоне pH приблизительно 4,8-5,5.

69. Способ в соответствии с любым из параграфов 62-68, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.

70. Способ по параграфу 69, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.

71. Способ по параграфу 70, где гомофарнезол содержит EE:EZ в массовом соотношении 80:20.

72. Способ по любому из параграфов 62-71, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

73. Способ по любому из параграфов 62-72, где (-)-амброксид выделяют из реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.

74. Способ в соответствии с параграфом 73, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

75. Способ по параграфу 74, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

76. Способ по параграфу 74 или 75, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

77. (-)-Амброксид, получаемый способом по любому из параграфов 72-76.

78. (-)-Амброксид по параграфу 26 в твердой форме, предпочтительно в аморфной или кристаллической форме.

79. Способ получения продукта, включающий включение в продукт (-)-амброксида по любому из параграфа 77 или параграфа 78.

80. Способ по параграфу 79, где продукт представляет собой ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

81. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащий (-)-амброксид по параграфу 77 или 78.

82. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 77 или 78 и один или более чем один дополнительный компоненте

83. Применение (-)-амброксида по параграфу 77 или 78 в качестве составной части ароматизирующего продукта или потребительского косметического продукта для ухода.

Дополнительные аспекты изобретения (ZmoSHC1)

1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 2.

2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 2.

3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 2.

4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью относительно SEQ ID NO: 2.

5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеций или инсерций относительно SEQ ID NO: 2, где одна или более чем одна мутация, отличающаяся от мутации активного центра SHC, локализована/локализованы в домене 2 фермента SHC (Фиг. 19 и/или 20).

6. Производное SHC/HAC в соответствии с любым из параграфов 1-5, где одна или более мутаций относительно SEQ ID NO: 2 выбраны из таблицы 2, где, если выбрана только одна мутация, она представляет собой не F668Y.

7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 2 и/или таблицы 6.

8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 2 и содержит по меньшей мере замены F668Y или Y185R в комбинации с по меньшей мере одной или более из F182L и/или I498T.

9. Производное SHC/HAC по параграфу 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 2, и которое содержит одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 129, 145, 182, 185, 282, 498, 647 и 668 относительно SEQ ID NO: 2, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 2.

10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более замен, выбранных из группы, состоящей из: S129A, V145V, F182L, Y185R, G282V, I498T, Н646Н и F668Y относительно SEQ ID NO: 2.

11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F668Y.

12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F182L.

13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F668Y и F182L

14. Производное SHC/HAC в соответствии с параграфом 10, содержащее Y185R и I498T.

15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее G282V.

16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F668Y.

17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F182L.

18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F668Y.

19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее Н646Н.

20. Производное SHC в соответствии с параграфом 10, содержащее S129A, и V145V, и F182L

21. Производное SHC/HAC в соответствии с любым из параграфов 1-20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 и/или 75.

22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.

23. Изолированная нуклеотидная последовательность в соответствии с параграфом 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74 и/или 76.

24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.

25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.

26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.

27. Вектор, содержащий конструкцию в соответствии с любым из параграфов 24-26.

28. Вектор по параграфу 27, представляющий собой плазмиду.

29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.

32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.

33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.

34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.

35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадию культивирования одной или более чем одной рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.

36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования биокатализатора.

37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 166, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100.

38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в подходящих реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.

39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при подходящих значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.

40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100, для фермента WT SHC/HAC.

41. Способ в соответствии с любым из параграфов 37-40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.

42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.

43. Способ в соответствии с любым из параграфов 37-42, где стадии выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.

44. Способ в соответствии с любым из параграфов 37-43, где субстрат гомофарнезол содержит один или более чем один стереоизомер гомофарнезола.

45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.

46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.

47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.

48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE.EZ 66:34.

49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.

50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

51. Способ по любому из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием этапа экстракции/дистилляции органическим растворителем или паром или фильтрования.

52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.

56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.

57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащее (-)-амброксид по параграфу 55 или 56.

59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более чем один дополнительный компонент.

60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.

61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC используют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.

Дополнительные аспекты изобретения (ZmoSHC2)

1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 3.

2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 3.

3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 3.

4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью относительно SEQ ID NO: 3.

5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеций или инсерций относительно SEQ ID NO: 3, где одна или более чем одна мутация, отличающаяся от мутации активного центра SHC, локализована в домене 2 фермента SHC (Фиг. 19 и/или 20).

6. Производное SHC/HAC в соответствии с любым из параграфов 1-5, где одна или более чем одна мутация относительно SEQ ID NO: 3 выбрана из таблицы 3, где, если выбрана только одна мутация, она не является F620Y.

7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 3 и/или таблицы 7.

8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 3 и содержит по меньшей мере замены F620Y или I140R в комбинации с по меньшей мере одной или более из F137L и/или I450T.

9. Производное SHC/HAC по параграфу 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 3 и содержащую одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 85, 100, 137, 140, 233, 450, 598 и 620 относительно SEQ ID NO: 3, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 3.

10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более чем одну замену, выбранную из группы, состоящей из: G85A, V100V, F137L, I140R, V233V, I450T, N598H и F620Y относительно SEQ ID NO: 3.

11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F620Y.

12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F137L.

13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F620Y и F137L.

14. Производное SHC/HAC в соответствии с параграфом 10, содержащее I140R и I450T.

15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее V233V.

16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F620Y.

17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F137L.

18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F620Y.

19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее N598H.

20. Производное SHC в соответствии с параграфом 10, содержащее G85A, и V100V, и F137L.

21. Производное SHC/HAC в соответствии с любым из параграфов 1-20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 и/или 111.

22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.

23. Изолированная нуклеотидная последовательность в соответствии с параграфом 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110 и/или 112.

24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.

25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.

26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.

27. Вектор, содержащий конструкцию в соответствии с любым из параграфов 24-26.

28. Вектор по параграфу 27, представляющий собой плазмиду.

29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.

32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.

33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.

34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.

35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадии: (а) культивирование одной или более чем одной рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.

36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования биокатализатора.

37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 167, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100.

38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в приемлемых реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.

39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при приемлемых значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.

40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100 для фермента WT SHC/HAC.

41. Способ в соответствии с любым из параграфов 37-40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или чем одного более из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.

42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно приблизительно 1:1 или 0,5:1.

43. Способ в соответствии с любым из параграфов 37-42, где этапы выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.

44. Способ в соответствии с любым из параграфов 37-43, где субстрат гомофарнезол содержит один или более чем один стереоизомер гомофарнезола.

45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.

46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.

47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.

48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80: 20; EE:EZ 86:14; EE:EZ 70:30; EE.EZ 69:31; и EE:EZ 66:34.

49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.

50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

51. Способ по любому из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием этапа экстракции/дистилляции органическим растворителем или паром или фильтрования.

52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.

56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.

57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащее (-)-амброксид по параграфу 55 или 56.

59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более дополнительных компонентов.

60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.

61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC применяют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.

Дополнительные аспекты изобретения (BJpSHC)

1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 4.

2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 4.

3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 4.

4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью относительно SEQ ID NO: 4.

5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеций или инсерций относительно SEQ ID NO: 4, где одна или более чем одна мутация, отличающаяся от мутации активного центра SHC, локализована в домене 2 фермента SHC (Фиг. 19 и/или 20).

6. Производное SHC/HAC в соответствии с любым из параграфов 1-5, где одна или более мутаций относительно SEQ ID NO: 4 выбраны из таблицы 4, где, если выбрана только одна мутация, она не является F628Y.

7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 4 и/или таблицы 8.

8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 4 и содержит по меньшей мере замены F628Y или I140R в комбинации с по меньшей мере одной или более из F137L и/или I450T.

9. Производное SHC/HAC по параграфу 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 4 и содержащую одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 88, 104, 141, 144, 241, 459, 607 и 628 относительно SEQ ID NO: 4, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 4.

10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более замен, выбранных из группы, состоящей из: А88А, V104V, F141L, Y144R, V241V, I459T, М607Н и F628Y относительно SEQ ID NO: 4.

11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F628Y.

12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F141L.

13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F628Y и F141L

14. Производное SHC/HAC в соответствии с параграфом 10, содержащее Y144R и I459T.

15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее V241V.

16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F628Y.

17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F141L.

18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F628Y.

19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее М607Н.

20. Производное SHC в соответствии с параграфом 10, содержащее S129A, и V145V, и F182L.

21. Производное SHC/HAC в соответствии с любым из параграфов 1-20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145 и/или 147.

22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.

23. Изолированная нуклеотидная последовательность в соответствии с параграфом 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 114, 116, 118, 120, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146 и/или 148.

24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.

25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.

26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.

27. Вектор, содержащий конструкцию в соответствии с любым из параграфов 24-26.

28. Вектор по параграфу 27, представляющий собой плазмиду.

29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.

31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.

32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.

33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.

34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.

35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадии: (а) культивирование одной или более рекомбинантных клеток-хозяев в соответствии с любым из параграфов 31-34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.

36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования биокатализатора.

37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 168, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100.

38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в приемлемых реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.

39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при приемлемых значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.

40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100, для фермента WT SHC/HAC.

41. Способ в соответствии с любым из параграфов 37-40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.

42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно приблизительно 1:1 или 0,5:1.

43. Способ в соответствии с любым из параграфов 37-42, где этапы выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.

44. Способ в соответствии с любым из параграфов 27-31, где субстрат гомофарнезол содержит один или более стереоизомеров гомофарнезола.

45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.

46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.

47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.

48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.

49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.

50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).

51. Способ по любому из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием этапа экстракции/дистилляции органическим растворителем или паром или фильтрования.

52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.

53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).

55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.

56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.

57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащее (-)-амброксид по параграфу 55 или 56.

59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более чем один дополнительный компонент.

60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.

61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC применяют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.

В другом аспекте предложена модель кристаллической структуры (CMS) SHC, основанная на структурных координатах SHC, с аминокислотной последовательностью описанного в настоящем описании SHC или его производного. CMS SHC содержит домен связывающего кармана сквалена/гомофарнезола (squalene/homofarnesol binding pocket domain, SHBD), содержащий связывающий карман сквалена/гомофарнезола (SHBP) и субстрат сквален/гомофарнезол, связанный с SBD (например, см. Фиг. 19 и 20). Эта модель кристаллической структуры SHC (CMS) облегчает тестирование потенциальных производных-кандидатов фермента SHC/HAC in-silico.

Таким образом, в других воплощениях в настоящем изобретении предложен способ скрининга на фермент (например, производное SHC/HAC), способный к связыванию SHBD, включающий использование CMS SHC/HAC. В другом аспекте в настоящем изобретении предложен способ скрининга на фермент (например, эталонного фермента SHC или производного SHC/HAC), способный к связыванию SHBP, где способ включает приведение SHBP в контакт с тестируемым соединением (например, производным SHC) и определение наличия или отсутствия связывания тестируемого соединения с указанным SHBP. В некоторых воплощениях изобретения способ предназначен для скрининга тестируемого соединения (например, модулятора), полезного при модулировании активности производного фермента SHC.

В другом аспекте в настоящем изобретении предложен способ прогнозирования, имитации или моделирования молекулярных характеристик и/или молекулярных взаимодействий эталонного SHC и/или производного SHC/HAC со связывающим доменом сквалена/гомофарнезола (SHBD), включающий использование компьютерной модели, где в указанной компьютерной модели включены, использованы или изображены структурные координаты связывающего домена сквалена/гомофарнезола, как определено выше, для получения изображения указанного лиганд-связывающего домена и, возможно, вывода указанного изображения на дисплей.

Во всем тексте настоящего описания и следующей ниже формулы изобретения, если контекстом не требуется иное, под словом «содержать» и его вариантами, такими как «содержит» и «содержащий», следует понимать включение указанного целого числа, или стадии, либо группы целых чисел или стадий, но не исключение любого другого целого числа, или стадии, либо группы целых чисел или стадий. Термин «содержащий» также означает «включающий» и также «состоящий из», например, композиция, «содержащая» X, может состоять исключительно из X или может включать что-либо еще дополнительное, например, X+Y. Необходимо отметить, что используемые в настоящем описании и прилагаемой формуле изобретения формы единственного числа включают в себя соответствующие формы множественного числа, если контекстом явным образом не требуется иное. В качестве примера, ссылка на «ген» или «фермент» является ссылкой на «один или более чем один ген» или «один или более чем один фермент».

Должно быть понятно, что изобретение не ограничено конкретной методологией, протоколами и реагентами, описанными в настоящем описании, поскольку они могут варьировать. Должно быть также понятно, что используемая в настоящем описании терминология предназначена только для цели описания конкретных воплощений и не предназначена для ограничения объема настоящего изобретения, которое будет ограничено только прилагаемой формулой изобретения. Если не определено иное, все используемые в настоящем описании технические и научные термины имеют те же значения, которые обычно понятны специалистам в данной области техники. В соответствии с настоящим изобретением могут быть применены традиционные методы молекулярной биологии, микробиологии и рекомбинантных ДНК, которые входят в компетенцию специалистов в данной области техники.

Данное изобретение не ограничено в его применении к деталям конструкции и порядком расположения компонентов, приведенных в последующем описании или проиллюстрированных в графических материалах. Возможны другие воплощения изобретения и его применение на практике или осуществление различными путями. Используемые здесь формулировки и терминология также предназначены для описания настоящего изобретения, и их не следует рассматривать как ограничивающие.

Предпочтительно используемые в настоящем описании термины определены, как описано в публикации «А multilingual glossary of biotechnological terms: (IUPAC Recommendations)», Leuenberger, H.G.W, Nagel, B. and Kolbl, H. eds. (1995), Helvetica Chimica Acta, CH-4010 Basel, Switzerland).

Во всем тексте данного описания цитируется несколько документов. Каждый из цитируемых в настоящем описании документов (включая все патенты, заявки на патенты, научные публикации, спецификации производителя, номера последовательностей по каталогу GenBank и т.д.), приведенных выше или ниже, полностью включен в настоящий документ посредством ссылки.

Описанные в настоящем описании примеры являются иллюстративными для настоящего изобретения и не предназначены для его ограничения. В настоящем описании раскрыты различные воплощения настоящего изобретения. Многочисленные модификации и вариации описанных и проиллюстрированных в настоящем описании методов могут быть выполнены без отклонения от сущности и объема изобретения. Соответственно, следует понимать, что примеры являются только иллюстративными и не имеют ограничительного характера для объема изобретения.

SEQ ID NO: 1 (Alicyclobacillus acidocaldarius), AacSHC

SEQ ID NO: 2 (Zymomonas mobilis), ZmoSHC1

SEQ ID NO: 3 (Zymomonas mobilis), ZmoSHC2

SEQ ID NO: 4 (Bradyrhizobium japonicum), BjpSHC

SEQ ID NO: 149 (Burkholderia ambifaria)

SEQ ID NO: 151 (Burkholderia ambifaria)

SEQ ID NO: 153 [Bacillus anthracis)

SEQ ID NO: 155 (Frankia alni)

SEQ ID NO: 157 (Rhodopseudomonas palent)

SEQ ID NO: 159 {Streptomyces coelicolor)

SEQ ID NO: 169

Вариант 101А10 (SEQ ID NO: 30)

Вариант 101А10 (SEQ ID NO: 29)

Вариант 111С8 ((SEQ ID NO: 28)

Вариант 111С8 (SEQ ID NO: 27)

Вариант SHC215G2 (SEQ ID NO: 22)

Вариант SHC215G2 (SEQ ID NO: 21)

Вариант SHC3 (SEQ ID NO: 26)

Вариант SHC3 (SEQ ID NO: 25)

Вариант SHC10 (SEQ ID NO: 32)

Вариант SHC10 (SEQ ID NO: 31)

Вариант SHC26 (SEQ ID NO: 24)

Вариант SHC26 (SEQ ID NO: 23)

Вариант SHC30 (SEQ ID NO: 34)

Вариант SHC30 (SEQ ID NO: 33)

Вариант SHC31 (SEQ ID NO: 36)

Вариант SHC31 (SEQ ID NO: 35)

Вариант SHC32 (SEQ ID NO: 38)

Вариант SHC32 (SEQ ID NO: 37)

Вариант SHC33 (SEQ ID NO: 40)

Вариант SHC33 (SEQ ID NO: 39)

Вариант F605W(SEQ ID NO: 170)

Вариант F605W (SEQ ID NO: 171)

SEQ ID NO: 166 (ZmoSHC1)

Диссертация Miriam Seitz доступна по ссылке http://elib.unistuttgart.de/handle/11682/1400

Escher S, Giersch W., Niclass Y, Bernardinello G and Ohloff G (1990). Configuration-odor relationships in 5β-Ambrox. Helv. Chim. Acta 73, 1935-1947.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

Для лучшего понимания настоящего изобретения приведена ссылка на сопроводительные графические материалы, в которых:

На Фиг. 1-4 показано выравнивание последовательностей отдельных производных AacSHC относительно AacSHC SEQ ID NO: 1. На Фиг. 1 сверху вниз изображены SEQ ID NO:: SEQ ID NO: 1, SEQ ID NO: 29, SEQ ID NO: 27, SEQ ID NO: 21, SEQ ID NO: 19, SEQ ID NO: 9, SEQ ID NO: 23, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37 и SEQ ID NO: 39.

На Фиг. 5 показана карта плазмиды.

На Фиг. 6 показаны относительные значения активности НАС AacSHC дикого типа и производных AacSHC, представленных в таблице 24, в стандартных условиях (рН 6,0, 55°С, 0,050% SDS, клетки до значения OD650 нм 10).

На Фиг. 7а показаны профили активности НАС производных AacSHC относительно WT AacSHC с использованием гомофарнезола качества EEH:EZH 87:13 и гомофарнезола чистоты 96% (определенной с использованием NMR).

На Фиг. 7b показано относительное повышение активности производных AacSHC относительно WT AacSHC (4 ч (начальная скорость) и выход через 22 ч) с использованием гомофарнезола качества EEH:EZH 87:13 и гомофарнезола чистоты 96% (определенной с использованием NMR).

На Фиг. 8а показаны профили активности НАС производных AacSHC относительно WT AacSHC с использованием гомофарнезола качества EEH:EZH 92:08 и гомофарнезола чистоты 100% (определенной методом NMR).

На Фиг. 8b показано относительное повышение активности производных AacSHC относительно WT AacSHC (4 ч (начальная скорость) и выход через 22 ч) с использованием гомофарнезола качества EEH:EZH 92:08 и гомофарнезола чистоты 100% (определенной методом NMR).

На Фиг. 9а показаны профили активности НАС производных AacSHC, приведенных в таблице 24, относительно WT AacSHC с использованием гомофарнезола качества EEH:EZH 66:33 и гомофарнезола чистоты 76% (определенной методом NMR).

На Фиг. 9b показано относительное повышение активности производных AacSHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч) с использованием гомофарнезола качества EEH:EZH 66:33 и гомофарнезола чистоты 76% (определенной методом NMR).

На Фиг. 10 показаны результаты определения активности НАС для трех производных SHC, проявляющих приблизительно 10-кратное (215G2), 7-кратное (SHC26) и 6-кратное (SHC32) повышение активности по сравнению с ферментом AacSHC/HAC дикого типа.

На Фиг. 11 показана наблюдаемая конверсия Е,Е-гомофарнезола в амброксид производным SHC/HAC (215G2 SHC) и WT AacSHC. После 7 часов реакции (оценка начальной скорости реакции) конверсия вариантом 215G2 SHC была в 13 раз выше по сравнению с конверсией, достигаемой SHC дикого типа. После 48 часов реакции конверсия вариантом была приблизительно в 8 раз выше, чем для фермента дикого типа.

На Фиг. 12 показаны полученные продукты реакции (амброксид и продукт (IV)) при использовании ЕЕН в качестве исходного материала (для биоконверсии WT SHC и/или производным SHC/HAC); и полученные продукты реакции ((-)-амброксид (I) и продукты (II), (IV) и (III) (см. таблицу 21) при использовании EE:EZ в качестве исходного материала); для простоты ссылки соединения I-IV можно идентифицировать следующим образом:

I: (3aR,5aS,9aS,9bR)-3а,6,6,9а-тетраметилдодекагидронафто[2,1-b]фуран (-)-Амброксид

II: (7aS,11aS,Z)-5,8,8,11а-тетраметил-2,3,6,7,7а,8,9,10,11,11а-декагидробензо[b]оксонин

IV: (3aR,5aS,9aS,9bS)-3а,6,6,9а-тетраметилдодекагидронафто[2,1-b]фуран

III: (3aS,5aS,9aS,9bS)-3а,6,6,9а-тетраметилдодекагидронафто[2,1-b]фуран 9-эпи-Амброксид

На Фиг. 13 показан анализ GC продуктов реакции для амброксида и продуктов (II), (IV) и (III) в таблице 25.

На Фиг. 14 показан анализ GC продуктов реакции для амброксида и продуктов (II), (IV) и (III) в таблице 25.

На Фиг. 15 приведены сравнительные данные для активности варианта 215G2SHC в количественном анализе цельноклеточной биоконверсии в присутствии Тритона Х-100 или SDS.

На Фиг. 16 показана процентная доля конвертированного ЕЕН для различных соотношений SDS/клетки.

На Фиг. 17 показан % конверсии ЕЕН в стандартной реакции биоконверсии (как описано в примере 7) для трех различных концентраций SDS.

На Фиг. 18 показан % конверсии ЕЕН в стандартной реакции биоконверсии (как описано в примере 7) для трех различных значений рН.

На Фиг. 19 показана локализация мутаций, идентифицированных в вариантах SHC/HAC 101A10, 111С8 и 215G2, на кристаллической структуре SHC (в цвете): красный для варианта 215G2; пурпурный (винно-красный) для варианта 101A10 и зеленый для варианта 111С8. Для аминокислот, идентифицированных как ответственные за повышенную активность, боковые цепи выделены желтым цветом в сокристаллизованном аналоге субстрата. Другие мутации для идентифицированных вариантов без повышения активности отмечены синим цветом. Отмечено, что синие мутации распределены приблизительно пополам (т.е. 50:50) по 2 доменам фермента, при этом идентифицированные благоприятные мутации AacSHC локализованы, в основном (удаленно друг от друга), в домене 2. Единственное исключение составляет мутация F601Y, расположенная вблизи активного центра.

На Фиг. 20 показаны следующие мутации (черным и белым цветом): мутации, не оказывающие благоприятного действия на активность SHC/HAC, показаны черным цветом, они распределены по 2 доменам фермента SHC. Серым цветом показаны мутации, идентифицированные в вариантах SHC (101А10, 111С8 и 215G2), проявляющие повышенную активность SHC/HAC, и они расположены за единственным исключением в домене 2 фермента SHC. Выделена боковая цепь мутаций, вносящих вклад в повышенную активность вариантов.

На Фиг. 21 показана область клонирования и экспрессии плазмиды рЕТ-28а(+); номера SEQ ID для последовательностей на Фиг. 21 приведены ниже:

рЕТ 28а (нуклеотидная последовательность): SEQ ID NO: 179;

рЕТ 28а (аминокислотная последовательность): SEQ ID NO: 180;

рЕТ 28b (нуклеотидная последовательность): SEQ ID NO: 181;

рЕТ 28b (аминокислотная последовательность): SEQ ID NO: 182;

рЕТ 28с (нуклеотидная последовательность): SEQ ID NO: 183; и

рЕТ 28с (аминокислотная последовательность): SEQ ID NO: 184.

На Фиг. 22 показана объемная производительность 1,5х концентрированной реакционной смеси биоконверсии ЕЕН, содержащей 375 г/л клеток, 188 г/л ЕЕН, 2,33% SDS, по сравнению с объемной производительностью регулярной биоконверсии, которая была проведена параллельно при 125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS (пример 7).

На Фиг. 23 показана регулярная биоконверсия (125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS), которая была проведена, как описано в примере 7, но с заменой цитратного буферного раствора рН 5,4 на 0,5% или 0,9% NaCl, при этом все остальные параметры реакции не менялись. Параллельно в качестве контроля проводили биоконверсию в цитратном буферном растворе.

На Фиг. 24 показано изменение твердофазной экстракции (-)-амброксида по мере проведения отмывок толуолом в виде % от количества (-)-амброксида, исходно присутствовавшего в 200 мл всего реакционного бульона (за счет соотношения объемов бульон/толуол % в первом экстракте превышает 100%).

На Фиг. 25 показано изменение твердофазной экстракции (-)-амброксида по мере проведения отмывок этанолом в виде процентной доли от исходно присутствующего количества (-)-амброксида. После 4 отмывок (всего 640 мл EtOH, т.е. 3,2х начального объема всей реакционной смеси или 8х объема твердой фазы) было извлечено приблизительно 99% (-)-амброксида, первоначально присутствующего в реакционном бульоне.

ПРИМЕРЫ

Во избежание сомнений все ссылки на WT SHC и варианты SHC относятся к WT AacSHC (SEQ ID NO: 1) и его вариантам (например, перечисленным в таблице 23 и/или в таблице 24).

ПРИМЕР 1

Получение биокатализатора

Методы 1

Получение плазмиды SHC

Ген, кодирующий сквален-гопен-циклазу Alicyclobacillus acidocaldarius (AacSHC) встраивали в плазмиду рЕТ-28а(+), где он находился под контролем IPTG-индуцибельного промотора Т7 для продуцирования белка в Escherichia coli (см. Фиг. 5 и 21). Этой плазмидой трансформировали штамм Е. coli BL21(DE3), используя стандартный протокол трансформации с тепловым шоком.

Культуры в колбах Эрленмейера

Для продуцирования белка использовали либо комплексную (LB), либо минимальную питательную среду. Одним из примеров успешно используемой минимальной питательной среды является среда М9.

Приготовление среды

Выбранную по умолчанию минимальную питательную среду готовили, как описано ниже, для 350 мл культуры: к 35 мл исходного раствора лимонной кислоты/фосфата (133 г/л KH2PO4, 40 г/л (NH4)2HPO4, 17 г/л лимонной кислоты. H2O с рН, доведенным до 6,3) добавляли 307 мл H2O, при необходимости рН доводили до 6,8 32% раствором NaOH. После стерилизации в автоклаве добавляли 0,850 мл 50% раствора MgSO4, 0,035 мл раствора микроэлементов (состав приведен в следующем разделе), 0,035 мл раствора тиамина и 7 мл 20% раствора глюкозы.

Продуцирование биокатализатора SHC (продуцирование биокатализатора)

Для продуцирования биокатализатора в небольшом масштабе (SHC дикого типа или вариантов SHC) 350 мл культуры (питательной среды с добавлением 50 мкг/мл канамицина) инокулировали из предварительной культуры штамма E. coli BL21(DE3), содержащего плазмиду для продуцирования SHC. Клетки выращивали до оптической плотности приблизительно 0,5 (OD650 нм) при 37°С при постоянном перемешивании (250 об/мин).

Затем продуцирование белка индуцировали добавлением IPTG до концентрации 300 мкМ с последующей инкубацией в течение 5-6 часов при постоянном встряхивании. Наконец, полученную в результате биомассу собирали центрифугированием, промывали 50 мМ буфером Трис-HCl рН 7,5. Клетки хранили в виде осадков при 4°С или -20°С до дальнейшего использования. Как правило, из 1 литра культуры получали от 2,5 до 4 грамм клеток независимо от используемой питательной среды.

Ферментации готовили и проводили в реакторах Infors HT емкостью 750 мл. В ферментационный сосуд добавляли 168 мл деионизированной воды. Реакционный сосуд был оборудован всеми необходимыми датчиками (pO2, рН, отбора проб, гашения пены), устройством подачи С+N и бутылками с гидроксидом натрия и простерилизован в автоклаве. После стерилизации в автоклаве в реактор добавляют:

20 мл 10x буферного раствора фосфата/лимонной кислоты

14 мл 50% глюкозы

0,53 мл раствора MgSO4

2 мл раствора (NН4)2SO4

0,020 мл раствора микроэлементов

0,400 мл раствора тиамина

0,200 мл исходного раствора канамицина

Устанавливали следующие рабочие параметры: рН=6,95, pO2=40%, Т=30°С, перемешивание при 300 об/мин. Каскад: установка числа об/мин 300, минимум 300, максимум 1000, установка скорости потока л/мин 0,1, минимум 0, максимум 0,6. Контроль гашения пенообразования: 1:9.

В ферментер вносили посевную культуру до значения OD650 нм 0,4-0,5. Эту посевную культуру выращивали в питательной среде LB (с канамицином) при 37°С, 220 об/мин в течение 8 ч. Сначала ферментацию проводили в периодическом режиме в течение 11,5 ч, после чего начинали подачу С+N с раствором для подпитки (стерилизованный раствор глюкозы (143 мл H2O+35 г глюкозы), в который после стерилизации было добавлено: 17,5 мл раствора (NH4)2SO4, 1,8 мл раствора MgSO4, 0,018 мл раствора микроэлементов, 0,360 мл раствора тиамина, 0,180 мл исходного раствора канамицина. Подпитку проводили при постоянной скорости потока приблизительно 4,2 мл/ч. Измерения глюкозы и NH4+ проводили извне для оценки доступности источников С и N в культуре. Обычно концентрация глюкозы оставалась очень низкой.

Культуры выращивали в течение суммарно 25 часов, где они, как правило, достигали значения OD650 нм 40-45. Затем продуцирование SHC начинали путем добавления в ферментер IPTG до концентрации приблизительно 1 мМ (в виде однократного добавления IPTG или в течение периода 3-4 часа с использованием инфузионного шприца), установки температуры на 40°С и pO2 на 20%. Индукцию продуцирования SHC продолжали в течение 16 ч при 40°С. По окончании индукции клетки собирали центрифугированием, промывали 0,1 М буферным раствором лимонной кислоты/цитрата натрия с рН 5,4 и хранили в виде осадков при температуре 4°С или -20°С до дальнейшего использования.

Результаты 1а

Как правило, при всех прочих неизменных условиях удельная активность продуцируемого биокатализатора была выше при использовании минимальной среды по сравнению с комплексной средой. Индукцию успешно осуществляли при температуре 30 или 37°С. Было отмечено, что при проведении индукции при 40-43°С получали биокатализатор с более высокой удельной активностью.

Результаты 1b

В приведенной ниже таблице 22 для 2 примеров показан объем культуры, оптическая плотность и количество клеток, как в начале, так и в конце индукции, а также количество собранной биомассы (сырая масса).

Таблица 22

OD650 нм на момент инокуляции: 0,45 (пример 1) и 0,40 (пример 2). Начальные объемы: 205 мл.

ПРИМЕР 2

Получение вариантов SHC и скрининг активности

Методы 2

Во избежание сомнений ЕЕ соответствует (3Е,7Е); смесь EZ соответствует (3Z,7E); ZE соответствует (7Z,3E); ZZ соответствует (7Z,3Z); и ЕЕН соответствует (3Е,7Е).

Программу изменения фермента проводили, используя ген SHC дикого типа (WT) Alicyclobacillus acidocaldarius (AacSHC) в качестве матрицы (GenBank M73834, Swissprot P33247). Была создана библиотека из приблизительно 10500 вариантов SHC, которую подвергали скринингу на поиск вариантов, проявляющих повышенную способность к замыканию цикла ЕЕН. Скрининг проводили в реакциях в цитратном буфере с рН 6,0 (0,150 мл), содержащем 4 г/л ЕЕН и 0,050% SDS, при 55°С и при постоянном перемешивании.

При отборе лучших вариантов для валидации стандартный тест проводили в цитратном буферном растворе рН 6,0, содержащем 4 г/л ЕЕН, 0,050% SDS, клетки, экспрессирующие варианты SHC, до значения OD600 нм 10,0. Конечный объем составлял 1 мл, реакционные смеси инкубировали при 55°С и энергично перемешивали с помощью магнитной мешалки. Отбор проб реакционной смеси в различные моменты времени позволял исследовать профили активности (конверсию ЕЕН в (-)-амброксид), определяемые с помощью анализа методом газовой хроматографии (см. приведенные ниже методы анализа).

Из данного цикла валидации были получены 3 варианта с повышенной активностью замыкания цикла ЕЕН (101А10, 111С8 и 215G2), и впоследствии в этих 3 вариантах было идентифицировано в общей сложности 8 мутаций. Впоследствии было проведено исследование мутаций, чтобы определить, какие из них полезны в отношении замыкания цикла ЕЕН с образованием амброксида. Кроме этого производного AacSHC, был сконструирован другой вариант AacSHC, который содержал все идентифицированные полезные мутации (SHC33, как показано в таблице 23 ниже). Условия скрининга были следующими: 4 г/л ЕЕН, клетки до OD650 нм 10,0, SDS до 0,05% и 0,1% (2 концентрации), и реакции проводили при 55°С при постоянном перемешивании.

Результаты 2а

Результаты 2b

Из трех отобранных мутаций (101А10, 111С8 и 215G2) лучшую активность показала мутация 215G2.

ПРИМЕР 3

Оптимизированные реакционные условия с вариантами SHC

Исследуемые параметры реакции: температура, концентрация SDS и рН

Методы 3

Реакционные условия для вариантов производных SHC, идентифицированных в таблице 23, были индивидуально оптимизированы в отношении температуры, рН и концентрации SDS. С этой целью клетки Е. coli трансформировали плазмидой для продуцирования индивидуальных вариантов, культивировали их в колбах Эрленмейера и индуцировали продуцирование SHC, как описано выше. Таким образом, гарантировали, что все культуры содержат одинаковые или очень сходные количества SHC. Клетки собирали центрифугированием, промывали 0,1 М цитратным буферным раствором (рН 6,0) и хранили при -20°С до дальнейшего использования.

Результаты 3

Итоговые результаты этого исследования оптимизации приведены ниже в таблице. Цикл оптимизации также проводили с SHC дикого типа.

В следующей таблице 24 показаны оптимальные реакционные условия для дикого типа и вариантов, рассматриваемые для характеризации каждого производного фермента SHC/HAC.

Обсуждение 3

В примере 3 показаны различия, отмеченные в реакционных условиях для производных фермента SHC по сравнению с WT SHC. Для вариантов SHC наблюдали значимые отклонения оптимальных значений температуры, рН и концентрации SDS от SHC дикого типа. Лишь небольшое число мутаций оказали значимый эффект на оптимальные реакционные условия биоконверсии. Для определения оптимальных реакционных условий для отдельных вариантов SHC реакции проводили при нагрузке субстрата 4 г/л ЕЕН и клеток, продуцирующих фермент SHC дикого типа или его производные, при оптимальной плотности OD650 нм 10,0.

Температура

Данные в таблице 24 показывают неожиданный результат, что, тогда как фермент WT SHC обладает оптимальной активностью при 55°С (в диапазоне 45-60°С), ряд производных SHC обладает оптимальной активностью при 35°С (34-50°С). Применение производных SHC по настоящему изобретению в способах получения (-)-амброксида из Е,Е-гомофарнезола при пониженных температурах реакции обладает значительными экономическими преимуществами для получения (-)-амброксида в промышленном масштабе.

Солюбилизирующий агент

SDS был отобран и идентифицирован из длинного перечня возможных солюбилизирующих агентов, которые не были пригодными в реакции биоконверсии (дополнительную информацию см. в примере 14).

SDS лучше чем, например, Тритон Х-100, в отношении скорости и выхода реакции (оба агента тестировали при использовании 4 г/л ЕЕН и 125 г/л ЕЕН, как приведено в примере 7).

ПРИМЕР 4

Тестирование активности вариантов SHC по сравнению с ферментом WT SHC в стандартных условиях

Методы 4

Продуцирование вариантов для сравнения относительной активности биокатализаторов (как описано в таблице 24) описано ниже. Клетки Е. coli трансформировали плазмидой для продуцирования одного из вариантов SHC, и впоследствии клетки Е. coli культивировали в питательной среде LB при 37°С и 280 об/мин, выращивали до значения OD650нм 0,50 и индуцировали Продуцирование фермента добавлением IPTG. Индукцию продолжали в течение 5,5 часов при 37°С, 280 об/мин. Клетки собирали центрифугированием, промывали 0,1 М цитратным буферным раствором рН 6,0 и хранили при -20°С до дальнейшего использования. При сравнении активности вариантов SHC (см. Фиг. 6) образец реакционной смеси наносили на полиакриламидный гель с SDS (SDS-PAGE) для анализа содержания SHC в реакционных смесях. Этот анализ подтвердил, что все реакционные смеси содержат идентичные количества фермента SHC.

Результаты 4а

На Фиг. 6 показаны относительные значения активности SHC дикого типа и его вариантов в стандартных условиях (рН 6,0, 55°С, 0,050% SDS, клетки до значения OD650 нм 10). Было также отмечено, что SHC дикого типа и по меньшей мере протестированные варианты SHC в соответствии с примерами настоящего изобретения толерантны к растворителю. Это означает, что в биоконверсионную реакционную смесь можно добавлять выбранные не смешиваемые с водой растворители (вплоть до почти 100%).

Результаты 4b

При использовании варианта 215G2 SHC заметного эффекта на активность этого варианта при добавлении в реакционную смесь NaCl (тестируемые концентрации от 5 до 100 мМ (только)) не наблюдали. Кроме того, при добавлении NaCl вплоть до 100 мМ или до 154 мМ (0,9% NaCl) отрицательного влияния на активность SHC для варианта 215G2 не показано. Этот результат позволяет предположить, что при проведении реакции биоконверсии в физиологическом растворе NaCl (0,9%) или подобном ему растворе и поддержании рН при соответствующем значении (например, приблизительно 5,4 (5,2-5,6)) реакцию биоконверсии можно проводить в отсутствие буфера, но в присутствии физиологического раствора NaCl или подобного ему раствора.

Обсуждение 4

На Фиг. 6 проиллюстрировано ранжирование активности отдельных вариантов и ферментов SHC дикого типа в отношении конверсии ЕЕН в (-)-амброксид.

ПРИМЕР 5

Профили активности WT SHC и производного SHC

Методы 5

Тест на активность проводили в 0,1 М цитратном буфере в объеме 5 мл при постоянном встряхивании при 900 об/мин на аппарате Heidolph Synthesis 1. Значение рН используемого буферного раствора, температура, при которой проводили реакцию, и концентрация SDS (додецилсульфата натрия) в реакционной смеси зависели от используемого варианта SHC (дикого типа или варианта). Сводные данные оптимальных условий для каждого из тестируемых вариантов приведены выше в таблице 24.

В качестве исходного материала использовали гомофарнезол чистоты 96% и субстрат гомофарнезол с соотношением EEH:EZH 87:13.

Во избежание сомнений, смесь EE:EZ представляет собой смесь изомеров ((3Е,7Е) и (3Z,7E).

Результаты 5

Используемый гомофарнезол: EEH:EZH 87:13, чистота (NMR): 96%.

Результаты проведения стандартного теста в оптимизированных условиях, показанные на Фиг. 7В (профили активности производных SHC относительно WT SHC) и на Фиг. 7А, показывают относительное повышение активности производных SHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч).

Используемый гомофарнезол: EEH:EZH 92:08, чистота (NMR): 100%

Результаты проведения стандартного теста в оптимизированных условиях, показанные на Фиг. 8В (профили активности производных AacSHC относительно WT AacSHC) и на Фиг. 8А, показывают относительное повышение активности производных AacSHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч).

Используемый гомофарнезол: EEH:EZH 66:33, чистота (NMR): 76%

Результаты проведения стандартного теста в оптимизированных условиях, показанные на Фиг. 9 В (профили активности производных AacSHC, как показано в таблице 24, относительно WT AacSHC) и на Фиг. 9А, показывают относительное повышение активности производных AacSHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч).

Обсуждение 5

Основной вывод состоит в том, что независимо от качества используемого субстрата гомофарнезола четыре лучших производных фермента SHC были ранжированы в следующем порядке: 215GSHC, SHC26, SHC32 и SHC3.

ПРИМЕР 6

Определение баланса массы из реакционных смесей, полностью экстрагированных растворителем

Методы 6

Все условия оставались неизменными, и для каждого варианта проводили 2 реакции. В качестве субстрата использовали гомофарнезол. После 4 часов и 22 часов инкубации продукт реакции и непрореагировавший субстрат полностью экстрагировали для каждого из вариантов отмывками в общем количестве 6 равным объемом трет-бутил-метилового эфира (MTBE/tBME). Содержание гомофарнезола и амброксида в каждой из отмывок определяли с помощью анализа GC. Общее количество образовавшегося амброксида и остаточного гомофарнезола рассчитывали по калибровочным кривым, которые строили с использованием растворов, приготовленных из аутентичного амброксида и гомофарнезола.

Результаты 6

Результаты на Фиг. 10 показали, что с используемым субстратом было подтверждено, что 3 лучших варианта проявляют приблизительно 10-кратное (215G2), 7-кратное (SHC26) и 6-кратное (SHC32) повышение активности по сравнению с ферментом SHC дикого типа.

ПРИМЕР 7

Результативность биотрансформации при 125 г/л Е,Е-гомофарнезола (ЕЕН)

Методы 7

Цель состояла в определении повышения волюметрической производительности с использованием варианта 215G2SHC. Для оптимизации условий тестовой реакции, включающих параметры рН, концентрацию клеток и концентрацию SDS, был создан дизайн серии экспериментальных исследований (ДЭИ). Реакционные условия были следующими: 125 г/л ЕЕН (из гомофарнезола EE:EZ 86:14), 250 г/л клеток, 1,55% SDS, при этом реакцию проводили при 35°С в 0,1 М цитратном буфере рН 5,4.

Типичную реакцию (общий объем 150 г) проводят, как описано ниже, в ферментерах Infors емкостью 0,75 л. В реакционный сосуд загружают необходимое количество гомофарнезола, соответствующее 18,75 г ЕЕН. Добавляют 2,33 г SDS из 15,5% (масс./масс.) раствора, приготовленного в 0,1 М цитратном буферном растворе рН 5,4. Суспензию клеток готовят из клеток Е. coli, которые продуцировали вариант 215G2 SHC, путем суспендирования клеток в 0,1 М цитратном буферном растворе рН 5,4. После определения сырой массы клеток этой суспензии центрифугированием в течение 10 мин при 10°С и 17210g в реакционный сосуд добавляют необходимый объем клеток с целью введения в реакционную смесь 37,5 г клеток. Объем реакционной смеси дополняют до 150 г необходимым количеством реакционного буферного раствора. Реакцию проводят при 37°С при постоянном перемешивании при 900 об/мин. Регулирование рН проводят, используя 40% водный раствор лимонной кислоты. Образцы реакционной смеси (1 мл) отбирают в различные моменты времени, экстрагируют 5 объемами MTBE/tBME (5 мл). Содержание гомофарнезола и амброксида в реакционной смеси определяли с помощью анализа методом GC после осветления фазы растворителя центрифугированием (настольная центрифуга, 13000 об/мин, 2 мин), 10-кратное разведение MTBE/tBME.

Такую же реакцию проводили с клетками E. coli, которые продуцировали фермент SHC дикого типа. В этом случае реакцию проводили при 55°С в 0,1 М цитратном буферном растворе рН 6,0. Сводные данные реакционных условий для этого примера приведены в строке 2 таблицы 24а ниже. Реакционные условия, представленные в строке 1 таблицы 24а ниже, взяты из предыдущих примеров (например, примеров 3-5).

Результаты 7

На Фиг. 11 представлена наблюдаемая конверсия ЕЕН в амброксид 2 ферментами. После 7 часов реакции (оценка начальной скорости реакции) конверсия вариантом 215G2 SHC была в 13 раз выше по сравнению с конверсией, достигаемой SHC дикого типа. После 48 часов реакции конверсия вариантом была приблизительно в 8 раз выше, чем для фермента дикого типа.

Общие примечания 7

Концентрация клеток

Все концентрации клеток (г/л) в реакционных смесях, описанных в этом примере, указаны в виде сырой массы клеток. Концентрацию в виде сырой массы клеток (г/л) суспензии клеток определяют после центрифугирования образца этой суспензии клеток в течение 10 мин при 17210g и 4°С.

Корреляция между г/л клеток и OD650 нм

При использовании биоконверсии 125 г/л ЕЕН с 215G2 SHC или WT SHC 250 г/л клеток в этой реакции соответствует значению OD650 нм приблизительно раному 172 в данной реакции. При тестировании различных препаратов биокатализатора наблюдали изменения в отношении значения OD650 нм к количеству биокатализатора. При использовании биокатализатора при 4 г/л ЕЕН, но применяя клетки до значения OD650 нм 10,0, определили, что OD650 нм 10,0 эквивалентна 1,45 г/л клеток.

Обсуждение 7

Данные показывают, что оптимизированный и эффективный способ биоконверсии НАС был разработан с использованием относительно высоких концентраций субстрата ЕЕН (125 г/л) по сравнению с документами уровня техники, где раскрыта концентрация субстрата гомофарнезола, составляющая лишь от приблизительно 0,2 г/л (см. JP 2009060799) до приблизительно 2,36 г/л (10 мМ) (см. WO 2010/139719 А2, US 2012/0135477 A1) и Seitz et al (2012), цитируется выше).

ПРИМЕР 8

Анализ GC

Методы 8

Для количественного определения содержания ЕЕН и амброксида образцы экстрагировали соответствующим объемом трет-бутилметилового эфира (MBTE/tBME). Фракцию растворителя отделяли от водной фазы центрифугированием, после чего проводили анализ методом газовой хроматографии. 1 мкл фазы растворителя инъецировали (коэффициент деления потока 3) на колонку 30 м × 0,32 мм × 0,25 мкм Zebron ZB-5. Хроматографию на колонке проводили при постоянном потоке (4 мл/мин H2) с градиентом температуры: 100°С, 15°С/мин до 200°С, 120°С/мин до 240°С, 4 мин при 240°С, что приводило в результате к разделению амброксида, ЕЕН и EZH. Температура на входе составляла 200°С, температура детектора: 300°С.

Конверсию ЕЕН рассчитывали, исходя из площадей пиков, соответствующих амброксиду и ЕЕН, по следующей формуле:

конверсия (%) = 100 × (Площадь амброксид_пик/(Площадь амброксид_пик + Площадь E,Е-гомофарнезол_пик))

Подлинность продукта реакции амброксида подтверждали посредством GC-MC (зарегистрированные значения и интенсивности: m/z 221 (100%), m/z 97 (40%), m/z 137 (3,3%), m/z 43 (2,6%), m/z 41 (2,5%), m/z 55 (2,4%), m/z 95 (1,9%), m/z 67 (1,8%), m/z 81 (138%), m/z 222 (1,7%)).

Обсуждение 8

Извлечение продукта проводили либо путем экстракции растворителем, либо экстракции паром. Используемые растворители представляли собой, например, МТВЕ или гексан: изопропанол (3:2). Реакционную смесь многократно экстрагировали равными объемами растворителя, и фракции растворителя подвергали анализу GC до тех пор, пока ни субстрат, ни продукт больше не обнаруживались. Как правило, было достаточно от 5 до 6 отмывок. Альтернативно, экстракцию продуктов реакции осуществляли паром.

ПРИМЕР 9

Реакция, протекающая в одном реакционном сосуде

Методы 9

Проводили ферментацию 200 мл с E. coli BL21 (DE3), трансформированной плазмидой рЕТ28а(+) 215G2 SHC для продуцирования 215G2 SHC с N-концевой His-меткой, используя стандартный протокол выращивания и индукции, описанный выше. В конце фазы индукции аэрацию отключали, температуру устанавливали на 35°С, рН доводили до 5,5 лимонной кислотой, а скорость мешалки - до 500 об/мин. Объем культуры рассчитывали с учетом всех добавлений, проведенных в процессе выращивания культуры (подпитки и потребления основания). В соответствии с этим объемом и OD культуры в ферментер добавляли необходимое количество SDS. Добавляли ЕЕН до 4 г/л. Из реакционной смеси отбирали образцы в различные моменты времени, образцы (150-300 мкл) экстрагировали 700 мкл МТВЕ для анализа GC. Конверсия ЕЕН в амброксид происходила непосредственно в бульоне для культивирования. Реакцию проводили в общей сложности в течение 22,5 дней, в течение которых многократно добавляли ЕЕН.

Результаты 9

По достижении завершения реакции 10,6 г ЕЕН циклизовалось с получением амброксида. Продукты реакции (структуры приведены ниже) экстрагировали паром и количественно извлекали из реакционной смеси.

Примечание относительно продуктов реакции

При конверсии гомофарнезола EE:EZ 87:13 посредством SHC образуются продукты реакции: амброксид, продукты (II), (IV) и (III), как представлено на Фиг. 12, и их соотношение отражает соотношение EE:EZ исходного материала.

При использовании в качестве исходного материала ЕЕН образуются только (-)-амброксид (I) и продукт (IV).

При использовании в качестве исходного материала EZH (3Z,7E) образуются только продукты (II) и (III).

Однако при использовании смеси ЕЕН и EZH образуются амброксид (I) и продукты (II), (IV) и (III).

При 100% конверсии EE:EZ 66:34 будет получено 66%:34% ((амброксид+(IV)):((II)+(III)).

При проведении экстракции паром экстрагируются все 4 продукта - амброксид и продукты (II), (IV) и (III), а в результате этапа кристаллизации образуется амброксид чистоты 99% (GC) при выходе по меньшей мере 70%.

Обсуждение 9

Эти данные демонстрируют, что получение (-)-амброксида возможно в биоконверсионной реакционной среде или в реакционной системе «реакции, протекающей в одном реакционном сосуде», и что селективное обогащение амброксидом достигается в результате экстракции паром и кристаллизации.

Если исходное вещество гомофарнезола представляет собой смесь изомеров ЕЕ и EZ (например, 86:14), из каждого из этих изомеров образуется 2 продукта (всего 4), при этом (-)-амброксид, тем не менее, является основным компонентом неочищенного продукта и преобладающим компонентом в кристаллизованном материале (чистота 99,1%). (+)-Амброксид не был обнаружен.

ПРИМЕР 10

Конверсия смесей гомофарнезола EE:EZ

Во избежание сомнений, ЕЕ соответствует (3Е,7Е); смесь EZ соответствует (3Z,7E); ZE соответствует (7Z,3E); ZZ соответствует (7Z,3Z); ЕЕН соответствует (3Е,7Е); и EZH соответствует (3Z,7E).

Методы 10

Смеси EE:EZ подвергали биоконверсии в следующих реакционных условиях: суммарное содержание гомофарнезола составляло 146 г/л при концентрации клеток 250 г/л и SDS 1,55%, и использовали следующие субстраты гомофарнезола (смеси гомофарнезола EE:EZ):

EE:EZ 86:14 (самое высокое содержание ЕЕН для данного примера),

EE:EZ 69:31 (самое низкое содержание ЕЕН для данного примера),

EE:EZ 80:20

ЕЕН: EZH 70:30

Биоконверсия смеси гомофарнезола 7Е, 3Е/7Е, 3Z

Биоконверсию проводили с использованием следующих реакционных условий:

Реакцию (суммарный объем 150,1 г) проводили в 0,1 М буферном растворе лимонной кислоты/цитрата натрия рН 5,4 в ферментере Infors НТ емкостью 750 мл, содержащем общее количество гомофарнезола 146 г/л, используя субстрат гомофарнезол, который представлял собой смесь 7E,3E:7E,3Z 86:14, 250 г/л клеток (полученных в соответствии со способом примера 1) и 1,55% SDS. Реакцию проводили при 35°С при постоянном перемешивании (800 об/мин), регулирование рН проводили, используя 10-40% водный раствор лимонной кислоты. Из реакционной смеси отбирали образцы в различные моменты времени, образцы экстрагировали растворителем для анализа GC. Было отмечено, что конверсия гомофарнезола происходит одинаково быстро при 2 качественных вариантах гомофарнезола (EE:EZ 86:14 и EE:EZ 69:31).

Результаты 10

Конверсию обоих изомеров Е,Е- и Е,Z-гомофарнезола наблюдали при проведении биоконверсии 125 г/л Е,Е-гомофарнезола из материала EEH:EZH 86:14 с использованием WT SHC и одного конкретного производного SHC (215G2 SHC). Таким образом, фермент SHC дикого типа из Alicyclobacillus acidocaldarius образует такие же продукты реакции (т.е. амброксид, продукты (II), (IV) и (III)) из материала EEH:EZH 86:14, как и варианты SHC из таблицы 23 из смесей EEH:EZH. На Фиг. 13 и 14 приведен анализ GC продуктов реакции для амброксида и продуктов (II), (IV) и (III).

Обсуждение 10

В результате биоконверсии гомофарнезола в амброксид в соответствии с настоящим изобретением образуется (-)-амброксид как преобладающее соединение, но могут также образоваться идентифицированные выше соединения, отличающиеся от (-)-амброксида (например, соединения (II), (IV) и (III)) которые могут придавать или не придавать благоприятные ольфакторные ноты продукту (-)-амброксиду. Как показано выше, в условиях селективной кристаллизации амброксид можно отделить от других побочных продуктов ((II), (IV) и (III)). Соответственно, в случае отрицательного влияния на сенсорный характер конечного продукта амброксида селективное отделение продуктов (II), (IV) и (III) от конечного продукта (-)-амброксида повышает его ценность в качестве аорматизирующего пордукта, или корригента, или косметического продукта, или потребительского продукта для ухода. Сенсорный анализ проводят с использованием хорошо разработанных сенсорных тестов, используемых подготовленными парфюмерами. Чистота конечного продукта (-)-амброксида может быть показателем ольфакторного качества продукта в том случае, если продукт сам по себе, в основном, определяет желаемый сенсорный профиль.

ПРИМЕР 11

Конверсия ЕЕН из смеси ЕЕ:EZ:ZE:ZZ-гомофарнезола

Методы 11

ЕЕ:EZ:ZE:ZZ-Гомофарнезол 40:26:20:14 использовали в качестве субстрата для конверсии ЕЕН с использованием 215G2 SHC. В сравнительных целях также использовали другой гомофарнезол EE:EZ 2:1 или 93:07.

Конверсию смеси ЕЕ:EZ:ZE:ZZ-гомофарнезола исследовали с вариантом 215G2 SHC, но не в оптимизированных условиях. Реакционные условия были следующими: рН 5,8 в 100 мМ цитратном буфере, 0,10% SDS, 40°С. При проведении всех реакций при постоянной концентрации 2 г/л ЕЕН (с соответственно измененными общими концентрациями гомофарнезола) наблюдали описанные ниже коэффициенты конверсии ЕЕН.

Результаты 11

Наблюдали следующие коэффициенты конверсии смеси изомеров гомофарнезола:

EE:EZ 2:1 50-55% EE:EZ 93:7 78% EE:EZ:ZE:ZZ 40:26:20:14 6%

Обсуждение 11

Помимо наблюдаемых значений выхода, эти данные показывают, что вариант 215G2 SHC способен осуществлять конверсию ЕЕН в амброксид из комплексной смеси EE:EZ:ZE:ZZ гомофарнезола. Как и ожидали, наблюдали, что более низкий коэффициент конверсии приводил в результате к снижению выхода амброксида. Этот результат согласуется с точкой зрения, что изомеры гомофарнезола, отличающиеся от ЕЕН, могут конкурировать с ЕЕН за доступ к производным фермента SHC/HAC и, следовательно, могут действовать как конкурентные ингибиторы и/или альтернативные субстраты конверсии ЕЕН в (-)-амброксид.

ПРИМЕР 12

Сравнительные данные для цельноклеточной биоконверсии с использованием Тритона Х-100 и SDS

Методы 12

Клетки-хозяева Е. coli выращивали в соответствии с протоколом Методов 4 из Примера 4. Реакцию биоконверсии с использованием варианта 215G2SHC проводили в соответствии со стандартным тестом примера 4. В качестве наиболее подходящих реакционных условий для варианта 215G2 SHC были выбраны: концентрация гомофарнезола 4 г/л при количестве клеток до значения OD650 нм 10,0 в буферном растворе лимонной кислоты/фосфата натрия 0,1 М рН 5,4, 35°С и SDS в концентрации 0,07%.

Результаты 12

На Фиг. 15 приведено сравнение активности варианта 215G2SHC в количественном анализе цельноклеточной биоконверсии при использовании Тритона Х-100 в диапазоне концентрации от 0,005% до 0,48% и SDS в концентрации 0,07%.

Обсуждение 12

Данные показывают, что максимальная активность с использованием Тритоном Х-100 составляла лишь около 20% активности, полученной с использованием SDS.

ПРИМЕР 13

Отношение SDS/клетки

Методы 13

Реакцию биоконверсии осуществляли в соответствии с Методами 4 из Примера 4, используя концентрацию субстрата ЕЕН 4 г/л, клетки при значении OD650 нм 5,0, в результате которой получили производное фермента 215G2 SHC.

Результаты 13

Результаты, представленные на Фиг. 16, показывают процентную долю конвертированного ЕЕН для различных соотношений SDS/клетки.

На Фиг. 16 показано, что процентная доля конверсии ЕЕН в (-)-амброксид с использованием различных значений соотношения SDS/клетки зависит от соотношения SDS/клетки. Это соотношение должно быть тщательно установлено для достижения максимальной конверсии.

Например, в случае слишком низкой концентрации SDS может наблюдаться субоптимальная конверсия гомофарнезола. С другом стороны, например, при слишком высокой концентрации SDS может быть риск повреждения биокатализатора за счет разрушения интактной клетки микроорганизма и/или денатурации/инактивации фермента SHC/HAC. При проведении реакции биоконверсии в соответствии с Методами 7 из Примера 7 с использованием 125 г/л ЕЕН и 250 г/л биокатализатора наилучший протокол биоконверсии показал соотношение [SDS]/[клетки] 16:1.

Обсуждение 13

Результаты показывают, что существует некоторая степень независимости между концентрацией солюбилизирующего агента (SDS), количеством биомассы и концентрацией субстрата (ЕЕН). В качестве примера, при повышении концентрации субстрата гомофарнезола для эффективного протекания реакции биоконверсии требуются достаточные количества биокатализатора и солюбилизирующего агента (SDS).

ПРИМЕР 14

Тестирование возможных солюбилизирующих агентов для применения в реакции биоконверсии

Методы 14

В качестве возможного заменителя SDS тестировали различные солюбилизирующие агенты (представленные в таблице 26 ниже) в реакциях замыкания цикла ЕЕН ферментом 215G2 SHC, используя такие же условия, как в стандартном тесте (4 г/л ЕЕН, клетки до значения OD650 нм 10,0). С использованием стандартного теста также тестировали возможность усиления активности (кумулятивный эффект) за счет комбинирования SDS при его оптимальной концентрации (0,060-0,070%) с другими используемыми солюбилизирующими агентами, оптимальные концентрации которых определяли индивидуально на основании скрининга, проведенного с этими соединениями (см. таблицу 26 ниже). Кроме того, также тестировали «глубокие эвтектические растворители» и ионные жидкости, известные как способствующие солюбилизации нерастворимых в воде соединений.

Результаты 14

В следующей таблице 26 приведены сводные данные о солюбилизирующих агентах (например: поверхностно-активных веществах, детергентах, усилителях растворимости и т.п.), протестированных к настоящему времени в реакциях замыкания цикла ЕЕН ферментом 215G2 SHC. Ни в одном случае не наблюдали повышения активности по сравнению с контрольной реакцией, проведенной с использованием SDS в диапазоне концентрации 0,060-0,070%. Активность, наблюдаемая при использовании этих соединений по отдельности при концентрации, определенной как оптимальная, составляли лишь приблизительно 20% от полученных в контрольных реакциях с SDS. Было отмечено, что при полном отсутствии добавления солюбилизирующего агента достигалась 20% конверсия ЕЕН. При использовании SDS и добавлении дополнительного солюбилизирующего агента (при концентрации, определенной в тесте как оптимальная) синергического эффекта не наблюдали. Наблюдали, скорее, снижение процентной доли конверсии ЕЕН. На основании этого исследования был сделан вывод, что в условиях тестирования соединения вовсе не улучшают конверсию ЕЕН; скорее, было получено их нежелательное воздействие на замыкание цикла, и из исследованных солюбилизирующих агентов SDS наиболее полезен. Кроме того, при тестировании «глубоких эвтектических растворителей» и ионных жидкостей, которые, как известно, способствуют солюбилизации нерастворимых в воде соединений, также не было получено положительных результатов.

Обсуждение 14

Автором изобретения был выбран и идентифицирован SDS в качестве полезного солюбилизирующего агента из длинного перечня других солюбилизирующих агентов, которые не оказались полезными в реакции биоконверсии гомофарнезола в (-)-амброксид по настоящему изобретению.

ПРИМЕР 15

Чувствительность реакции биоконверсии к концентрации SDS

Методы 15

Применяемыми условиями являются условия стандартной биоконверсии (как описано в примере 7) при 125 г/л и 250 г/л биокатализатора и 1,55% SDS. Также были протестированы две другие концентрации SDS (1,40% и 1,70% SDS). Все концентрации SDS приведены в % масс./масс.

Условия стандартной реакции биоконверсии (как описано в примере 7) при 125 г/л и 250 г/л биокатализатора и 1,55% SDS также использовали для тестирования различных значений рН.

Контрольную реакцию проводили при рН 5,4 в 0,1 М цитратном буферном растворе. Для проведения реакций при низком рН использовали 0,1 М ацетатный буферный раствор.

Результаты 15

Данные, представленные на Фиг. 17, показывают, что реакция биоконверсии оказалась менее чувствительной к изменениям концентрации SDS, чем при тестировании активности НАС в стандартном тесте при 4 г/л ЕЕН и применяемом количестве клеток при OD650 нм 10,0.

Данные, представленные на Фиг. 18, показывают, что при применении реакции биоконверсии оказалась менее чувствительной к изменениям рН, чем при тестировании активности НАС в стандартном тесте при 4 г/л ЕЕН и применяемом количестве клеток при OD650 нм 10,0.

Обсуждение 15

Эти данные показывают робастность реакции биоконверсии при 125 г/л ЕЕН и 250 г/л клеток по отношению к тестируемым показателям - диапазону концентрации SDS и диапазону рН.

ПРИМЕР 16

Локализация идентифицированных мутаций SHC/HAC на кристаллической структуре

Положения мутаций, идентифицированных в вариантах AacSHC/HAC, отмечены на Фиг. 19 следующим образом: красным для варианта 215G2; пурпурным (винно-красным) для варианта 101А10 и зеленым для варианта 111С8. Для аминокислот, идентифицированных как ответственные за повышенную активность, боковые цепи выделены желтым цветом в сокристаллизованном аналоге субстрата. Другие мутации для идентифицированных вариантов без повышения активности отмечены синим цветом. Отмечено, что синие мутации распределены приблизительно пополам (т.е. 50:50) по 2 доменам фермента, при этом идентифицированные благоприятные мутации AacSHC локализованы, в основном (удаленно друг от друга), в домене 2. Единственное исключение составляет мутация F601Y, расположенная вблизи активного сайта. Если рассматривать только оба производных фермента SHC/HAC, представляющих собой 215G2 и 111С8, все мутации локализуются в домене 2. На Фиг. 20 та же информация представлена черным и белым цветом.

Результаты 16

Все полезные мутанты (красный/зеленый/пурпурный), соответствующие 215G2, 111С8 и 101А10, локализованы, в основном (кроме одного мутанта F601Y), в домене 2 (Wendt et al (1997) Science 277: 1811) кристаллической структуры SHC (как показано на Фиг. 19). Комбинации полезных мутаций SHC пронумерованы в соответствии с AacSHC дикого типа (SEQ ID NO: 1).

Обсуждение 16

Кристаллическая структура полезна для идентификации производных SHC/HAC с требуемым соотношением структуры/активности, особенно в отношении конверсии гомофарнезола в (-)-амброксид. Полезный этап предварительного отбора может ограничиться отбором аминокислотных остатков, локализованных в домене 2 кристаллической структуры SHC/HAC (см. Фиг. 19 и 20).

ПРИМЕР 17

Получение гомофарнезола

Методы 17

Общие условия анализов

Неполярная ЖХ/МС: 50°С/2 мин, 20°С/мин 200°С, 35°С/мин 270°С. Система ЖХ/МС Agilent 5975C MSD с системой ЖХ HP серия 7890А. Неполярная колонка: ВРХ5 производства компании SGE, 5% фенил 95% диметилполисилоксан 0,22 мм × 0,25 мм × 12 м. Газ-носитель: Гелий. Температура инжектора: 230°С. Разделение потоков 1:50. Скорость потока: 1,0 мл/мин. Линия передачи: 250°С. МС-квадруполь: 106°С. МС-источник: 230°С.

A) Получение N-метил-N-нитрозомочевины (MNU) в THF

Раствор мочевины (175 г, 2,9 моль) и метиламина гидрохлорида (198 г, 2,9 моль) в воде (400 мл) нагревают с обратным холодильником (105°С) в течение 3,5 ч при перемешивании. При 40°С добавляют раствор NaNO2 (101 г, 1,45 моль) в воде (200 мл). Через 15 мин добавляют THF (1000 мл), в результате чего получают 2-фазную прозрачную смесь. Концентрированную H2SO4 (110 г, 1,1 моль) добавляют при 0-5°С и перемешивают в течение 1,5 ч. Еще через 0,5 ч при 0-5°С разделяют две прозрачные фазы при 25°С. Органическую фазу (А) (1065 мл, теоретически 1,35 М) выдерживают в течение нескольких дней при 0-5°С или сразу переносят в реактор для циклопропанирования.

После разделения фаз водную фазу дважды экстрагируют THF (2х 1:1). В результате получают 1100 мл фазы В и 1075 фазы С. Если фаза А обеспечивает 51% конверсию концевого алкена в циклопропан при последующей реакции циклопропанирования, фаза В образует менее 0,5% циклопропана, а фаза С не дает обнаружимой конверсии. Авторы изобретения заключили, что после первого разделения фаз экстрагируется более 99% MNU. Поэтому после первого разделения фаз водную фазу обычно отбрасывают (из органической фазы А) после обработки концентрированным водным раствором KOH и уксусной кислотой.

B) Получение Е-Δ-фарнезена с использованием MNU в THF

N-метил-N-нитрозомочевину 1,35 М в THF (136 мл, 184 ммоль) добавляют по каплям при 0°С к быстро перемешиваемой смеси Е-бета-фарнезена (CAS 18794-84-8) (25 г, 122 ммоль) и водного раствора KOH (50 мл, 40%) при 0-5°С. После добавления 4 мл раствора MNU добавляют Pd(acac)2 (7,4 мг, 0,024 ммоль, 0,02%), предварительно растворенный в 0,5 мл дихлорметана.

Остальной раствор MNU добавляют в течение 4 ч при 0-5°С. На этой стадии GC показала 28% не преобразованного Е-β-фарнезена, 65% желаемого моноциклопропана (показано выше) и 3% бициклопропанированного соединения 5. После 16 ч при 25°С добавляют уксусную кислоту (100 мл) при 0-5°С с последующим добавлением трет-бутил-метилового эфира (250 мл). После разделения фаз органическую фазу промывают 2 М HCl (250 мл), и водную фазу экстрагируют трет-бутил-метиловым эфиром (250 мл). Объединенные органические слои промывают водой (2×100 мл), 10% водным раствором NaOH (2×100 мл) и водой (2×100 мл), высушивают над MgSO4, фильтруют и концентрируют с получением 26,9 г светло-желтой жидкости, которая содержит 9% Е-β-фарнезена, 82% желаемого соединения моноциклопропана и 6% бициклопропанированного побочного продукта.

Далее желаемое соединение можно выделить путем очистки дистилляцией. В результате добавления 1 г K2CO3 (1 г) и дистилляции на колонке из рулонной стали 30 см при 40-60 мбар получают 147 г соединения моноциклопропана (68%, скорректированный выход) при 135-145°С. Фракции объединяют с получением 92 г соединения моноциклопропана 100% чистоты.

Аналитические данные Е-Δ фарнезена:

1H-NMR (CDCl3, 400 МГц): 5.1 (2 m, 2 H), 4.6 (2 Н), 2.2 (2 Н), 2.1 (4 Н), 2.0 (2 H), 1.7 (s, 3 H), 1.6 (2 s, 6 H), 1.3 (1 H), 0.6 (2 H), 0.45 (2 Н) млн-1. 13C-NMR (CDCl3, 400 МГц): 150.9 (s), 135.1 (s), 131.2 (s), 124.4 (d), 124.1 (d), 106.0 (t), 39.7 (t), 35.9 (t), 26.7 (t), 25.7 (q), 17.7 (q), 16.0 (d), 6.0 (t) млн-1. ЖХ/МС: 218 (2%, М+), 203 (5%, [M - 15]+), 175 (11%), 147 (31%), 134 (15%), 133 (20%), 121 (12%), 107 (55%), 95 (16%), 93 (30%), 91 (20%), 82 (11%), 81 (33%), 79 (42%), 69 (100%), 67 (22%), 55 (20%), 53 (21%), 41 (75%). ИК (пленка): 3081 (w), 2967 (m), 2915 (m), 2854 (m), 1642 (m), 1439 (m), 1377 (m), 1107 (w), 1047 (w), 1018 (m), 875 (s), 819 (m), 629 (w). Аналитически вычислено для C16-H26: С, 88,00; Н, 12,00. Обнаружено: С, 87,80; Н, 12,01.

С) Получение (7Е)-4,8,12-триметилтридека-3,7,11-триен-1-ола ((7Е)-гомофарнезола)

Смесь (Е)-(6,10-диметилундека-1,5,9-триен-2-ил)циклопропана (Е-Δ фарнезена) (1 г, 4,6 ммоль), додекана (0,2 г, 1,15 ммоль, внутренний стандарт) и L-(+)-винной кислоты (1 г, 6,9 ммоль) в трубке под давлением нагревают при перемешивании при 150°С. Через 18 ч и после полной конверсии (в соответствии с GC) смесь наливают на смесь воды (50 мл) и толуола (50 мл).

Фазы разделяют, и водную фазу экстрагируют толуолом (50 мл). Объединенные органические слои промывают концентрированным водным раствором Na2CO3 (50 мл) и концентрированным раствором NaCl (2×50 мл), высушивают над MgSO4, фильтруют и выпаривают при пониженном давлении с получением коричневатой смолы (1,35 г), которую смешивают с 30% водным раствором KOH (4,3 мл) и перемешивают при 25°С в течение 2 ч. С помощью анализа методом GC выявлено образование 96% (7Е)-4,8,12-триметилтридека-3,7,11-триен-1-ола в соответствии с внутренним стандартом. Отношение E/Z 68:22. Данные анализа Е-изомера согласуются с данными литературы, см., например, Р. Kocienski, S. Wadman J. Org. Chem. 54, 1215 (1989).

Результаты 17

Данные показывают получение гомофарнезола, приемлемого для биоконверсии в (-)-амброксид.

Обсуждение 17

Способ получения гомофарнезола также подробно описан в двух одновременно поданных заявках на патент - РСТ/ЕР2014/072882 (WO 2015/059290) and РСТ/ЕР2014/072891 (WO 2015/059293) - полное содержание которых включено в настоящий документ посредством ссылки.

ПРИМЕР 18

Реакция, протекающая в одном реакционном сосуде

В данном эксперименте: Проводили (i) ферментацию штаммом E. coli, продуцирующим вариант 215G2 SHC (например, как описано в примере 1) с последующей (ii) конверсией ЕЕН непосредственно в ферментационной смеси. Поскольку 3 параметра [клетки], [ЕЕН] и [SDS] (г/л) связаны между собой, было необходимо скорректировать параметры [ЕЕН] и [SDS] в доступном объеме ферментационной смеси в зависимости от концентрации клеток (г/л), полученной в конце ферментации. Цель состояла в конверсии 125 г/л ЕЕН с использованием 250 г/л клеток при концентрации SDS 1,55%. Для обеспечения надлежащей биоконверсии клетки должны находиться в состоянии покоя в статусе истощения источника глюкозы. Аэрацию отключали.

Методы 18

Ферментация:

Для обеспечения достаточно точного определения объема ферментационного бульона в реакторе в конце ферментации регистрировали все объемы отбираемых образцов, а также объемы всех добавлений в ферментер (подпитки, основания, кислоты и т.д.).

Определение концентрации клеток в ферментационной смеси:

Для определения сырой массы клеток (г/л) отбирали образец ферментационной смеси (5-10 мл) при постоянном перемешивании и помещали в центрифужную пробирку. Регистрировали массу образца. Образец центрифугировали в течение 10 мин при 17210g и 4°С (например, 12000 об/мин, ротор SS-34, центрифуга Sorvall RC3B). Супернатант осторожно отбирали пипеткой и регистрировали массу осадка. Концентрацию клеток на основании сырой массы определяют как гклетоксмеси или гклетоксмеси.

Объем ферментационной смеси в ферментере определяли с учетом всех добавлений и отборов. В случае нахождения ферментера на весах массу ферментационной смеси определяли путем взвешивания, в ином случае 1 мл принимали за 1 г.

Определение необходимых количеств гомофарнезола и SDS:

В соответствии с определенной концентрацией клеток и объемом ферментационной смеси определяли количество Е,Е-гомофарнезола и SDS для добавления в реактор с целью сохранения одинакового соотношения между 3, как описано в примере биоконверсии примера 9: 125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS.

Осуществление биоконверсии:

1. Температуру устанавливали на 35°С. Аэрацию отключали.

2. В ферментационную смесь добавляли рассчитанное количество гомофарнезола.

3. Необходимое количество SDS осторожно добавляли из водного исходного 15,5% раствора SDS.

4. Реакционную смесь тщательно перемешивали в течение приблизительно 15 мин при 800 млн-1.

5. Регистрировали рН реакционной смеси (внутренний электрод для измерения рН).

6. Образец (приблизительно 1 мл) отбирали в 15 мл пробирку Falcon. Добавляли приблизительно 5 мл деионизированной воды, и после тщательного перемешивания регистрировали рН на внешнем калиброванном электроде.

7. рН в реакторе пошагово устанавливали на 5,4 (значение, измеренное на внешнем калиброванном электроде) с использованием 85% H3PO4, при этом контролируя рН на внешнем электроде, как описано выше (6.).

8. В ходе биоконверсии регулировали рН, используя, например, 10-25% H3PO4 и 32% NaOH.

10. Отбор образцов реакционной смеси: приблизительно 1 мл реакционной смеси помещали в пробирку Falcon емкостью 15 мл. Добавляли приблизительно 5 мл МТВЕ. Образец экстрагировали при энергичном перемешивании. Аликвоту центрифугировали в настольной центрифуге в течение 1 мин при максимальной скорости (пробирка Eppendorf). 100 л фазы растворителя добавляли в виалу для GC, содержащую 900 л МТВЕ. В течение первого дня биоконверсии образцы отбирали один раз в 1-1,5 часа. В последующие дни отбирали только 3 образца.

11. 1 л фазы растворителя анализировали на содержание амброксида и ЕЕН, как описано в примере 8.

12. Конверсию ЕЕН (%) рассчитывали как 100×(амброксидплощадь/(амброксидплощадь+ЕЕНплощадь)).

Результаты 18

Результаты демонстрируют, что ферментацию и конверсию ЕЕН проводили в одном реакционном сосуде в реакторе KLF2000 (Bioengineering) в масштабе 1,9 литров. 251 г/л клеток обеспечивали конверсию 238 г ЕЕН (251 г/л клеток) до не менее 93% за 47 часов. При измерении через 93 ч после начала конверсия составляла 99%.

Подобный эксперимент в одном реакционном сосуде проводили в реакторе Infors HT емкостью 0,75 л. После ферментации в соответствии со стандартным протоколом (пример 1) добавляли клетки из реактора, собранные из других экспериментов по ферментации, проведенных параллельно по такому же протоколу. Полученный в результате объем смеси составлял 479 г. Концентрация клеток была определена как 313,7 г/л, что составляло 1,25x концентрацию клеток при стандартной биоконверсии (250 г/л клеток). В реактор добавляли соответствующие количества ЕЕН и SDS. Конверсия 75,1 г ЕЕН (эквивалентно 157 г/л ЕЕН в этом примере) составляла 98% менее чем за 90 ч. Этот результат демонстрирует возможность проведения ферментации и конверсии ЕЕН в одном реакционном сосуде при концентрации не менее 125 г/л ЕЕН, если при проведении ферментации используют клетки, продуцирующие вариант 215G2 SHC, при достаточно высокой плотности клеток.

Обсуждение 18

Преимущественно была получена 99% конверсия субстрата, что весьма полезно с коммерческой точки зрения при использовании дорогостоящего исходного материала (например, ЕЕН).

ПРИМЕР 19

Повышение волюметрической продуктивности

Методы 19

Чтобы дополнительно повысить волюметрическую продуктивность, использовали 1,5х концентрированную биоконверсионную реакционную смесь, содержащую 375 г/л клеток, 188 г/л ЕЕН, 2,33% SDS. Параллельно проводили стандартную биоконверсию с использованием 125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS (пример 7). 2 реакции проводили в реакторах Infors HT емкостью 0,750 л, все остальные параметры оставались неизменными.

Результаты 19

Результаты на Фиг. 22 демонстрируют, что процентная доля конверсии через 75 ч после начала составляла 88% при 1,5х биоконверсии по сравнению с 95% при стандартной биоконверсии. Процентная доля конверсии через 96 ч после начала составляла 93% конверсии ЕЕН при 1,5х биоконверсии по сравнению с 97% при стандартной биоконверсии. Процентная доля конверсии при 1,5х биоконверсии составляла 96% от полученной при стандартной биоконверсии, было отмечено, что со временем перемешивание при 1,5х биоконверсии становилось более затруднительным по мере исчезновения маслянистого гомофарнезола, замещаемого твердыми продуктами реакции. Этим можно объяснить несколько сниженный уровень конверсии при 1,5х биоконверсии. Использование реактора, оборудованного улучшенным перемешивающим устройством, может улучшить конверсию ЕЕН при 1,5х биоконверсии. Этот результат показывает, что можно проводить реакции биоконверсии при 188 г/л ЕЕН или более при условии достижения эффективного перемешивания, поскольку эффективность перемешивания, по-видимому, является единственным ограничением системы.

Производительность (-)-амброксида

«Производительность (-)-амброксида» относится к количеству извлекаемого (-)-амброксида в граммах на литр объема биотрансформации в час времени биоконверсии (т.е. времени после добавления субстрата). В связи с этим и со ссылкой на Фиг. 22 производительность (-)-амброксида рассчитывают, как описано ниже:

Биоконверсия 125 г/л ЕЕН (250 г/л клеток)

производительность через 1,25 ч: 10,3 грамма на литр в час

производительность через 8,25 ч: 6,3 грамма на литр в час

производительность через 21,25 ч: 4,1 грамма на литр в час

Биоконверсия 187.5 г/л ЕЕН (375 г/л клеток)

производительность через 1,25 ч: 12,2 грамма на литр в час

производительность через 8,25 ч: 8,2 грамма на литр в час

производительность через 21,25 ч: 5,5 грамма на литр в час

Можно считать, что производительность, рассчитанная через приблизительно 6-8 часов после начала, является репрезентативной для начальной скорости реакции, которая лучше всего описывает максимальный коэффициент конверсии системы.

При типичных биоконверсиях с использованием 125 г/л ЕЕН с 250 г/л клеток показана производительность амброксида от 6,3 до 8,5 граммов на литр в час через приблизительно 6-8 часов (репрезентативная для начальной скорости реакции).

ПРИМЕР 20

Замена реакционного буферного раствора раствором NaCl

Методы 20

Стандартную биоконверсию (125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS) проводили, как описано в примере 7, но с заменой цитратного буферного раствора рН 5,4 на 0,5% или 0,9% NaCl, при этом все остальные параметры реакции не менялись. Параллельно в качестве контроля проводили биоконверсию в цитратном буферном растворе.

Результаты 20

Результаты на Фиг. 23 показывают, что коэффициент конверсии ЕЕН был одинаковым при проведении реакций в буферном растворе и в 0,9% растворе NaCl. Коэффициент конверсии был ниже при проведении реакции только в 0,5% NaCl. Этот результат показывает возможность проведения биоконверсии в отсутствие обеспечиваемой буфером точной регуляции рН и обеспечение достаточной ионной силы.

ПРИМЕР 21

Экстракция твердой фазы из реакционного бульона

С учетом того, что (-)-амброксид нерастворим в воде и не является жидким при температурах ниже приблизительно 75°С, эти свойства рассматривали как возможное преимущество для экстракции продукта из твердой фазы биотрансформации с использованием либо смешиваемых с водой (например, этанола), либо не смешиваемых с водой (например, толуола) растворителей.

Методы 21

200 мл реакционной смеси центрифугировали, чтобы отделить твердую фазу от жидкой (водной) (Sorvall GS3, 5000 об/мин, 10 мин, 10°С). Таким образом отделяли приблизительно 80 мл твердого осадка от приблизительно 120 мл жидкой фазы. Анализ (газовая хроматография, пример 8) водной фазы после экстракции МТВЕ показал, что она содержит не более чем приблизительно 0,3% (-)-амброксида, исходно присутствующего в 200 мл реакционной смеси. Для экстракции амброксида из твердой фазы использовали толуол и 99% этанол.

Результаты 21

Экстракция толуолом:

80 мл твердой фазы экстрагировали 6 раз 45 мл толуола (приблизительно объема твердой фазы, при энергичном перемешивании в течение 30 с и центрифугировании (Sorvall GS3, 5000 об/мин, 10 мин, 10°С). Проводили анализ методом GC для определения содержания (-)-амброксида в фазе растворителя. Более 99,5% (-)-амброксида, исходно присутствующего в реакционной смеси, экстрагировали в результате 6 экстракций, при которых общий объем толуола составляет 1,35х исходного объема реакционной смеси (200 мл) или 3,4х объема твердой фазы. На графике на Фиг. 24 показано изменение экстракции по мере проведения отмывок толуолом в виде % от количества (-)-амброксида, первоначально присутствовавшего в 200 мл всей реакционной смеси (за счет соотношения объема реакционная смесь/толуол % в первом экстракте превышает 100%).

Экстракция этанолом:

80 мл твердой фазы экстрагировали (Infors Multifors HT, 35°С, 1000 об/мин, 30 мин) приблизительно 160 мл (2 объема) 99% этанола с последующим центрифугированием. В ходе процедуры экстракции кристаллизация амброксида не происходила. На графике на Фиг. 25 показано, что после 4 отмывок (всего 640 мл EtOH, т.е. 3,2х начального объема всей реакционной смеси или 8х от объема твердой фазы) было извлечено приблизительно 99% (-)-амброксида, первоначально присутствующего в реакционной смеси. На первой стадии экстракции необходимо достаточное количество этанола, чтобы предотвратить кристаллизацию амброксида (растворимость в этаноле). При использовании только 1 или объема твердой фазы на первой стадии экстракции получили липкую пасту, с которой было трудно обращаться, и (-)-амброксид кристаллизовался в виде игольчатых кристаллов на осадке после центрифугирования. Температура, по-видимому, не является фактором, ответственным за эту кристаллизацию (экстракцию и центрифугирование тестировали при комнатной температуре и приблизительно при 35°С-40°С).

За образование кристаллов, по-видимому, ответственна концентрация (-)-амброксида в фазе EtOH, а также соотношение EtOH/вода в жидкой фазе (остаточное содержание влаги в твердой фазе). Тем не менее было отмечено, что объем этанола можно уменьшить до 1 объема твердой фазы.

Примечание 21

Поскольку (-)-амброксид не находится в жидкой фазе при комнатной температуре, он выделяется вместе с биомассой и может быть экстрагирован органическим растворителем (например, смешиваемым с водой растворителем (например, этанолом) или не смешиваемым с водой растворителем (например, толуолом). Стадия центрифугирования, которая отделяет (-)-амброксид в твердой фазе реакционной смеси, обладает преимуществом, поскольку позволяет уменьшить количество растворителя, необходимое для экстракции (-)-амброксида.

ПРИМЕР 22

Сенсорный анализ

Цель: проведение сенсорного анализа (-)-амброксида и побочных продуктов (соединений II, III и IV), образующихся в «неочищенном» экстракте и в «кристаллизованном» экстракте.

Результат 22(а)

Результатом преобразования ЕЕН является (-)-амброксид (соединение I) и изомер (-)-амброксида (соединение IV).

Результат 22(b)

Результатом биотрансформации EZH является макроциклический простой эфир (соединение II) и 9b-эпи-амброксид (соединение III).

Результат 22(с)

Неочищенная композиция (-)-амброксида содержит соединения I, II, III и IV, где % каждого присутствующего соединения составляет 87,1, 2,8, 2,5 и 7,6%, соответственно.

Результат 22(d)

Композиция материала после селективной кристаллизации (в лабораторном масштабе) содержит те же соединения, присутствующие в количестве 99,1, 0,1, 0,1 и 0,7%, соответственно.

Были получены следующие результаты сенсорного анализа:

(-)-Амброксид: ОТН 0,2 нг/л (ОТН представляет собой порог восприятия запаха).

Соединение IV из ЕЕН: слабый, IsoE, древесный, GC-TH 5-10 нг.

Соединение II из EZH: «без запаха» (GC-TH более 500 нг) (GC-TH представляет собой порог обнаружения).

Соединение III из EZH: GC-TH приблизительно в 10 раз выше, чем для амброксида (около 2 нг).

Вывод

Общее процентное содержание каждого из 3 побочных продуктов (соединений II, III и IV) в «неочищенном» экстракте составляет приблизительно 3%.

Общее процентное содержание каждого из 3 побочных продуктов (соединений II, III и IV) в «кристаллизованном» экстракте составляет приблизительно 1% (лабораторный масштаб).

Сенсорный анализ 3 побочных продуктов (соединений II, III и IV) показал более слабый запах по сравнению с (-)-амброксидом.

В действительности запах 9b-эпи-амброксида (соединения III) приблизительно в 10 раз слабее, чем (-)-амброксида, что позволяет предположить, что он по существу не имеет запаха.

Как показывает сенсорный анализ, удаление из (-)-амброксида одного или более соединений, представляющих собой побочные продукты, может улучшить запах остаточного соединения (т.е. (-)-амброксида) даже в том случае, когда удаляемые соединения как таковые не имеют запаха.

Таким образом, усиление запаха амброксида наблюдали в отсутствие соединений II, III и IV.

ПРИМЕР 23

Извлечение амброксида экстракцией паром

Методы 23

Полученная в результате чистота неочищенного (экстрагированного паром) и кристаллизованного (-)-амброксида

Реакционную смесь реакции биотрансформации EE:EZ 86:14 экстрагировали паром, и продукт реакции кристаллизовали, как описано ниже. Погон от дистилляции паром собирали в виде двухфазной смеси. Органическую фазу сохраняли, а водную фазу отбрасывали. Состав органической фазы анализировали методом GC, и результаты приведены в таблице 25 ниже (см. «неочищенный»). Впоследствии органическую фазу концентрировали до сухости. Затем к неочищенному высушенному продукту добавляли этанол, и смесь подогревали до растворения продукта. При комнатной температуре медленно добавляли воду, и (-)-амброксид кристаллизуется при периодическом перемешивании и охлаждении в ледяной бане.

Результаты 23

В таблице 25 ниже также показаны результаты анализа методом GC продуктов, полученных после этапа экстракции/дистилляции паром («неочищенный»), и кристаллизованного продукта ((-)-амброксида). В таблице 25 ссылки на EZH и ЕЕН относятся к (3Z,7E) гомофарнезолу и 7Е,3Е гомофарнезолу соответственно.

В таблице 25 показано, что из конкретного исходного материала (EEH:EZH 86:14) при использовании WT SHC или производного SHC образуется желаемый конечный продукт (-)-амброксид и очень специфичная смесь побочных продуктов (II, IV и III). Данные исследования селективной кристаллизации показывают значительное обогащение (-)-амброксидом (I) практически при отсутствии побочных продуктов (II), (IV) или (III), обнаруживаемых в кристаллизованном образце. Соответственно, из данной смеси EE:EZ получают ольфакторно чистый продукт (-)-амброксид, который селективно кристаллизуется относительно несложным и экономичным путем.

Обсуждение 23

Экстракция паром/фильтрация являются экологически благоприятными способами выделения амброксида, поскольку обеспечивают удобное выделение амброксида без использования растворителей с сопутствующей инактивацией биокатализатора.

Резюме 23

(-)-Амброксид, полученный при использовании реакции биоконверсии, можно экстрагировать с использованием растворителя из всей реакционной смеси (например, используя не смешиваемый с водой растворитель, или путем экстракции/дистилляции паром, или путем фильтрования) или из твердой фазы (например, используя смешиваемый с водой растворитель) способами, известными специалистам в данной области техники.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Givaudan SA

<120> Enzymes and Applications thereof

<130> 30578

<150> GB 1507207.7

<151> 2015-04-24

<160> 188

<170> PatentIn version 3.3

<210> 1

<211> 631

<212> PRT

<213> Alicyclobacillus acidocaldarius

<400> 1

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 2

<211> 725

<212> PRT

<213> Zymomonas mobilis

<400> 2

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 3

<211> 658

<212> PRT

<213> Zymomonas mobilis

<400> 3

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 4

<211> 684

<212> PRT

<213> Bradyrhizobium japonicum

<400> 4

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 5

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 5

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Ala Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 6

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 6

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcgc gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 7

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 7

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Val Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 8

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 8

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accgtcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 9

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 9

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 10

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 10

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 11

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 11

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 12

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 12

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 13

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 13

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Val

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 14

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 14

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg tgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 15

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 15

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 16

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 16

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 17

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 17

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val His Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 18

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 18

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcattac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 19

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 19

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 20

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 20

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 21

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 21

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Val

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 22

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 22

atggctgagc agttggtgga agctccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg tgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 23

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 23

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 24

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 24

atggctgagc agttggtgga agctccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 25

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 25

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 26

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 26

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 27

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 27

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Ala Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Val Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 28

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 28

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcgc gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accgtcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 29

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 29

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val His Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 30

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 30

atggctgagc agttggtgga agcaccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcattac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 31

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 31

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 32

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 32

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 33

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 33

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 34

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 34

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 35

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 35

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Leu Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 36

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 36

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgctcacg cggaggtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 37

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 37

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 38

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 38

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 39

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 39

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Leu Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 40

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 40

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgctcacg cggaggtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 41

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 41

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ala Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 42

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (387)..(387)

<223> n представляет собой a, c, g, или t

<400> 42

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggcgcntgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 43

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 43

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 44

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 44

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 45

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 45

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 46

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (544)..(546)

<223> ntn представляет собой ttr или ctn

<400> 46

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 47

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 47

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 48

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (553)..(555)

<223> ngn представляет собой agr или cgn

<400> 48

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 49

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 49

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Val Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 50

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (846)..(846)

<223> n представляет собой a, c, g, или t

<400> 50

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtgtnttac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 51

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 51

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 52

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (1494)..(1494)

<223> n представляет собой a, c, g, или t

<400> 52

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 53

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 53

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 54

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 54

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 55

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 55

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 56

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 56

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 57

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 57

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Val Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 58

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (553)..(555)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (846)..(846)

<223> n представляет собой a, c, g, или t

<220>

<221> misc_feature

<222> (1494)..(1494)

<223> n представляет собой a, c, g, или t

<400> 58

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtgtnttac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 59

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 59

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 60

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (553)..(555)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1494)..(1494)

<223> n представляет собой a, c, g, или t

<400> 60

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 61

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 61

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 62

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 62

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 63

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 63

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ala Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 64

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (387)..(387)

<223> n представляет собой a, c, g, или t

<220>

<221> misc_feature

<222> (544)..(546)

<223> ntn представляет собой ttr или ctn

<400> 64

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggcgcntgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 65

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 65

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 66

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 66

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 67

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 67

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 68

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (544)..(546)

<223> ntn представляет собой ttr или ctn

<400> 68

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 69

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 69

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 70

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (544)..(546)

<223> ntn представляет собой ttr или ctn

<400> 70

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 71

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 71

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Leu Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 72

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (544)..(546)

<223> ntn представляет собой ttr или ctn

<220>

<221> misc_feature

<222> (553)..(555)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1494)..(1494)

<223> n представляет собой a, c, g, или t

<400> 72

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtcntnaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 73

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 73

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 74

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (553)..(555)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1494)..(1494)

<223> n представляет собой a, c, g, или t

<400> 74

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 75

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 75

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Leu Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 76

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<220>

<221> misc_feature

<222> (544)..(546)

<223> ntn представляет собой ttr или ctn

<220>

<221> misc_feature

<222> (553)..(555)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1494)..(1494)

<223> n представляет собой a, c, g, или t

<400> 76

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtcntnaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 77

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 77

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Ala Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 78

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (255)..(255)

<223> n представляет собой a, c, g, или t

<400> 78

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcgcntggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 79

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 79

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 80

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 80

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 81

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 81

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 82

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (409)..(411)

<223> ntn представляет собой ttr или ctn

<400> 82

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 83

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 83

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 84

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (418)..(420)

<223> ngn представляет собой agr или cgn

<400> 84

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 85

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 85

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 86

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 86

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 87

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 87

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 88

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (1350)..(1350)

<223> n представляет собой a, c, g, или t

<400> 88

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 89

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 89

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile His Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 90

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 90

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat acaytggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 91

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 91

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 92

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 92

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 93

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 93

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 94

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (418)..(420)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1350)..(1350)

<223> n представляет собой a, c, g, или t

<400> 94

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 95

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 95

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 96

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (418)..(420)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1350)..(1350)

<223> n представляет собой a, c, g, или t

<400> 96

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 97

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 97

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 98

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 98

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 99

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 99

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Ala Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 100

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (255)..(255)

<223> n представляет собой a, c, g, или t

<220>

<221> misc_feature

<222> (409)..(411)

<223> ntn представляет собой ttr или ctn

<400> 100

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcgcntggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 101

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 101

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile His Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 102

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 102

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat acaytggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 103

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 103

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 104

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (409)..(411)

<223> ntn представляет собой ttr или ctn

<400> 104

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 105

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 105

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 106

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (409)..(411)

<223> ntn представляет собой ttr или ctn

<400> 106

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 107

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 107

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Arg Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 108

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (409)..(411)

<223> ntn представляет собой ttr или ctn

<220>

<221> misc_feature

<222> (418)..(420)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1350)..(1350)

<223> n представляет собой a, c, g, или t

<400> 108

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtngn 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 109

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 109

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 110

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (418)..(420)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1350)..(1350)

<223> n представляет собой a, c, g, или t

<400> 110

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 111

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 111

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Arg Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 112

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<220>

<221> misc_feature

<222> (409)..(411)

<223> ntn представляет собой ttr или ctn

<220>

<221> misc_feature

<222> (418)..(420)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1350)..(1350)

<223> n представляет собой a, c, g, или t

<400> 112

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtngn 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 113

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 113

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 114

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 114

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 115

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 115

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 116

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 116

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 117

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 117

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 118

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (421)..(423)

<223> ntn представляет собой ttr или ctn

<400> 118

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 119

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 119

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 120

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (430)..(432)

<223> ngn представляет собой agr или cgn

<400> 120

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 121

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 121

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 122

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 122

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 123

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 123

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 124

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (1377)..(1377)

<223> n представляет собой a, c, g, или t

<400> 124

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 125

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 125

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys His Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 126

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 126

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcca ytggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 127

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 127

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 128

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 128

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 129

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 129

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 130

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (430)..(432)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1377)..(1377)

<223> n представляет собой a, c, g, или t

<400> 130

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 131

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 131

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 132

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (430)..(432)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1377)..(1377)

<223> n представляет собой a, c, g, или t

<400> 132

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 133

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 133

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 134

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 134

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 135

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 135

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 136

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (421)..(423)

<223> ntn представляет собой ttr или ctn

<400> 136

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 137

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 137

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys His Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 138

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 138

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcca ytggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 139

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 139

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 140

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (421)..(423)

<223> ntn представляет собой ttr или ctn

<400> 140

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 141

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 141

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 142

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (421)..(423)

<223> ntn представляет собой ttr или ctn

<400> 142

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 143

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 143

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Arg

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 144

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (421)..(423)

<223> ntn представляет собой ttr или ctn

<220>

<221> misc_feature

<222> (430)..(432)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1377)..(1377)

<223> n представляет собой a, c, g, или t

<400> 144

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ntnacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 145

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 145

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 146

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (430)..(432)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1377)..(1377)

<223> n представляет собой a, c, g, или t

<400> 146

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 147

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 147

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Arg

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 148

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<220>

<221> misc_feature

<222> (421)..(423)

<223> ntn представляет собой ttr или ctn

<220>

<221> misc_feature

<222> (430)..(432)

<223> ngn представляет собой agr или cgn

<220>

<221> misc_feature

<222> (1377)..(1377)

<223> n представляет собой a, c, g, или t

<400> 148

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ntnacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 149

<211> 657

<212> PRT

<213> Burkholderia ambifaria

<400> 149

Met Asn Asp Leu Thr Glu Met Ala Thr Leu Ser Ala Gly Thr Val Pro

1 5 10 15

Ala Gly Leu Asp Ala Ala Val Ala Ser Ala Thr Asp Ala Leu Leu Ala

20 25 30

Ala Gln Asn Ala Asp Gly His Trp Val Tyr Glu Leu Glu Ala Asp Ser

35 40 45

Thr Ile Pro Ala Glu Tyr Val Leu Leu Val His Tyr Leu Gly Glu Thr

50 55 60

Pro Asn Leu Glu Leu Glu Gln Lys Ile Gly Arg Tyr Leu Arg Arg Val

65 70 75 80

Gln Gln Ala Asp Gly Gly Trp Pro Leu Phe Thr Asp Gly Ala Pro Asn

85 90 95

Ile Ser Ala Ser Val Lys Ala Tyr Phe Ala Leu Lys Val Ile Gly Asp

100 105 110

Asp Glu Asn Ala Glu His Met Gln Arg Ala Arg Arg Ala Ile Gln Ala

115 120 125

Met Gly Gly Ala Glu Met Ser Asn Val Phe Thr Arg Ile Gln Leu Ala

130 135 140

Leu Tyr Gly Ala Ile Pro Trp Arg Ala Val Pro Met Met Pro Val Glu

145 150 155 160

Ile Met Leu Leu Pro Gln Trp Phe Pro Phe His Leu Ser Lys Val Ser

165 170 175

Tyr Trp Ala Arg Thr Val Ile Val Pro Leu Leu Val Leu Asn Ala Lys

180 185 190

Arg Pro Ile Ala Lys Asn Pro Arg Gly Val Arg Ile Asp Glu Leu Phe

195 200 205

Val Asp Pro Pro Val Asn Ala Gly Leu Leu Pro Arg Gln Gly His Gln

210 215 220

Ser Pro Gly Trp Phe Ala Phe Phe Arg Val Val Asp His Ala Leu Arg

225 230 235 240

Ala Ala Asp Gly Leu Phe Pro Asn Tyr Thr Arg Glu Arg Ala Ile Arg

245 250 255

Gln Ala Val Ser Phe Val Asp Glu Arg Leu Asn Gly Glu Asp Gly Leu

260 265 270

Gly Ala Ile Tyr Pro Ala Met Ala Asn Ala Val Met Met Tyr Asp Val

275 280 285

Leu Gly Tyr Ala Glu Asp His Pro Asn Arg Ala Ile Ala Arg Lys Ser

290 295 300

Ile Glu Lys Leu Leu Val Val Gln Glu Asp Glu Ala Tyr Cys Gln Pro

305 310 315 320

Cys Leu Ser Pro Val Trp Asp Thr Ser Leu Ala Ala His Ala Leu Leu

325 330 335

Glu Thr Gly Asp Ala Arg Ala Glu Glu Ala Val Ile Arg Gly Leu Glu

340 345 350

Trp Leu Arg Pro Leu Gln Ile Leu Asp Val Arg Gly Asp Trp Ile Ser

355 360 365

Arg Arg Pro His Val Arg Pro Gly Gly Trp Ala Phe Gln Tyr Ala Asn

370 375 380

Pro His Tyr Pro Asp Val Asp Asp Thr Ala Val Val Ala Val Ala Met

385 390 395 400

Asp Arg Val Gln Lys Leu Lys His Asn Asp Ala Phe Arg Asp Ser Ile

405 410 415

Ala Arg Ala Arg Glu Trp Val Val Gly Met Gln Ser Ser Asp Gly Gly

420 425 430

Trp Gly Ala Phe Glu Pro Glu Asn Thr Gln Tyr Tyr Leu Asn Asn Ile

435 440 445

Pro Phe Ser Asp His Gly Ala Leu Leu Asp Pro Pro Thr Ala Asp Val

450 455 460

Ser Gly Arg Cys Leu Ser Met Leu Ala Gln Leu Gly Glu Thr Pro Leu

465 470 475 480

Asn Ser Glu Pro Ala Arg Arg Ala Leu Asp Tyr Met Leu Lys Glu Gln

485 490 495

Glu Pro Asp Gly Ser Trp Tyr Gly Arg Trp Gly Met Asn Tyr Val Tyr

500 505 510

Gly Thr Trp Thr Ala Leu Cys Ala Leu Asn Ala Ala Gly Leu Thr Pro

515 520 525

Asp Asp Pro Arg Val Lys Arg Gly Ala Gln Trp Leu Leu Ser Ile Gln

530 535 540

Asn Lys Asp Gly Gly Trp Gly Glu Asp Gly Asp Ser Tyr Lys Leu Asn

545 550 555 560

Tyr Arg Gly Phe Glu Gln Ala Pro Ser Thr Ala Ser Gln Thr Ala Trp

565 570 575

Ala Leu Leu Gly Leu Met Ala Ala Gly Glu Val Asn Asn Pro Ala Val

580 585 590

Ala Arg Gly Val Glu Tyr Leu Ile Ala Glu Gln Lys Glu His Gly Leu

595 600 605

Trp Asp Glu Thr Arg Phe Thr Ala Thr Gly Phe Pro Arg Val Phe Tyr

610 615 620

Leu Arg Tyr His Gly Tyr Arg Lys Phe Phe Pro Leu Trp Ala Leu Ala

625 630 635 640

Arg Tyr Arg Asn Leu Lys Arg Asn Asn Ala Thr Arg Val Thr Phe Gly

645 650 655

Leu

<210> 150

<400> 150

000

<210> 151

<211> 682

<212> PRT

<213> Burkholderia ambifaria

<400> 151

Met Ile Arg Arg Met Asn Lys Ser Gly Pro Ser Pro Trp Ser Ala Leu

1 5 10 15

Asp Ala Ala Ile Ala Arg Gly Arg Asp Ala Leu Met Arg Leu Gln Gln

20 25 30

Pro Asp Gly Ser Trp Cys Phe Glu Leu Glu Ser Asp Ala Thr Ile Thr

35 40 45

Ala Glu Tyr Ile Leu Met Met His Phe Met Asp Lys Ile Asp Asp Ala

50 55 60

Arg Gln Glu Lys Met Ala Arg Tyr Leu Arg Ala Ile Gln Arg Leu Asp

65 70 75 80

Thr His Gly Gly Trp Asp Leu Tyr Val Asp Gly Asp Pro Asp Val Ser

85 90 95

Cys Ser Val Lys Ala Tyr Phe Ala Leu Lys Ala Ala Gly Asp Ser Glu

100 105 110

His Ala Pro His Met Val Arg Ala Arg Asp Ala Ile Leu Glu Leu Gly

115 120 125

Gly Ala Ala Arg Ser Asn Val Phe Thr Arg Ile Leu Leu Ala Thr Phe

130 135 140

Gly Gln Val Pro Trp Arg Ala Thr Pro Phe Met Pro Ile Glu Phe Val

145 150 155 160

Leu Phe Pro Lys Trp Val Pro Ile Ser Met Tyr Lys Val Ala Tyr Trp

165 170 175

Ala Arg Thr Thr Met Val Pro Leu Leu Val Leu Cys Ser Leu Lys Ala

180 185 190

Arg Ala Arg Asn Pro Arg Asn Ile Ala Ile Pro Glu Leu Phe Val Thr

195 200 205

Pro Pro Asp Gln Glu Arg Gln Tyr Phe Pro Pro Ala Arg Gly Met Arg

210 215 220

Arg Ala Phe Leu Ala Leu Asp Arg Val Val Arg His Val Glu Pro Leu

225 230 235 240

Leu Pro Lys Arg Leu Arg Gln Arg Ala Ile Arg His Ala Gln Ala Trp

245 250 255

Cys Ala Glu Arg Met Asn Gly Glu Asp Gly Leu Gly Gly Ile Phe Pro

260 265 270

Pro Ile Val Tyr Ser Tyr Gln Met Met Asp Val Leu Gly Tyr Pro Asp

275 280 285

Asp His Pro Leu Arg Arg Asp Cys Glu Asn Ala Leu Glu Lys Leu Leu

290 295 300

Val Thr Arg Pro Asp Gly Ser Met Tyr Cys Gln Pro Cys Leu Ser Pro

305 310 315 320

Val Trp Asp Thr Ala Trp Ser Thr Met Ala Leu Glu Gln Ala Arg Gly

325 330 335

Val Ala Val Pro Glu Ala Gly Ala Pro Ala Ser Ala Leu Asp Glu Leu

340 345 350

Asp Ala Arg Ile Ala Arg Ala Tyr Asp Trp Leu Ala Glu Arg Gln Val

355 360 365

Asn Asp Leu Arg Gly Asp Trp Ile Glu Asn Ala Pro Ala Asp Thr Gln

370 375 380

Pro Gly Gly Trp Ala Phe Gln Tyr Ala Asn Pro Tyr Tyr Pro Asp Ile

385 390 395 400

Asp Asp Ser Ala Val Val Thr Ala Met Leu Asp Arg Arg Gly Arg Thr

405 410 415

His Arg Asn Ala Asp Gly Ser His Pro Tyr Ala Ala Arg Val Ala Arg

420 425 430

Ala Leu Asp Trp Met Arg Gly Leu Gln Ser Arg Asn Gly Gly Phe Ala

435 440 445

Ala Phe Asp Ala Asp Cys Asp Arg Leu Tyr Leu Asn Ala Ile Pro Phe

450 455 460

Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Glu Asp Val Ser Gly

465 470 475 480

Arg Val Leu Leu Cys Phe Gly Val Thr Lys Arg Ala Asp Asp Arg Ala

485 490 495

Ser Leu Ala Arg Ala Ile Asp Tyr Val Lys Arg Thr Gln Gln Pro Asp

500 505 510

Gly Ser Trp Trp Gly Arg Trp Gly Thr Asn Tyr Leu Tyr Gly Thr Trp

515 520 525

Ser Val Leu Ala Gly Leu Ala Leu Ala Gly Glu Asp Pro Ser Gln Pro

530 535 540

Tyr Ile Ala Arg Ala Leu Ala Trp Leu Arg Ala Arg Gln His Ala Asp

545 550 555 560

Gly Gly Trp Gly Glu Thr Asn Asp Ser Tyr Ile Asp Pro Ala Leu Ala

565 570 575

Gly Thr Asn Ala Gly Glu Ser Thr Ser Asn Cys Thr Ala Trp Ala Leu

580 585 590

Leu Ala Gln Met Ala Phe Gly Asp Gly Glu Ser Glu Ser Val Arg Arg

595 600 605

Gly Ile Ala Tyr Leu Gln Ser Val Gln Gln Asp Asp Gly Phe Trp Trp

610 615 620

His Arg Ser His Asn Ala Pro Gly Phe Pro Arg Ile Phe Tyr Leu Lys

625 630 635 640

Tyr His Gly Tyr Thr Ala Tyr Phe Pro Leu Trp Ala Leu Ala Arg Tyr

645 650 655

Arg Arg Leu Ala Gly Gly Val Ser Ala Ala Gly Ala His Ala Val Pro

660 665 670

Ala Ser Thr Gly Ala Asp Ala Ala Leu Ala

675 680

<210> 152

<400> 152

000

<210> 153

<211> 617

<212> PRT

<213> Bacillus anthracis

<400> 153

Met Leu Leu Tyr Glu Lys Ala His Glu Glu Ile Val Arg Arg Ala Thr

1 5 10 15

Ala Leu Gln Thr Met Gln Trp Gln Asp Gly Thr Trp Arg Phe Cys Phe

20 25 30

Glu Gly Ala Pro Leu Thr Asp Cys His Met Ile Phe Leu Leu Lys Leu

35 40 45

Leu Gly Arg Asp Lys Glu Ile Glu Pro Phe Val Glu Arg Val Ala Ser

50 55 60

Leu Gln Thr Asn Glu Gly Thr Trp Lys Leu His Glu Asp Glu Val Gly

65 70 75 80

Gly Asn Leu Ser Ala Thr Ile Gln Ser Tyr Ala Ala Leu Leu Ala Ser

85 90 95

Lys Lys Tyr Thr Lys Glu Asp Ala Asn Met Lys Arg Ala Glu Asn Phe

100 105 110

Ile Gln Glu Arg Gly Gly Val Ala Arg Ala His Phe Met Thr Lys Phe

115 120 125

Leu Leu Ala Ile His Gly Glu Tyr Glu Tyr Pro Ser Leu Phe His Leu

130 135 140

Pro Thr Pro Ile Met Phe Leu Gln Asn Asp Ser Pro Phe Ser Ile Phe

145 150 155 160

Glu Leu Ser Ser Ser Ala Arg Ile His Leu Ile Pro Met Met Leu Cys

165 170 175

Leu Asn Lys Arg Phe Arg Val Gly Lys Lys Leu Leu Pro Asn Leu Asn

180 185 190

His Ile Ala Gly Gly Gly Gly Glu Trp Phe Arg Glu Asp Arg Ser Pro

195 200 205

Val Phe Gln Thr Leu Leu Ser Asp Val Lys Gln Ile Ile Ser Tyr Pro

210 215 220

Leu Ser Leu His His Lys Gly Tyr Glu Glu Ile Glu Arg Phe Met Lys

225 230 235 240

Glu Arg Ile Asp Glu Asn Gly Thr Leu Tyr Ser Tyr Ala Thr Ala Ser

245 250 255

Phe Tyr Met Ile Tyr Ala Leu Leu Ala Leu Gly His Ser Leu Gln Ser

260 265 270

Ser Met Ile Gln Lys Ala Ile Ala Gly Ile Thr Ser Tyr Ile Trp Lys

275 280 285

Met Glu Arg Gly Asn His Leu Gln Asn Ser Pro Ser Thr Val Trp Asp

290 295 300

Thr Ala Leu Leu Ser Tyr Ala Leu Gln Glu Ala Gln Val Ser Lys Asp

305 310 315 320

Asn Lys Met Ile Gln Asn Ala Thr Ala Tyr Leu Leu Lys Lys Gln His

325 330 335

Thr Lys Lys Ala Asp Trp Ser Val His Ala Pro Ala Leu Thr Pro Gly

340 345 350

Gly Trp Gly Phe Ser Asp Val Asn Thr Thr Ile Pro Asp Ile Asp Asp

355 360 365

Thr Thr Ala Val Leu Arg Ala Leu Ala Arg Ser Arg Gly Asn Lys Asn

370 375 380

Ile Asp Asn Ala Trp Lys Lys Gly Gly Asn Trp Ile Lys Gly Leu Gln

385 390 395 400

Asn Asn Asp Gly Gly Trp Gly Ala Phe Glu Lys Gly Val Thr Ser Lys

405 410 415

Leu Leu Ala Lys Leu Pro Ile Glu Asn Ala Ser Asp Met Ile Thr Asp

420 425 430

Pro Ser Thr Pro Asp Ile Thr Gly Arg Val Leu Glu Phe Phe Gly Thr

435 440 445

Tyr Ala Gln Asn Glu Leu Pro Glu Lys Gln Ile Gln Arg Ala Ile Asn

450 455 460

Trp Leu Met Asn Val Gln Glu Glu Asn Gly Ser Trp Tyr Gly Lys Trp

465 470 475 480

Gly Ile Cys Tyr Leu Tyr Gly Thr Trp Ala Val Met Thr Gly Leu Arg

485 490 495

Ser Leu Gly Ile Pro Ser Ser Asn Pro Ser Leu Thr Arg Ala Ala Ser

500 505 510

Trp Leu Glu His Ile Gln His Glu Asp Gly Gly Trp Gly Glu Ser Cys

515 520 525

His Ser Ser Val Glu Lys Arg Phe Val Thr Leu Pro Phe Ser Thr Pro

530 535 540

Ser Gln Thr Ala Trp Ala Leu Asp Ala Leu Ile Ser Tyr Tyr Asp Thr

545 550 555 560

Glu Thr Pro Ala Ile Arg Lys Gly Val Ser Tyr Leu Leu Ser Asn Pro

565 570 575

Tyr Val Asn Glu Arg Tyr Pro Thr Gly Thr Gly Leu Pro Gly Ala Phe

580 585 590

Tyr Ile Arg Tyr His Ser Tyr Ala His Ile Tyr Pro Leu Leu Thr Leu

595 600 605

Ala His Tyr Ile Lys Lys Tyr Arg Lys

610 615

<210> 154

<211> 1854

<212> DNA

<213> Bacillus anthracis

<400> 154

atgttattat acgaaaaagc gcatgaagaa atagtgagaa gagcaacagc acttcaaaca 60

atgcaatggc aagatggtac gtggcgattt tgttttgaag gagctccatt aacagattgc 120

catatgattt ttttattaaa attattaggt agagataaag agatagaacc gttcgtagaa 180

agagtagcat cactccaaac aaatgaagga acatggaaat tgcacgaaga tgaagtagga 240

ggtaatttat cagctacaat tcaatcttat gccgccttac ttgcatcgaa aaaatataca 300

aaagaagatg cgaatatgaa acgagcagaa aattttattc aggaacgcgg tggtgtggcg 360

cgtgctcatt ttatgacgaa gtttttatta gcaattcatg gagaatatga atatccttca 420

ctctttcatt taccaacacc aatcatgttt ttacagaatg attccccctt tagtatattt 480

gaattaagta gctcagcacg tattcattta attccgatga tgctatgttt aaataaaaga 540

tttcgagtag ggaaaaagtt attaccaaat ttaaatcaca ttgcgggcgg aggcggagaa 600

tggtttcggg aggatcggtc tccagttttt caaacgttat taagtgatgt aaaacaaatt 660

atatcgtatc cactttcgtt acatcataaa ggatatgagg aaatagaacg ttttatgaaa 720

gagcgtattg atgaaaatgg aacgttatat agttacgcaa ctgcctcgtt ttatatgatt 780

tatgctttac ttgcgttagg gcattctctt caatcatcaa tgattcaaaa ggctatagct 840

gggataacat cttatatatg gaagatggaa agagggaatc atttgcaaaa ctctccttca 900

accgtgtggg atacagcttt attaagctat gcgttacaag aggctcaagt ttcaaaggat 960

aataagatga ttcaaaatgc aacagcgtat ttattaaaaa aacagcatac aaaaaaagct 1020

gattggagcg tacatgctcc ggcgcttact cctggcggtt ggggtttttc ggatgtgaat 1080

acgacaattc cagatataga tgatacaaca gctgtgctaa gggcattggc acgaagtaga 1140

ggaaacaaaa atatagataa tgcttggaag aaagggggca attggattaa aggattacaa 1200

aataatgatg gtggctgggg agcatttgaa aaaggtgtga cgagcaaatt attagcaaaa 1260

ttaccaatcg aaaacgcaag tgatatgatt acagatcctt ctacgccaga tattacgggg 1320

agagtgttag agtttttcgg gacgtatgca caaaacgaat tgcctgagaa acagatacaa 1380

agggcaataa attggttaat gaatgtacaa gaggaaaatg gatcatggta tgggaaatgg 1440

gggatttgtt atctatatgg tacgtgggct gttatgactg gtttacggtc actcggaatt 1500

ccgtctagca atccttcatt gacacgagca gcttcatggc ttgaacatat acagcatgaa 1560

gatggtggtt ggggagaatc atgccacagt agtgtggaga aaaggttcgt tactttacca 1620

tttagtacac catcccaaac tgcatgggcg ttagatgctc tcatttctta ctatgataca 1680

gaaacgccag ctattcgaaa aggtgtttca tatttgcttt cgaatcctta tgtgaatgaa 1740

agatatccta ctggaacagg tttaccaggt gcgttttata ttaggtatca tagctatgcc 1800

catatatatc cactacttac tttggcacat tatataaaaa aatatagaaa ataa 1854

<210> 155

<211> 720

<212> PRT

<213> Frankia alni

<400> 155

Met Pro Ala Gly Val Gly Val Leu Val Trp Leu Asp Gln Arg Leu Arg

1 5 10 15

Ala Met Gly Arg Pro Asp Leu Val Thr Thr Thr Gly Gly Ala Glu Ile

20 25 30

Pro Phe Val Leu Val Ala Ala Thr Ala Ser Thr Val Gly Val Ala Leu

35 40 45

Ala Leu Arg Arg Pro Arg His Pro Val Gly Trp Leu Phe Leu Ala Leu

50 55 60

Gly Gly Val Leu Leu Leu Ser Gly Gly Thr Gln Gly Tyr Ala Ala Tyr

65 70 75 80

Gly Ala Val Ala Arg Pro Gly Arg Leu Pro Ala Ala Asp Leu Val Ala

85 90 95

Ile Tyr Ala Asp Ala Gly Phe Ile Pro Trp Leu Val Leu Val Ala Leu

100 105 110

Ile Leu His Leu Thr Pro Thr Gly Arg Pro Leu Ser Ala Arg Trp Gly

115 120 125

Arg Ile Ala Leu Ala Thr Ala Val Ala Gly Gly Leu Trp Leu Leu Val

130 135 140

Gly Leu Val Thr Thr Glu Thr Met Gln Pro Pro Phe Gln Ser Val Thr

145 150 155 160

Asn Pro Leu Leu Ile Gly Gly Pro Leu Gly Pro Leu Leu Val Ala Arg

165 170 175

Arg Val Leu Gly Leu Ala Thr Gly Ala Gly Val Val Leu Ala Ala Val

180 185 190

Ser Leu Ile Val Arg Phe Arg Arg Ser Val Asp Val Glu Arg Arg Gln

195 200 205

Leu Leu Trp Val Ala Val Ala Ala Val Pro Leu Pro Val Leu Met Ala

210 215 220

Ala Ser Phe Ala Ala Ser Tyr Ala Gly Asn Asn Thr Ala Ala Gly Leu

225 230 235 240

Ala Ala Ala Thr Leu Ile Gly Leu Leu Ala Ile Gly Ala Gly Leu Ala

245 250 255

Ile Gly Gln Tyr His Leu Tyr Asp Val Glu Glu Ile Leu Ser Arg Ala

260 265 270

Val Thr Tyr Leu Leu Val Ser Gly Leu Leu Ala Ala Ser Tyr Ala Thr

275 280 285

Val Val Ile Val Val Gly Gln Ser Leu Ala Gly Arg Thr Gly Arg Ser

290 295 300

Gln Ile Ser Ala Val Leu Ala Thr Leu Ala Ala Val Ala Val Thr Ala

305 310 315 320

Pro Ala Tyr Arg Lys Ile Gln Glu Gly Val Asp Arg Arg Phe Ser Arg

325 330 335

Arg Arg Phe Glu Thr Leu Gln Val Ile Arg Arg Tyr Leu Arg Asp Pro

340 345 350

Asp Pro Asp Val Ala Val Glu Glu Val Leu Arg Arg Ala Leu Gly Asp

355 360 365

Pro Thr Leu Ala Val Ala Tyr Leu Val Asp Asp Arg Arg Gln Trp Val

370 375 380

Ser Ala Asp Gly Gln Pro Ala Asn Pro Gly Asn Ser Phe Met Ala Ala

385 390 395 400

Val Glu Val Tyr Arg Arg Gly Arg Pro Ile Ala Arg Val Thr Phe Asp

405 410 415

Arg Gly Arg Ala Gln Pro Gly Leu Val Arg Ala Ala Ala Thr Ala Ala

420 425 430

Thr Ala Glu Leu Asp Asn Ala Gly Leu Arg Ala Ala Val Ala Leu Gln

435 440 445

Leu Val Glu Val Arg Gln Ser Arg Thr Arg Ile Ala Ala Ala Gln Phe

450 455 460

Ala Glu Arg Arg Thr Ile Glu Arg Asn Leu His Asp Gly Ala Gln Gln

465 470 475 480

Arg Leu Leu Ala Leu Ala Leu Gln Leu Arg Ala Val Gln Leu Gly Gly

485 490 495

Asp Glu Ala Ser Leu Arg Gln Ala Ile Ser Thr Gly Ile Asp Gln Leu

500 505 510

Gln Ala Ala Val Val Glu Leu Arg Glu Leu Ala Asn Gly Leu His Pro

515 520 525

Ala Val Leu Ala Asp Gly Gly Leu Ala Ala Ala Leu Asp Asp Val Ala

530 535 540

Ala Arg Thr Pro Val Pro Ile Lys Ile Ser Ala Pro Asp Arg Arg Tyr

545 550 555 560

Pro Pro Asp Leu Glu Ala Ala Ala Trp Phe Ile Ala Cys Glu Ala Met

565 570 575

Ala Asn Ala Val Lys His Ala His Pro Thr Thr Ile Ala Val Asp Val

580 585 590

Ser Ala Pro Asp Gly Gln Leu Ile Val Glu Val Arg Asp Asp Gly Ile

595 600 605

Gly Gly Ala Gln Pro Ser Gly Pro Gly Leu Arg Gly Ile Ala Asp Arg

610 615 620

Ala Glu Ala Phe Gly Gly Ser Leu Thr Val His Thr Asp Pro Gly Thr

625 630 635 640

Gly Thr Thr Ile Arg Ala Leu Leu His Arg Arg Ser Pro Leu Ser Ser

645 650 655

Gly Arg Arg Ser Val Met Ile Glu Gly Cys Val Asp Val Val Ala Val

660 665 670

Arg Arg Phe Arg Cys Arg Ser Ser Arg Gly Ser Gly Ser Arg Arg Arg

675 680 685

Arg Ser Ser Trp Arg Cys Gly Gly Ile Cys Gly Ser Arg Cys Arg Thr

690 695 700

Gly Met Ser Arg Ser Cys Ser Arg Asn Ala Ala Ser Lys Leu Ile Thr

705 710 715 720

<210> 156

<400> 156

000

<210> 157

<211> 685

<212> PRT

<213> Rhodopseudomonas palent

<400> 157

Met Asp Ser Ile Leu Ala Pro Arg Ala Asp Ala Pro Arg Asn Ile Asp

1 5 10 15

Gly Ala Leu Arg Glu Ser Val Gln Gln Ala Ala Asp Trp Leu Val Ala

20 25 30

Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu Thr Asn Ala

35 40 45

Thr Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu

50 55 60

Asp His Pro Leu Arg Val Arg Leu Gly Arg Ala Leu Leu Asp Thr Gln

65 70 75 80

Arg Pro Asp Gly Ala Trp His Val Phe Tyr Gly Ala Pro Asn Gly Asp

85 90 95

Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly His

100 105 110

Arg Asp Asp Glu Glu Pro Leu Arg Lys Ala Arg Asp Trp Ile Leu Ser

115 120 125

Lys Gly Gly Leu Ala Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala

130 135 140

Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile Leu Pro Glu

145 150 155 160

Val Ile Trp Leu Pro Thr Trp Phe Pro Phe Ser Ile Tyr Asn Phe Ala

165 170 175

Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu Ser Ala His

180 185 190

Arg Pro Ser Arg Pro Leu Ala Pro Gln Asp Arg Leu Asp Ala Leu Phe

195 200 205

Pro Gln Gly Arg Asp Ser Phe Asn Tyr Asp Leu Pro Ala Arg Leu Gly

210 215 220

Ala Gly Val Trp Asp Val Ile Phe Arg Lys Ile Asp Thr Ile Leu His

225 230 235 240

Arg Leu Gln Asp Trp Gly Ala Arg Arg Gly Pro His Gly Ile Met Arg

245 250 255

Arg Gly Ala Ile Asp His Val Leu Gln Trp Ile Ile Arg His Gln Asp

260 265 270

Tyr Asp Gly Ser Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr Gly Leu

275 280 285

Met Ala Leu His Thr Glu Gly Tyr Ala Met Thr His Pro Val Met Ala

290 295 300

Lys Ala Leu Asp Ala Leu Asn Glu Pro Gly Trp Arg Ile Asp Ile Gly

305 310 315 320

Asp Ala Thr Phe Ile Gln Ala Thr Asn Ser Pro Val Trp Asp Thr Met

325 330 335

Leu Ser Leu Leu Ala Phe Asp Asp Ala Gly Leu Gly Glu Arg Tyr Pro

340 345 350

Glu Gln Val Glu Arg Ala Val Arg Trp Val Leu Lys Arg Gln Val Leu

355 360 365

Val Pro Gly Asp Trp Ser Val Lys Leu Pro Asp Val Lys Pro Gly Gly

370 375 380

Trp Ala Phe Glu Tyr Ala Asn Asn Phe Tyr Pro Asp Thr Asp Asp Thr

385 390 395 400

Ser Val Ala Leu Met Ala Leu Ala Pro Phe Arg His Asp Pro Lys Trp

405 410 415

Gln Ala Glu Gly Ile Glu Asp Ala Ile Gln Arg Gly Ile Asp Trp Leu

420 425 430

Val Ala Met Gln Cys Lys Glu Gly Gly Trp Gly Ala Phe Asp Lys Asp

435 440 445

Asn Asp Lys Lys Ile Leu Ala Lys Ile Pro Phe Cys Asp Phe Gly Glu

450 455 460

Ala Leu Asp Pro Pro Ser Ala Asp Val Thr Ala His Ile Ile Glu Ala

465 470 475 480

Phe Ala Lys Val Gly Leu Asp Arg Asn His Pro Ser Ile Val Arg Ala

485 490 495

Leu Asp Tyr Leu Lys Arg Glu Gln Glu Pro Glu Gly Pro Trp Phe Gly

500 505 510

Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu Pro Ala

515 520 525

Leu Ala Ala Ile Gly Glu Asp Met Arg Gln Pro Tyr Ile Ala Arg Ala

530 535 540

Cys Asp Trp Leu Ile Ala Arg Gln Gln Ala Asn Gly Gly Trp Gly Glu

545 550 555 560

Ser Cys Val Ser Tyr Met Asp Ala Lys Gln Ala Gly Glu Gly Thr Ala

565 570 575

Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Ile Ala Ala Asp

580 585 590

Arg Pro Gln Asp Arg Asp Ala Ile Glu Arg Gly Cys Leu Tyr Leu Thr

595 600 605

Glu Thr Gln Arg Asp Gly Thr Trp Gln Glu Val His Tyr Thr Gly Thr

610 615 620

Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn Asp Pro

625 630 635 640

Leu Leu Ser Lys Arg Leu Met Gln Gly Pro Glu Leu Ser Arg Ser Phe

645 650 655

Met Leu Arg Tyr Asp Leu Tyr Arg His Tyr Phe Pro Met Met Ala Ile

660 665 670

Gly Arg Val Leu Arg Gln Arg Gly Asp Arg Ser Gly His

675 680 685

<210> 158

<400> 158

000

<210> 159

<211> 679

<212> PRT

<213> Streptomyces coelicolor

<400> 159

Met Thr Ala Thr Thr Asp Gly Ser Thr Gly Ala Ser Leu Arg Pro Leu

1 5 10 15

Ala Ala Ser Ala Ser Asp Thr Asp Ile Thr Ile Pro Ala Ala Ala Ala

20 25 30

Gly Val Pro Glu Ala Ala Ala Arg Ala Thr Arg Arg Ala Thr Asp Phe

35 40 45

Leu Leu Ala Lys Gln Asp Ala Glu Gly Trp Trp Lys Gly Asp Leu Glu

50 55 60

Thr Asn Val Thr Met Asp Ala Glu Asp Leu Leu Leu Arg Gln Phe Leu

65 70 75 80

Gly Ile Gln Asp Glu Glu Thr Thr Arg Ala Ala Ala Leu Phe Ile Arg

85 90 95

Gly Glu Gln Arg Glu Asp Gly Thr Trp Ala Thr Phe Tyr Gly Gly Pro

100 105 110

Gly Glu Leu Ser Thr Thr Ile Glu Ala Tyr Val Ala Leu Arg Leu Ala

115 120 125

Gly Asp Ser Pro Glu Ala Pro His Met Ala Arg Ala Ala Glu Trp Ile

130 135 140

Arg Ser Arg Gly Gly Ile Ala Ser Ala Arg Val Phe Thr Arg Ile Trp

145 150 155 160

Leu Ala Leu Phe Gly Trp Trp Lys Trp Asp Asp Leu Pro Glu Leu Pro

165 170 175

Pro Glu Leu Ile Tyr Phe Pro Thr Trp Val Pro Leu Asn Ile Tyr Asp

180 185 190

Phe Gly Cys Trp Ala Arg Gln Thr Ile Val Pro Leu Thr Ile Val Ser

195 200 205

Ala Lys Arg Pro Val Arg Pro Ala Pro Phe Pro Leu Asp Glu Leu His

210 215 220

Thr Asp Pro Ala Arg Pro Asn Pro Pro Arg Pro Leu Ala Pro Val Ala

225 230 235 240

Ser Trp Asp Gly Ala Phe Gln Arg Ile Asp Lys Ala Leu His Ala Tyr

245 250 255

Arg Lys Val Ala Pro Arg Arg Leu Arg Arg Ala Ala Met Asn Ser Ala

260 265 270

Ala Arg Trp Ile Ile Glu Arg Gln Glu Asn Asp Gly Cys Trp Gly Gly

275 280 285

Ile Gln Pro Pro Ala Val Tyr Ser Val Ile Ala Leu Tyr Leu Leu Gly

290 295 300

Tyr Asp Leu Glu His Pro Val Met Arg Ala Gly Leu Glu Ser Leu Asp

305 310 315 320

Arg Phe Ala Val Trp Arg Glu Asp Gly Ala Arg Met Ile Glu Ala Cys

325 330 335

Gln Ser Pro Val Trp Asp Thr Cys Leu Ala Thr Ile Ala Leu Ala Asp

340 345 350

Ala Gly Val Pro Glu Asp His Pro Gln Leu Val Lys Ala Ser Asp Trp

355 360 365

Met Leu Gly Glu Gln Ile Val Arg Pro Gly Asp Trp Ser Val Lys Arg

370 375 380

Pro Gly Pro Pro Gly Gly Trp Ala Phe Glu Phe His Asn Asp Asn Tyr

385 390 395 400

Pro Asp Ile Asp Asp Thr Ala Glu Val Val Leu Ala Leu Arg Arg Val

405 410 415

Arg His His Asp Pro Glu Arg Val Glu Lys Ala Ile Gly Arg Gly Val

420 425 430

Arg Trp Asn Leu Gly Met Gln Ser Lys Asn Gly Ala Trp Gly Ala Phe

435 440 445

Asp Val Asp Asn Thr Ser Ala Phe Pro Asn Arg Leu Pro Phe Cys Asp

450 455 460

Phe Gly Glu Val Ile Asp Pro Pro Ser Ala Asp Val Thr Ala His Val

465 470 475 480

Val Glu Met Leu Ala Val Glu Gly Leu Ala His Asp Pro Arg Thr Arg

485 490 495

Arg Gly Ile Gln Trp Leu Leu Asp Ala Gln Glu Thr Asp Gly Ser Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ser Val Ile

515 520 525

Pro Ala Leu Thr Ala Ala Gly Leu Pro Thr Ser His Pro Ala Ile Arg

530 535 540

Arg Ala Val Arg Trp Leu Glu Ser Val Gln Asn Glu Asp Gly Gly Trp

545 550 555 560

Gly Glu Asp Leu Arg Ser Tyr Arg Tyr Val Arg Glu Trp Ser Gly Arg

565 570 575

Gly Ala Ser Thr Ala Ser Gln Thr Gly Trp Ala Leu Met Ala Leu Leu

580 585 590

Ala Ala Gly Glu Arg Asp Ser Lys Ala Val Glu Arg Gly Val Ala Trp

595 600 605

Leu Ala Ala Thr Gln Arg Glu Asp Gly Ser Trp Asp Glu Pro Tyr Phe

610 615 620

Thr Gly Thr Gly Phe Pro Trp Asp Phe Ser Ile Asn Tyr Asn Leu Tyr

625 630 635 640

Arg Gln Val Phe Pro Leu Thr Ala Leu Gly Arg Tyr Val His Gly Glu

645 650 655

Pro Phe Ala Lys Lys Pro Arg Ala Ala Asp Ala Pro Ala Glu Ala Ala

660 665 670

Pro Ala Glu Val Lys Gly Ser

675

<210> 160

<400> 160

000

<210> 161

<211> 725

<212> PRT

<213> Zymomonas mobilis

<400> 161

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 162

<211> 2178

<212> DNA

<213> Zymomonas mobilis

<400> 162

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 163

<211> 725

<212> PRT

<213> Zymomonas mobilis

<400> 163

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 164

<211> 2178

<212> DNA

<213> Zymomonas mobilis

<400> 164

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 165

<211> 1896

<212> DNA

<213> Alicyclobacillus acidocaldarius

<400> 165

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccatgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgtatgccg 480

ctcaacattt acgagtttgg ctcgtgggcc cgggcgaccg tcgtggcgat ctcaattgtc 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgat 600

accgacgtgc ctccgcgccg gcgcggcgcc aagggaggcg gcgggcgaat cttcgacgcg 660

ctggatcgcg ccctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccggg ccttggactg gctgctcgag cgccaggccg gagacggcag ttggggcggg 780

attcagccgc cctggtttta tacgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggttg ggagggcctc gagctgtacg gagtggacct cgactacggc 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggtcttgc cgtgctcgcg 960

ctgcgcgccg cggggcttcc ggccgatcac gaccggttgg tcaaggcggg cgagtggctt 1020

ttggaccggc agatcaccgt gccgggagac tgggcggtga agcgcccgaa cctcaaaccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tattacccgg acgtcgacga cacggccgtc 1140

gtggtctggg cgctgaacag ccttcgcttg ccggacgagc gccgcaggcg ggacgtgatg 1200

acgaaggggt tccgctggat cgtcggtatg cagagttcca acggcggctg gggcgcgtac 1260

gacgtcgaca acacgagcga tctgccaaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcggagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggc 1380

tacgacgacg cctggaaggt gatccggcgc gcggtcgagt acctcaagcg cgaacagcgc 1440

ccggatggca gttggtttgg ccgctggggc gtcaactacc tgtacggcac gggagcggtc 1500

gtgcccgcgc tgaaggccgt cgggatcgac gtgcgcgagc cgttcattca gaaggcgctc 1560

gattgggtcg agcagcatca gaacccggac ggtggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg caagggcgcg agcaccccgt cgcagacggc ttgggcgctg 1680

atggcactca tcgcgggcgg cagggcggag tcggattccg tgcgccgcgg cgtgcaatat 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccgggcg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 166

<211> 2178

<212> DNA

<213> Zymomonas mobilis

<400> 166

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 167

<211> 1977

<212> DNA

<213> Zymomonas mobilis

<400> 167

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 168

<211> 2055

<212> DNA

<213> Bradyrhizobium japonicum

<400> 168

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 169

<211> 1896

<212> DNA

<213> Alicyclobacillus acidocaldarius

<400> 169

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 170

<211> 1896

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 170

atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60

tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120

acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180

atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240

tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300

atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360

ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420

ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480

ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540

atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600

accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660

ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720

gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780

attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840

ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900

ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960

ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020

ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080

ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140

gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200

acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260

gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320

accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380

tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440

ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500

gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560

gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620

gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680

atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740

ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800

ttcccagggg attggtacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860

ctcggccgct acaagcaagc catcgagcgc aggtga 1896

<210> 171

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное AacSHC

<400> 171

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Trp Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 172

<211> 2178

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 172

atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60

gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120

ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180

aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240

gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300

gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360

ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420

atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480

cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540

gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600

cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660

caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720

ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780

tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840

cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900

atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960

attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020

catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080

ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140

atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200

gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260

gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320

accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380

ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440

ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500

tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560

gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620

gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680

tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740

tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800

gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860

cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920

attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980

gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040

gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtggatgctg 2100

cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160

attgatttga ataattga 2178

<210> 173

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC1

<400> 173

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Trp Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 174

<211> 1977

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 174

atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60

attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120

tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180

ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240

ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300

aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360

gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420

caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480

atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540

gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600

atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660

cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720

tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780

ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840

tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900

gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960

ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020

ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080

ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140

tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200

atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260

gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320

aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380

ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440

attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500

ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560

gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620

ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680

gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740

ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800

gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860

ccccgtgttt ggtatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920

gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977

<210> 175

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное ZmoSHC2

<400> 175

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Trp

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 176

<211> 2055

<212> DNA

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 176

atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60

gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120

ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180

ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240

gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300

aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360

gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420

ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480

ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540

tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600

ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660

gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720

gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780

gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840

ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900

aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960

gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020

ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080

gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140

catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200

gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260

aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320

ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380

ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440

gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500

tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560

gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620

ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680

ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740

tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800

gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860

ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920

gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc ctggatgctc 1980

cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040

cagagtcata gctag 2055

<210> 177

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное BjapSHC1

<400> 177

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Trp Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<210> 178

<211> 631

<212> PRT

<213> Alicyclobacillus acidocaldarius

<400> 178

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Ile Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Asp Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Arg Ile Phe Asp Ala Leu Asp Arg Ala

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Thr Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Asp Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Ser Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Val Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Arg

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Pro Ala Leu Lys Ala Val Gly Ile Asp Val Arg

500 505 510

Glu Pro Phe Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Asp Ser Val Arg Arg

565 570 575

Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 179

<211> 382

<212> DNA

<213> Artificial sequence

<220>

<223> Область клонирования/экспрессии синтической плазмиды pET-28a(+)

<220>

<221> CDS

<222> (109)..(285)

<400> 179

agatctcgat cccgcgaaat taatacgact cactataggg gaattgtgag cggataacaa 60

ttcccctcta gaaataattt ttgtttaact ttaagaagga gatatacc atg ggc agc 117

Met Gly Ser

1

agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg cgc ggc agc 165

Ser His His His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser

5 10 15

cat atg gct agc atg act ggt gga cag caa atg ggt cgc gga tcc gaa 213

His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Glu

20 25 30 35

ttc gag ctc cgt cga caa gct tgc ggc cgc act cga gca cca cca cca 261

Phe Glu Leu Arg Arg Gln Ala Cys Gly Arg Thr Arg Ala Pro Pro Pro

40 45 50

cca cca ctg aga tcc ggc tgc taa caaagcccga aaggaagctg agttggctgc 315

Pro Pro Leu Arg Ser Gly Cys

55

tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg 375

ttttttg 382

<210> 180

<211> 58

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическая конструкция

<400> 180

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

20 25 30

Gly Ser Glu Phe Glu Leu Arg Arg Gln Ala Cys Gly Arg Thr Arg Ala

35 40 45

Pro Pro Pro Pro Pro Leu Arg Ser Gly Cys

50 55

<210> 181

<211> 94

<212> DNA

<213> Artificial sequence

<220>

<223> Область клонирования/экспрессии синтической плазмиды pET-28b(+)

<220>

<221> CDS

<222> (1)..(72)

<400> 181

ggt cgg gat ccg aat tcg agc tcc gtc gac aag ctt gcg gcc gca ctc 48

Gly Arg Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu

1 5 10 15

gag cac cac cac cac cac cac tga gatccggctg ctaacaaagc cc 94

Glu His His His His His His

20

<210> 182

<211> 23

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическая конструкция

<400> 182

Gly Arg Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu

1 5 10 15

Glu His His His His His His

20

<210> 183

<211> 93

<212> DNA

<213> Artificial sequence

<220>

<223> Область клонирования/экспрессии синтической плазмиды pET-28c(+)

<220>

<221> CDS

<222> (1)..(93)

<400> 183

ggt cgg atc cga att cga gct ccg tcg aca agc ttg cgg ccg cac tcg 48

Gly Arg Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro His Ser

1 5 10 15

agc acc acc acc acc acc act gag atc cgg ctg cta aca aag ccc 93

Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys Pro

20 25 30

<210> 184

<211> 31

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическая конструкция

<400> 184

Gly Arg Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro His Ser

1 5 10 15

Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys Pro

20 25 30

<210> 185

<211> 631

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное SHC

<220>

<221> VARIANT

<222> (77)..(77)

<223> T77X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,

Q, R, S, T, V, W или Y

<220>

<221> VARIANT

<222> (92)..(92)

<223> I92X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,

Q, R, S, T, V, W или Y

<220>

<221> VARIANT

<222> (129)..(129)

<223> F129X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (132)..(132)

<223> M132X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (224)..(224)

<223> A224X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (432)..(432)

<223> I432X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (579)..(579)

<223> Q579X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (601)..(601)

<223> F601X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<400> 185

Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp

1 5 10 15

Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp

20 25 30

Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu

35 40 45

Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile

50 55 60

Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Xaa Trp Ala Leu

65 70 75 80

Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Xaa Glu Ala Tyr Val

85 90 95

Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys

100 105 110

Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val

115 120 125

Xaa Thr Arg Xaa Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys

130 135 140

Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro

145 150 155 160

Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala

165 170 175

Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg

180 185 190

Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg

195 200 205

Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Xaa

210 215 220

Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala

225 230 235 240

Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly

245 250 255

Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu

260 265 270

Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu

275 280 285

Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe

290 295 300

Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala

305 310 315 320

Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala

325 330 335

Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala

340 345 350

Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp

355 360 365

Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala

370 375 380

Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met

385 390 395 400

Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly

405 410 415

Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Xaa

420 425 430

Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val

435 440 445

Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala

450 455 460

Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys

465 470 475 480

Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly

485 490 495

Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg

500 505 510

Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn

515 520 525

Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala

530 535 540

Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu

545 550 555 560

Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg

565 570 575

Gly Val Xaa Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp

580 585 590

Glu Pro Tyr Tyr Thr Gly Thr Gly Xaa Pro Gly Asp Phe Tyr Leu Gly

595 600 605

Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr

610 615 620

Lys Gln Ala Ile Glu Arg Arg

625 630

<210> 186

<211> 725

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное SHC

<220>

<221> VARIANT

<222> (129)..(129)

<223> S129X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (145)..(145)

<223> V145X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (182)..(182)

<223> F182X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (185)..(185)

<223> Y185X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (282)..(282)

<223> G282X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (498)..(498)

<223> I498X имеет X, выбранный из: A, B, C, D, E, F, G, H, I, K, L, M,

N, P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (646)..(646)

<223> H646X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (668)..(668)

<223> F668X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<400> 186

Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys

1 5 10 15

Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile

20 25 30

Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr

35 40 45

Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn

50 55 60

Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro

65 70 75 80

Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala

85 90 95

Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu

100 105 110

Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly

115 120 125

Xaa Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr

130 135 140

Xaa Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn

145 150 155 160

Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu

165 170 175

Lys Asn Ile Arg Val Xaa Thr Arg Xaa Trp Leu Ala Leu Ile Gly Glu

180 185 190

Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe

195 200 205

Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg

210 215 220

Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg

225 230 235 240

Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg

245 250 255

Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp

260 265 270

Ser Gln Phe Phe Arg Thr Thr Asp Arg Xaa Leu His Trp Val Gln Ser

275 280 285

Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val

290 295 300

Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly

305 310 315 320

Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly

325 330 335

Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp

340 345 350

Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala

355 360 365

Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys

370 375 380

Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala

385 390 395 400

Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile

405 410 415

Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn

420 425 430

Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu

435 440 445

Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp

450 455 460

Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys

465 470 475 480

Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser

485 490 495

Lys Xaa Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val

500 505 510

Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser

515 520 525

Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu

530 535 540

Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

545 550 555 560

Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp

565 570 575

Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His

580 585 590

Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu

595 600 605

Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp

610 615 620

Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala

625 630 635 640

Ile Ala Lys Gly Cys Xaa Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly

645 650 655

Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Xaa Pro Gly Tyr Gly

660 665 670

Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu

675 680 685

Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe

690 695 700

Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu

705 710 715 720

Ile Asp Leu Asn Asn

725

<210> 187

<211> 658

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное SHC

<220>

<221> VARIANT

<222> (85)..(85)

<223> G85X имеет X, выбранный из: A, C, D, E, F, G, H, I, K , L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (100)..(100)

<223> V100X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (137)..(137)

<223> F137X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (140)..(140)

<223> I140X имеет X, выбранный из: A,, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (233)..(233)

<223> V233X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (450)..(450)

<223> I450X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (598)..(598)

<223> N598X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y

<220>

<221> VARIANT

<222> (620)..(620)

<223> F620X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<400> 187

Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp

1 5 10 15

Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys

20 25 30

Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr

35 40 45

Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu

50 55 60

Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln

65 70 75 80

Gly Glu His Gly Xaa Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu

85 90 95

Ser Ala Thr Xaa Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser

100 105 110

Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg

115 120 125

Gly Gly Ala Met Arg Ala Asn Val Xaa Thr Arg Xaa Gln Leu Ala Leu

130 135 140

Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu

145 150 155 160

Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr

165 170 175

Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys

180 185 190

Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val

195 200 205

Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg

210 215 220

Arg Phe Phe Ser Ala Leu Asp Lys Xaa Leu His Lys Val Glu Pro Tyr

225 230 235 240

Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe

245 250 255

Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro

260 265 270

Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu

275 280 285

Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met

290 295 300

Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln

305 310 315 320

Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met

325 330 335

Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu

340 345 350

Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala

355 360 365

Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg

370 375 380

Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala

385 390 395 400

Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu

405 410 415

Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn

420 425 430

Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn

435 440 445

Asn Xaa Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val

450 455 460

Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser

465 470 475 480

Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu

485 490 495

Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile

500 505 510

Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro

515 520 525

His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile

530 535 540

Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu

545 550 555 560

Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala

565 570 575

Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala

580 585 590

Val Thr Lys Gly Ile Xaa Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly

595 600 605

Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Xaa Pro Arg Val Phe

610 615 620

Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu

625 630 635 640

Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr

645 650 655

Gly Met

<210> 188

<211> 684

<212> PRT

<213> Artificial sequence

<220>

<223> Синтетическое производное SHC

<220>

<221> VARIANT

<222> (88)..(88)

<223> A88X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,

Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (104)..(104)

<223> V104X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,

Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (141)..(141)

<223> F141X, имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (144)..(144)

<223> Y144X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (241)..(241)

<223> V241X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (459)..(459)

<223> I459X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (607)..(607)

<223> M607X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<220>

<221> VARIANT

<222> (628)..(628)

<223> F628X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,

P, Q, R, S, T, V, W или Y.

<400> 188

Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly

1 5 10 15

Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp

20 25 30

Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu

35 40 45

Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met

50 55 60

Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu

65 70 75 80

Asp Ser Gln Arg Pro Asp Gly Xaa Trp Gln Val Tyr Phe Gly Ala Pro

85 90 95

Asn Gly Asp Ile Asn Ala Thr Xaa Glu Ala Tyr Ala Ala Leu Arg Ser

100 105 110

Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp

115 120 125

Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Xaa Thr Arg Xaa

130 135 140

Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile

145 150 155 160

Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr

165 170 175

Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu

180 185 190

Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp

195 200 205

Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val

210 215 220

Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys

225 230 235 240

Xaa Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu

245 250 255

Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His

260 265 270

Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr

275 280 285

Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val

290 295 300

Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp

305 310 315 320

Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp

325 330 335

Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp

340 345 350

Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln

355 360 365

Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro

370 375 380

Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp

385 390 395 400

Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro

405 410 415

Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp

420 425 430

Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp

435 440 445

Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Xaa Pro Phe Cys Asp Tyr

450 455 460

Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile

465 470 475 480

Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val

485 490 495

Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp

500 505 510

Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu

515 520 525

Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly

530 535 540

Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp

545 550 555 560

Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly

565 570 575

Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala

580 585 590

Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Xaa Trp

595 600 605

Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr

610 615 620

Gly Thr Gly Xaa Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn

625 630 635 640

Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg

645 650 655

Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met

660 665 670

Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser

675 680

<---

Похожие патенты RU2727641C2

название год авторы номер документа
КОНСТРУКТЫ Т-КЛЕТОЧНОГО РЕЦЕПТОРА И ИХ ПРИМЕНЕНИЕ 2019
  • Джунеджа, Викрам
  • Чой, Дзаевон
RU2785954C2
ИНСЕКТИЦИДНЫЕ БЕЛКИ РАСТИТЕЛЬНОГО ПРОИСХОЖДЕНИЯ И СПОСОБЫ ИХ ПРИМЕНЕНИЯ 2016
  • Аллен, Стефен
  • Барри, Дженнифер
  • Крейн, Вирджиния
  • Инглиш, Джеймс
  • Фенглер, Кевин
  • Шеперс, Эрик
  • Удрансзки, Ингрид
RU2762832C2
УЛУЧШЕННЫЕ ОДИНОЧНЫЕ ВАРИАБЕЛЬНЫЕ ДОМЕНЫ ИММУНОГЛОБУЛИНА, СВЯЗЫВАЮЩИЕСЯ С СЫВОРОТОЧНЫМ АЛЬБУМИНОМ 2017
  • Сталенс, Стефани
  • Стеффенсен, Сорен
  • Мориццо, Эрика
  • Понсартс, Раф
  • Оттеваре, Ингрид
  • Сердоббел, Ан
RU2765384C2
ВЫДЕЛЕНИЕ НОВОГО ПЕСТИВИРУСА, ВЫЗЫВАЮЩЕГО ВРОЖДЕННЫЙ ТРЕМОР А 2017
  • Рюменапф, Ганс Тилльманн
  • Ламп, Бенджамин
  • Шварц, Лукас
RU2765658C2
IL-12 ГЕТЕРОДИМЕРНЫЕ СЛИТЫЕ БЕЛКИ FC 2019
  • Бернетт, Мэттью
  • Дисджарлейс, Джон, Р.
  • Варма, Раджат
  • Лю, Ке
  • Хассанзаде-Кьяби, Наргесс
  • Рашид, Румана
RU2819097C2
УСОВЕРШЕНСТВОВАННЫЕ АГЕНТЫ, СВЯЗЫВАЮЩИЕ СЫВОРОТОЧНЫЙ АЛЬБУМИН 2018
  • Сталенс, Стефани
  • Стеффенсен, Сорен
  • Мориццо, Эрика
  • Сердоббел, Ан
RU2797270C2
КОНСТРУКЦИИ СЛИТОГО БЕЛКА ДЛЯ ЗАБОЛЕВАНИЯ, СВЯЗАННОГО С КОМПЛЕМЕНТОМ 2019
  • Кёртис, Майкл Стивен
  • Сторек, Майкл
  • Вайолетт, Шелия Мари
  • Каллед, Сюзан Л.
  • Фахноу, Келли С.
  • Хуан, Чэн Жань
  • Старк, Эллен Гарбер
  • Тейлор, Фредерик Роббинс
  • Каравелла, Джастин Эндрю
  • Холерс, Вернон Майкл
RU2824402C2
МОЛЕКУЛА РЕЦЕПТОРА IL4/IL13 ДЛЯ ВЕТЕРИНАРНОГО ПРИМЕНЕНИЯ 2018
  • Чжань, Ханцзюнь
  • Нгуйен, Лам
  • Цянь, Фон
  • Ли, Шир Цзяннь
RU2795591C2
УСОВЕРШЕНСТВОВАННЫЕ СВЯЗЫВАЮЩИЕСЯ С СЫВОРОТОЧНЫМ АЛЬБУМИНОМ ВЕЩЕСТВА 2018
  • Сталенс, Стефани
  • Стеффенсен, Сорен
  • Мориццо, Эрика
  • Сердоббел, Ан
RU2789495C2
БЕЛКИ RSV В ПРЕДШЕСТВУЮЩЕЙ СЛИЯНИЮ КОНФОРМАЦИИ И ИХ ПРИМЕНЕНИЕ 2014
  • Квонг Питер Д.
  • Грэхэм Барни С.
  • Маклеллан Джейсон С.
  • Джойс Майкл Гордон
  • Канекийо Масару
  • Чжан Баошань
  • Бойингтон Джеффри
  • Джорджив Ивелин Стефанов
  • Пансера Мари
  • Сото Синке
  • Сриватсан Санджай
  • Стюарт-Джонс Гийом
  • Чэнь Лэй
  • Чэнь Мань
  • Чуан Гво-Ю
  • Горман Джейсон
  • Офек Джилад
  • Састри Маллика
  • Янг Йонгпинг
  • Чжоу Тунцин
RU2761631C2

Иллюстрации к изобретению RU 2 727 641 C2

Реферат патента 2020 года СПОСОБ ПОЛУЧЕНИЯ (-)-АМБРОКСИДА, ПРОДУКТ РЕАКЦИИ, СОДЕРЖАЩИЙ (-)-АМБРОКСИД, И ЕГО ПРИМЕНЕНИЕ

Группа изобретений относится к биотехнологии, в частности к селективному получению (-)-амброксида. Предложен способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где смесь изомеров, содержащую (3Е,7Е)-гомофарнезол (ЕЕН)), ферментативно конвертируют в (-)-амброксид или в смесь, содержащую (-)-амброксид, с использованием фермента сквален-гопен-циклазы/гомофарнезол-амброксид-циклазы (SHC/HAC), имеющей полипептидную последовательность с по меньшей мере 70% идентичностью с SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4, в подходящих реакционных условиях. Смесь изомеров, содержащая ЕЕН, выбрана из одной или более чем одной из групп, состоящих из [(3Е,7Е) и (3Z,7E)], и/или [(3Е,7Е) и (3E,7Z)], и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ], [EE:ZE] и [EE:EZ:ZE]. Способ приводит к получению продукта, содержащего (-)-амброксид и побочные продукты (II), (III) и (IV):

, который применяют в составе ароматизирующего продукта, или косметического продукта, или потребительского продукта. Группа изобретений позволяет получать (-)-амброксид из гомофарнезола при пониженных реакционных температурах с высокой степенью биоконверсии. 6 н. и 15 з.п. ф-лы, 25 ил., 26 табл., 23 пр.

Формула изобретения RU 2 727 641 C2

1. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где смесь изомеров, содержащую (3Е,7Е)-гомофарнезол (ЕЕН)), ферментативно конвертируют в (-)-амброксид или в смесь, содержащую (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента сквален-гопен-циклазы/гомофарнезол-амброксид-циклазы (SHC/HAC), имеющей полипептидную последовательность с по меньшей мере 70% идентичностью с SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4, в реакционных условиях, подходящих для получения (-)-амброксида, и где смесь изомеров, содержащая ЕЕН, выбрана из одной или более чем одной из следующих групп, состоящих из [(3Е,7Е) и (3Z,7E)], и/или [(3Е,7Е) и (3E,7Z)], и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ], [EE:ZE] и [EE:EZ:ZE] соответственно.

2. Способ по п. 1, который осуществляют с использованием полипептидной последовательности фермента SHC/HAC, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4.

3. Способ по любому из пп. 1, 2, где используют рекомбинантные клетки-хозяева, продуцирующие фермент SHC/HAC.

4. Способ по п. 2 или 3, где нуклеотидная последовательность, кодирующая фермент SHC/HAC, выбрана из группы, состоящей из SEQ ID NO: 165, 166, 167, 168 или 169.

5. Способ по любому из пп. 1-4, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8.

6. Способ по любому из пп. 1-5, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для ферментов, представляющих собой SHC/HAC дикого типа или производное SHC/HAC, которые представлены в следующей таблице:

или в следующей таблице:

, предпочтительно при рН в диапазоне от 5,0 до 6,2, предпочтительно при температуре 35°С.

7. Способ по любому из пп. 1-6, где (-)-амброксид получают в смеси с по меньшей мере одним или более чем одним побочным продуктом (II) (IV) и (III)

8. Способ по любому из пп. 1-7, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.

9. Способ по любому из пп. 1-8, где (-)-амброксид выделяют из твердой фазы биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром.

10. Способ по п. 8 или 9, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя, предпочтительно представляющего собой этанол или толуол.

11. Способ по любому из пп. 8-10, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.

12. Способ по п. 11, где (-)-амброксид по существу не содержит побочных продуктов (II) (IV) и/или (III)

13. Способ по любому из пп. 1-12, где (-)-амброксид получают в диапазоне концентраций приблизительно 125-200 г/л.

14. Продукт реакции для ароматизации, содержащий (-)-амброксид и побочные продукты (II) (III) и (IV) получаемый способом по любому из пп. 1-13, где смесь изомеров, содержащая ЕЕН, выбрана из одной или более чем одной из следующих групп, состоящих из [(3Е,7Е) и (3Z,7E)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ] и [EE:EZ:ZE] соответственно.

15. Продукт реакции по п. 14 в твердой форме, предпочтительно в аморфной или кристаллической форме.

16. Способ получения продукта, содержащего (-)-амброксид, включающий включение продукта реакции по любому из пп. 14 или 15 в продукт.

17. Способ по п. 16, где продукт представляет собой ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.

18. Применение продукта реакции по п. 14 или 15 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта.

19. Применение по п. 18, где потребительский продукт для ухода представляет собой продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.

20. Ароматизирующая композиция, содержащая продукт реакции по п. 14 или 15 и один или более чем один дополнительный компонент.

21. Применение продукта реакции по п. 14 или 15 в качестве ароматизирующего вещества в косметической композиции или композиции потребительского продукта для ухода.

Документы, цитированные в отчете о поиске Патент 2020 года RU2727641C2

US 5616737 A1, 01.04.1997
JP 2009060799 A, 26.03.2009
US 2013273619 A1, 17.10.2013
US 8507564 B2,13.08.2013
СПОСОБ ОБРАБОТКИ БАНКНОТ (ВАРИАНТЫ) 2010
  • Минин Петр Валерьевич
  • Коротенко Владислав Игоревич
  • Письменный Дмитрий Геннадиевич
  • Шешуков Дмитрий Евгеньевич
RU2438182C1
US 8932839 B2, 13.01.2015
NEUMANN S
and H
SIMON
"Purification, partial characterization and substrate specificity of a squalene cyclase from Bacillus acidocaldarius." Biol
Chem
Hoppe-Seyler, 1986,

RU 2 727 641 C2

Авторы

Эйхгорн Эрик

Шиллинг Борис

Валер Денис

Фураж Лорэн

Лошэр Эстер

Даты

2020-07-22Публикация

2016-04-22Подача