Настоящее изобретение относится к полинуклеотидам, кодирующим новые слитые полипептиды, состоящие по сути из сигнального пептида для транслокации через мембрану и полипептида, обеспечивающего α-1,6-глюкозидазную активность, а также к бактериям, содержащим указанные полинуклеотиды. Настоящее изобретение, кроме того, относится к способам получения химических продуктов тонкого синтеза с использованием сред, содержащих изомальтозу и/или панозу в качестве источника углерода.

Штаммы рода Corynebacterium, в частности, вида Corynebacterium glutamicum, являются известными продуцентами L-аминокислот, таких как протеиногенные аминокислоты, например, L-лизин, L-треонин, L-валин или L-изолейцин, и других химических продуктов тонкого синтеза, таких как витамины, нуклеозиды и нуклеотиды. Ввиду большого экономического значения этих химических веществ постоянно проводится работа по улучшению их способов получения. Улучшения могут касаться генетической конституции микроорганизма, применяемой технологии ферментации или обработки продукта до желаемой формы. Применяемыми способами улучшения генетической конституции являются способы мутагенеза, селекции и выбора мутантов. Способы технологии рекомбинантной ДНК также применялись на протяжении многих лет для улучшения штаммов этой группы бактерий. Обобщенные справочные сведения, касающиеся Corynebacterium, в частности, Corynebacterium glutamicum, можно найти у L. Eggeling и M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005), A. Burkovski (Corynebacteria Genomics and Molecular Biology, Caister Academic Press, 2008) или H. Yukawa и M. Inui (Corynebacterium glutamicum Biology and Biotechnology, Springer Verlag, 2013).

Одним из основных источников углерода, используемых для размножения этой группы бактерий и для образования желаемого химического вещества, является глюкоза. Глюкозу, используемую в бродильном производстве, как правило, получают из крахмала путем ферментативного гидролиза. Крахмал представляет собой смесь двух различных полисахаридов, каждый из которых состоит из цепей связанных повторяющихся звеньев глюкозы. Данная смесь состоит главным образом из двух отдельных полисахаридов - амилозы и амилопектина. Амилоза является практически линейным полисахаридом с глюкозными звеньями, соединенными практически исключительно α-1,4-гликозидными связями. Глюкозные звенья в амилопектине, кроме того, соединены α-1,6-гликозидными связями. Содержание амилозы в крахмале таких видов растений, как маис, пшеница или рис, составляет приблизительно 20-30%, а содержание амилопектина - приблизительно 80-70%. Подробную информацию о крахмале можно найти у J. Bemiller и R. Whistler (Starch: Chemistry and Technology, 3. ed., Elsevier, 2009).

Ферментативный гидролиз крахмала до глюкозы включает два основных этапа. На первом этапе, также называемом ожижением, крахмал обрабатывают α-амилазой (4-α-D-глюканглюканогидролазой; EC 3.2.1.1). Продуктами данной реакции являются олигомеры глюкозы с α-1,4-связями, также называемые мальтодекстрином, содержащие такие молекулы, как мальтотриоза (O-α-D-Glcp-(1→4)-O-α-D-Glcp-(1→4)-D-Glcp) и мальтогексаоза (соответствующий гексамер D-глюкозы c α-(1→4)-связями), а также олигомеры глюкозы, содержащие α-1,6-связь, также называемые предельным декстрином. На втором этапе, также называемом осахариванием, эту смесь обрабатывают глюкоамилазой, также называемой в данной области техники амилоглюкозидазой (4-α-D-глюканглюкогидролазой; EC 3.2.1.3). Этот фермент быстро гидролизует α-1,4-связь. Также он гидролизует α-1,6-связь, но с меньшей скоростью. В уровне техники также описывается использование пуллуланазы (пуллулан-6-α-глюканогидролазы) для гидролиза α-1,6-связи, содержащейся в предельных декстринах. Продуктом этого второго этапа является раствор глюкозы, содержащий, помимо прочего, остаточную мальтозу (4-O-(α-D-глюкопиранозил)-D-глюкопиранозу), изомальтозу (6-O-(α-D-глюкопиранозил)-D-глюкопиранозу) и панозу (O-α-D-Glcp-(1→6)-O-α-D-Glcp-(1→4)-D-Glcp) в качестве побочных продуктов. Эти побочные продукты являются результатом обратных ферментативных реакций вследствие высокой концентрации глюкозы, накапливающейся в ходе этапа осахаривания. Обратная реакция, катализируемая глюкоамилазой, дает мальтозу и изомальтозу. Поскольку коммерческие ферментативные препараты могут содержать трансглюкозидазу (1,4-α-глюкан-6-α-глюкозилтрансферазу; EC 2.4.1.24), присутствие этого фермента также способствует образованию изомальтозы и панозы. Существуют многочисленные видоизменения этой основной процедуры благодаря доступным ферментам, их смесям и условиям реакции.

Обобщенные сведения, касающиеся ферментативного гидролиза крахмала до глюкозы и образуемых побочных продуктов, можно найти у P.H. Blanchard (Technology of Corn Wet Milling and Associated Processes, Elsevier, 1992), M.W. Kearsley и S.Z. Dziedzic (Handbook of Starch Hydrolysis Products and their Derivatives, Chapmann & Hall, 1995), B.H. Lee (Fundamentals of Food Biotechnology, VCH Publishers, 1996) или H. Uhlig (Industrial Enzymes and their Application, John Wiley & Sons 1998). Данные, касающиеся состава гидролизатов крахмала, производимых таким образом, можно найти у A. Converti (Starch/Stärke 46 (7), 260-265, 1994), M. Chaplin и C. Bucke (Enzyme Technology, Cambridge University Press, 1990), Amarakone, P. B и соавт. (Journal of the Japanese Society of Starch Science, 31(1), 1-7, 1984), WO9927124 A1 и WO2005100583 A2. Содержание глюкозы в таких гидролизатах крахмала составляет приблизительно 85-97% (в пересчете на содержание сухого вещества).

Для промышленного ферментативного получения серийно производимых химических продуктов тонкого синтеза, таких как L-аминокислоты, например, L-лизин, неэкономично сначала очищать глюкозу от гидролизата крахмала, а затем использовать ее в процессе ферментации. Вместо этого используют сам гидролизат крахмала в качестве недорогого содержащего глюкозу сырья.

Corynebacterium glutamicum не может использовать изомальтозу или панозу в качестве источника углерода. Соответственно, эти соединения накапливаются в ферментативном бульоне в процессе получения при использовании указанного гидролизата крахмала в качестве сырья. Присутствие этих сахаров, в свою очередь, является неблагоприятным, поскольку они представляют собой дополнительную нагрузку на сточные воды заводов. Кроме того, они могут приводить к потерям продукта в ходе этапов обработки для производства конечного продукта. Например, известно, что восстанавливающий конец молекулы сахара может реагировать с аминогруппой L-аминокислот, например, L-лизина, с образованием продуктов реакции Майяра (M.W. Kearsley and S.Z. Dziedzic: Handbook of Starch Hydrolysis Products and their Derivatives, Chapmann & Hall, 1995).

Чтобы избежать этих недостатков, были разработаны способы превращения изомальтозы и/или панозы в глюкозу в ходе процесса ферментации. В WO2005100583 A2, WO2014093312 A1 и WO2015061289 A1 описывается добавление трансглюкозидазы в ферментативный бульон, содержащий гидролизат крахмала или сахарный сироп в качестве источника углерода. Этот подход имеет недостаток, заключающийся в том, что фермент следует получать отдельно, что таким образом увеличивает производственные затраты.

Другого подхода придерживаются в EP2241632 A1. В ней предлагается придавать микроорганизму изомальтазную активность. В качестве микроорганизмов представлены Enterobacteriaceae, в том числе E. coli и коринеформные бактерии, в том числе конкретные примеры этой группы бактерий. В EP2241632 A1, кроме того, сообщается, что можно использовать внутриклеточную или внеклеточную изомальтазу. В случае если предоставляется внутриклеточная изомальтаза, а клетка не обладает активностью поглощения изомальтозы, предпочтительно придавать как внутриклеточную изомальтазную активность, так и активность поглощения изомальтозы клеткой. В качестве примеров гена изомальтазы показаны гены maIL и glvA Bacillus subtilis и их гомологи. В качестве генов транспортеров изомальтозы показаны ген glvC Bacillus subtilis и другие гены, выполняющие аналогичную функцию, различного происхождения. В ходе экспертизы был представлен экспериментальный пример, в котором гены glvA и glvC Bacillus subtilis экспрессировались в штамме C. glutamicum, выделяющем L-лизин. Сконструированный штамм продемонстрировал благоприятное потребление изомальтозы и образование L-лизина по сравнению с эталоном. Однако в EP2241632 A1 не говорится о том, позволит ли данная система клетке C. glutamicum потреблять панозу.

В EP2241632 A1, кроме того, в целом предполагается, что ген внеклеточной изомальтазы можно получить путем лигирования кодирующей области гена изомальтазы с последовательностью, кодирующей сигнальный пептид для секреции белка в поверхностный слой клетки или за пределы клетки. В качестве сигнального пептида предлагается белок A Staphylococcus aureus. Посредством слияния указанного сигнального пептида белка A с изомальтазой MaIL Bacillus subtilis приводится технический пример для E. coli. В документе не говорится о том, разрушает ли также эта секретируемая изомальтаза панозу. Кроме того, в документе не говорится о подходящих сигнальных пептидах для Corynebacterium glutamicum или о том, как выбрать соответствующий сигнальный пептид, подходящий для изомальтазы.

В EP2241632 A1 также представлены два перечня предполагаемых генов изомальтазы из различных микроорганизмов. В таблице 1 EP2241632 A1 представлены потенциальные изомальтазы в качестве гомологов MaIL, обладающих, помимо прочего, функцией многофункциональной G-амилазы, продуцирующей олигосахариды, олиго-1,6-глюкозидазы, каталитической области альфа-амилазы или трегалозо-6-фосфатгидролазы. В таблице 2 представлены потенциальные гены изомальтазы в качестве гомологов, обладающих функцией мальтозо-6'-фосфатглюкозидазы или 6-фосфо-альфа-глюкозидазы.

Аналогичным образом, S. Jiang и L. Ma раскрыли нуклеотидную последовательность гена олиго-1,6-глюкозидазы штамма HB002 Bacillus subtilis (доступного в Национальном центре биотехнологической информации (NCBI) под номером доступа в GenBank AY008307.1). В записи не говорится об активности кодируемого белка в отношении изомальтозы и панозы.

В уровне техники сообщается о различных внутриклеточных α-1,6-глюкозидазах (EC 3.2.1.10), обладающих способностью разрушать α-1,6-связь в изомальтозе и/или панозе.

Нуклеотидная последовательность гена IMA1 штамма S288c Saccharomyces cerevisiae, кодирующего олиго-1,6-глюкозидазу, доступна в NCBI под номером доступа в GenBank NC_001139 с идентификатором локуса YGR287C. В этой записи кодируемый белок раскрывается как изомальтаза. В записи не говорится о ее активности в отношении панозы.

Ген dexB Streptococcus mutans кодирует внутриклеточную глюкан-1,6-альфа-глюкозидазу (Whiting et al, Journal of General Microbiology 139, 2019-2026, 1993), обладающую способностью гидролизовать α-1,6-связь в изомальтозе и панозе.

WO2004018645 A2 относится к секвенированию генома Bifidobacterium breve ATCC 15700 и, в частности, к идентификации генов, кодирующих ферменты, обладающие способностью гидролизовать α-1,6-связь в изомальтозе и панозе.

У Pokusaeva и соавт. (Applied and Environmental Microbiology 75, 1135-1143, 2009) описываются два гена agl1 и agl2 Bifidobacterium breve UCC2003, кодирующие ферменты Agl1 и Agl2, оба из которых обладают активностью α-1,6-глюкозидаз. Данные ферменты способны гидролизовать α-1,6-связь в панозе и изомальтозе. У Pokusaeva и соавт. отсутствует четкое объяснение внутри- или внеклеточной локализации этих двух ферментов. Однако в обзорной статье Pokusaeva и соавт. (Genes and Nutrition 6, 285-306, 2011) два фермента Agl1 и Agl2 классифицируются как «цитоплазматические ферменты» (см. страницы 299-300).

У C. glutamicum существует два пути секреции белков. Один называется Sec-путем и опосредует транслокацию белков-предшественников в развернутом состоянии через мембрану. Другой называется Tat-путем и опосредует перенос белков-предшественников в их свернутом состоянии. Сигнальный пептид белка-предшественника отщепляется от белка-предшественника пептидазой в ходе процесса секреции, и зрелый белок высвобождается в культуральную среду. Обобщенные сведения, касающиеся секреции белков у Corynebacterium glutamicum, были представлены A. A. Vertes входящими в состав публикации H. Yukawa и M. Inui Corynebacterium glutamicum Biology and Biotechnology, Springer Verlag, 2013), а также Liu и соавт. (Critical Reviews in Biotechnology 1-11, 2016).

Имеется ряд сообщений об успешной секреции у C. glutamicum различных белков от различных видов или различного происхождения. Однако большинство из этих белков секретируется их естественными хозяевами, что указывает на тот факт, что эти белки обладают присущей им способностью секретироваться.

Liebl и соавт. (Journal of Bacteriology 174, 1854-1861, 1992) сообщали об успешной экспрессии и секреции стафилококковой нуклеазы, внеклеточном ферменте Staphylococcus aureus, у C. glutamicum с помощью сигнального пептида первоначального хозяина.

Billman-Jacobe и соавт. (Applied and Environmental Microbiology 61, 1610-1613, 1995) сообщали об экспрессии и секреции основной протеазы Dichelobacter nodosus и субтилизина Bacillus subtilis у C. glutamicum. Поскольку секреция субтилизина управляется его собственным сигнальным пептидом, естественный сигнальный пептид основной протеазы не способствует секреции. После замещения естественной сигнальной последовательности сигнальной последовательностью субтилизина основная протеаза секретировалась у C. glutamicum.

Salim и соавт. (Applied and Environmental Microbiology 63, 4392-4400, 1997) сообщали об экспрессии и секреции белка антигена 85 Mycobacterium tuberculosis у C. glutamicum. Этот белок в естественных условиях встречается в культуральных фильтратах M. tuberculosis.

EP1375664 A1 относится к продуцированию и секреции гетерологичных белков, таких как протрансглутаминаза Streptoverticillium mobaraense или человеческий эпидермальный фактор роста (hEGF), у Corynebacterium glutamicum путем слияния указанных белков с последовательностями сигнальных пептидов белков клеточной поверхности C. glutamicum или C. ammoniagenes. Протрансглутаминаза Streptoverticillium mobaraense является ферментом, который секретируется его естественным хозяином (Pasternack et al; European Journal of Biochemistry 257, 570-576, 1998). Человеческий эпидермальный фактор роста представляет собой секретируемый пептид, изначально обнаруженный Cohen, S. и Carpenter, G. (Proceedings of National Academy of Sciences USA 72(4), 1317-1321, 1975) в моче человека.

EP1748077 A1 относится к продуцированию и секреции гетерологичных белков у коринеформных бактерий c использованием области, представляющей собой зависимый от Tat-системы сигнальный пептид. В частности, изомальтодекстраназа Arthrobacter globiformis (6-α-D-глюканизомальтогидролаза) секретировалась у C. glutamicum при использовании сигнальной последовательности изомальтодекстраназы или сигнальной последовательности белка поверхностного слоя клеток SlpA C. ammoniagenes. Протеинглутаминаза Chryseobacterium proteolyticum секретировалась у C. glutamicum при использовании сигнальной последовательности изомальтодекстраназы A. globiformis, сигнальной последовательности SlpA C. ammoniagenes или сигнальной последовательности TorA Escherichia coli. Изомальтодекстраназа Arthrobacter globiformis является ферментом, который секретируется его естественным хозяином (Iwai et al; Journal of Bacteriology 176, 7730-7734, 1994). Протеинглутаминаза Chryseobacterium proteolyticum также является ферментом, который секретируется в культуральную среду его естественным хозяином (Kikuchi et al; Applied Microbiology and Biotechnology 78, 67-74, 2008).

Watanabe и соавт. (Microbiology 155, 741-750, 2009) идентифицировали N-конец продукта гена CgR0949 и другие продукты генов C. glutamicum R как сигнальные пептиды, направляющие белки по секреторному Tat-пути. Сигнальные последовательности CgR0949 содержат последовательность из 30 аминокислотных остатков. После добавления этой сигнальной аминокислотной последовательности к α-амилазе Geobacillus stearothermophilus, из которой был удален естественный сигнальный пептид, фермент секретировался хозяином C. glutamicum в культуральную среду. α-Амилаза Geobacillus stearothermophilus является ферментом, который секретируется его естественным хозяином (Fincan and Enez, Starch 66, 182-189, 2014).

Breitinger, K. J. (диссертация на соискание ученой степени доктора философии, Ульмский университет, 2013) раскрыл экспрессию слитого полипептида, состоящего из предполагаемой сигнальной последовательности белка, кодируемого геном cg0955 C. glutamicum ATCC 13032, и пуллуланазы PulA Klebsiella pneumoniae UNF5023, в штамме C. glutamicum,, продуцирующем L-лизин. Пуллуланазную активность выявили в клеточном лизате и в мембранной фракции указанных клеток C. glutamicum, но не в надосадочной жидкости культуры указанного штамма. Пуллуланаза PulA Klebsiella pneumoniae UNF5023 является ферментом, который секретируется его естественным хозяином (Kornacker and Pugsley, Molecular Microbiology 4, 73-85, 1990). Breitinger, K. J., кроме того, установил, что 5'-конец гена Cg0955 C. glutamicum ATCC 13032 демонстрирует 95% степень гомологии по отношению к сигнальной последовательности гена cgR0949 C. glutamicum R. Сигнальная последовательность белка, кодируемого геном cgR0949, была классифицирована как сигнальная последовательность Tat-типа Watanabe и соавт. (Microbiology 155, 741-750, 2009).

Hyeon и соавт. (Enzyme and Microbial Technology 48, 371-377, 2011) сконструировали вектор pMT1s, предназначенный для секреции продуктов генов в культуральную среду с помощью нуклеотидной последовательности cg0955, кодирующей Tat-сигнальный пептид. Таким образом, они смогли достичь секреции поддерживающего белка CbpA Cellulomonas cellulovorans и эндоглюканазы CelE Clostridium thermocellum у C. glutamicum для получения миницеллюлосом. Эти белки секретируются и представляются на поверхности клетки у их естественных хозяев.

Kim и соавт. (Enzyme and Microbial Technology 66, 67-73, 2014) аналогичным образом обеспечивали экспрессию и секрецию эндоглюканазы CelE и β-глюкозидазы BglA C. thermocellum у C. glutamicum для представления их на поверхности клетки. У их естественного хозяина эти ферменты являются составляющими целлюлосом, расположенных на поверхности клетки своего хозяина.

Matano и соавт. (BMC Microbiology 16, 177, 2016) исследовали экспрессию и секрецию N-ацетилглюкозаминидазы из различных микроорганизмов. Ген под названием nagA2 идентифицировали в хромосоме C. glutamicum. После его экспрессии ферментативную активность выявляли в цитоплазматической фракции и надосадочной жидкости культуры. После замещения предполагаемого сигнального пептида NagA2 другими сигнальными последовательностями Tat-типа, в том числе SP0955 (другое название сигнального пептида, кодируемого cg0955), эффективность секреции улучшалась. Matano и соавт., кроме того, достигли секреции экзохитиназы ChiB Serratia marcescens путем слияния последовательности, кодирующей Tat-сигнальный пептид для секреции, из гена cg0955 C. glutamicum с chiB. Следует отметить, что экзохитиназа ChiB Serratia marcescens является ферментом, который экспортируется в периплазму своим естественным хозяином (Brurberg et al, Microbiology 142, 1581-1589 (1996)). Matano и соавт. дополнительно исследовали секрецию N-ацетилглюкозаминидазы Bacillus subtilis, кодируемой nagZ, у C. glutamicum. Этот фермент неэффективно секретируется своим естественным хозяином. Экспрессию N-ацетилглюкозаминидазы NagZ также обеспечивали при использовании различных сигнальных пептидов C. glutamicum для повышения количества ферментов в надосадочной жидкости. Однако слияние с этими сигнальными пептидами, в том числе с сигнальным пептидом из Cg0955, не оказывало эффект на количество фермента, секретируемого в надосадочную жидкость культуры. В частности, следует отметить, что слияние с сигнальным пептидом из Cg0955 существенно повышало величину внутриклеточной ферментативной активности.

Yim и соавт. (Applied Microbiology and Biotechnology 98, 273-284, 2014) сообщали о секреции рекомбинантного одноцепочечного вариабельного фрагмента антитела к сибиреязвенному токсину у C. glutamicum. Использование сигнального пептида TorA, направляющего по Tat-пути, приводило к весьма незначительной секреции, тогда как использование сигнального пептида PorB, направляющего по Sec-пути, приводило к измеримой секреции. Авторы также установили, что использование кодон-оптимизированной последовательности гена было одной из составляющих высокого уровня продуцирования белка.

WO2008049782 A1 относится к повышению экспрессии генов у C. glutamicum путем корректирования частоты использования кодонов в генах в соответствии с таковой для наиболее широко распространенных белков в клетке-хозяине.

Зеленый флуоресцентный белок (GFP) привлекает большой интерес в молекулярной биологии в качестве модельного белка, удобного для наблюдения благодаря своей флуоресценции. Он встречается у медуз, таких как Aequorea victoria, где он локализован в специальных фотоцитах (J. M. Kendall and M. N. Badminton, Tibtech, 216-224, 1998). Meissner и соавт. (Applied Microbiology and Biotechnology 76, 633-642, 2007) исследовали секрецию белка с помощью зеленого флуоресцентного белка у трех разных грамположительных бактерий Staphylococcus carnosus, Bacillus subtilis и Corynebacterium glutamicum. У всех трех микроорганизмов слияние Tat-сигнального пептида с GFP приводило к его транслокации через цитоплазматическую мембрану. Однако у S. carnosus GFP полностью задерживался в клеточной стенке и не высвобождался в надосадочную жидкость. У Bacillus subtilis GFP секретировался в надосадочную жидкость в неактивной форме. У C. glutamicum использовали различные Tat-сигнальные пептиды: сигнальный пептид TorA из E. coli, сигнальную последовательность PhoD из C. glutamicum и сигнальную последовательность PhoD из Bacillus subtilis. Хотя GFP секретировался во всех трех случаях, количество секретируемого белка существенно различалось. Сигнальная последовательность PhoD из B. subtilis на удивление давала наилучший результат.

Teramoto и соавт. (Applied Microbiology and Biotechnology 91, 677-687, 2011) использовали сигнальный пептид CgR0949 для достижения высокого выхода секреции GFP у C. glutamicum.

Следует отметить, что Hemmerich и соавт. (Microbial Cell Factory 15(1), 208, 2016) после поиска подходящего сигнального пептида для секреции кутиназы Fusarium solani pisi у Corynebacterium glutamicum заключили, что наилучший сигнальный пептид для конкретного целевого белка каждый раз должен оцениваться заново.

Изомальтоза и/или паноза содержатся в гидролизате крахмала в сравнительно небольших количествах. Соответственно, для исследовательской программы, направленной на получение штамма C. glutamicum, продуцирующего химический продукт тонкого синтеза, например, L-лизин, с высоким выходом и с использованием сравнительно низких количеств этих сахаров в качестве дополнительного источника углерода, нежелательно продуцировать и секретировать фермент, гидролизирующий α-1,6-гликозидную связь в этих сахарах, с высоким выходом. Оба соединения, химический продукт тонкого синтеза и фермент, будут конкурировать за один и тот же (одни и те же) источник(источники) углерода, и, таким образом, это будет отрицательно влиять на выход соединения, представляющего коммерческий интерес, которое представляет собой химический продукт тонкого синтеза. В этом случае продуцируемый и секретируемый фермент станет метаболической нагрузкой для продуцента химического продукта тонкого синтеза.

До сих пор направление внутриклеточного фермента микроорганизма, обладающего способностью к гидролизу α-1,6-гликозидной связи изомальтозы и/или панозы, на внеклеточный матрикс, т. e. надосадочную жидкость культуры, не было продемонстрировано для Corynebacterium glutamicum.

Однако желательно обеспечить ферментативный процесс для получения химического продукта тонкого синтеза из недорогого сырьевого материала для ферментации, содержащего панозу и/или изомальтозу, такого как гидролизат крахмала, с помощью Corynebacterium, в частности, Corynebacterium glutamicum, обладающей способностью к гидролизу α-1,6-гликозидной связи панозы и/или изомальтозы, что таким образом делает доступным получение больших количеств этих олигомеров глюкозы и образование из них химических продуктов тонкого синтеза.

Целью настоящего изобретения является обеспечение полинуклеотида, кодирующего полипептид, который обладает α-1,6-глюкозидазной активностью, и при этом данный полипептид может секретироваться Corynebacterium, предпочтительно Corynebacterium glutamicum.

Дополнительная цель настоящего изобретения заключается в обеспечении Corynebacterium, предпочтительно Corynebacterium glutamicum, содержащей указанный полинуклеотид.

Кроме того, целью настоящего изобретения является обеспечение способа получения химического продукта тонкого синтеза, такого как L-аминокислоты, витамины, нуклеозиды и нуклеотиды, из источника углерода, содержащего олигосахариды, состоящие по меньшей мере из двух соединенных α-1-6-гликозидной связью глюкозных мономеров, таких как паноза (O-α-D-Glcp-(1→6)-O-α-D-Glcp-(1→4)-D-Glcp) или изомальтоза (O-α-D-Glcp-(1→6)-O-α-D-Glcp), с помощью указанной Corynebacterium.

Для достижения указанной в общих чертах выше цели в настоящем изобретении обеспечиваются полинуклеотиды, кодирующие новые слитые полипептиды, по сути содержащие Tat-сигнальный пептид CgR0949 или Cg0955 и полипептиды Agl2 или Agl1 Bifidobacterium breve UCC2003, а также их варианты, обеспечивающие α-1,6-глюкозидазную активность.

В настоящем изобретении, кроме того, обеспечиваются бактерии рода Corynebacterium и Escherichia, несущие указанные полинуклеотиды, и способы получения химических продуктов тонкого синтеза из олигосахаридов, состоящих по меньшей мере из двух соединенных α-1-6-гликозидной связью глюкозных мономеров, таких как паноза и/или изомальтоза, с помощью указанных бактерий.

Цели, лежащие в основе настоящего изобретения, достигаются с помощью выделенного полинуклеотида, предпочтительно дезоксирибополинуклеотида, кодирующего слитый полипептид, содержащий аминокислотные последовательности a), b) и c), при этом

a) представляет собой N-концевой Tat-сигнальный пептид, состоящий из аминокислотной последовательности, выбранной из

a1) положений 1-33 SEQ ID NO: 10 или положений 1-33 SEQ ID NO: 12 и

a2) положений 1-33 SEQ ID NO: 10 с Ala в положении 13 или положений 1-33 SEQ ID NO: 12 с Ala в положении 13;

b) представляет собой C-концевой полипептид, обладающий α-1,6-глюкозидазной активностью, состоящий из аминокислотной последовательности, выбранной из

b1) по меньшей мере на (≥) 95% идентичной, предпочтительно на ≥ 99% идентичной последовательности из положений 37-639 SEQ ID NO: 10, и

b2) по меньшей мере на (≥) 95% идентичной, предпочтительно на ≥ 99% идентичной последовательности из положений 37-643 SEQ ID NO: 12, и

c) представляет собой от 0 до максимум 10 аминокислотных остатков, предпочтительно от 1 до 3 аминокислотных остатков, особенно предпочтительно 3 аминокислотных остатка, между a) и b).

В случае если аминокислотная последовательность c) состоит из 3 аминокислотных остатков, предпочтительно, чтобы эти 3 аминокислоты имели последовательность Met Thr Ser.

Можно показать, что предусматриваемый полинуклеотид, в котором кодирующая последовательность для специфического Tat-сигнального пептида согласно a1) или a2) объединена со специфической α-1,6-глюкозидазой согласно b1) или b2), обеспечивает разрушение панозы и изомальтозы при экспрессии у бактерии из рода Corynebacterium или Escherichia, продуцирующей химический продукт тонкого синтеза. Экспрессия полинуклеотида в соответствии с настоящим изобретением не возлагает метаболическую нагрузку на продуцирование указанного химического продукта тонкого синтеза. Экспрессия полинуклеотида в соответствии с настоящим изобретением, кроме того, улучшает выход химического продукта тонкого синтеза, продуцируемого бактерией, продуцирующей химический продукт тонкого синтеза, делая доступными панозу и изомальтозу в качестве источника углерода.

Предусматриваемый полинуклеотид в соответствии с настоящим изобретением, таким образом, решает следующие задачи:

- обеспечения α-1,6-глюкозидазы со специфичностью, которая позволяет осуществлять деполимеризацию изомальтозы и панозы в условиях ферментации;

- экспрессии α-1,6-глюкозидазы у бактерии, продуцирующей химический продукт тонкого синтеза, без возникновения метаболической нагрузки на продуцирование химического продукта тонкого синтеза;

- достижения секреции α-1,6-глюкозидазы в окружающую среду бактерии, продуцирующей химический продукт тонкого синтеза, путем объединения кодирующей последовательности для α-1,6-глюкозидазы с подходящим сигнальным пептидом, совместимым со специфической α-1,6-глюкозидазой;

- обеспечения дополнительного метаболизируемого источника углерода для продуцирования химического продукта тонкого синтеза и повышения суммарного выхода химического продукта тонкого синтеза, продуцируемого бактерией, посредством достижения того, что экспрессия секретируемой α-1,6-глюкозидазы не конкурирует с продуцированием химического продукта тонкого синтеза за источник углерода.

В случае если аминокислотная последовательность a) непосредственно прилегает или, соответственно, присоединена к аминокислотной последовательности b), число аминокислотных остатков c) равняется 0 (нулю).

В случае если число аминокислотных остатков c) равняется 3 (трем), предпочтительно, чтобы последовательность указанных аминокислотных остатков представляла собой Met Thr Ser или Ile Leu Val.

Предпочтительно, чтобы N-концевой Tat-сигнальный пептид a) состоял из аминокислотной последовательности a1), которая представляет собой аминокислотную последовательность из положений 1-33 SEQ ID NO: 10 или положений 1-33 SEQ ID NO: 12.

Кроме того, предпочтительно, чтобы аминокислотная последовательность C-концевого полипептида b1) была выбрана из положений 37-639 SEQ ID NO: 10 и из положений 37-639 SEQ ID NO: 10 с дополнительным Met перед положением 37, как показано под SEQ ID NO: 6, и особенно предпочтительной является аминокислотная последовательность из положений 37-639 SEQ ID NO: 10.

Термин «дополнительный Met перед положением 37, как показано под SEQ ID NO: 6» означает, что аминокислота Met встроена в аминокислотную последовательность SEQ ID NO: 10 между положениями 36 и 37.

Кроме того, предпочтительно, чтобы C-концевой полипептид b2) был выбран из положений 39-643 SEQ ID NO: 12, положений 38-643 SEQ ID NO: 12 и положений 37-643 SEQ ID NO: 12, и особенно предпочтительной является аминокислотная последовательность из положений 37-643 SEQ ID NO: 12.

Подробности, касающиеся биохимических свойств и химической структуры полинуклеотидов и полипептидов, присутствующих в живых организмах, например, бактериях, таких как Corynebacterium или Escherichia, можно найти, например, помимо прочего, в учебнике "Biochemie" Berg и соавт. (Spektrum Akademischer Verlag Heidelberg, Berlin, Germany, 2003; ISBN 3-8274-1303-6).

Полинуклеотиды, состоящие из дезоксирибонуклеотидных мономеров, содержащих нуклеотидные основания или, соответственно, основания аденин (a), гуанин (g), цитозин (c) и тимин (t), называются дезоксирибополинуклеотидами или дезоксирибонуклеиновой кислотой (ДНК). Полинуклеотиды, состоящие из рибонуклеотидных мономеров, содержащих нуклеотидные основания или основания аденин (a), гуанин (g), цитозин (c) и урацил (u), называются рибополинуклеотидами или рибонуклеиновой кислотой (РНК). Мономеры в указанных полинуклеотидах ковалентно соединены друг с другом 3',5'-фосфодиэфирной связью. Принято, что однонитевые полинуклеотиды записывают в 5'-3'-направлении. Соответственно, полинуклеотид имеет 5'-конец и 3'-конец. Для целей настоящего изобретения предпочтительны дезоксирибополинуклеотиды. У бактерий, например, Corynebacterium или Escherichia, ДНК, как правило, присутствует в двухнитевой форме. Соответственно, длина молекулы ДНК, как правило, приводится в парах оснований (п.о.).

Полипептиды состоят из L-аминокислотных мономеров, соединенных пептидными связями. Для сокращения L-аминокислот используют однобуквенный код и трехбуквенный код IUPAC. Благодаря природе биосинтеза полипептидов полипептиды имеют амино-конец и карбоксильный конец, также называемые N-концом и C-концом. Полипептиды также называют белками.

Слитые полипептиды, также называемые в данной области техники слитыми белками или химерными белками, представляют собой полипептиды, создаваемые посредством соединения двух или более генов, которые изначально кодировали отдельные полипептиды. В результате трансляции такого слитого гена получают полипептид с функциональными свойствами каждого из исходных полипептидов.

В ходе работы над настоящим изобретением часть, содержащую 5'-конец нуклеотидной последовательности различных генов, кодирующих N-концевую часть полипептидов, обладающих способностью к транслокации через цитоплазматическую мембрану бактерии, сливали с нуклеотидными последовательностями генов или их частей, кодирующими полипептиды, обладающие α-1,6-глюкозидазной ферментативной активностью, при этом указанные полипептиды, таким образом, составляют C-концевую часть или, соответственно, C-концевой полипептид в слитом полипептиде.

У бактерий, таких как Corynebacterium и Escherichia, имеются два основных пути секреции белков или, соответственно, полипептидов через цитоплазматическую мембрану. Один называют общим секреторным путем или Sec-путем, а другой называют путем диаргининовой транслокации или Tat-путем. Общий обзор этих двух путей транслокации был представлен Natale и соавт. (Biochimica et Biophysica Acta 1778, 1735 -1756, 2008), а обзор конкретно для Corynebacterium glutamicum был дан Liu и соавт. (Critical Reviews in Biotechnology 2016) и Freudl (Journal of Biotechnology http://dx.doi.org/10.1016/j.jbiotec.2017.02.023).

Функциональный анализ пути диаргининовой транслокации у Corynebacterium glutamicum был представлен Kikuchi и соавт. (Applied and Environmental Microbiology 72, 7183 - 7192, 2006).

Нуклеотидная последовательность кодирующей области (cds) cgR0949 штамма R Corynebacterium glutamicum показана под SEQ ID NO: 3, а аминокислотная последовательность кодируемого полипептида CgR0949 показана под SEQ ID NO: 4 в перечне последовательностей. Нуклеотидную последовательность кодирующей области cgR0949 также можно найти в NCBI по идентификатору локуса CGR_RS04950 геномной последовательности, доступной под № NC_009342. Аминокислотную последовательность CgR0949, также обозначаемую в данной области техники как CgR_0949, можно найти под номером доступа в GenBank BAF53923.1.

Watanabe и соавт. (Microbiology 155, 741 - 750, 2009) идентифицировали аминокислотную последовательность из положений 1-30 SEQ ID NO: 4 как сигнальную последовательность или, соответственно, сигнальный пептид, направляющие по Tat-пути, и последовательность Leu Gly Ala, показанную в положениях 31-33 SEQ ID NO: 4, как предполагаемый сайт расщепления.

Нуклеотидная последовательность кодирующей области (cds) cg0955 штамма ATCC13032 Corynebacterium glutamicum показана под SEQ ID NO: 1, а аминокислотная последовательность кодируемого полипептида Cg0955 показана под SEQ ID NO: 2 в протоколе последовательностей. Нуклеотидную последовательность кодирующей области cg0955 также можно найти в NCBI по идентификатору локуса NCgl0801 геномной последовательности, доступной под № NC_003450. Аминокислотную последовательность Cg0955 можно найти под номером доступа NP_600064.1.

В настоящем изобретении термин «сигнальный пептид CgR0949», или «Tat-сигнальный пептид CgR0949», или «сигнальный пептид Cg0955», или «Tat-сигнальный пептид Cg0955» включает аминокислотную последовательность сигнальной последовательности и предполагаемый сайт расщепления Leu Gly Ala, как определено у Watanabe и соавт. (см. фигуру 3 на стр. 745 у Watanabe и соавт.).

Аминокислотная последовательность из положений 1-33 SEQ ID NO: 2 идентична аминокислотной последовательности из положений 1-33 SEQ ID NO: 4 за исключением положения 13. Аминокислота в положении 13 SEQ ID NO: 2 представляет собой Thr, а аминокислота в положении 13 SEQ ID NO: 4 представляет собой Ala.

Аминокислотная последовательность из положений 1-33 SEQ ID NO: 2 полностью идентична аминокислотной последовательности из положений 1-33 SEQ ID NO: 10 и полностью идентична аминокислотной последовательности SEQ ID NO: 12.

Термин «α-1,6-глюкозидаза» означает фермент, который обладает активностью гидролиза α-1,6-связи в некоторых олигосахаридах, получаемых из крахмала или гликогена. Для целей настоящего изобретения фермент обладает по меньшей мере способностью гидролизовать α-1,6-связь, содержащуюся в изомальтозе и/или панозе. Согласно Номенклатурному комитету Международного союза биохимии и молекулярной биологии (NC-IUBMB) принятым названием фермента является «олиго-1,6-глюкозидаза», а систематическим названием - «олигосахарид-α-1,6-глюкогидролаза». EC-номером фермента является EC 3.2.1.10. Инструкции по измерению активности указанного фермента можно найти у Pokusaeva и соавт. (Applied and Environmental Microbiology 75, 1135-1143, 2009). Активность фермента также можно оценивать с помощью хромогенного субстрата, такого как пара-нитрофенил-α-глюкозид, как описано, например, у Deng и соавт. (FEBS Open Bio 4, 200 - 212, 2014).

В одном наборе предпочтительных вариантов осуществления настоящего изобретения C-концевая часть полипептида или, соответственно, C-концевой полипептид слитого полипептида представляют собой α-1,6-глюкозидазу Agl2 штамма UCC2003 Bifidobacterium breve (см. Pokusaeva и соавт.) и ее варианты. Эту группу C-концевых полипептидов также называют далее C-концевыми полипептидами Agl2-типа. Аминокислотная последовательность кодируемого полипептида α-1,6-глюкозидазы Agl2 штамма UCC2003 Bifidobacterium breve находится в открытом доступе в базе данных GenBank NCBI (Национальный центр биотехнологической информации, Национальная библиотека медицины США, Роквилл-Пайк 8600, Бетесда, Мэриленд, 20894, США) под номером доступа FJ386390. Она также показана под SEQ ID NO: 6 в протоколе последовательностей. Аминокислотная последовательность из положений 2-604 SEQ ID NO: 6 идентична аминокислотной последовательности из положений 37-639 SEQ ID NO: 10. Аминокислотная последовательность из положений 37-639 SEQ ID NO: 10 представляет собой C-концевой полипептид кодируемого слитого полипептида, показанного под SEQ ID NO: 10.

В соответствии с настоящим изобретением можно использовать варианты указанного C-концевого полипептида, которые имеют аминокислотную последовательность, на ≥ 95% идентичную, предпочтительно на ≥ 99%, особенно предпочтительно на 100% идентичную аминокислотной последовательности из положений 37-639 SEQ ID NO: 10. Пример C-концевого полипептида, имеющего аминокислотную последовательность, на ≥ 99% идентичную таковой из положений 37-639 SEQ ID NO: 10, показан под SEQ ID NO: 6.

Было обнаружено, что при присоединении Tat-сигнального пептида Cg0955 к указанным α-1,6-глюкозидазам Agl2 цели настоящего изобретения достигались эффективным образом.

Эти C-концевые полипептиды Agl2-типа предпочтительно присоединены к Tat-сигнальному пептиду Cg0955, показанному в положениях 1-33 аминокислотной последовательности SEQ ID NO: 2. Аминокислотная последовательность из положений 1-33 SEQ ID NO: 2 идентична аминокислотной последовательности из положений 1-33 SEQ ID NO: 10. Они могут быть соединены непосредственно или с помощью последовательности максимум из 10 аминокислот, предпочтительно 1-3, особенно предпочтительно 3 аминокислот. Предпочтительно, чтобы эти 3 аминокислоты имели последовательность Met Thr Ser.

Соответственно, в настоящем изобретении обеспечивается выделенный полинуклеотид, кодирующий слитый полипептид, содержащий аминокислотную последовательность SEQ ID NO: 10, предпочтительно состоящий из нее и обладающий α-1,6-глюкозидазной активностью. Кодируемый слитый полипептид, показанный под SEQ ID NO: 10, был обозначен как Tat-'Agl2.

Аминокислотная последовательность C-концевого полипептида в слитом полипептиде, показанном под SEQ ID NO: 10, которая представляет собой аминокислотную последовательность из положений 37-639 SEQ ID NO: 10, может кодироваться нуклеотидной последовательностью из положений 4-1812 SEQ ID NO: 5, которая представляет собой нуклеотидную последовательность кодирующей области гена agl2, содержащегося в Bifidobacterium breve UCC2003, без стартового кодона atg. Нуклеотидную последовательность из положений 4-1812 SEQ ID NO: 5 также называют 'agl2.

Из уровня техники известно, что генетический код является вырожденным, что означает, что определенная аминокислота может кодироваться несколькими различными триплетами. Термин «частота использования кодонов» относится к наблюдению того, что некий организм, как правило, не будет использовать каждый возможный кодон для определенной аминокислоты с одной и той же частотой. Вместо этого организм обычно будет демонстрировать определенные предпочтения для конкретных кодонов, что означает, что эти кодоны обнаруживаются чаще в кодирующей последовательности транскрибируемых генов организма. Если некоторый ген, чужеродный для своего будущего хозяина, т. e. из другого вида, должен быть экспрессирован в будущем организме-хозяине, то тогда кодирующая последовательность указанного гена должна быть скорректирована в соответствии с частотой использования кодонов указанного будущего организма-хозяина. В настоящем изобретении указанным геном, чужеродным для своего будущего хозяина, являются agl2 Bifidobacterium breve UCC2003 или его варианты, а указанным будущим хозяином является Corynebacterium, предпочтительно Corynebacterium glutamicum. Идеи, касающиеся оптимизации частоты использования кодонов, можно найти у Fath и соавт. (PLos ONE, 6(3), e17596, 2011) и в WO2008049782.

Согласно дополнительному варианту осуществления настоящего изобретения указанная аминокислотная последовательность из положений 37-639 SEQ ID NO: 10 кодируется выделенным полинуклеотидом, имеющим нуклеотидную последовательность, оптимизированную по частоте использования кодонов для Corynebacterium glutamicum, при этом указанная нуклеотидная последовательность является на ≥ 99,0%, особенно предпочтительно на ≥ 99,5%, более особенно предпочтительно на 100% идентичной нуклеотидной последовательности из положений 109-1917 SEQ ID NO: 9.

Нуклеотидную последовательность из положений 109-1917 SEQ ID NO: 9, являющуюся оптимизированной по частоте использования кодонов (cuo) для Corynebacterium glutamicum, в настоящем изобретении также называют «'agl2_cuo».

В соответствии с настоящим изобретением выделенный полинуклеотид, кодирующий слитый полипептид, содержащий аминокислотную последовательность из положений 1-33 SEQ ID NO: 10, непосредственно после которой расположена последовательность из трех аминокислот, предпочтительно аминокислотная последовательность из положений 34-36 SEQ ID NO: 10, непосредственно после которой расположена аминокислотная последовательность из положений 37-639 SEQ ID NO: 10, может кодироваться нуклеотидной последовательностью, содержащей нуклеотиды 1-1917 SEQ ID NO: 9, предпочтительно содержащей SEQ ID NO: 9. Более конкретно, указанная нуклеотидная последовательность может состоять из нуклеотидов 1-1917 SEQ ID NO: 9 или SEQ ID NO: 9.

В другом наборе вариантов осуществления настоящего изобретения C-концевая часть полипептида или, соответственно, C-концевой полипептид слитого полипептида представляют собой α-1,6-глюкозидазу Agl1 штамма UCC2003 Bifidobacterium breve (см. Pokusaeva и соавт.) и ее варианты. Эту группу C-концевых полипептидов также называют далее C-концевыми полипептидами Agl1-типа. Аминокислотная последовательность кодируемого полипептида α-1,6-глюкозидазы Agl1 штамма UCC2003 Bifidobacterium breve находится в открытом доступе в базе данных GenBank NCBI (Национальный центр биотехнологической информации, Национальная библиотека медицины США, Роквилл-Пайк 8600, Бетесда, Мэриленд, 20894, США) под номером доступа FJ386389. Она также показана под SEQ ID NO: 8 в протоколе последовательностей. Аминокислотная последовательность из положений 1-607 SEQ ID NO: 8 идентична аминокислотной последовательности из положений 37-643 SEQ ID NO: 12. Аминокислотная последовательность из положений 37-643 SEQ ID NO: 12 представляет собой C-концевой полипептид кодируемого слитого полипептида, показанного под SEQ ID NO: 12. В соответствии с настоящим изобретением можно использовать варианты указанного C-концевого полипептида, которые имеют аминокислотную последовательность, на ≥ 95% идентичную, предпочтительно на ≥ 99%, особенно предпочтительно на 100% идентичную аминокислотной последовательности из положений 37-643 SEQ ID NO: 12. Примерами C-концевых полипептидов, имеющих аминокислотную последовательность, на ≥ 99% идентичную таковой из положений 37-643 SEQ ID NO: 12, являются C-концевые полипептиды, имеющие аминокислотную последовательность из 38-643 SEQ ID NO: 12 или из 39-643 SEQ ID NO: 12.

Эти C-концевые полипептиды Agl1-типа предпочтительно присоединены к Tat-сигнальному пептиду Cg0955, показанному аминокислотной последовательностью SEQ ID NO: 2 из положений 1-33. Аминокислотная последовательность из положений 1-33 SEQ ID NO: 2 идентична аминокислотной последовательности из положений 1-33 SEQ ID NO: 12. Они могут быть соединены непосредственно или с помощью последовательности максимум из 10 аминокислот, предпочтительно 1-3, особенно предпочтительно 3 аминокислот. Предпочтительно, чтобы эти 3 аминокислоты имели последовательность Ile Leu Val.

Соответственно, в настоящем изобретении обеспечивается выделенный полинуклеотид, кодирующий слитый полипептид, содержащий аминокислотную последовательность SEQ ID NO: 12, предпочтительно состоящий из нее и обладающий α-1,6-глюкозидазной активностью. Кодируемый слитый полипептид, показанный под SEQ ID NO: 12, был обозначен как Tat-Agl1.

Аминокислотная последовательность C-концевого полипептида в слитом полипептиде, показанном под SEQ ID NO: 12, которая представляет собой аминокислотную последовательность из положений 37-643 SEQ ID NO: 12, может кодироваться нуклеотидной последовательностью из положений 1-1821 SEQ ID NO: 7, которая представляет собой нуклеотидную последовательность кодирующей области гена agl1, содержащегося в Bifidobacterium breve UCC2003.

Из уровня техники известно, что генетический код является вырожденным, что означает, что определенная аминокислота может кодироваться несколькими различными триплетами. Термин «частота использования кодонов» относится к наблюдению того, что некий организм, как правило, не будет использовать каждый возможный кодон для определенной аминокислоты с одной и той же частотой. Вместо этого организм обычно будет демонстрировать определенные предпочтения для конкретных кодонов, что означает, что эти кодоны обнаруживаются чаще в кодирующей последовательности транскрибируемых генов организма. Если некоторый ген, чужеродный для своего будущего хозяина, т. e. из другого вида, должен быть экспрессирован в будущем организме-хозяине, то тогда кодирующая последовательность указанного гена должна быть скорректирована в соответствии с частотой использования кодонов указанного будущего организма-хозяина. В настоящем изобретении указанным геном, чужеродным для своего будущего хозяина, являются agl1 Bifidobacterium breve UCC2003 или его варианты, а указанным будущим хозяином является Corynebacterium, предпочтительно Corynebacterium glutamicum. В соответствии с настоящим изобретением предпочтительно, чтобы указанная аминокислотная последовательность из положений 37-639 SEQ ID NO: 12 кодировалась выделенным полинуклеотидом, имеющим нуклеотидную последовательность, оптимизированную по частоте использования кодонов для Corynebacterium glutamicum, при этом указанная нуклеотидная последовательность является на ≥ 99,0%, особенно предпочтительно на ≥ 99,5%, более особенно предпочтительно на 100% идентичной нуклеотидной последовательности из положений 109-1929 SEQ ID NO: 11.

Нуклеотидную последовательность из положений 109-1929 SEQ ID NO: 11, являющуюся оптимизированной по частоте использования кодонов (cuo) для Corynebacterium glutamicum, в настоящем изобретении также называют «agl1_cuo».

В соответствии с настоящим изобретением, кроме того, предпочтительно, чтобы выделенный полинуклеотид, кодирующий слитый полипептид, содержащий аминокислотную последовательность из положений 1-33 SEQ ID NO: 12, непосредственно после которой расположена последовательность из трех аминокислот, предпочтительно аминокислотная последовательность из положений 34-36 SEQ ID NO: 12, непосредственно после которой расположена аминокислотная последовательность из положений 37-643 SEQ ID NO: 12, кодировался нуклеотидной последовательностью, содержащей нуклеотиды 1-1929 SEQ ID NO: 11, предпочтительно содержащей SEQ ID NO: 11. Более конкретно, предпочтительно, чтобы указанная нуклеотидная последовательность состояла из нуклеотидов 1-1929 SEQ ID NO: 11 или SEQ ID NO: 11.

Ввиду двухнитевой структуры ДНК нить, комплементарная нити, показанной в протоколе последовательностей, например, под SEQ ID NO: 9 или SEQ ID NO: 11, также является объектом настоящего изобретения. Для достижения экспрессии полинуклеотидов в соответствии с настоящим изобретением указанные полинуклеотиды функционально связаны с промотором.

Соответственно, в настоящем изобретении обеспечивается выделенный полинуклеотид, кодирующий слитый полипептид в соответствии с настоящим изобретением, функционально связанный с промотором.

Промотор означает полинуклеотид, предпочтительно дезоксирибополинуклеотид, который функционально связан с полинуклеотидом, подлежащим транскрипции, и определяет точку и частоту инициации транскрипции полинуклеотида, обеспечивая таким образом экспрессию полинуклеотида. Термин «функционально связанный» в данном контексте означает расположение промотора последовательно с полинуклеотидом, подлежащим экспрессии, что в результате приводит к транскрипции указанного полинуклеотида. При таких порядках расположения расстояние между 3'-концом промотора и 5'-концом кодирующей последовательности, как правило, составляет ≤ 300 пар оснований, предпочтительно ≤ 200 пар оснований, особенно предпочтительно ≤ 100 пар оснований, более особенно предпочтительно ≤ 60 пар оснований. В контексте настоящего изобретения указанный полинуклеотид, подлежащий экспрессии, кодирует слитый полипептид в соответствии с настоящим изобретением, как, например, показано под SEQ ID NO: 10 или SEQ ID NO: 12.

Термин «транскрипция» означает процесс, посредством которого продуцируется молекула комплементарной РНК, начиная с ДНК-матрицы. В этом процессе участвуют специфические белки, например, РНК-полимераза. Затем синтезированная РНК (информационная РНК) служит в качестве матрицы в процессе трансляции, в результате которого получают полипептид или, соответственно, белок. Транскрипция, как правило, заканчивается на нуклеотидной последовательности, называемой терминатором транскрипции. Примером терминатора транскрипции является терминатор транскрипции гена gap Corynebacterium glutamicum, идентифицированный Eikmanns, B. J. (Journal of Bacteriology 174(19), 6067 - 6068, 1992) и показанный под SEQ ID NO: 13 перечня последовательностей.

Дополнительные подробности, касающиеся экспрессии генов, биосинтеза ДНК, биосинтеза РНК, можно найти в учебниках по биохимии и молекулярной генетике, известных из уровня техники.

Промоторы для Corynebacterium, предпочтительно Corynebacterium glutamicum, хорошо известны из уровня техники. См., например, M. Patek (Regulation of gene expression, в: L. Eggeling and M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005)) или Patek и соавт. (Microbial Biotechnology 6, 103 - 117, 2013).

Подходящие промоторы включают в себя промоторы, описанные в WO2002040679, предпочтительно промоторы, показанные в ней под SEQ ID NO: 4-22, tac-промоторы, описанные De Boer и соавт. (Proceedings of the National Academy of Sciences USA 80, 21 - 25, 1983; см. также Morinaga и соавт. (Journal of Biotechnology 5, 305 - 312, 1987)), предпочтительно промоторы PtacI или PtacII, особенно предпочтительно PtacI, определенный нуклеотидной последовательностью из положений 1-75 SEQ ID NO: 14 в перечне последовательностей, промотор Pef-tu фактора элонгации трансляции белка TU, описанный в WO2005059093, предпочтительно промотор, показанный в ней под SEQ ID NO: 1, промотор Pgro, описанный в WO2005059143, предпочтительно промотор, показанный в ней под SEQ ID NO: 1, промотор Psod, описанный в WO2005059144, предпочтительно промотор, показанный в ней под SEQ ID NO: 1, варианты промотора гена gap, описанные в WO2013000827, предпочтительно промоторы Pgap3, показанные в ней под SEQ ID NO: 3, и Pg3N3, показанный в ней под SEQ ID NO: 34, а также варианты промотора гена dapB, описанные в US8637295, предпочтительно промотор PdapBN1, показанный в нем под SEQ ID NO: 13.

Предпочтительными промоторами являются tac-промоторы, промотор PdapBN1, промотор Pgap3 и промотор Pg3N3.

Особенно предпочтительными являются промотор PtacI, показанный под SEQ ID NO: 14 в положениях 1-75, и промотор PdapBN1, показанный под SEQ ID NO: 15 перечня последовательностей настоящего изобретения. Указанные промоторы соединяют с полинуклеотидом, кодирующим слитый полипептид в соответствии с настоящим изобретением, путем конструирования единицы экспрессии, которая представляет собой выделенный полинуклеотид, содержащий промотор, предпочтительно промотор, подробно описанный выше, особенно предпочтительно промотор PdapBN1, и функционально связанную с указанным промотором нуклеотидную последовательность, кодирующую слитый полипептид в соответствии с настоящим изобретением.

Предпочтительно, чтобы указанная единица экспрессии, которая представляет собой выделенный полинуклеотид, содержала промотор PdapBN1, показанный под SEQ ID NO: 16 в положениях 32-91 в протоколе последовательностей, и с указанным промотором была функционально связана, предпочтительно непосредственно с помощью нуклеотидной последовательности из положений 92-121 SEQ ID NO: 16, нуклеотидная последовательность, кодирующая слитый полипептид SEQ ID NO: 17, предпочтительно нуклеотидная последовательность из положений 122-2038 SEQ ID NO: 16.

Особенно предпочтительно, чтобы указанная единица экспрессии, который представляет собой выделенный полинуклеотид, содержала нуклеотидную последовательность из положений 32-2038 SEQ ID NO: 16, более особенно предпочтительно нуклеотидную последовательность из положений 32-2041 SEQ ID NO: 16.

В дополнительном варианте осуществления единица экспрессии, который представляет собой выделенный полинуклеотид, содержит нуклеотидную последовательность из 32-2088 SEQ ID NO: 16, предпочтительно SEQ ID NO: 16. Нуклеотидная последовательность из положений 2053-2088 SEQ ID NO: 16 идентична нуклеотидной последовательности из положений 3-38 SEQ ID NO: 13, при этом SEQ ID NO: 13 является терминатором транскрипции гена gap, как описано у B. J. Eickmanns (Journal of Bacteriology 174(19), 6076-6086, 1992). Для осуществления настоящего изобретения использовали терминатор транскрипции под названием Tgap*, имеющий нуклеотидную последовательность из положений 3-38 SEQ ID NO: 13.

Указанную единицу экспрессии можно встроить в подходящий плазмидный вектор. Подобным образом указанную единицу экспрессии можно создать путем встраивания выделенного полинуклеотида, кодирующего слитый полипептид в соответствии с настоящим изобретением, ниже промотора, предоставляемого вектором экспрессии, доступным в данной области техники, как указано в общих чертах ниже.

Подходящие плазмидные векторы для Corynebacterium glutamicum хорошо известны из уровня техники. Обобщенная информация о подходящих плазмидных векторов, в том числе нативных плазмид, клонирующих векторов, векторов экспрессии и плазмидных векторов, обеспечивающих хромосомную интеграцию, приведена в M. Patek and J. Nesvera: Promoters and Plasmid Vectors of Corynebacterium glutamicum (H. Yukawa and M. Inui: Corynebacterium glutamicum Biology and Biotechnology, Springer Verlag, 2013), а также в L. Eggeling and O. Reyes: Experiments (L. Eggeling and M. Bott: Handbook of Corynebacterium glutamicum, CRC Press 2005).

Примером подходящего плазмидного вектора, предпочтительно вектора экспрессии, является pVWEx1, описанный у Peters-Wendisch и соавт. (Journal of Molecular Microbiology and Biotechnology 3, 295 - 300, 2001). Нуклеотидная последовательность pVWEx1 доступна в базе данных GenBank под номером доступа MF034723. Плазмидный вектор pVWEx1 обладает способностью к автономной репликации у Corynebacterium glutamicum и Escherichia coli. Поэтому его также называют челночным вектором. Он предоставляет промотор PtacI и подходящие сайты клонирования, например, сайт рестрикции для PstI и BamHI, на 3'-конце или, соответственно, ниже указанного промотора PtacI. Дополнительные элементы и подробности, касающиеся этого вектора экспрессии, можно найти у Peters-Wendisch и соавт. После встраивания нуклеотидной последовательности, кодирующей слитый полипептид в соответствии с настоящим изобретением, например, полинуклеотида, показанного под SEQ ID NO: 21, в указанные сайты клонирования она функционально связывается с указанным промотором PtacI, и, соответственно, ее экспрессия контролируется указанным промотором PtacI. Таким образом, полученный в результате плазмидный вектор содержит единицу экспрессии, описанную выше.

Другим примером подходящих плазмидных векторов, предпочтительно плазмидных векторов, обеспечивающих хромосомную интеграцию, являются pK*mob и pK*mobsacB, особенно предпочтительно pK18mobsacB, описанный у Schäfer и соавт. (Gene 145, 69 - 73, 1994). Нуклеотидная последовательность pk18mobsacB доступна в NCBI под номером доступа FJ437239. Эти плазмидные векторы способны к автономной репликации у Escherichia coli, но не у Corynebacterium. Однако благодаря своей мобилизуемой природе их можно переносить из Escherichia coli в Corynebacterium glutamicum путем конъюгации. Благодаря присутствию системы отбора на основе гена sacB, придающей своему хозяину чувствительность к сахарозе, плазмидный вектор pK18mobsacB обеспечивает средство отбора двойных рекомбинантов после гомологичной рекомбинации. Таким образом, это позволяет выделять штаммы, несущие ген, представляющий интерес, интегрированный в целевой сайт их хромосом. Аналогичные плазмидные векторы описаны, например, в WO2002070685 и WO2003014362. В контексте настоящего изобретения термин «ген, представляющий интерес» означает выделенные полинуклеотиды в соответствии с настоящим изобретением.

Целевым сайтом в данном контексте является нуклеотидная последовательность, которая является необязательной для роста штамма Corynebacterium и образования им химического продукта тонкого синтеза. Перечень подходящих целевых сайтов, представляющих собой кодирующие последовательности, необязательные для образования L-лизина, например, ген aecD, кодирующий C-S-лиазу (Rossol and Pühler, Journal of Bacteriology 174(9), 2968 - 2977, 1992), у Corynebacterium glutamicum показан в таблице 3 WO2003040373. Целевые сайты, кроме того, включают в себя нуклеотидные последовательности, кодирующие фаги или компоненты фагов, например, показанные в таблице 13 WO2004069996. Целевые сайты, кроме того, включают в себя межгенные области. Межгенная область представляет собой нуклеотидную последовательность, расположенную между двумя кодирующими последовательностями и являющуюся нефункциональной. Перечень подходящих межгенных областей показан, например, в таблице 12 WO2004069996.

В ходе работы над настоящим изобретением идентифицировали новый подходящий целевой сайт.

Предпочтительным целевым сайтом является межгенная область между кодирующими последовательностями, идентифицированными по идентификатору локуса NCgl2176 и идентификатору локуса NCgl2177 хромосомы Corynebacterium glutamicum ATCC13032, предпочтительно SEQ ID NO: 18 в положениях 1036-1593, и соответствующий (гомологичный) целевой сайт в различных штаммах вида. Нуклеотидная последовательность хромосомы Corynebacterium glutamicum ATCC13032 доступна в NCBI под номером доступа NC_003450.

Из уровня техники известно, что гомологичные нуклеотидные последовательности или, соответственно, аллели в хромосоме вида Corynebacterium glutamicum варьируются у разных штаммов дикого типа и мутантов, полученных из них.

Соответствующая (гомологичная) последовательность по отношению к SEQ ID NO: 18 в штамме ATCC13869 показана под SEQ ID NO: 19. Соответствующая межгенная область расположена между кодирующими последовательностями, идентифицированными по идентификатору локуса BBD29_10725 и идентификатору локуса BBD29_1730, и предпочтительно представляет собой SEQ ID NO: 19 в положениях 1036-1593. SEQ ID NO: 19 в положениях 1036-1593 на > 98% идентична SEQ ID NO: 18 в положениях 1036-1593. Нуклеотидная последовательность хромосомы Corynebacterium glutamicum ATCC13869 доступна в NCBI под номером доступа NZ_CP016335.1.

Соответствующая (гомологичная) последовательность по отношению к SEQ ID NO: 18 в штамме ATCC14067 показана под SEQ ID NO: 20. Межгенная область предпочтительно расположена в положениях 1036-1593 SEQ ID NO: 20. SEQ ID NO: 20 в положениях 1036-1593 на > 97 % идентична SEQ ID NO: 18 в положениях 1036-1593.

Соответственно, предпочтительный целевой сайт на > 95%, предпочтительно на > 97%, особенно предпочтительно на > 98%, особенно сильно предпочтительно на > 99% идентичной, наиболее особенно предпочтительно на 100% идентичен SEQ ID NO: 18 в положениях 1036-1593.

Для осуществления интеграции выделенных полинуклеотидов в соответствии с настоящим изобретением, предпочтительно функционально связанных с промотором, в целевой сайт с помощью гомологичной рекомбинации их 5'-конец и их 3'-конец связывают с полинуклеотидами, содержащими нуклеотидные последовательности выше и ниже целевого сайта. В данной области техники эти последовательности также называются фланкирующими последовательностями, в частности, 5'-фланкирующей последовательностью и 3'-фланкирующей последовательностью. Фланкирующие последовательности, как правило, имеет длину от ≥ 200 до ≤ 2000 пар оснований.

Плазмидный вектор для осуществления интеграции желаемого полинуклеотида в хромосому желаемой Corynebacterium содержит полинуклеотид, содержащий в 5'-3'-направлении: 5'-фланкирующую последовательность, желаемый полинуклеотид и 3'-фланкирующую последовательность.

Соответственно, плазмидный вектор для осуществления интеграции полинуклеотида в соответствии с настоящим изобретением в хромосому подходящей Corynebacterium содержит полинуклеотид, содержащий в 5'-3'-направлении: 5'-фланкирующую последовательность, полинуклеотид в соответствии с настоящим изобретением и 3'-фланкирующую последовательность.

После двух событий гомологичной рекомбинации, включающих в себя событие рекомбинации в 5'-фланкирующей последовательности, предоставляемой плазмидным вектором, с гомологичной последовательностью хромосомы Corynebacterium и событие рекомбинации в 3'-фланкирующей последовательности, предоставляемой плазмидным вектором, с гомологичной последовательностью хромосомы Corynebacterium, полинуклеотид в соответствии с настоящим изобретением интегрируется в хромосому Corynebacterium.

Событие гомологичной рекомбинации также может называться кроссинговером.

В предпочтительном варианте осуществления указанные фланкирующие последовательности выбраны из нуклеотидных последовательностей, содержащихся в SEQ ID NO: 18, которая содержит межгенную область между локусом с идентификатором NCgl2176 и локусом с идентификатором NCgl2177, или из нуклеотидных последовательностей, на > 95%, предпочтительно на > 97%, особенно предпочтительно на > 98%, особенно сильно предпочтительно на > 99% идентичных SEQ ID NO: 18.

Подобным образом указанные фланкирующие последовательности могут быть выбраны из нуклеотидных последовательностей, содержащихся в SEQ ID NO: 19 или SEQ ID NO: 20, обе из которых характеризуются > 99% идентичностью по отношению к SEQ ID NO: 18. Соответственно, в настоящем изобретении обеспечиваются плазмидные векторы, содержащие выделенные полинуклеотиды в соответствии с настоящим изобретением.

Идеи и информацию, касающиеся синтеза, анализа полинуклеотидов и обращения с ними, можно найти, помимо прочего, в книге P. Fu и S. Panke (Systems Biology and Synthetic Biology, Wiley, 2009), книге S. Narang (Synthesis and Applications of DNA and RNA Academic Press, 1987), руководстве J. Sambrook и соавт. (Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1989), учебнике C. R. Newton и A. Graham (PCR, Spektrum Akademischer Verlag, 1994) и руководстве D. Rickwood и B. D. Hames (Gel electrophoresis of nucleic acids, a practical approach, IRL Press, 1982).

Анализ последовательностей полинуклеотидов и полипептидов, например, выравнивания последовательностей, можно выполнять с помощью общедоступного программного обеспечения, такого как CLC Genomics Workbench (Qiagen, Хильден, Германия) или программа MUSCLE, предоставляемая Европейским институтом биоинформатики (EMBL-EBI, Хинкстон, Великобритания).

Выделенные полинуклеотиды в соответствии с настоящим изобретением переносят в штаммы Corynebacterium, предпочтительно Corynebacterium glutamicum, или Escherichia, предпочтительно Escherichia coli, посредством трансформации с помощью физико-химических способов или посредством конъюгации с помощью плазмидных векторов, содержащих указанные полинуклеотиды. Для физико-химической трансформации Corynebacterium можно применять способы электропорации по Dunican и Shivnan (Bio/Technology 7, 1067 - 1070, 1989) или Ruan и соавт. (Biotechnology letters, 2015, DOI 10.1007/s10529-015-1934-x) или способ трансформации сферопластов и протопластов по Thierbach и соавт. (Applied Microbiology and Biotechnology 29, 356 -362, 1988). Для конъюгационного переноса или, соответственно, конъюгации из Escherichia coli в Corynebacterium можно применять способ по Schäfer и соавт. (Journal of Bacteriology 172, 1663 - 1666, 1990). Для отбора штаммов Corynebacterium, несущих полинуклеотид в соответствии с настоящим изобретением в целевом сайте хромосомы после двух событий гомологичной рекомбинации, можно применять способ по Schäfer и соавт. Технические подробности в отношении различных целевых сайтов можно найти, например, в WO2003040373 и WO2004069996. Дополнительные подробности также можно найти в статье «Experiments» L. Eggeling и O. Reyes, входящей в состав публикации L. Eggeling и M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005).

Для целей настоящего изобретения термины «трансформация» и «конъюгация» могут быть обобщены термином «трансформация».

Перенос полинуклеотидов в соответствии с настоящим изобретением можно подтвердить посредством саузерн-гибридизации с использованием зонда, комплементарного полинуклеотиду в соответствии с настоящим изобретением или его части, посредством полимеразной цепной амплификации (PCR) полинуклеотида в соответствии с настоящим изобретением или его части, предпочтительно с последующим анализом нуклеотидной последовательности продукта амплификации, или посредством измерения α-1,6-глюкозидазной активности.

В ходе работы над настоящим изобретением было обнаружено, что после трансформации бактерий из рода Corynebacterium, предпочтительно бактерий вида Corynebacterium glutamicum, выделенным полинуклеотидом, кодирующим полипептид в соответствии с настоящим изобретением, предпочтительно связанный с промотором, полученные трансформанты обладали способностью секретировать полипептид, обладающий α-1,6-глюкозидазной активностью, в среду.

Кроме того, было обнаружено, что кодируемый полипептид Tat-'Agl2, показанный под SEQ ID NO: 10, после секреции в среду указанной Corynebacterium glutamicum имел аминокислотную последовательность из положений 31-639 SEQ ID NO: 10 или аминокислотную последовательность из положений 38-639 SEQ ID NO: 10.

Указанные полипептид или, соответственно, полипептиды, секретируемые в среду указанной Corynebacterium, гидролизуют изомальтозу с получением глюкозы и гидролизуют панозу с получением глюкозы и мальтозы. Таким образом, указанная Corynebacterium обладает способностью использовать панозу и/или изомальтозу в качестве источника углерода.

Соответственно, в настоящем изобретении обеспечивается бактерия, выбранная из рода Corynebacterium, предпочтительно Corynebacterium glutamicum, или Escherichia, предпочтительно Escherichia coli, содержащая выделенный полинуклеотид, кодирующий полипептид в соответствии с настоящим изобретением, предпочтительно связанный с промотором, при этом указанная бактерия обладает способностью секретировать полипептид, обладающий α-1,6-глюкозидазной активностью, кодируемый указанным выделенным полинуклеотидом.

Соответственно, в настоящем изобретении, кроме того, обеспечивается Corynebacterium, предпочтительно Corynebacterium glutamicum, обладающая способностью секретировать полипептид, обладающий α-1,6-глюкозидазной активностью и имеющий аминокислотную последовательность из положений 31-639 SEQ ID NO: 10 или аминокислотную последовательность из положений 38-639 SEQ ID NO: 10.

Выделенные полинуклеотиды в соответствии с настоящим изобретением могут содержаться в плазмидном векторе, автономно реплицирующемся у Corynebacterium, или могут содержаться в хромосоме Corynebacterium. В случае когда выделенный полинуклеотид в соответствии с настоящим изобретением содержится в хромосоме, он реплицируется как часть хромосомы. Предпочтительно, чтобы указанный выделенный полинуклеотид содержался в хромосоме бактерии. Особенно предпочтительно, чтобы указанный выделенный полинуклеотид содержался в последовательности хромосомы (целевом сайте), на > 95% идентичной SEQ ID NO: 18 в положениях 1036-1593, как указано в общих чертах выше.

Число копий (копий на клетку Corynebacterium) единицы экспрессии, содержащей выделенный полинуклеотид в соответствии с настоящим изобретением, связанный с промотором, как правило, не превышает 40. Предпочтительно, чтобы указанное число копий составляло ≤ 10, особенно предпочтительно ≤ 5, особенно сильно предпочтительно ≤ 2, наиболее особенно предпочтительно 1.

Описание рода Corynebacterium и видов, составляющих этот род, можно найти в статье «Corynebacterium» K. A. Bernard и G. Funke в Bergey's Manual of Systematics of Archaea and Bacteria (Bergey's Manual Trust, 2012).

В роде Corynebacterium предпочтительным видом является Corynebacterium glutamicum. Подходящими штаммами являются, например, штаммы ATCC13032, ATCC14067 и ATCC13869, штаммы, также называемые в данной области техники штаммами дикого типа, и полученные из них штаммы, выделяющие химические продукты тонкого синтеза. Штамм ATCC13032 (также доступный как DSM20300) является штаммом, представляющим собой типовой таксон вида Corynebacterium glutamicum. Штамм ATCC14067 (также доступный как DSM20411) также известен под устаревшим названием Brevibacterium flavum. Штамм ATCC13869 (также доступный как DSM1412) также известен под устаревшим названием Brevibacterium lactofermentum. Таксономическое исследование этой группы бактерий на основании гибридизации ДНК-ДНК было выполнено Liebl и соавт. (International Journal of Systematic Bacteriology 41(2), 255-260, 1991). Сравнительный анализ различных штаммов вида Corynebacterium glutamicum на основании анализа геномных последовательностей был предоставлен Yang и Yang (BMC Genomics 18(1):940).

На протяжении последних десятилетий в данной области техники было получено большое количество штаммов из рода Corynebacterium, выделяющих химический продукт тонкого синтеза, начиная с таких штаммов, как ATCC13032, ATCC14067, ATCC13869 и т. п. Их получали в результате осуществления программ разработки штаммов с помощью, помимо прочего, таких способов, как классический мутагенез, селекция на устойчивость к антиметаболитам, а также амплификация и модификация промоторов генов пути биосинтеза рассматриваемого химического продукта тонкого синтеза с помощью способов генной инженерии. Обобщенные сведения можно найти у L. Eggeling и M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005) или H. Yukawa и M. Inui (Corynebacterium glutamicum Biology and Biotechnology, Springer Verlag, 2013).

Штаммы Corynebacterium, предпочтительно Corynebacterium glutamicum, подходящие для измерений в соответствии с настоящим изобретением, имеют функциональный Tat-путь (диаргининовой транслокации) секреции белка. Белки Tat-пути Corynebacterium glutamicum кодируются генами tatA, tatB, tatC и tatE и описаны у Kikuchi и соавт. (Applied and Environmental Microbiology 72(11), 7183 - 7192, 2006).

Термин «химический продукт тонкого синтеза» включает L-аминокислоты, витамины, нуклеозиды и нуклеотиды, при этом L-аминокислоты являются предпочтительными.

Термин «витамин» включает рибофлавин.

Термин «L-аминокислота» включает протеиногенные L-аминокислоты, а также L-орнитин и L-гомосерин. Протеиногенные L-аминокислоты следует понимать как означающие L-аминокислоты, присутствующие в природных белках, то есть в белках микроорганизмов, растений, животных и людей. Протеиногенные L-аминокислоты включают в себя L-аспарагиновую кислоту, L-аспарагин, L-треонин, L-серин, L-глутаминовую кислоту, L-глутамин, L-глицин, L-аланин, L-цистеин, L-валин, L-метионин, L-изолейцин, L-лейцин, L-тирозин, L-фенилаланин, L-гистидин, L-лизин, L-триптофан, L-аргинин, L-пролин и в некоторых случаях L-селеноцистеин и L-пирролизин.

Химический продукт тонкого синтеза предпочтительно выбран из группы, состоящей из протеиногенной L-аминокислоты, L-орнитина и L-гомосерина. Особенное предпочтение отдается протеиногенным L-аминокислотам, выбранным из L-лизина, L-треонина, L-валина и L-изолейцина, при этом L-лизин является особенно сильно предпочтительным.

Термин «L-аминокислоты» при упоминании в настоящем документе в контексте образования продукта также включает их соли, например, моногидрохлорид L-лизина или сульфат L-лизина в случае L-аминокислоты L-лизина.

Штаммы вида Corynebacterium glutamicum, выделяющие L-лизин, широко известны из уровня техники и могут использоваться для целей настоящего изобретения. Например, Blombach и соавт. (Applied and Environmental Microbiology 75(2), 419-427, 2009) описывают штамм DM1933, депонированный под номером доступа DSM25442; в WO2008033001 описывается штамм KFCC10881-C14, депонированный под номером доступа KCCM10770P, а EP0841395 относится к штамму AJ11082, депонированному под номером доступа NRRL B-1147. Кроме того, можно использовать штамм DM2031 Corynebacterium glutamicum, выделяющий L-лизин, депонированный в соответствии с Будапештским договором как DSM32514. Штамм DM2031 является усовершенствованным производным DM1933, обладающим повышенной способностью к выделению L-лизина.

Обобщенные сведения, касающиеся выведения штаммов Corynebacterium glutamicum, выделяющих L-лизин, можно найти, помимо прочего, у L. Eggeling и M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005), V. F. Wendisch (Amino Acid Biosynthesis - Pathways, Regulation and Metabolic Engineering, Springer Verlag, 2007), H. Yukawa и M. Inui (Corynebacterium glutamicum Biology and Biotechnology, Springer Verlag, 2013), а также у Eggeling и Bott (Applied Microbiology and Biotechnology 99 (9), 3387-3394, 2015).

Штаммы вида Corynebacterium glutamicum, выделяющие L-треонин, известны из уровня техники и могут использоваться для целей настоящего изобретения. Например, в EP0385940 описывается штамм DM368-2, депонированный под номером DSM5399.

Штаммы вида Corynebacterium glutamicum, выделяющие L-валин, известны из уровня техники и могут использоваться для целей настоящего изобретения. Например, в US5188948 описывается штамм AJ12341, депонированный под номером FERM BP-1763, а в EP2811028 описывается штамм ATCC14067_PprpD2-ilvBN.

Штаммы вида Corynebacterium glutamicum, выделяющие L-изолейцин, известны из уровня техники и могут использоваться для целей настоящего изобретения. Например, в US4656135 описывается штамм AJ12152, депонированный под номером FERM BP-760.

Штаммы вида Corynebacterium glutamicum, выделяющие рибофлавин, описываются в EP2787082.

Термин «DSM» означает депозитарий Немецкой коллекции микроорганизмов и клеточных культур, расположенный в Брауншвейге, Германия. Термин «KCCM» означает депозитарий Корейского центра культур микроорганизмов, расположенный в Сеуле, Корея. Термин «NRRL» означает депозитарий Коллекции культур Службы сельскохозяйственных исследований, расположенный в Пеории, Иллинойс, США. Термин «ATCC» означает депозитарий Американской коллекции типовых культур, расположенный в Манассасе, Виргиния, США. Термин «FERM» означает депозитарий Национального института технологии и оценки (NITE), расположенный в Токио, Япония.

Для получения бактерии из рода Corynebacterium, выделяющей химический продукт тонкого синтеза, предпочтительно Corynebacterium glutamicum, обладающей способностью секретировать полипептид, обладающий α-1,6-глюкозидазной активностью, кодируемый выделенным полинуклеотидом в соответствии с настоящим изобретением, бактерию из рода Corynebacterium, выделяющую химический продукт тонкого синтеза, трансформируют выделенным полинуклеотидом в соответствии с настоящим изобретением, предпочтительно выделенным полинуклеотидом, связанным с промотором (единицей экспрессии).

Таким образом получают бактерию из рода Corynebacterium, выделяющую химический продукт тонкого синтеза, предпочтительно Corynebacterium glutamicum, обладающую способностью использовать панозу и/или изомальтозу в качестве источника углерода для роста и выделения химического продукта тонкого синтеза.

Подобным образом возможно получать бактерию, выделяющую химический продукт тонкого синтеза в соответствии с настоящим изобретением, сначала трансформируя штамм дикого типа из рода Corynebacterium, предпочтительно Corynebacterium glutamicum, такой как, например, ATCC13032, ATCC13869 или ATCC14067, полинуклеотидом в соответствии с настоящим изобретением, а затем используя полученного трансформанта в качестве исходной точки для программы разработки штамма, направленной на получение желаемого химического продукта тонкого синтеза.

Соответственно, в настоящем изобретении обеспечивается Corynebacterium, выделяющая химический продукт тонкого синтеза, предпочтительно Corynebacterium glutamicum, содержащая выделенный полинуклеотид в соответствии с настоящим изобретением, обладающая, таким образом, способностью использовать панозу и/или изомальтозу для роста, а также для выделения и продуцирования химического продукта тонкого синтеза. В настоящем изобретении, кроме того, обеспечивается ферментативный процесс продуцирования химического продукта тонкого синтеза с помощью Corynebacterium в соответствии с настоящим изобретением.

Ферментативный процесс может являться непрерывным процессом или прерывным процессом, таким как периодический процесс или периодический процесс с подпиткой. Обобщенная информация, касающаяся общей природы процессов ферментации, доступна в учебнике H. Chmiel (Bioprozesstechnik, Spektrum Akademischer Verlag, 2011), в учебнике C. Ratledge и B. Kristiansen (Basic Biotechnology, Cambridge University Press, 2006) или в учебнике V.C. Hass и R. Pörtner (Praxis der Bioprozesstechnik Spektrum Akademischer Verlag, 2011).

В рамках ферментативного процесса Corynebacterium в соответствии с настоящим изобретением культивируют в подходящей среде.

Подходящая среда, используемая для продуцирования химического продукта тонкого синтеза с помощью ферментативного процесса, содержит источник углерода, источник азота, источник фосфора, неорганические ионы и при необходимости другие органические соединения. Компоненты, используемые в ферментативном процессе, также называют в данной области техники исходными материалами.

В рамках ферментативного процесса в соответствии с настоящим изобретением Corynebacterium, предпочтительно Corynebacterium glutamicum, содержащую выделенный полинуклеотид в соответствии с настоящим изобретением и обладающую способностью выделять химический продукт тонкого синтеза, культивируют в среде, подходящей для продуцирования и накопления указанного химического продукта тонкого синтеза, с использованием источника углерода, содержащего по меньшей мере один олигомер α-D-глюкозы, состоящий по меньшей мере из двух соединенных α-1-6-гликозидной связью глюкозных мономеров, такой как изомальтоза и паноза, предпочтительно содержащего глюкозу и по меньшей мере один олигомер глюкозы, выбранный из изомальтозы и панозы.

В дополнительных вариантах осуществления настоящего изобретения указанный источник углерода содержит глюкозу и изомальтозу, или содержит глюкозу и панозу, или содержит глюкозу, изомальтозу и панозу.

В соответствии с экономическими потребностями источник углерода может дополнительно содержать, помимо глюкозы, изомальтозы и панозы, другие соединения, которые используются Corynebacterium, предпочтительно Corynebacterium glutamicum, для роста, а также выделения и продуцирования химического продукта тонкого синтеза. Эти соединения включают в себя сахара, такие как мальтоза, сахароза или фруктоза, или органические кислоты, такие как молочная кислота. Содержание изомальтозы в указанном источнике углерода составляет ≥ 0,1%, предпочтительно ≥ 0,2% по сухому веществу. Содержание изомальтозы в указанном источнике углерода не превышает (≤) 50% по сухому веществу, не превышает (≤) 40% по сухому веществу, не превышает (≤) 30% по сухому веществу, не превышает (≤) 20% по сухому веществу или не превышает (≤) 10% по сухому веществу при подаче смесей соединений, служащих источником углерода.

Содержание панозы в указанном источнике углерода составляет ≥ 0,1%, предпочтительно ≥ 0,2% по сухому веществу. Содержание панозы в указанном источнике углерода не превышает (≤) 50% по сухому веществу, не превышает (≤) 40% по сухому веществу, не превышает (≤) 30% по сухому веществу, не превышает (≤) 20% по сухому веществу или не превышает (≤) 10% по сухому веществу при подаче смесей соединений, служащих источником углерода.

Содержание глюкозы в указанном источнике углерода составляет ≥ 30%, предпочтительно ≥ 40% по сухому веществу, особенно предпочтительно ≥ 50% по сухому веществу. Содержание глюкозы в указанном источнике углерода не превышает (≤) 99,9% по сухому веществу, не превышает (≤) 99,8% по сухому веществу, не превышает (≤) 99,6% по сухому веществу или не превышает (≤) 99% по сухому веществу при подаче смесей соединений, служащих источниками углерода.

Рядовому специалисту в данной области будет ясно, что сумма всех компонентов в сухом веществе, служащих в качестве источника углерода, не превышает 100%.

Примером источника углерода, содержащего глюкозу и олигомер глюкозы, выбранный из изомальтозы и панозы, являются гидролизаты крахмала.

Гидролизаты крахмала получают путем гидролиза крахмала, как правило, произведенного из зерен кукурузы, пшеницы, ячменя или риса, или из клубней картофеля, или из корней маниока. Благодаря режиму гидролиза крахмала получают различные продукты, как правило, с основным компонентом, например, глюкозой или мальтозой, и различными побочными компонентами, например, мальтозой, изомальтозой, панозой или мальтотриозой.

Для целей настоящего изобретения гидролизат крахмала определяют как продукт, полученный путем гидролиза, предпочтительно ферментативного гидролиза, из крахмала, произведенного из зерен кукурузы, пшеницы, ячменя или риса, или из клубней картофеля, или из корней маниока, предпочтительно из зерен кукурузы, пшеницы или риса, и имеющий следующий состав сухого вещества (вес/вес): глюкоза ≥ 80%, предпочтительно ≥ 90%, не выше (≤) 99% или не выше (≤) 98%; изомальтоза ≥ 0,1%, предпочтительно ≥ 0,2%, не выше (≤) 4%; паноза ≥ 0,1%, предпочтительно ≥ 0,2%, не выше (≤) 3%. Гидролизат крахмала, используемый для целей настоящего изобретения, как правило, дополнительно содержит мальтозу при ≥ 0,1% или ≥ 0,2%, не выше (≤) 5% по сухому веществу. Кроме того, гидролизат крахмала, используемый для целей настоящего изобретения, может содержать дополнительные олигомеры глюкозы, а также неорганические ионы и белки. Рядовому специалисту в данной области будет ясно, что сумма всех компонентов в сухом веществе не превышает 100%. Сухое вещество коммерческих жидких гидролизатов крахмала обычно находится в диапазоне 55-75% (вес/вес). Идеи, касающиеся анализа гидролизатов крахмала, можно найти у M.W. Kearsley и S.Z. Dziedzic (Handbook of Starch Hydrolysis Products and their Derivatives, Chapmann & Hall, 1995).

В качестве источника азота можно использовать органические азотсодержащие соединения, такие как пептоны, мясной экстракт, соевые гидролизаты или мочевина, или неорганические соединения, таких как сульфат аммония, хлорид аммония, фосфат аммония, карбонат аммония, нитрат аммония, газообразный аммиак или водный аммиак.

В качестве источника фосфора можно использовать фосфорную кислоту, дигидрофосфат калия или гидрофосфат дикалия или соответствующие натрийсодержащие соли.

Неорганические ионы, такие как ионы калия, натрия, магния, кальция, железа и дополнительные следовые элементы и т. п., предоставляются в виде солей серной кислоты, фосфорной кислоты или хлористоводородной кислоты.

Другие органические соединения означают незаменимые факторы роста, такие как витамины, например, тиамин или биотин, или L-аминокислоты, например, L-гомосерин.

Компоненты среды можно добавлять в культуру в виде единой партии или можно подавать надлежащим образом в ходе культивирования.

В ходе ферментативного процесса pH в культуре можно контролировать посредством использования надлежащим образом основных соединений, таких как гидроксид натрия, гидроксид калия, аммиак или водный аммиак, или кислых соединений, таких как фосфорная кислота или серная кислота. pH, как правило, доводят до значения 6,0-8,5, предпочтительно 6,5-8,0. Для контроля пенообразования возможно использовать противовспенивающие средства, такие как, например, сложные эфиры жирных кислот и полигликолей. Для поддержания стабильности плазмид возможно добавлять в среду подходящие селективные вещества, такие как, например, антибиотики. Ферментативный процесс предпочтительно осуществляют в аэробных условиях. Для поддержания таких условий в культуру вводят кислород или кислородсодержащие газовые смеси, такие как, например, воздух. Ферментативный процесс осуществляют при необходимости при повышенном давлении, например, при повышенном давлении 0,03-0,2 MПa. Температура культуры обычно составляет от 25°C до 40°C, предпочтительно от 30°C до 37°C. В прерывном процессе культивирование продолжают до тех пор, пока не образуется количество желаемого химического продукта тонкого синтеза, достаточное для извлечения. Тогда культивирование завершают. Данной цели обычно достигают в пределах периода от 10 часов до 160 часов. В непрерывных процессах возможны более длительные периоды культивирования.

Примеры подходящих сред и условий культивирования можно найти, помимо прочего, у L. Eggeling и M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005) и в патентных документах US5770409, US5990350, US 5275940, US5763230 и US6025169.

Благодаря способности Corynebacterium в соответствии с настоящим изобретением выделять и продуцировать химический продукт тонкого синтеза в среду в ходе ферментативного процесса концентрация химического продукта тонкого синтеза повышается, и он накапливается в среде.

Таким образом, в результате ферментативного процесса образуется ферментативный бульон, который содержит желаемый химический продукт тонкого синтеза, предпочтительно L-аминокислоту. Затем продукт, содержащий химический продукт тонкого синтеза, извлекают в жидкой или твердой форме.

«Ферментативный бульон» означает среду, в которой культивировали Corynebacterium в соответствии с настоящим изобретением в течение определенного времени и при определенных условиях.

По завершении ферментативного процесса полученный в результате ферментативный бульон соответственно содержит:

a) биомассу (клеточную массу) Corynebacterium в соответствии с настоящим изобретением, при этом указанная биомасса была получена за счет размножения клеток указанной Corynebacterium,

b) желаемый химический продукт тонкого синтеза, накопленный в ходе ферментативного процесса,

c) побочные органические продукты, накопленные в ходе ферментативного процесса, и

d) компоненты используемой среды, которые не были потреблены в ходе ферментативного процесса.

Побочные органические продукты включают в себя соединения, которые могут быть образованы Corynebacterium в соответствии с настоящим изобретением в ходе ферментативного процесса в дополнение к продуцированию желаемого химического продукта тонкого синтеза.

Ферментативный бульон удаляют из сосуда для культивирования или ферментационного чана, при необходимости собирают и используют для получения продукта, содержащего химический продукт тонкого синтеза, предпочтительно продукта, содержащего L-аминокислоту, в жидкой или твердой форме. Выражение «извлечение продукта, содержащего химический продукт тонкого синтеза» также используют для данного контекста. В самом простом случае сам содержащий химический продукт тонкого синтеза ферментативный бульон, который был удален из ферментационного чана, представляет собой извлеченный продукт.

Ферментативный бульон затем можно подвергнуть одному или нескольким воздействиям, выбранным из группы, состоящей из:

a) от частичного (от > 0% до < 80%) до полного (100%) или практически полного (≥ 80%, ≥ 90%, ≥ 95%, ≥ 96%, ≥ 97%, ≥ 98%, ≥ 99%) удаления воды,

b) от частичного (от > 0% до < 80%) до полного (100%) или практически полного (≥ 80%, ≥ 90%, ≥ 95%, ≥ 96%, ≥ 97%, ≥ 98%, ≥ 99%) удаления биомассы, при этом последнюю необязательно инактивируют перед удалением,

c) от частичного (от > 0% до < 80%) до полного (100%) или практически полного (≥ 80%, ≥ 90%, ≥ 95%, ≥ 96%, ≥ 97%, ≥ 98%, ≥ 99%, ≥ 99,3%, ≥ 99,7%) удаления побочных органических продуктов, образовавшихся в ходе ферментативного процесса, и

d) от частичного (> 0%) до полного (100%) или практически полного (≥ 80%, ≥ 90%, ≥ 95%, ≥ 96%, ≥ 97%, ≥ 98%, ≥ 99%, ≥ 99,3%, ≥ 99,7%) удаления остаточных компонентов используемой среды или, соответственно, остаточных исходных материалов, которые не были потреблены в ходе ферментативного процесса.

Для воздействий a), b), c) и d) из уровня техники доступно множество технических инструкций.

Удаление воды (воздействие a) можно осуществлять, помимо прочего, путем выпаривания с помощью, например, испарителя с падающей пленкой, путем обратного осмоса или нанофильтрации. Концентраты, полученные таким образом, можно дополнительно обработать путем распылительной сушки или распылительной грануляции. Подобным образом возможно непосредственно высушивать ферментативный бульон с применением распылительной сушки или распылительной грануляции.

Удаление биомассы (воздействие b) можно осуществлять, помимо прочего, путем центрифугирования, фильтрации или декантации или их комбинации.

Удаление побочных органических продуктов (воздействие c) или удаление остаточных компонентов среды (воздействие d) можно осуществлять, помимо прочего, с помощью хроматографии, например, ионообменной хроматографии, обработки активированным углем или кристаллизации. В случае присутствия побочных органических продуктов или остаточных компонентов среды в ферментативном бульоне в виде твердых веществ их можно удалить посредством воздействия b).

Общие инструкции по способам разделения, очистки и грануляции можно найти, помимо прочего, в книге R. Ghosh «Principles of Bioseparation Engineering» (World Scientific Publishing, 2006), книге F. J. Dechow «Separation and Purification Techniques in Biotechnology» (Noyes Publications, 1989), статье «Bioseparation» Shaeiwitz и соавт. (Ullmann's Encyclopedia of Industrial Chemistry, Wiley-VCH, 2012) и книге P. Serno и соавт. «Granulieren» (Editio Cantor Verlag, 2007).

Схему последовательной переработки для получения L-лизиновых продуктов можно найти в статье «L-lysine Production» R. Kelle и соавт. (L. Eggeling and M. Bott (Handbook of Corynebacterium glutamicum, CRC Press, 2005)). В US5279744 сообщается о производстве очищенного L-лизинового продукта с помощью ионообменной хроматографии. В US4956471 сообщается о производстве очищенного L-валинового продукта с помощью ионообменной хроматографии. В US5431933 сообщается о производстве сухих L-аминокислотных продуктов, например, L-лизинового продукта или L-валинового продукта, содержащего большую часть составляющих ферментативного бульона.

Таким образом осуществляют концентрирование или очистку желаемого химического продукта тонкого синтеза и получают продукт, имеющий желаемое содержание указанного химического продукта тонкого синтеза.

Анализ L-аминокислот для определения концентрации в один или более моментов времени в ходе ферментации можно проводить путем разделения L-аминокислот с помощью ионообменной хроматографии, предпочтительно катионообменной хроматографии, с последующей постколоночной дериватизацией с использованием нингидрина, как описано у Spackman и соавт. (Analytical Chemistry 30: 1190-1206 (1958)). Также для постколоночной дериватизации возможно использовать ортофталевый альдегид вместо нингидрина. Обзорную статью по ионообменной хроматографии можно найти у Pickering (LC.GC (Magazine of Chromatographic Science) 7(6), 484-487 (1989)). Подобным образом возможно осуществлять предколоночную дериватизацию, например, с использованием ортофталевого альдегида или фенилизотиоцианата, и фракционировать полученные производные аминокислот с помощью обращенно-фазовой хроматографии (RP), предпочтительно в форме высокоэффективной жидкостной хроматографии (HPLC). Этот тип способа описан, например, у Lindroth и соавт. (Analytical Chemistry 51:1167-1174 (1979)). Выявление осуществляют фотометрическим способом (поглощение, флуоресценция). Обзор в отношении анализа аминокислот можно найти, помимо прочего, в учебнике «Bioanalytik» Lottspeich и Zorbas (Spektrum Akademischer Verlag, Heidelberg, Germany 1998).

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ

A) МАТЕРИАЛЫ И СПОСОБЫ

В данном разделе кратко описываются используемые молекулярно-биологические наборы, праймеры и химические вещества, а также некоторые подробности применяемых способов.

1. Химические вещества

a. IPTG (изопропил-β-D-1-тиогалактопиранозид) приобретали у Carl-Roth (Карлсруэ, Германия, № по каталогу 2316.4).

b. Раствор канамицина из Streptomyces kanamyceticus приобретали у Sigma Aldrich (Сент-Луис, США, № по каталогу K0254).

c. Натриевую соль налидиксовой кислоты приобретали у Sigma Aldrich (Сент-Луис, США, № по каталогу N4382).

d. Пептон из соевой муки приобретали у Merck KGaA (Дармштадт, Германия, № по каталогу 1.017212.0500).

e. Гемикальциевую соль пропионовой кислоты (C₃H₅O₂ x ½ Ca) приобретали у Sigma Chemical CO. (Сент-Луис, США, № по каталогу P-2005).

f. Жидкий кукурузный экстракт (CSL) SOLULYS® 048K с содержанием сухих веществ от 48% до 52% по весу приобретали у ROQUETTE AMERICA INC (Киокак, Айова, США).

g. Гидролизат крахмала Clearsweet®, 95% неочищенный жидкий декстрозный кукурузный сироп, приобретали у Cargill, Incorporated (Миннеаполис, Миннесота, США). Он имел общее содержание твердых веществ 70,5-71,5% по весу.

h. Если не указано иное, все другие химические вещества приобретали чистыми для анализа у Merck (Дармштадт, Германия), Sigma Aldrich (Сент-Луис, США) или Carl-Roth (Карлсруэ, Германия).

2. Культивирование

Если не указано иное, все процедуры культивирования/инкубирования выполняли согласно описанному ниже.

a. Бульон LB (MILLER) от Merck (Дармштадт, Германия, № по каталогу 110285) использовали для культивирования штаммов E. coli в жидкой среде. Жидкие культуры (10 мл жидкой среды на 100-миллилитровую колбу Эрленмейера с 3 перегородками) инкубировали в стандартном шейкере-инкубаторе Infors HT Multitron от Infors AG (Боттминген, Швейцария) при 37°C и 200 оборотах в минуту.

b. Агар LB (MILLER) от Merck (Дармштадт, Германия № по каталогу 110283) использовали для культивирования штаммов E. coli на чашке с агаром. Чашки с агаром инкубировали при 37°C в мини-инкубаторе INCU-Line® от VWR (Раднор, США).

c. Бульон с сердечно-мозговым экстрактом (BHI) от Merck (Дармштадт, Германия; № по каталогу 110493) использовали для культивирования штаммов C. glutamicum в жидкой среде. Жидкие культуры (10 мл жидкой среды на 100-миллилитровую колбу Эрленмейера с 3 перегородками) инкубировали в стандартном шейкере-инкубаторе Infors HT Multitron от Infors AG (Боттминген, Швейцария) при 33°C и 200 оборотах в минуту.

d. Агар с сердечно-мозговым экстрактом (BHI-агар) от Merck (Дармштадт, Германия; № по каталогу 113825) использовали для культивирования штаммов C. glutamicum на чашках с агаром. Чашки с агаром инкубировали при 33°C в инкубаторе от Heraeus Instruments с контроллером температуры Kelvitron® (Ханау, Германия).

3. Определение оптической плотности

a. Оптическую плотность бактериальных суспензий в культурах во встряхиваемых колбах определяли при 600 нм (OD600) с помощью BioPhotometer от Eppendorf AG (Гамбург, Германия).

b. Оптическую плотность бактериальных суспензий, получаемых в микроферментационной системе BioLector® (48-луночном FlowerPlate®), определяли при 660 нм (OD660) с помощью устройства для считывания планшетов GENios™ от Tecan Group AG (Меннедорф, Швейцария).

4. Центрифугирование

a. Настольная центрифуга для реакционных пробирок объемом до 2 мл

Вызывали осаждение бактериальных суспензий с максимальным объемом 2 мл при использовании 1-миллилитровых или 2-миллилитровых реакционных пробирок (например, пробирок Eppendorf® 3810X) с помощью центрифуги Eppendorf 5417 R в течение 5 минут при 13000 оборотов в минуту.

b. Настольная центрифуга для пробирок объемом до 50 мл

Вызывали осаждение бактериальных суспензий с максимальным объемом 50 мл при использовании 15-миллилитровых или 50-миллилитровых центрифужных пробирок (например, 50-миллилитровых конических центрифужных пробирок FalconTM) с помощью центрифуги Eppendorf 5810 R в течение 10 минут при 4,000 оборотов в минуту.

5. Выделение ДНК

a. Плазмидную ДНК выделяли из клеток E. coli с помощью набора QIAprep для центрифугирования культур малого объема от Qiagen (Хильден, Германия, № по каталогу 27106) согласно инструкциям производителя.

b. Выделение плазмид из C. glutamicum осуществляли с помощью того же набора, который описан в разделе a., но клетки предварительно инкубировали в 600 мкл буфера P1, дополненного 12,5 мг лизоцима и 10 ед. мутанолизина (из Streptomyces globisporus ATCC 21553, Sigma Aldrich, Сент-Луис, США, № по каталогу M4782) в течение 2 часов при 37°C.

c. Общую ДНК из C. glutamicum выделяли с помощью способа по Eikmanns и соавт. (Microbiology 140, 1817-1828, 1994).

6. Синтез генов

Молекулы ДНК синтезировали в компании GeneArt (Thermo Fisher Scientific GENEART GmbH, Регенсбург, Германия) с помощью их собственного процесса GeneAssemble. Способ включает синтез олигонуклеотидов de novo и самосборку перекрывающихся комплементарных олигонуклеотидов с последующей ПЦР-амплификацией. Способ кратко изложен Graf и соавт. в статье «Rationales of Gene Design and De Novo Gene Construction» в Systems Biology and Synthetic Biology под ред. P. Fu и S. Panke (John Wiley, 411-438, 2009).

7. Полимеразная цепная реакция (ПЦР)

a. Базовый набор Taq для ПЦР (набор Taq) от Qiagen (Хильден, Германия, № по каталогу 201203) использовали для амплификации желаемого сегмента ДНК для подтверждения ее присутствия или для проверки последовательности с помощью способа Сэнгера. Набор использовали согласно инструкциям производителя (см. таблицу 1).

Таблица 1. Условия термоциклирования для ПЦР с использованием базового набора Taq для ПЦР (набора Taq) от Qiagen

b. Мастер-микс SapphireAmp® для быстрой ПЦР (смесь Sapphire) от Takara Bio Inc (Takara Bio Europe S.A.S., Сен-Жермен-ан-Ле, Франция; № по каталогу RR350A/B) использовали в качестве альтернативы для подтверждения присутствия желаемого сегмента ДНК в клетках, взятых из колоний E. coli или C. glutamicum, согласно инструкциям производителя (см. таблицу 2).

Таблица 2. Условия термоциклирования для ПЦР с использованием мастер-микса SapphireAmp® для быстрой ПЦР (смеси Sapphire) от Takara Bio Inc.

c. Праймер

Используемые олигонуклеотиды синтезировали в Eurofins Genomics GmbH (Эберсберг, Германия) с помощью фосфорамидитного способа, описанного у McBride и Caruthers (Tetrahedron Lett. 24, 245-248, 1983).

d. Матрица

В качестве ПЦР-матрицы использовали либо надлежащим образом разбавленный раствор выделенной плазмидной ДНК, либо общую ДНК, содержащуюся в колонии (ПЦР колоний). Для указанной ПЦР колоний матрицу получали путем отбора клеточного материала с помощью зубочистки из колонии на чашке с агаром и помещения клеточного материала непосредственно в реакционную пробирку для ПЦР. Клеточный материал нагревали в течение 10 секунд при 800 Вт в микроволновой печи типа Mikrowave & Grill от SEVERIN Elektrogeräte GmbH (Зундерн, Германия), а затем к матрице в реакционной пробирке для ПЦР добавляли мастер-микс для ПЦР от Takara Bio Inc.

e. Циклер для ПЦР

ПЦР осуществляли в циклерах для ПЦР типа Mastercycler или Mastercycler Nexus Gradient от Eppendorf AG (Гамбург, Германия).

8. Расщепление ДНК рестрикционными ферментами

Рестрикционные эндонуклеазы FastDigest (FD) и соответствующий буфер от ThermoFisher Scientific (Уолтем, США) использовали для рестрикционного расщепления плазмидной ДНК. Реакции осуществляли согласно инструкциям из руководства от производителя.

9. Лигирование фрагментов ДНК

Для лигирования рестриктированной векторной ДНК с желаемыми фрагментами ДНК использовали ДНК-лигазу T4 Ready-To-Go от Amersham Biosciences Corp (приобретенную у GE Healthcare, Чалфонт-Сент-Джайлс, Великобритания, № по каталогу 27036101) согласно инструкциям производителя.

10. Определение размера фрагментов ДНК

В зависимости от числа и размера фрагментов ДНК, подлежащих исследованию, использовали автоматизированный капиллярный электрофорез или электрофорез в агарозном геле.

a. Капиллярный электрофорез

Размер фрагментов ДНК определяли посредством автоматизированного капиллярного электрофореза с использованием QIAxcel от Qiagen (Хильден, Германия).

b. Электрофорез в агарозном геле

Для разделения фрагментов ДНК после рестрикционного расщепления или ПЦР использовали агарозные гели с 0,8% агарозы (Biozym LE Agarose, Хессиш-Ольдендорф, Германия) в 1x TAE (буфере трис-ацетат-EDTA; исходный раствор: 50 x буфер TAE (AppliChem, Дармштадт, Германия)). Разделение осуществляли с помощью оборудования для электрофореза Mini-Sub Cell GT от BioRad (Bio-Rad Laboratories GmbH, Мюнхен, Германия) при 100 В в течение 45 минут. Маркер длины ДНК O'GeneRuler размером 1 т. п.о. (Thermo Scientific, Шверте, Германия) использовали в качестве эталона для определения размера фрагментов. Спустя 20 минут инкубирования геля в ванне для окрашивания, содержащей краситель для нуклеиновых кислот GelRedTM от Biotrend (Кельн, Германия, разбавление согласно инструкциям изготовителя: 1:10000), фрагменты ДНК визуализировали посредством УФ-облучения с использованием устройства для визуализации Gel iX20 от Intas (Геттинген, Германия).

11. Очистка ПЦР-амплификатов и рестрикционных фрагментов

ПЦР-амплификаты и рестрикционные фрагменты очищали с помощью набора для очистки продуктов ПЦР QIAquick от Qiagen (Хильден, Германия, № по каталогу 28106) согласно инструкциям производителя.

После электрофореза в геле и вырезания желаемого фрагмента ДНК использовали набор для экстракции из геля Qiagen MinElute (Хильден, Германия, № по каталогу 28604) согласно инструкциям производителя.

12. Определение концентрации ДНК

Концентрацию ДНК измеряли с использованием спектрофотометра NanoDrop ND-1000 от PEQLAB Biotechnologie GmbH, торговой марки VWR с 2015 года (Эрланген, Германия).

13. Сборка по Гибсону

Векторы экспрессии и интегрирующие векторы получали с помощью способа по Gibson и соавт. (Science 319, 1215-20, 2008). Использовали набор Gibson Assembly от New England BioLabs Inc. (Ипсвич, США, № по каталогу E2611) для этой цели. Реакционную смесь, содержащую рестриктированный вектор и по меньшей мере одну ДНК-вставку, инкубировали при 50°C в течение 60 минут. Для эксперимента по трансформации использовали 0,5 мкл смеси для сборки.

14. Химическая трансформация E. coli

a. Химически компетентные клетки E. coli Stellar™ приобретали у Clontech Laboratories Inc. (Маунтин-Вью, США, № по каталогу 636763) и трансформировали согласно протоколу производителя (PT5055-2).

Эти клетки использовали в качестве хозяев для трансформации реакционными смесями после сборки по Гибсону. Трансформационные партии культивировали на протяжении ночи в течение приблизительно 18 часов при 37°C, и трансформантов, содержащих плазмиды, отбирали на агаре LB, дополненном 50 мг/л канамицина.

b. Штамм S17-1 E. coli K-12 использовали в качестве донора для конъюгационного переноса плазмид на основе pK18mobsacB из E. coli в C. glutamicum. Штамм S17-1 описан у Simon, R. и соавт. (Bio/Technology 1, 784-794, 1983). Он доступен из Американской коллекции типовых культур под номером доступа ATCC47055.

Химически компетентные клетки E. coli S17-1 получали следующим образом. В предварительную культуру в виде 10 мл среды LB (10 мл жидкой среды на 100-миллилитровую колбу Эрленмейера с 3 перегородками) инокулировали 100 мкл бактериальной суспензии штамма S17-1, и культуру инкубировали на протяжении ночи в течение приблизительно 18 часов при 37°C и 250 оборотах в минуту. В основную культуру (70 мл LB, содержащейся в 250-миллилитровой колбе Эрленмейера с 3 перегородками) инокулировали 300 мкл предварительной культуры, и ее инкубировали до OD600 0,5-0,8 при 37°C. Культуру центрифугировали в течение 6 минут при 4°C и 4000 оборотов в минуту, и надосадочную жидкость сливали. Клеточный осадок ресуспендировали в 20 мл стерильного охлажденного льдом раствора 50 мM CaCl₂ и инкубировали на льду в течение 30 минут. После следующего этапа центрифугирования осадок ресуспендировали в 5 мл охлажденного льдом раствора 50 мM CaCl₂, и суспензию инкубировали на льду в течение 30 минут. Клеточную суспензию затем доводили до конечной концентрации 20% глицерина (объем/объем) 85% стерильным охлажденным льдом глицерином. Суспензию разделяли на аликвоты по 50 мкл и хранили при -80°C.

Для трансформации клеток S17-1 использовали протокол согласно Tang и соавт. (Nucleic Acids Res. 22(14), 2857-2858, 1994) с тепловым шоком в течение 45 секунд.

15. Трансформация C. glutamicum путем электропорации

Плазмидные векторы на основе pVWEx1 переносили в клетки C. glutamicum с помощью модифицированного способа электропорации по Van der Rest и соавт. (Appl Microbiol Biotechnol 52, 541-545, 1999).

Для получения компетентных клеток C. glutamicum штаммы размножали в среде BHIS (37 г/л BHI, 91 г/л сорбита (Sigma Aldrich, Сент-Луис, США)) посредством предварительного культивирования и последующего основного культивирования. Предварительная культура состояла из 10 мл среды BHIS, содержащейся в 100-миллилитровой колбе Эрленмейера с 3 перегородками. В нее инокулировали 100 мкл исходной культуры в глицерине, и ее инкубировали на протяжении ночи в течение приблизительно 18 часов при 33°C и 200 оборотах в минуту. Основная культура состояла из 250 мл среды BHIS, содержащейся в 1-литровой колбе Эрленмейера с 4 перегородками. В нее инокулировали 5 мл предварительной культуры, и ее инкубировали в течение 4 часов при 33°C и 150 оборотах в минуту до OD600 примерно 1,8.

Следующие технологические этапы осуществляли на льду с использованием стерильных охлажденных льдом буферов или, соответственно, растворов. Основную культуру центрифугировали в течение 20 минут при 4°C и 4000 оборотов в минуту. Надосадочную жидкость сливали, клеточный осадок ресуспендировали в 2 мл буфера TG (1 мM трис(гидроксиметил)-аминометана, 10% глицерина, доведенного до pH 7,5 с помощью HCl), и к клеточной суспензии добавляли еще 20 мл буфера TG. Этот этап промывания повторяли дважды. После указанных этапов промывания следовали два дополнительных этапа промывания, на которых буфер TG заменяли 10% (объем/объем) раствором глицерина. После конечного этапа центрифугирования к клеточному осадку добавляли 2 мл 10% (объем/объем) глицерина. Затем полученную клеточную суспензию разделяли на аликвоты в виде порций по 100 мкл и хранили при -80°C.

Электропорацию штаммов C. glutamicum осуществляли согласно описанному у Van der Rest и соавт. В отступление от этой процедуры, температура культивирования составляла 33°C, а средой для культивирования на чашках с агаром был BHI-агар. Трансформантов отбирали на чашках с BHI-агаром, дополненным 25 мг/л канамицина.

16. Конъюгация C. glutamicum

Плазмидную систему pK18mobsacB, описанную у Schäfer и соавт. (Gene 145, 69 - 73, 1994), использовали для интеграции желаемых фрагментов ДНК в хромосому C. glutamicum. Модифицированный способ конъюгации по Schäfer и соавт. (Journal of Bacteriology 172, 1663 - 1666, 1990) использовали для переноса соответствующей плазмиды в желаемый реципиентный штамм C. glutamicum.

Культивирование штаммов C. glutamicum осуществляли в виде жидких культур в среде BHI при 33°C. Воздействие тепловым шоком осуществляли при 48,5°C в течение 9 минут. Трансконъюганты, образующиеся в результате первого события рекомбинации, отбирали путем высевания конъюгационной партии на агар EM8 (таблица 3), который был дополнен 25 мг/л канамицина и 50 мг/л налидиксовой кислоты. Чашки с агаром EM8 инкубировали в течение 72 часов при 33°C.

Таблица 3. Состав агара EM8

Для переноса трансконъюгантов на BHI-агар, который был дополнен 25 мг/л канамицина и 50 мг/л налидиксовой кислоты, использовали стерильные зубочистки. Чашки с агаром инкубировали в течение 20 часов при 33°C. Затем культуры соответствующих трансконъюгантов, полученные таким образом, размножали в течение еще 24 часов при 33°C в 10 мл среды BHI, содержащейся в 100-миллилитровых колбах Эрленмейера с 3 перегородками. Для выделения клонов, в которых имеет место второе событие рекомбинации, из жидкой культуры отбирали аликвоту, соответствующим образом разбавляли и высевали (как правило, 100-200 мкл) на BHI-агар, который был дополнен 10% сахарозой. Чашки с агаром инкубировали в течение 48 часов при 33°C. Затем колонии, растущие на чашках с агаром, содержащим сахарозу, изучали в отношении фенотипа чувствительности к канамицину. Чтобы сделать это, использовали зубочистку для удаления клеточного материала из колонии и переноса его на BHI-агар, содержащий 25 мг/л канамицина, и на BHI-агар, содержащий 10% сахарозу. Чашки с агаром инкубировали в течение 60 часов при 33°C. Клоны трансконъюгантов, которые оказывались чувствительными к канамицину и устойчивыми к сахарозе, изучали в отношении интеграции желаемого фрагмента ДНК в хромосому посредством ПЦР.

17. Определение нуклеотидных последовательностей

Нуклеотидные последовательности молекул ДНК определяли в Eurofins Genomics GmbH (Эберсберг, Германия) с помощью циклического секвенирования с использованием дидезоксинуклеотидного способа обрыва цепи по Sanger и соавт. (Proceedings of the National Academy of Sciences USA 74, 5463 - 5467, 1977) на анализаторе ДНК 3730xl от Applied Biosystems® (Карлсбад, Калифорния, США). Для визуализации и оценивания последовательностей использовали программное обеспечение Clone Manager Professional 9 от Scientific & Educational Software (Денвер, США).

18. Исходные культуры штаммов E. coli и C. glutamicum в глицерине

Для длительного хранения получали исходные культуры штаммов E. coli и C. glutamicum в глицерине. Выбранные клоны E. coli культивировали в 10 мл среды LB, дополненной 2 г/л глюкозы. Выбранные клоны C. glutamicum культивировали в двукратно концентрированной среде BHI, дополненной 2 г/л глюкозы. Культуры содержащих плазмиды штаммов E. coli дополняли 50 мг/л канамицина. Культуры содержащих плазмиды штаммов C. glutamicum дополняли 25 мг/л канамицина. Среда содержалась в 100-миллилитровых колбах Эрленмейера с 3 перегородками. В нее инокулировали петлю с клетками, взятыми из колонии, и культуру инкубировали в течение приблизительно 18 часов при 37°C и 200 оборотах в минуту в случае с E. coli и 33°C и 200 оборотах в минуту в случае с C. glutamicum. После указанного периода инкубирования в культуру добавляли 1,2 мл 85% (объем/объем) стерильного глицерина. Полученную клеточную суспензию, содержащую глицерин, затем разделяли на аликвоты в виде порций по 2 мл и хранили при -80°C.

19. Система для культивирования BioLector®

Для исследования функциональных характеристик сконструированных штаммов C. glutamicum использовали микроферментационную систему BioLector® (m2p-labs GmbH, Басвайлер, Германия).

Для этой цели использовали 48-луночный FlowerPlate® (m2p-labs GmbH, Басвайлер, Германия, № по каталогу MTP-48-BO), заполненный 1 мл среды на лунку. Лунки FlowerPlate® были оснащены оптодом для анализа содержания растворенного кислорода в жидкости. BioLector® дополнительно оснащен оптическим устройством для измерения интенсивности света, рассеиваемого клеточными частицами в микробной культуре, содержащейся в лунке FlowerPlate®. Этот так называемый сигнал обратного рассеяния (Samorski et al., Biotechnol Bioeng. 92(1):61-8, 2005) коррелирует с концентрацией клеточных частиц. Это позволяет неинвазивным путем отслеживать в режиме онлайн рост микробной культуры.

Предварительные культуры штаммов получали в 10 мл двукратно концентрированной среды BHI. В случае с содержащими плазмиды (pVWEx1 и ее производные) штаммами среда была дополнена 25 мг/л канамицина. Среда содержалась в 100-миллилитровой колбе Эрленмейера с 3 перегородками. В нее инокулировали 100 мкл исходной культуры в глицерине, и культуру инкубировали в течение 24 часов при 33°C и 200 оборотах в минуту.

После указанного периода инкубирования определяли значения оптической плотности OD600 предварительных культур.

Основные культуры получали путем инокулирования в лунки 48-луночного FlowerPlate®, содержащие 1 мл среды, аликвоты предварительной культуры с получением оптической плотности OD600 0,1.

В качестве среды для модификаций основной культуры использовали среду CGXII, описанную у Keilhauer и соавт. (J. Bacteriol. 1993 Sep; 175(17): 5595-5603). Для удобства состав среды CGXII показан в таблице 4.

Таблица 4. Состав среды CGXII по Keilhauer

Среда, называемая CGXII_CSL, дополнительно содержит жидкий кукурузный экстракт в концентрации 7,5 г/л. Среда, называемая CGXII_YE, дополнительно содержит дрожжевой экстракт в концентрации 7,5 г/л.

В случае с содержащими плазмиды (pVWEx1 и ее производные) штаммами среда дополнительно была дополнена 25 мг/л канамицина и 0,3 мM IPTG для индуцирования экспрессии под контролем промотора PtacI.

Эти основные культуры инкубировали в течение периода до 48 часов при 33°C и 800 оборотах в минуту в системе BioLector® до полного потребления глюкозы.

Концентрацию глюкозы в суспензии анализировали глюкометром OneTouch Vita® от LifeScan (Johnson & Johnson Medical GmbH, Нойс, Германия).

После культивирования суспензионные культуры переносили в микропланшет с глубокими лунками. Часть суспензионной культуры соответствующим образом разбавляли для измерения OD600. Другую часть культуры центрифугировали, и в надосадочной жидкости анализировали концентрацию L-аминокислот, например, L-лизина или L-валина, и остаточного источника углерода, такого как паноза.

20. Культивирование в 2-литровых колбах

Продуцирование L-лизина при использовании гидролизата крахмала в качестве источника углерода выполняли в 2-литровых колбах следующим образом.

Предварительные культуры штаммов C. glutamicum получали в 10 мл двукратно концентрированной среды BHI. Среда содержалась в 100-миллилитровых колбах Эрленмейера с 3 перегородками. В нее инокулировали 100 мкл исходной культуры в глицерине. Затем культуру инкубировали в течение 24 часов при 33°C и 200 оборотах в минуту. После указанного периода инкубирования определяли значения оптической плотности OD600 предварительных культур.

Основные культуры получали путем инокулирования в 200 мл среды, содержащей гидролизат крахмала (стерилизованный отдельно в стерилизаторе непрерывного действия) в качестве источника углерода, содержащейся в 2-литровых колбах Эрленмейера, имеющих 4 перегородки, аликвоты предварительной культуры с получением оптической плотности OD600 0,5. Культуры инкубировали в течение 57 часов при 33°C и 150 оборотах в минуту.

21. Анализатор аминокислот

Концентрацию L-лизина и других L-аминокислот, например, L-валина, в образцах надосадочной жидкости культуры определяли с помощью ионообменной хроматографии с использованием анализатора аминокислот SYKAM S433 от SYKAM Vertriebs GmbH (Фюрштенфельдбрук, Германия). В качестве твердой фазы использовали колонку со сферическими гранулами полистирольного катионообменника (PEEK LCA N04/Na, с размерами 150 × 4,6 мм) от SYKAM. В зависимости от L-аминокислоты разделение происходило в изократическом режиме с использованием смеси буферов A и B для элюирования или путем градиентного элюирования с использованием указанных буферов. В качестве буфера A использовали водный раствор, содержащий в 20 л 263 г цитрата тринатрия, 120 г лимонной кислоты, 1100 мл метанола, 100 мл 37% HCl и 2 мл октановой кислоты (конечное значение pH 3,5). В качестве буфера B использовали водный раствор, содержащий в 20 л 263 г цитрата тринатрия, 100 г борной кислоты и 2 мл октановой кислоты (конечное значение pH 10,2). Свободные аминокислоты окрашивали нингидрином посредством постколоночной дериватизации и выявляли фотометрическим способом при 570 нм.

22. Определение глюкозы с использованием непрерывно-проточной системы (CFS)

Для определения концентрации глюкозы в надосадочной жидкости использовали многоканальный непрерывно-проточный анализатор SANplus от SKALAR analytic GmbH (Эркеленц, Германия). Глюкозу выявляли с помощью сопряженного ферментного анализа (гексокиназного/глюкозо-6-фосфатдегидрогеназного) по образованию NADH.

23. Анализ панозы и изомальтозы

Для определения концентрации панозы и изомальтозы в надосадочной жидкости культуры использовали компактную систему для HPLC (жидкостной хроматографии высокого давления) от Thermo Fisher Scientific Inc. (Уолтем, Массачусетс, США). Разделение выполняли с помощью распределительной хроматографии на амино-модифицированном силикагеле с ионообменными свойствами (колонка с аминосорбентом YMC Polyamine II S-5 мкм, 250*4,6 мм; Thermo Fisher Scientific Inc., Уолтем, Массачусетс, США) с использованием элюента, состоящего из 30% воды и 70% ацетонитрила (объем/объем). Выявление происходило с помощью детектора RI (показателя преломления) (Thermo Fisher Scientific Inc., Уолтем, Массачусетс, США).

24. Получение надосадочной жидкости культуры для анализа секретируемого слитого белка на основе α-1,6-глюкозидазы

Предварительную культуру штамма C. glutamicum получали в 10 мл двукратно концентрированной среды BHI, дополненной 25 мг/л канамицина. Среда содержалась в 100-миллилитровой колбе Эрленмейера с 3 перегородками. В нее инокулировали 100 мкл исходной культуры в глицерине. Затем культуру инкубировали в течение 24 часов при 33°C и 200 оборотах в минуту.

После указанного периода инкубирования определяли оптическую плотность OD600 предварительной культуры.

Основные культуры состояли из 2x 50 мл среды CGXII_CSL (см. таблицу 5), дополненной 25 мг/л канамицина и 0,3 мM IPTG, содержащейся в 500-миллилитровых колбах Эрленмейера с 4 перегородками. В нее инокулировали аликвоту предварительной культуры с получением оптической плотности OD600 0,8, и ее инкубировали в течение 24 часов при 33°C и 150 оборотах в минуту.

После указанного периода инкубирования значения оптической плотности OD600 основных культур составляли 41. Культуры центрифугировали в течение 10 минут при 4000 оборотов в минуту. Полученную надосадочную жидкость фильтровали с помощью высокопоточного шприцевого фильтра Minisart® (0,22 мкм) от Sartorius (Геттинген, Германия, № по каталогу 16532). Фильтрат концентрировали с помощью центрифужного фильтрующего блока Amicon Ultra-15 (30K) от Merck Millipore Ltd. (Корк, Ирландия, № по каталогу UFC903024) для повышения содержания белка. Для этого надосадочную жидкость (максимум 12 мл) пипеткой переносили в фильтровальное устройство и помещали в предусмотренную центрифужную пробирку. В центрифужном фильтрующем блоке проводили центрифугирование в течение 45 минут при 10°C и 4000 оборотов в минуту. После центрифугирования надосадочную жидкость в фильтрующем блоке переносили пипеткой в отдельную пробирку.

Содержание белка в концентрате определяли согласно Бредфорду (Anal. Biochem. 72, 248-254, 1976) с использованием окрашивающего реагента для анализа белков Bio-Rad от BioRad (Bio-Rad Laboratories GmbH, Мюнхен, Германия, № по каталогу 5000006) согласно инструкциям производителя. В качестве стандарта использовали бычий сывороточный альбумин. Концентрация белка в концентрате составляла 0,8 мг/мл.

25. Выявление сайта расщепления слитого белка

Надосадочную жидкость культуры клеток, экспрессирующих слитый полипептид, исследовали с помощью LC-MS (жидкостной хроматографии в сочетании с масс-спектрометрией) с использованием электрораспылительной ионизации (ESI). В качестве инструмента использовали систему для UPLC Accela 1250, соединенную с Orbitrap Elite от Thermo Fisher (Scientific Inc., Уолтем, США) с колонкой Poroshell SB300-C18, 75 x 2,1 мм от Agilent (Санта-Клара, США). В качестве элюента A использовали водный раствор 0,1% TFA (трифторуксусной кислоты), а в качестве элюента B - 0,1% TFA, растворенную в ацетонитриле/1-пропаноле (60/40). Для разделения градиент, показанный в таблице 5, использовали при скорости потока 0,3 мл/минута при 70°C. Перед измерением образец разбавляли 1:20 в водном 50 мM трис-буфере (pH 7,5). Объем вводимого образца составлял 15 мкл.

Таблица 5. Градиент элюирования

С помощью способа ESI белки ионизируются как многократно протонированные молекулярные ионы [M+nH]n+. Это позволяет выявлять даже высокомолекулярные соединения в ограниченном окне диапазона масс. Молекулярный вес незаряженного белка также можно пересчитать с помощью программного обеспечения для деконволюции по зарядовому состоянию Promass 2.8 для Xcalibur от Novatia, LLC (Нью-Джерси, США). Белковые фракции элюируются в области времени удержания от 8 до 12 минут.

26. Измерение α-1,6-глюкозидазной ферментативной активности

α-1,6-Глюкозидазную активность в образцах надосадочной жидкости культуры определяли с использованием пара-нитрофенил-α-глюкозида в качестве хромогенного субстрата, как описано у Deng и соавт. (FEBS Open Bio 4, 200 - 212, 2014).

Образцы надосадочной жидкости, используемые для анализа, получали путем центрифугирования культур и последующей фильтрации образцов надосадочной жидкости с использованием высокопоточного шприцевого фильтра Minisart® (0,22 мкм) от Sartorius (Геттинген, Германия, № по каталогу 16532).

Анализ выполняли при 34°C в реакционной смеси, имеющей конечный объем 1500 мкл. 750 мкл 100 мM калий-фосфатного буфера (pH 7), 150 мкл 10 мг/мл BSA (бычьего сывороточного альбумина) и 150 мкл 40 мM пара-нитрофенил-α-глюкозида переносили пипеткой в реакционную пробирку, и реакцию начинали путем добавления 450 мкл надосадочной жидкости культуры. Через 2, 4, 6 и 8 минут 200 мкл образцов удаляли из реакционной смеси и переносили пипеткой в 800 мкл 1 M раствора карбоната натрия. Концентрацию п-нитрофенола определяли при 405 нм с использованием спектрофотометра U-3200 от Hitachi Scientific Instruments (Nissel Sangyo GmbH, Дюссельдорф, Германия). Коэффициент молярной экстинкции для п-нитрофенола определяли как ε = 17,6 см²/ммоль при 405 нм в 0,8 M растворе карбоната натрия с pH 11 и при 34°C. Одну единицу (ед.) определяют как количество фермента, которое катализирует превращение 1 мкмоль субстрата в минуту.

B) РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ

Пример 1

Идентификация подходящей α-1,6-глюкозидазы

Пример 1.1

Схема эксперимента

Гены различного происхождения, кодирующие глюкозидазы, которые, как сообщалось, гидролизуют α-1,6-связи в олигомерах глюкозы, тестировали в отношении их способности придавать C. glutamicum признак разложения панозы. Библиографические подробности генов кратко изложены в таблице 6.

Таблица 6. Происхождение тестируемых α-1,6-глюкозидазных функций и используемого Tat-сигнального пептида

¹ (Applied and Environmental Microbiology 75, 1135-1143, 2009)

² (Диссертация, Ульмский университет, 2013)

³ (идентификатор локуса: CGTRNA_RS04205); под номером доступа NC_003450.3; та же cds доступна под идентификатором локуса NCgl0801)

В сущности кодирующие последовательности перечисленных в таблице 6 генов, кодирующих полипептиды, обеспечивающие ферментативную функцию, приспосабливали под частоту использования кодонов Corynebacterium glutamicum (cuo = оптимизированная частота использования кодонов) и сливали с нуклеотидной последовательностью, кодирующей Tat-сигнальный пептид Cg0955, описанный у Breitinger (диссертация, Ульмский университет, 2013). Аминокислотная последовательность Tat-сигнального пептида Cg0955 и кодирующая ее нуклеотидная последовательность показаны под SEQ ID NO: 2 и SEQ ID NO: 1 в перечне последовательностей. Полинуклеотиды, кодирующие полученные в результате слитые полипептиды, клонировали в вектор экспрессии pVWEx1, описанный Peters-Wendisch и соавт. (Journal of Molecular Microbiology and Biotechnology 3, 295 - 300, 2001). Нуклеотидная последовательность pVWEx1 доступна в базе данных GenBank под номером доступа MF034723. Карта плазмиды pVWEx1 показана на фигуре 1.

Штамм Corynebacterium glutamicum, продуцирующий L-лизин, трансформировали сконструированными векторами экспрессии, и полученных в результате трансформантов тестировали в отношении их способности разлагать панозу.

Пример 1.2

Разработка и синтез слитых генов

Полинуклеотиды, кодирующие слитые полипептиды, разрабатывали и синтезировали с сайтом рестрикции для эндонуклеазы PstI (CTGCAG) на 5'-конце и с терминатором транскрипции Tgap* (см. SEQ ID NO: 13) и сайтом рестрикции для эндонуклеазы BamHI (GGATCC) на 3'-конце нуклеотидной последовательности. Сайты рестрикции для PstI и BamHI обеспечивают возможность клонирования в челночный вектор pVWEx1 для E. coli и C. glutamicum.

Слитый ген tat-'agl2_cuo

Нуклеотидная последовательность полинуклеотида, синтезированного и содержащего кодирующую последовательность слитого гена tat-'agl2_cuo, показана под SEQ ID NO: 21. Аминокислотная последовательность слитого полипептида Tat-'Agl2 показана под SEQ ID NO: 22. Аминокислотная последовательность слитого полипептида в положениях 1-33 идентична аминокислотной последовательности Cg0955, показанной под SEQ ID NO: 2 в положениях 1-33. Эту часть аминокислотной последовательности слитого полипептида также называют N-концевым Tat-сигнальным пептидом.

Аминокислотная последовательность слитого полипептида в положениях 37-639 SEQ ID NO: 22 идентична аминокислотной последовательности полипептида Agl2, показанной под SEQ ID NO: 6 в положениях 2-604. Отсутствие начальной аминокислоты метионина (Met) в Agl2 в слитом полипептиде указано как “'” в обозначении слитого полипептида.

Содержание G + C в нуклеотидной последовательности, кодирующей C-концевой полипептид слитого полипептида ('agl2_cuo), показанной под SEQ ID NO: 21 в положениях 122-1930, составляет 58,2%. Содержание G + C в нуклеотидной последовательности, кодирующей полипептид Agl2 Bifidobacterium breve UCC2003 и не имеющей стартового кодона atg ('agl2), показанной под SEQ ID NO: 5 в положениях 4-1812, составляет 65,6%.

Полинуклеотид tat-'agl2_cuo, показанный под SEQ ID NO: 21, клонировали в челночный вектор pVWEx1. Для этой цели полинуклеотид, показанный под SEQ ID NO: 21, разрезали рестрикционными эндонуклеазами PstI и BamHI и лигировали в вектор, обработанный рестрикционными эндонуклеазами PstI и BamHI. Полученную плазмиду назвали pVWEx1_tat-'agl2_cuo. Карта плазмиды pVWEx1_tat-'agl2_cuo показана на фигуре 2.

Слитый ген tat-agl1_cuo

Нуклеотидная последовательность полинуклеотида, синтезированного и содержащего кодирующую последовательность слитого гена tat-agl1_cuo, показана под SEQ ID NO: 23. Аминокислотная последовательность слитого полипептида Tat-Agl1 показана под SEQ ID NO: 24. Аминокислотная последовательность слитого полипептида в положениях 1-33 идентична аминокислотной последовательности Cg0955, показанной под SEQ ID NO: 2 в положениях 1-33. Эту часть аминокислотной последовательности слитого полипептида также называют N-концевым Tat-сигнальным пептидом.

Аминокислотная последовательность слитого полипептида в положениях 37-643 SEQ ID NO: 24 идентична аминокислотной последовательности полипептида Agl1, показанной под SEQ ID NO: 8.

Содержание G + C в нуклеотидной последовательности, кодирующей C-концевой полипептид слитого полипептида (agl1_cuo), показанной под SEQ ID NO: 23 в положениях 122-1942, составляет 58,1%. Содержание G + C в нуклеотидной последовательности, кодирующей полипептид Agl1 Bifidobacterium breve UCC2003 (agl1), показанной под SEQ ID NO: 7 в положениях 1-1821, составляет 58,6%.

Полинуклеотид tat-agl1_cuo, показанный под SEQ ID NO: 23, клонировали в челночный вектор pVWEx1. Для этой цели полинуклеотид, показанный под SEQ ID NO: 23, разрезали рестрикционными эндонуклеазами PstI и BamHI и лигировали в вектор, обработанный рестрикционными эндонуклеазами PstI и BamHI. Полученную плазмиду назвали pVWEx1_tat-agl1_cuo.

Слитый ген tat-'IMA1_cuo

Нуклеотидная последовательность полинуклеотида, синтезированного и содержащего кодирующую последовательность слитого гена tat-'IMA1_cuo, показана под SEQ ID NO: 25. Аминокислотная последовательность слитого полипептида Tat-'IMA1 показана под SEQ ID NO: 26. Аминокислотная последовательность слитого полипептида в положениях 1-33 идентична аминокислотной последовательности Cg0955, показанной под SEQ ID NO: 2 в положениях 1-33. Эту часть аминокислотной последовательности слитого полипептида также называют N-концевым Tat-сигнальным пептидом.

Аминокислотная последовательность слитого полипептида в положениях 37-624 SEQ ID NO: 26 идентична аминокислотной последовательности полипептида IMA1, показанного под номером доступа NP_11803, в положениях 2-589. Отсутствие начальной аминокислоты метионина (Met) в IMA1 в слитом полипептиде указано как “'” в обозначении слитого полипептида.

Содержание G + C в нуклеотидной последовательности, кодирующей C-концевой полипептид слитого полипептида ('IMA1_cuo), показанной под SEQ ID NO: 25 в положениях 122-1885, составляет 53,2%. Содержание G + C в нуклеотидной последовательности, кодирующей полипептид IMA1 Saccharomyces cerevisiae S288c и не имеющей стартового кодона atg ('IMA1), составляет 42,4%.

Полинуклеотид tat-'IMA1_cuo, показанный под SEQ ID NO: 25, клонировали в челночный вектор pVWEx1. Для этой цели полинуклеотид, показанный под SEQ ID NO: 25, разрезали рестрикционными эндонуклеазами PstI и BamHI и лигировали в вектор, обработанный рестрикционными эндонуклеазами PstI и BamHI. Полученную плазмиду назвали pVWEx1_tat-'IMA1_cuo.

Слитый ген tat-'AY008307_cuo

Нуклеотидная последовательность полинуклеотида, синтезированного и содержащего кодирующую последовательность слитого гена tat-'AY008307_cuo, показана под SEQ ID NO: 27. Аминокислотная последовательность слитого полипептида Tat-'AY008307 показана под SEQ ID NO: 28. Аминокислотная последовательность слитого полипептида в положениях 1-33 идентична аминокислотной последовательности Cg0955, показанной под SEQ ID NO: 2 в положениях 1-33. Эту часть аминокислотной последовательности слитого полипептида также называют N-концевым Tat-сигнальным пептидом.

Аминокислотная последовательность слитого полипептида в положениях 37-596 SEQ ID NO: 28 идентична аминокислотной последовательности полипептида олиго-1,6-глюкозидазы, показанного под номером доступа AAG23399, в положениях 2-561. Отсутствие исходной аминокислоты метионина (Met) в слитом полипептиде указано как “'” в обозначении слитого полипептида.

Содержание G + C в нуклеотидной последовательности, кодирующей C-концевой полипептид слитого полипептида ('AY008307_cuo), показанной под SEQ ID NO: 27 в положениях 122-1801, составляет 53,1%. Содержание G + C в нуклеотидной последовательности, кодирующей полипептид AY008307 Bacillus subtilis HB002 и не имеющей стартового кодона atg ('AY008307), составляет 44,0%.

Полинуклеотид tat-'AY008307_cuo, показанный под SEQ ID NO: 27, клонировали в челночный вектор pVWEx1. Для этой цели полинуклеотид, показанный под SEQ ID NO: 27, разрезали рестрикционными эндонуклеазами PstI и BamHI и лигировали в вектор, обработанный рестрикционными эндонуклеазами PstI и BamHI. Полученную плазмиду назвали pVWEx1_tat-'AY008307_cuo.

Ген agl2_cuo

Нуклеотидная последовательность полинуклеотида, содержащего кодирующую последовательность гена agl2_cuo, показана под SEQ ID NO: 29, а кодируемая аминокислотная последовательность полипептида Agl2 показана под SEQ ID NO: 30. Аминокислотная последовательность полипептида в положениях 1-604 идентична аминокислотной последовательности Agl2, показанной под SEQ ID NO: 6 в положениях 1-604. Аминокислотная последовательность полипептида, показанная под SEQ ID NO: 30 в положениях 2-604, идентична аминокислотной последовательности слитого белка Tat-Agl2, показанной под SEQ ID NO: 10 в положениях 37-639.

Для демонстрации эффекта Tat-сигнального пептида в отношении секреции фермента или, соответственно, разложения панозы разрабатывали и конструировали контрольную плазмиду, содержащую полную кодирующую последовательность гена agl2_cuo, но не имеющую нуклеотидной последовательности, кодирующей сигнальный пептид. Эту контрольную плазмиду назвали pVWEx1_agl2_cuo.

Для этой цели разрабатывали и синтезировали полинуклеотид Wo_tat, показанный под SEQ ID NO: 31.

Wo_tat содержит от 5'-конца к 3'-концу сайт распознавания для эндонуклеазы MauBI, промотор PtacI, сайты распознавания для эндонуклеаз PstI и SexAI и 5'-конец кодирующей последовательности agl2_cuo, содержащий сайт распознавания для эндонуклеазы FspAI (см. SEQ ID NO: 21). Указанный 5'-конец кодирующей последовательности agl2_cuo состоит из нуклеотидной последовательности из положений 14-77 SEQ ID NO: 29, кодирующей первую 21 N-концевую аминокислоту полипептида Agl2, в том числе начальную аминокислоту метионин.

Плазмиду pVWEx1_agl2_cuo конструировали следующим образом. Плазмиду pVWEx1_tat-'agl2_cuo (см. фигуру 2) расщепляли рестрикционными эндонуклеазами MauBI и FspI. Таким образом получали два фрагмента ДНК: один фрагмент ДНК длиной 473 п.о., содержащий промотор PtacI и 5'-конец слитого гена tat-'agl2_cuo, фактически кодирующий Tat-сигнальный пептид (отмеченный как tat на фигуре 2), и второй фрагмент ДНК длиной 10116 п.о., содержащий последовательность pVWEx1 и 3'-конец слитого гена tat-'agl2_cuo, фактически кодирующий α-1,6-глюкозидазу Agl2 (отмеченную как 'agl2_cuo на фигуре 2). Эти два фрагмента ДНК разделяли посредством электрофореза в агарозном геле. Фрагмент ДНК размером 473 п.о. отбрасывали, а фрагмент ДНК размером 10116 п.о. выделяли из агарозного геля и очищали. Полинуклеотид Wo_tat также обрабатывали рестрикционными эндонуклеазами MauBI и FspAI и очищали. Эти два фрагмента ДНК, полученные таким образом, лигировали, и лигированную смесь использовали для трансформации химически компетентных клеток E. coli Stellar™. Нуклеотидную последовательность agl2_cuo (также показанную под SEQ ID NO: 29) в выделенной плазмиде трансформанта подтверждали с помощью способа секвенирования по Сэнгеру.

Таким образом, получали плазмиду pVWEx1_agl2_cuo. Ее карта показана на фигуре 3.

Пример 1.3

Конструирование штамма

В качестве хозяина для оценивания способности сконструированных слитых генов придавать виду C. glutamicum способность к разложению панозы был выбран штамм DM1933.

Штамм DM1933 является продуцентом L-лизина, описанным Blombach и соавт. (Applied and Environmental Microbiology 75(2), 419-427, 2009). Он депонирован согласно Будапештскому договору под номером доступа DSM25442.

Штамм DM1933 трансформировали выделенной плазмидной ДНК pVWEx1, pVWEx1_tat-'agl2_cuo, pVWEx1_tat-agl1_cuo, pVWEx1_tat-'IMA1_cuo, pVWEx1_tat-'AY008307_cuo и pVWEx1_agl2_cuo путем электропорации. Отбор трансформантов, размножение трансформантов и получение исходных культур в глицерине выполняли согласно описанному в разделе «Материалы и способы» и в присутствии канамицина.

Конкретные нуклеотидные последовательности трансформантов амплифицировали с помощью ПЦР колоний для проверки плазмидного статуса трансформантов. Используемые праймеры и размер ПЦР-амплификатов кратко изложены в таблице 7.

Таблица 7. Перечень используемых праймеров и размер амплификатов при ПЦР-анализе трансформантов

Для ПЦР использовали набор Taq (см. таблицу 1) с температурой на этапе отжига (этапе 3), установленной на 53°C, и продолжительностью этапа элонгации (этапа 4), установленной на 13 секунд. Определение размера амплификатов выполняли посредством капиллярного электрофореза.

Нуклеотидные последовательности используемых праймеров также показаны в перечне последовательностей под SEQ ID NO: 33 - SEQ ID NO: 37.

Трансформантов, полученных и проанализированных таким образом, использовали для дальнейшего исследования.

Пример 1.4

Разложение панозы

Трансформантов из примера 1.3 анализировали в отношении их способности разлагать панозу путем периодического культивирования с использованием системы BioLector®.

В качестве среды использовали CGXII_CSL, содержащую 15 г/л глюкозы и 4,8 г/л панозы в качестве источника углерода. Среда, кроме того, была дополнена канамицином и IPTG. Культуры инкубировали в течение приблизительно 20 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра, и определяли значения оптической плотности культур и концентрацию остаточной панозы.

Результат эксперимента представлен в таблице 8 и демонстрирует, что α-1,6-глюкозидазы Agl1 и Agl2, слитые с Tat-сигнальным пептидом Cg0955, т. e. Tat-Agl1 и Tat-'Agl2, были способны придавать C. glutamicum признак разложения панозы, при этом Tat-'Agl2 превосходил Tat-Agl1.

Таблица 8. Разложение панозы различными трансформантами DM1933, экспрессирующими различные α-1,6-глюкозидазы, слитые с сигнальным пептидом Cg0955

Пример 2

Идентификация подходящего сигнального пептида

Пример 2.1

Схема эксперимента

Tat-сигнальные пептиды для секреции различных секретируемых белков C. glutamicum тестировали в отношении их способности направлять секрецию α-1,6-глюкозидазы Agl2 в надосадочную жидкость культуры C. glutamicum.

Watanabe и соавт. (Microbiology 155, 741-750, 2009) оценивали эффективность различных Tat-сигнальных пептидов C. glutamicum R в отношении направления α-амилазы Geobacillus stearothermophilus, лишенной своего естественного сигнального пептида, в надосадочную жидкость культуры C. glutamicum R с помощью анализа диффузии на чашках с агаром. См. фигуру 3 на странице 745 у Watanabe и соавт.

В аналогичном подходе сигнальные пептиды полипептидов CgR0079, CgR0120, CgR0124, CgR0900, CgR0949, CgR1023, CgR1448, CgR2137, CgR2627 и CgR2926 оценивали в отношении их способности направлять α-1,6-глюкозидазу Agl2 B. breve UCC2003 в надосадочную жидкость культуры C. glutamicum путем измерения разложения панозы в надосадочной жидкости культуры. Соответственно, нуклеотидные последовательности, кодирующие сигнальные пептиды указанных полипептидов, сливали с геном agl2, оптимизированным по частоте использования кодонов для C. glutamicum ('agl2_cuo).

Нуклеотидные последовательности, кодирующие полипептиды, и аминокислотные последовательности полипептидов доступны в NCBI под номером доступа в GenBank NC_009342 (полный геном C. glutamicum R). В частности, их также можно идентифицировать по старым идентификаторам локусов cgR_0079, cgR_0120, cgR_0124, cgR_0900, cgR_0949, cgR_1023, cgR_1448, cgR_2137, cgR_2627 и cgR_2926. Кодирующая последовательность cgR0949 или, соответственно, cgR_0949 также показана под SEQ ID NO: 3 в перечне последовательностей.

Пример 2.2

Разработка и синтез слитых генов

В качестве исходной точки для конструирования различных слитых генов использовали плазмиду pVWEx1_tat-'agl2_cuo. Нуклеотидную последовательность, кодирующую Tat-сигнальный пептид Cg0955 (текущий идентификатор локуса NCgl0801), содержащуюся в плазмиде, заменяли нуклеотидной последовательностью, кодирующей сигнальный пептид CgR0079, CgR0120, CgR0124, CgR0900, CgR0949, CgR1023, CgR1448, CgR2137, CgR2627 или CgR2926.

Для этой цели плазмиду pVWEx1_tat-'agl2_cuo (см. фигуру 2) расщепляли рестрикционными эндонуклеазами SexAI и SpeI. Таким образом получали два фрагмента ДНК: один фрагмент ДНК длиной 109 п.о., кодирующий сигнальный пептид, и второй фрагмент ДНК длиной 10332 п.о., состоящий по сути из последовательностей ДНК pVWEx1 и 'agl2_cuo. Эти два фрагмента ДНК разделяли посредством электрофореза в агарозном геле. Фрагмент ДНК размером 109 п.о. отбрасывали, а фрагмент ДНК размером 10332 п.о. выделяли из агарозного геля и очищали.

Полинуклеотиды или, соответственно, молекулы ДНК, кодирующие различные сигнальные пептиды, содержащие предполагаемый сайт расщепления, описанные Watanabe и соавт., показаны под SEQ ID NO: 38-57.

За исключением полинуклеотида, кодирующего сигнальный пептид CgR0124, их конструировали и синтезировали с обеспечением возможности клонирования путем сборки по Гибсону. Для этой цели полинуклеотиды содержат на своих 5'-конце и 3'-конце последовательности длиной 25-45 п.о. и 24-54 п.о., которые перекрываются с соответствующими концами фрагмента ДНК размером 10332 п.о.

Для трансформации химически компетентных клеток E. coli Stellar™ использовали индивидуальные смеси Gibson Assembly из полинуклеотида, кодирующего сигнальный пептид CgR0079, CgR0120, CgR0900, CgR0949, CgR1023, CgR1448, CgR2137, CgR2627 и CgR2926, и указанного фрагмента ДНК pVWEx1_tat-'agl2_cuo размером 10332 п.о.

Разрабатывали и синтезировали полинуклеотид, кодирующий сигнальный пептид CgR0124 (см. SEQ ID NO: 42), для обеспечения возможности клонирования с использованием ДНК-лигазы. Для этой цели полинуклеотид содержит на своем 5'-конце сайт распознавания для SexAI, а на своем 3'-конце сайт распознавания для SpeI. Лигированную смесь, содержащую полинуклеотид, обработанный двумя рестрикционными эндонуклеазами, и указанный выделенный фрагмент ДНК pVWEx1_tat-'agl2_cuo размером 10332 п.о., использовали для трансформации химически компетентных клеток E. coli Stellar™.

Затем анализировали плазмидную ДНК произвольно выбранных трансформантов, полученных из различных смесей Gibson Assembly и лигированной смеси. Для этой цели трансформантов анализировали с помощью ПЦР колоний с использованием смеси Sapphire (см. таблицу 2) с праймером pVW_4 и праймером «Wtat», перечисленными в таблице 9, с последующим определением размеров амплификатов посредством капиллярного электрофореза. Праймеры также показаны под SEQ ID NO: 58 - SEQ ID NO: 68 в перечне последовательностей.

Таблица 9. Перечень используемых праймеров и размер амплификатов при ПЦР-анализе трансформантов

Таким образом, идентифицировали трансформантов, содержащих плазмиды, имеющие желаемую последовательность, кодирующую конкретный сигнальный пептид, связанный с полипептидом Agl2.

Несмотря на несколько попыток, не было получено трансформантов, несущих плазмиду, имеющую последовательность, кодирующую сигнальный пептид CgR0124.

Затем определяли нуклеотидные последовательности слитых генов, содержащихся в соответствующих плазмидах. Для этой цели плазмидную ДНК выделяли из трансформантов, и нуклеотидные последовательности отдельных слитых генов анализировали путем секвенирования по Сэнгеру.

Таким образом, идентифицировали плазмиды на основе pVWEx1, имеющие нуклеотидную последовательность, кодирующую сигнальный пептид CgR0079, CgR0120, CgR0900, CgR0949, CgR1023, CgR1448, CgR2137, CgR2627 и CgR2926, слитую с нуклеотидной последовательностью 'agl2_cuo.

Пример 2.3

Конструирование штамма

Штамм DM1933 C. glutamicum трансформировали описанными выше плазмидами путем электропорации. Трансформантов анализировали с помощью ПЦР колоний с использованием смеси Sapphire (см. таблицу 2) с праймерами из таблицы 9 и последующего анализа длины посредством капиллярного электрофореза.

Исходные культуры трансформантов в глицерине получали в присутствии канамицина и использовали в качестве исходного материала для дальнейших исследований.

Пример 2.4

Разложение панозы

Трансформантов, несущих различные слитые гены из примера 2.3, анализировали в отношении их способности разлагать панозу путем периодического культивирования с использованием системы для культивирования BioLector®.

В качестве среды использовали CGXII_CSL, содержащую 15 г/л глюкозы и 4,8 г/л панозы в качестве источника углерода. Среда, кроме того, была дополнена канамицином и IPTG.

Культуры инкубировали в течение приблизительно 20 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра. Затем определяли значения оптической плотности культур и концентрации остаточной панозы.

Результат эксперимента показан в таблице 10. Для удобства в таблицу были включены результаты Watanabe и соавт., касающиеся секреции α-амилазы.

Таблица 10. Разрушение панозы различными трансформантами DM1933, экспрессирующими различные сигнальные пептиды, слитые с α-1,6-глюкозидазой Agl2

¹ не тестировали

² Watanabe и соавт.

³не выявляемая

Наилучшего разложения панозы достигали с помощью штаммов, несущих слитые гены, кодирующие сигнальный пептид CgR2137 или Cg0955.

В дальнейшем штамм, экспрессирующий слитый полипептид, имеющий сигнальный пептид Cg0955, называется DM1933/pVWEx1_tat-'agl2_cuo (см. пример 1.3), а штамм, экспрессирующий слитый полипептид, имеющий сигнальный пептид CgR2137, называется DM1933/pVWEx1_cgR2137-'agl2_cuo.

Пример 2.5

Продуцирование L-лизина различными трансформантами штамма DM1933

Штаммы DM1933/pVWEx1, DM1933/pVWEx1_tat-'agl2_cuo и DM1933/pVWEx1_cgR2137-'agl2_cuo анализировали в отношении их способности продуцировать L-лизин из смеси глюкозы и панозы путем периодического культивирования с использованием системы BioLector®.

В качестве среды использовали CGXII_CSL, содержащую 15 г/л глюкозы и 4,8 г/л панозы в качестве источника углерода. Среда, кроме того, была дополнена канамицином и IPTG. Культуры инкубировали в течение приблизительно 20 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра, и определяли концентрации L-лизина, панозы и оптическую плотность OD660. Результат эксперимента представлен в таблице 11.

Таблица 11. Образование L-лизина при использовании смеси глюкозы и панозы в качестве источника углерода

¹ L-лизин в виде L-лизин x HCl

² не выявляемая

Эксперимент показал, что образование L-лизина было сильно сниженным у штамма DM1933/pVWEx1_cgR2137-'agl2_cuo. Соответственно, работу со слитым геном cgR2137-'agl2_cuo больше не проводили.

Эксперимент, кроме того, показал, что штамм DM1933/pVWEx1_tat-'agl2_cuo способен продуцировать L-лизин из панозы.

Пример 3

Эффект экспрессии слитого гена tat-'agl2_cuo в отношении роста и выхода L-лизина

Разрабатывали эксперименты для оценивания того, может ли экспрессия слитого гена tat-'agl2_cuo, содержащегося в pVWEx1_tat-'agl2_cuo, отрицательно влиять на скорость роста своего хозяина и на продуцирование L-лизина.

Пример 3.1

Эффект в отношении роста при использовании глюкозы в качестве источника углерода

Штаммы DM1933/pVWEx1 и DM1933/pVWEx1_tat-'agl2_cuo культивировали с использованием системы BioLector®, и образование биомассы регистрировали путем измерения рассеянного света (сигнала обратного рассеяния).

В качестве среды использовали CGXII_CSL, содержащую 20 г/л глюкозы в качестве источника углерода. Среда, кроме того, была дополнена канамицином и IPTG. В конце культивирования измеряли α-1,6-глюкозидазную ферментативную активность в надосадочной жидкости культуры.

Результат представлен на фигуре 4 и в таблице 12. Показано, что экспрессия слитого гена tat-agl2_cuo, содержащегося в единице экспрессии, содержащей промотор PtacI, которая содержится в штамме DM1933/pVWEx1_tat-'agl2_cuo, не оказывает неблагоприятного влияния на скорость роста своего штамма-хозяина.

Таблица 12. α-1,6-Глюкозидазная ферментативная активность в надосадочной жидкости культуры штаммов DM1933/pVWEx1 и DM1933/pVWEx1_tat-'agl2_cuo после роста на глюкозе

Пример 3.2

Эффект в отношении продуцирования L-лизина при использовании глюкозы в качестве источника углерода

Штаммы DM1933/pVWEx1 и DM1933/pVWEx1_tat-'agl2_cuo культивировали с использованием системы BioLector®, и в конце культивирования измеряли концентрацию образовавшегося L-лизина.

В качестве среды использовали CGXII_CSL, содержащую 20 г/л глюкозы в качестве источника углерода. Среда, кроме того, была дополнена канамицином и IPTG. Культуры инкубировали в течение приблизительно 20 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра, и измеряли концентрацию образовавшегося L-лизина и оптическую плотность OD660.

Результат представлен в таблице 13. Показано, что экспрессия слитого гена tat-'agl2_cuo, содержащегося в единице экспрессии, содержащей промотор PtacI, которая содержится в штамме DM1933/pVWEx1_tat-'agl2_cuo, не оказывает неблагоприятного влияния на выход продуцируемого L-лизина.

Таблица 13. Продуцирование L-лизина штаммами DM1933/pVWEx1 и DM1933/pVWEx1_tat-'agl2_cuo при использовании глюкозы в качестве источника углерода

¹ L-лизин в виде L-лизин x HCl

Пример 4

Продуцирование L-лизина при использовании трансформантов штамма DM2031

Продуцент L-лизина C. glutamicum DM2031 является потомком штамма DM1933, характеризующегося повышенной способностью продуцировать L-лизин. Он содержит дополнительную копию оперона lysC(T311I)asd, экспрессируемого под контролем промотора Pg3N3 (WO2013000827) и встроенного в межгенную область между NCgl0038 и NCgl0039. Кроме того, он содержит копию аллеля pyc(P458S), расположенного тандемно в сайте pyc(P458S), как описано в WO2003014330. Штамм был депонирован согласно Будапештскому договору в DSMZ под номером указания DSM32514.

Штамм DM2031 трансформировали плазмидами pVWEx1_tat-'agl2_cuo и pVWEx1. Штаммы DM2031/pVWEx1 и DM2031/pVWEx1_tat-'agl2_cuo, полученные таким образом, культивировали с использованием системы BioLector®, и в конце культивирования измеряли концентрацию образовавшегося L-лизина.

В качестве среды использовали CGXII_CSL, содержащую 8 г/л глюкозы либо 8 г/л глюкозы и 5,7 г/л панозы в качестве источника углерода. Среды, кроме того, были дополнены канамицином и IPTG. Культуры инкубировали в течение приблизительно 20 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра, и измеряли концентрацию образовавшегося L-лизина.

Таблица 14. Продуцирование L-лизина трансформантами штамма DM2031 при использовании глюкозы и смеси глюкозы и панозы в качестве источника углерода

¹ L-лизин в виде L-лизин x HCl

Результат представлен в таблице 14. Показано, что штамм DM2031/pVWEx1_tat-'agl2_cuo способен продуцировать L-лизин из панозы.

Пример 5

Хромосомная интеграция и экспрессия слитого гена tat-'agl2_cuo

Единицу экспрессии (см. SEQ ID NO: 16), содержащую промотор PdapBN1 (см. SEQ ID NO: 15), слитый ген tat-'agl2_cuo (см. SEQ ID NO: 9) и терминатор транскрипции Tgap* (см. SEQ ID NO: 13), разрабатывали, синтезировали и интегрировали в целевой сайт, который представляет собой межгенную область между локусами с идентификаторами NCgl2176 и NCgl2177 (см. SEQ ID NO: 18) в хромосоме продуцента L-лизина DM1933.

Для переноса единицы экспрессии в хромосому использовали плазмиду pK18mobsacB вместе со штаммом S17-1 E. coli, как описано у Schäfer и соавт. (Gene 145, 69 - 73, 1994). Нуклеотидная последовательность pK18mobsacB доступна в базе данных GenBank под номером доступа FJ437239.

Пример 5.1

Конструирование плазмиды pK18mobsacB_INT::PBN1-tat-'agl2_cuo

На первом этапе разрабатывали и синтезировали полинуклеотид или, соответственно, молекулу ДНК для предоставления фланкирующих последовательностей, необходимых для интеграции единицы экспрессии в целевой сайт в хромосоме хозяина C. glutamicum путем гомологичной рекомбинации. Полинуклеотид назвали INT.

Нуклеотидная последовательность полинуклеотида (молекулы ДНК) INT показана под SEQ ID NO: 69. Она содержит от своего 5'-конца до своего 3'-конца сайт распознавания для рестрикционной эндонуклеазы EcoRI, часть (3'-конец) гена, идентифицируемую по идентификатору локуса NCgl2176, межгенную область (IR) между локусами с идентификаторами NCgl2176 и NCgl2177, имеющую сайты распознавания для рестрикционных эндонуклеаз EcoRV (GATATC), AvrII (CCTAGG) и SmaI (CCCGGG), искусственно созданные путем обмена нуклеотидов, нуклеотидную последовательность гена, идентифицируемую по идентификатору локуса NCgl2177 (в комплементарной нити молекулы ДНК), последовательность, расположенную выше NCgl2177, и сайт распознавания для рестрикционной эндонуклеазы HindIII (AAGCTT).

Два сайта рестрикции для EcoRI и HindIII на 5'- и 3'-конце молекулы ДНК использовали для клонирования полинуклеотида в вектор pK18mobsacB, разрезанный рестрикционными эндонуклеазами EcoRI и HindIII.

В результате получали вектор pK18mobsacB, содержащий полинуклеотид INT. Эту плазмиду назвали pK18mobsacB_INT.

На втором этапе разрабатывали и синтезировали полинуклеотид, содержащий единицу экспрессии под названием PBN1-tat-'agl2_cuo. Он содержит промотор PdapBN1, слитый ген tat-'agl2_cuo и терминатор транскрипции Tgap*. Его нуклеотидная последовательность показана под SEQ ID NO: 70. Она содержит нуклеотидную последовательность SEQ ID NO: 16 и дополнительно содержит 20 нуклеотидов (GCGTCTAGAACTGATGAACA) на 5'-конце и 9 нуклеотидов (GGATCCGCG) на 3'-конце. Карта единицы экспрессии PBN1-tat-'agl2_cuo показана на фигуре 5.

На третьем этапе полинуклеотид PBN1-tat-'agl2_cuo обрабатывали рестрикционной эндонуклеазой XbaI и клонировали в вектор pK18mobsacB_INT, линеаризованный путем обработки рестрикционной эндонуклеазой AvrII. Химически компетентные клетки E. coli Stellar™ использовали в качестве хозяев для трансформации.

Плазмидную ДНК выделяли из трансформантов и обрабатывали рестрикционной эндонуклеазой HincII. Фрагменты ДНК разделяли посредством электрофореза в агарозном геле (0,8% вес/объем агарозы).

Плазмиды, содержащие единицу экспрессии PBN1-tat-'agl2_cuo в желаемой ориентации в межгенной области (IR) полинуклеотида INT, при этом желаемая ориентация представляет собой 5'-'NCgl2176-PBN1-tat-'agl2_cuo-NCgl2177-3', идентифицировали по картине расположения фрагментов ДНК, имеющих длину 3197 п.о., 2928 п.о., 2314 п.о. и 822 п.о. Одну из плазмид, идентифицированных таким образом, назвали pK18mobsacB_INT::PBN1-tat-'agl2_cuo. Целостность единицы INT::PBN1-tat-'agl2_cuo в плазмиде подтверждали путем определения ее нуклеотидной последовательности с помощью способа Сэнгера. Карта указанной единицы INT::PBN1-tat-'agl2_cuo показана на фигуре 6. В сущности она состоит из признаков 'NCgl2176, IR', единицы экспрессии PBN1-tat-'agl2_cuo, 'IR и NCgl2177. Сегмент с признаками 'NCgl2176 и IR' представляет собой 5'-фланкирующую последовательность, а сегмент с признаками 'IR и NCgl2177 представляет собой 3'-фланкирующую последовательность, необходимые для интеграции единицы экспрессии PBN1-tat-'agl2_cuo в хромосому. Карта плазмиды pK18mobsacB_INT::PBN1-tat-'agl2_cuo показана на фигуре 7.

Пример 5.2

Конструирование штамма DM1933_INT::PBN1-tat-'agl2_cuo

Плазмиду pK18mobsacB_INT::PBN1-tat-'agl2_cuo использовали для интеграции единицы экспрессии PBN1-tat-'agl2_cuo в хромосому продуцента L-лизина DM1933.

Для этой цели штамм S17-1 E. coli трансформировали плазмидной ДНК, полученной в примере 5.1. Модифицированный способ конъюгации по Schäfer и соавт. (Journal of Bacteriology 172, 1663 - 1666, 1990), описанный в разделе «Материалы и способы», использовали для конъюгационного переноса в штамм DM1933 и отбора клонов трансконъюгантов на основании их фенотипа устойчивости к сахарозе и чувствительности к канамицину.

Клоны трансконъюгантов анализировали с помощью ПЦР колоний с использованием набора Taq с праймерами IR_1 и IR_2, перечисленными в таблице 15, с последующим определением размеров амплификатов посредством капиллярного электрофореза. Праймеры также показаны под SEQ ID NO: 71 и SEQ ID NO: 72 в перечне последовательностей. Для ПЦР использовали набор Taq (см. таблицу 1) с температурой на этапе отжига (этапе 3), установленной на 55°C, и продолжительностью этапа элонгации (этапа 4), установленной на 40 секунд.

Таблица 15. Перечень используемых праймеров и размер амплификата при ПЦР-анализе клонов трансконъюгантов

Нуклеотидные последовательности продуктов ПЦР клонов трансконъюгантов, имеющих надлежащий размер, дополнительно анализировали путем секвенирования по Сэнгеру.

Одного из клонов трансконъюгантов, охарактеризованных таким образом, назвали DM1933_INT::PBN1-tat-'agl2_cuo. Исходную культуру клона трансконъюганта в глицерине получали и использовали в качестве исходного материала для дальнейших исследований.

Пример 5.3

Продуцирование L-лизина штаммом DM1933_INT::PBN1-tat-'agl2_cuo при использовании глюкозы и смеси глюкозы и панозы в качестве источника углерода

Штаммы DM1933_INT::PBN1-tat-'agl2_cuo и DM1933 в качестве контроля анализировали в отношении их способности продуцировать L-лизин из глюкозы или из смеси глюкозы и панозы путем периодического культивирования с использованием системы BioLector®.

В качестве среды использовали CGXII_CSL, содержащую 20 г/л глюкозы, либо 15 г/л глюкозы, либо смесь 15 г/л глюкозы и 4,8 г/л панозы. Культуры инкубировали в течение приблизительно 20 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра. Затем измеряли значения оптической плотности OD660 и концентрации L-лизина и панозы.

Результат эксперимента представлен в таблице 16. Показано, что присутствие единицы экспрессии PBN1-tat-'agl2_cuo в штамме DM1933_INT::PBN1-tat-'agl2_cuo не оказывает отрицательного эффекта на выход L-лизина на глюкозе. Кроме того, показано, что штамм DM1933_INT::PBN1-tat-'agl2_cuo способен продуцировать L-лизин из панозы.

Таблица 16. Продуцирование L-лизина штаммом DM1933_INT::PBN1-tat'-agl2_cuo

^*INT::PBN1-tat-'agl2_cuo

¹ L-лизин в виде L-лизин x HCl

² не анализировали

Пример 6

Продуцирование L-лизина штаммом DM1933_INT::PBN1-tat-'agl2_cuo при использовании гидролизата крахмала в качестве источника углерода

Штаммы DM1933 и DM1933_INT::PBN1-tat-'agl2_cuo культивировали в среде CGXII_CSL с использованием гидролизата крахмала в качестве источника углерода (77,3 мл гидролизата крахмала Clear Sweet®/л). Среда, полученная таким образом, содержала 60 г/л глюкозы, 0,4 г/л панозы и 1,2 г/л изомальтозы.

Культивирование выполняли в 2-литровых колбах Эрленмейера, как описано в разделе «Материалы и способы». Образцы отбирали из культур в различные моменты времени, и измеряли значения оптической плотности OD660 и концентрации L-лизина, изомальтозы, панозы и глюкозы. Результат эксперимента кратко изложен в таблице 17. Показано, что штамм DM1933_INT::PBN1-tat-'agl2_cuo способен потреблять изомальтозу и панозу, содержащиеся в гидролизате крахмала.

Таблица 17. Продуцирование L-лизина при использовании гидролизата крахмала в качестве источника углерода

^* INT::PBN1-tat-'agl2_cuo ² в виде L-лизин x HCl

¹ не анализировали ³ не выявляемая

Пример 7

Определение аминокислотной последовательности секретируемого слитого белка на основе α-1,6-глюкозидазы

Штамм DM1933_INT::PBN1-tat-'agl2_cuo культивировали, и надосадочную жидкость культуры собирали, фильтровали и концентрировали, как подробно описано в разделе «Материалы и способы». Затем концентрированную надосадочную жидкость анализировали с помощью жидкостной хроматографии в сочетании с масс-спектрометрией (LC-MS).

В надосадочной жидкости культуры было обнаружено два вида полипептидов. Один, имеющий общую формулу C3031 H4582 N844 O958 S18, соответствует аминокислотной последовательности SEQ ID NO: 10 в положениях 31-639. Другой, имеющий общую формулу C3004 H4535 N837 O948 S17, соответствует аминокислотной последовательности SEQ ID NO: 10 в положениях 38-639. Оба полипептида были обнаружены в отношении приблизительно 1:1.

Пример 8

Продуцирование L-валина

Исследовали продуцирование L-валина из панозы с использованием слитого гена tat-'agl2_cuo.

Пример 8.1

Конструирование продуцента L-валина, содержащего слитый ген tat-'agl2_cuo

Штамм ATCC14067_PprpD2-ilvBN является продуцентом L-валина, принадлежащим к виду C. glutamicum. Конструирование штамма, начиная со штамма ATCC14067, описано в EP2811028 A1.

Штамм ATCC14067_PprpD2-ilvBN трансформировали выделенной плазмидной ДНК pVWEx1 и pVWEx1_tat-'agl2_cuo путем электропорации. Отбор трансформантов, размножение трансформантов и получение исходных культур в глицерине выполняли согласно описанному в разделе «Материалы и способы» и в присутствии канамицина.

Конкретные нуклеотидные последовательности трансформантов амплифицировали с помощью ПЦР колоний для проверки плазмидного статуса трансформантов. Используемые праймеры и размер ПЦР-амплификатов кратко изложены в таблице 18.

Таблица 18. Перечень используемых праймеров и размер амплификатов при ПЦР-анализе трансформантов

Для ПЦР использовали смесь Sapphire (см. таблицу 2) с температурой на этапе отжига (этапе 3), установленной на 53°C, и продолжительностью этапа элонгации (этапа 4), установленной на 10 секунд. Определение размера амплификатов выполняли посредством капиллярного электрофореза.

Нуклеотидные последовательности используемых праймеров также показаны в перечне последовательностей под SEQ ID NO: 33 - SEQ ID NO: 36.

Трансформантов ATCC14067_PprpD2-ilvBN/pVWEx1 и ATCC14067_PprpD2-ilvBN/pVWEx1_tat-'agl2_cuo, полученных и проанализированных таким образом, использовали для дальнейшего исследования.

Пример 8.2

Продуцирование L-валина штаммом ATCC14067_PprpD2-ilvBN/pVWEx1_tat-'agl2_cuo при использовании глюкозы и смеси глюкозы и панозы в качестве источника углерода

Штаммы ATCC14067_PprpD2-ilvBN/pVWEx1_tat-'agl2_cuo и ATCC14067_PprpD2-ilvBN/pVWEx1 в качестве контроля анализировали в отношении их способности продуцировать L-валин из глюкозы или из смеси глюкозы и панозы путем периодического культивирования с использованием системы BioLector®.

В качестве среды использовали CGXII_YE, содержащую 15 г/л глюкозы либо смесь 15 г/л глюкозы и 4,8 г/л панозы. Среды, кроме того, были дополнены канамицином, IPTG и гемикальциевой солью пропионовой кислоты (0,75 г/л). Культуры инкубировали в течение приблизительно 25 часов до полного потребления глюкозы, что подтверждалось в анализе уровня глюкозы с использованием глюкометра. Затем измеряли значения оптической плотности OD660 и концентрации L-валина и панозы.

Результат эксперимента представлен в таблице 19. Показано, что присутствие слитого гена tat-'agl2, содержащегося в единице экспрессии, содержащей промотор PtacI, которая содержится в штамме ATCC14067_PprpD2-ilvBN/pVWEx1_tat-'agl2_cuo, позволяет штамму продуцировать L-валин из панозы.

Таблица 19. Продуцирование L-валина штаммом ATCC14067_PprpD2-ilvBN/pVWEx1_tat-'agl2_cuo

^* ATCC14067_PprpD2-ilvBN

¹ L-валин

² не анализировали

³ не выявляемая

ПЕРЕЧЕНЬ СОКРАЩЕНИЙ

'agl2_cuo оптимизированная по частоте использования кодонов кодирующая последовательность гена agl2 Bifidobacterium breve UCC2003, не имеющая стартового кодона ATG

'IR 3'-концевая последовательность межгенной области (IR) между генами, идентифицируемыми по идентификаторам локусов Ncgl2177 и Ncgl2176

'Ncgl2176 3'-концевая последовательность кодирующей последовательности, идентифицируемая по идентификатору локуса Ncgl2176

(AvrII/XbaI) гибридная последовательность, полученная после лигирования «липких» концов, созданных с помощью рестрикционных эндонуклеаз AvrII и XbaI

agl2_cuo оптимизированная по частоте использования кодонов кодирующая последовательность гена agl2 Bifidobacterium breve UCC2003

BamHI последовательность, распознаваемая рестрикционной эндонуклеазой BamHI

EcoRI последовательность, распознаваемая рестрикционной эндонуклеазой EcoRI

FspAI последовательность, распознаваемая рестрикционной эндонуклеазой FspAI

ч. часы

HincII последовательность, распознаваемая рестрикционной эндонуклеазой HincII

HindIII последовательность, распознаваемая рестрикционной эндонуклеазой HindIII

IR' 5'-концевая последовательность межгенной области (IR) между генами, идентифицируемыми по идентификаторам локусов Ncgl2177 и Ncgl2176

lacI ген, кодирующий репрессор LacI

lacZ-альфа 5'-концевая последовательность гена lacZ, кодирующего α-пептид β-галактозидазы

MauBI последовательность, распознаваемая рестрикционной эндонуклеазой MauBI

MCS сайт множественного клонирования

Ncgl2177 кодирующая последовательность, идентифицируемая по идентификатору локуса Ncgl2177

neo ген, кодирующий аминогликозид-3'-фосфотрансферазу

nptII ген, кодирующий неомицинфосфотрансферазу

ori p15A точка начала репликации плазмиды p15A E. coli

ori pCG1 точка начала репликации плазмиды pCG1 C. glutamicum

ori pMB1 точка начала репликации плазмиды pMBI E. coli

PBN1 последовательность промотора PdapBN1

PtacI последовательность промотора PtacI

PstI последовательность, распознаваемая рестрикционной эндонуклеазой PstI

RP4-mob последовательность области mob плазмиды RP4

sacB ген, кодирующий левансахаразу

SexAI последовательность, распознаваемая рестрикционной эндонуклеазой SexAI

SpeI последовательность, распознаваемая рестрикционной эндонуклеазой SpeI

tat 5'-конец кодирующей последовательности cg0955 C. glutamicum ATCC13032, кодирующей Tat-сигнальный пептид (диаргининовый транслокатор)

tat-'agl2_cuo последовательность слитого гена, кодирующая слитый полипептид Tat-'Agl2

Tgap* последовательность терминатора Tgap*

XbaI последовательность, распознаваемая рестрикционной эндонуклеазой XbaI

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Эвоник Дегусса ГмбХ

<120> Способ получения химических продуктов тонкого синтеза

с помощью Corynebacterium, секретирующей модифицированные

альфа-1,6-глюкозидазы

<130> 201700156

<160> 72

<170> PatentIn, версия 3.5

<210> 1

<211> 843

<212> ДНК

<213> Corynebacterium glutamicum ATCC13032

<220>

<221> CDS

<222> (1)..(840)

<223> cg0955

<220>

<221> прочая_сигнальная_последовательность

<222> (1)..(99)

<223> 5'-концевая последовательность cg0955, кодирующая

Tat-сигнальный пептид Cg0955

<220>

<221> прочий_признак

<222> (1)..(101)

<223> 5'-концевая последовательность cg0955

<220>

<221> прочий_признак

<222> (102)..(102)

<223> нуклеотидное основание цитозин

<220>

<221> прочий_признак

<222> (841)..(843)

<223> стоп-кодон

<400> 1

atg caa ata aac cgc cga ggc ttc tta aaa gcc acc aca gga ctt gcc 48

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

act atc ggc gct gcc agc atg ttt atg cca aag gcc aac gcc ctt gga 96

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

gca atc aag ggc acc gtc atc gac tac gca gca ggc gtc ccc agc gca 144

Ala Ile Lys Gly Thr Val Ile Asp Tyr Ala Ala Gly Val Pro Ser Ala

35 40 45

gca tcc att aaa aat gca ggg cac ctt gga gct gtc cgt tac gtg tca 192

Ala Ser Ile Lys Asn Ala Gly His Leu Gly Ala Val Arg Tyr Val Ser

50 55 60

cag cga cgc ccc ggc act gaa tcc tgg atg atc ggc aag cca gtc aca 240

Gln Arg Arg Pro Gly Thr Glu Ser Trp Met Ile Gly Lys Pro Val Thr

65 70 75 80

ctg gca gaa acc cga gct ttt gaa caa aac ggc ctc aaa acc gca tcc 288

Leu Ala Glu Thr Arg Ala Phe Glu Gln Asn Gly Leu Lys Thr Ala Ser

85 90 95

gtc tat caa tac gga aag gca gag acc gcc gat tgg aag aac ggc gcc 336

Val Tyr Gln Tyr Gly Lys Ala Glu Thr Ala Asp Trp Lys Asn Gly Ala

100 105 110

gca gga gcg gca acc cac gct cca cag gca att gcg ctt cac gtg gca 384

Ala Gly Ala Ala Thr His Ala Pro Gln Ala Ile Ala Leu His Val Ala

115 120 125

gct ggt ggc cct aaa aat cgc ccc atc tac gtg gcg atc gac gac aac 432

Ala Gly Gly Pro Lys Asn Arg Pro Ile Tyr Val Ala Ile Asp Asp Asn

130 135 140

cca agc tgg tct gaa tac acc aat cag att cgc ccc tac ctc cag gca 480

Pro Ser Trp Ser Glu Tyr Thr Asn Gln Ile Arg Pro Tyr Leu Gln Ala

145 150 155 160

ttc aat gtt gcg ctg tcc gct gcc ggc tac cag tta ggt gtc tac ggc 528

Phe Asn Val Ala Leu Ser Ala Ala Gly Tyr Gln Leu Gly Val Tyr Gly

165 170 175

aac tac aac gtc att aat tgg gct atc gcc gac ggc ctt gga gaa ttc 576

Asn Tyr Asn Val Ile Asn Trp Ala Ile Ala Asp Gly Leu Gly Glu Phe

180 185 190

ttc tgg atg cac aac tgg gga tca gaa gga aag atc cac cca cgc acc 624

Phe Trp Met His Asn Trp Gly Ser Glu Gly Lys Ile His Pro Arg Thr

195 200 205

acc atc cac cag atc cgc att gat aag gac acc ctc gac gga gtc ggc 672

Thr Ile His Gln Ile Arg Ile Asp Lys Asp Thr Leu Asp Gly Val Gly

210 215 220

atc gac atg aac aat gtc tat gca gac gac tgg ggt cag tgg acc cca 720

Ile Asp Met Asn Asn Val Tyr Ala Asp Asp Trp Gly Gln Trp Thr Pro

225 230 235 240

ggc aac gcg gtt gac gat gcc atc ccc acc att cct gga aac tcc aac 768

Gly Asn Ala Val Asp Asp Ala Ile Pro Thr Ile Pro Gly Asn Ser Asn

245 250 255

acg gga aca ggt act gga att gat gct gac acc atc aac caa gta atc 816

Thr Gly Thr Gly Thr Gly Ile Asp Ala Asp Thr Ile Asn Gln Val Ile

260 265 270

aag att ctt ggc acc cta tct agc taa 843

Lys Ile Leu Gly Thr Leu Ser Ser

275 280

<210> 2

<211> 280

<212> БЕЛОК

<213> Corynebacterium glutamicum ATCC13032

<400> 2

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

Ala Ile Lys Gly Thr Val Ile Asp Tyr Ala Ala Gly Val Pro Ser Ala

35 40 45

Ala Ser Ile Lys Asn Ala Gly His Leu Gly Ala Val Arg Tyr Val Ser

50 55 60

Gln Arg Arg Pro Gly Thr Glu Ser Trp Met Ile Gly Lys Pro Val Thr

65 70 75 80

Leu Ala Glu Thr Arg Ala Phe Glu Gln Asn Gly Leu Lys Thr Ala Ser

85 90 95

Val Tyr Gln Tyr Gly Lys Ala Glu Thr Ala Asp Trp Lys Asn Gly Ala

100 105 110

Ala Gly Ala Ala Thr His Ala Pro Gln Ala Ile Ala Leu His Val Ala

115 120 125

Ala Gly Gly Pro Lys Asn Arg Pro Ile Tyr Val Ala Ile Asp Asp Asn

130 135 140

Pro Ser Trp Ser Glu Tyr Thr Asn Gln Ile Arg Pro Tyr Leu Gln Ala

145 150 155 160

Phe Asn Val Ala Leu Ser Ala Ala Gly Tyr Gln Leu Gly Val Tyr Gly

165 170 175

Asn Tyr Asn Val Ile Asn Trp Ala Ile Ala Asp Gly Leu Gly Glu Phe

180 185 190

Phe Trp Met His Asn Trp Gly Ser Glu Gly Lys Ile His Pro Arg Thr

195 200 205

Thr Ile His Gln Ile Arg Ile Asp Lys Asp Thr Leu Asp Gly Val Gly

210 215 220

Ile Asp Met Asn Asn Val Tyr Ala Asp Asp Trp Gly Gln Trp Thr Pro

225 230 235 240

Gly Asn Ala Val Asp Asp Ala Ile Pro Thr Ile Pro Gly Asn Ser Asn

245 250 255

Thr Gly Thr Gly Thr Gly Ile Asp Ala Asp Thr Ile Asn Gln Val Ile

260 265 270

Lys Ile Leu Gly Thr Leu Ser Ser

275 280

<210> 3

<211> 843

<212> ДНК

<213> Corynebacterium glutamicum R

<220>

<221> CDS

<222> (1)..(840)

<223> cgR0949

<220>

<221> прочая_сигнальная_последовательность

<222> (1)..(99)

<223> 5'-концевая последовательность cgR0949, кодирующая

Tat-сигнальный пептид CgR0949

<220>

<221> прочий_признак

<222> (1)..(101)

<223> 5'-концевая последовательность cgR0949

<220>

<221> прочий_признак

<222> (102)..(102)

<223> нуклеотидное основание цитозин

<220>

<221> прочий_признак

<222> (841)..(843)

<223> стоп-кодон

<400> 3

atg caa ata aac cgc cga ggc ttc tta aaa gcc acc gca gga ctt gcc 48

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Ala Gly Leu Ala

1 5 10 15

act atc ggc gct gcc agc atg ttt atg cca aag gcc aac gcc ctt gga 96

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

gca atc aag ggc acc gtc atc gac tac gca gca ggc gtc ccc agc gca 144

Ala Ile Lys Gly Thr Val Ile Asp Tyr Ala Ala Gly Val Pro Ser Ala

35 40 45

gca tcc att aaa aat gca ggg cac ctt gga gct gtc cgt tac gtg tca 192

Ala Ser Ile Lys Asn Ala Gly His Leu Gly Ala Val Arg Tyr Val Ser

50 55 60

cag cga cgc ccc ggc act gaa tcc tgg atg atc ggc aag cca gtc aca 240

Gln Arg Arg Pro Gly Thr Glu Ser Trp Met Ile Gly Lys Pro Val Thr

65 70 75 80

ctg gca gaa acc cga tct ttt gaa caa aac ggc ctc aaa acc gca tcc 288

Leu Ala Glu Thr Arg Ser Phe Glu Gln Asn Gly Leu Lys Thr Ala Ser

85 90 95

gtt tat caa tac gga aag gca gag acc gcc gat tgg aag aac ggc gcc 336

Val Tyr Gln Tyr Gly Lys Ala Glu Thr Ala Asp Trp Lys Asn Gly Ala

100 105 110

gca gga gcg gca acc cac gct cca cag gca att gcg ctt cac gtg gca 384

Ala Gly Ala Ala Thr His Ala Pro Gln Ala Ile Ala Leu His Val Ala

115 120 125

gct ggt ggc cct aaa aat cgc ccc atc tac gtg gcg atc gac gac aac 432

Ala Gly Gly Pro Lys Asn Arg Pro Ile Tyr Val Ala Ile Asp Asp Asn

130 135 140

cca agc tgg tct gaa tac acc aat cag att cgc cct tac ctc cag gca 480

Pro Ser Trp Ser Glu Tyr Thr Asn Gln Ile Arg Pro Tyr Leu Gln Ala

145 150 155 160

ttc aat gtt gcg ctg tcc gct gcc ggc tac cag tta ggt gtg tac ggc 528

Phe Asn Val Ala Leu Ser Ala Ala Gly Tyr Gln Leu Gly Val Tyr Gly

165 170 175

aac tac aac gtc att gat tgg gct atc gcc gac ggc ctt gga gaa ttc 576

Asn Tyr Asn Val Ile Asp Trp Ala Ile Ala Asp Gly Leu Gly Glu Phe

180 185 190

ttc tgg atg cac aac tgg gga tca gaa gga aag atc cac cca cgc acc 624

Phe Trp Met His Asn Trp Gly Ser Glu Gly Lys Ile His Pro Arg Thr

195 200 205

acc atc cac cag atc cgc att gat aaa gac aac ctc gag ggt gtt ggc 672

Thr Ile His Gln Ile Arg Ile Asp Lys Asp Asn Leu Glu Gly Val Gly

210 215 220

att gac atg aac aat gtc tat gca gac gac tgg ggc cag tgg acc cca 720

Ile Asp Met Asn Asn Val Tyr Ala Asp Asp Trp Gly Gln Trp Thr Pro

225 230 235 240

gac aat gcg gtt gac gat gtc ttc ccc acc att ccc gga aac tcc aac 768

Asp Asn Ala Val Asp Asp Val Phe Pro Thr Ile Pro Gly Asn Ser Asn

245 250 255

acg gga aca ggt act gga att gat gct gac acc atc aac caa gta atc 816

Thr Gly Thr Gly Thr Gly Ile Asp Ala Asp Thr Ile Asn Gln Val Ile

260 265 270

aag att ctt ggc acc ctg tct agc taa 843

Lys Ile Leu Gly Thr Leu Ser Ser

275 280

<210> 4

<211> 280

<212> БЕЛОК

<213> Corynebacterium glutamicum R

<400> 4

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Ala Gly Leu Ala

1 5 10 15

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

Ala Ile Lys Gly Thr Val Ile Asp Tyr Ala Ala Gly Val Pro Ser Ala

35 40 45

Ala Ser Ile Lys Asn Ala Gly His Leu Gly Ala Val Arg Tyr Val Ser

50 55 60

Gln Arg Arg Pro Gly Thr Glu Ser Trp Met Ile Gly Lys Pro Val Thr

65 70 75 80

Leu Ala Glu Thr Arg Ser Phe Glu Gln Asn Gly Leu Lys Thr Ala Ser

85 90 95

Val Tyr Gln Tyr Gly Lys Ala Glu Thr Ala Asp Trp Lys Asn Gly Ala

100 105 110

Ala Gly Ala Ala Thr His Ala Pro Gln Ala Ile Ala Leu His Val Ala

115 120 125

Ala Gly Gly Pro Lys Asn Arg Pro Ile Tyr Val Ala Ile Asp Asp Asn

130 135 140

Pro Ser Trp Ser Glu Tyr Thr Asn Gln Ile Arg Pro Tyr Leu Gln Ala

145 150 155 160

Phe Asn Val Ala Leu Ser Ala Ala Gly Tyr Gln Leu Gly Val Tyr Gly

165 170 175

Asn Tyr Asn Val Ile Asp Trp Ala Ile Ala Asp Gly Leu Gly Glu Phe

180 185 190

Phe Trp Met His Asn Trp Gly Ser Glu Gly Lys Ile His Pro Arg Thr

195 200 205

Thr Ile His Gln Ile Arg Ile Asp Lys Asp Asn Leu Glu Gly Val Gly

210 215 220

Ile Asp Met Asn Asn Val Tyr Ala Asp Asp Trp Gly Gln Trp Thr Pro

225 230 235 240

Asp Asn Ala Val Asp Asp Val Phe Pro Thr Ile Pro Gly Asn Ser Asn

245 250 255

Thr Gly Thr Gly Thr Gly Ile Asp Ala Asp Thr Ile Asn Gln Val Ile

260 265 270

Lys Ile Leu Gly Thr Leu Ser Ser

275 280

<210> 5

<211> 1815

<212> ДНК

<213> Bifidobacterium breve UCC2003

<220>

<221> CDS

<222> (1)..(1812)

<223> agl2

<220>

<221> прочий_признак

<222> (4)..(1812)

<223> 'agl2

<220>

<221> прочий_признак

<222> (1813)..(1815)

<223> стоп-кодон

<400> 5

atg acc tct ttc aac cgt gaa ccc ctg ccc gac gcc gtc cgc acg aat 48

Met Thr Ser Phe Asn Arg Glu Pro Leu Pro Asp Ala Val Arg Thr Asn

1 5 10 15

ggc gcc acg ccc aac ccg tgg tgg tcg aat gcg gtg gtg tac cag atc 96

Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val Tyr Gln Ile

20 25 30

tac ccg cgg tcg ttc cag gac acg aac ggc gac ggt ctc ggc gac ctg 144

Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Leu Gly Asp Leu

35 40 45

aag ggc atc acc tcc cgc ctc gac tat ctc gcc gac ctc ggc gtg gat 192

Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu Gly Val Asp

50 55 60

gtg ctc tgg ctc tcc ccg gtc tac agg tcc ccg caa gac gac aac ggc 240

Val Leu Trp Leu Ser Pro Val Tyr Arg Ser Pro Gln Asp Asp Asn Gly

65 70 75 80

tac gac atc tcc gac tac cgg gat atc gac ccg ctg ttc ggc acg ctc 288

Tyr Asp Ile Ser Asp Tyr Arg Asp Ile Asp Pro Leu Phe Gly Thr Leu

85 90 95

gac gac atg gac gag ctg ctc gcc gaa gcg cac aag cgc ggc ctc aag 336

Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg Gly Leu Lys

100 105 110

atc gtg atg gac ctg gtg gtc aac cac acc tcc gac gag cac gcg tgg 384

Ile Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu His Ala Trp

115 120 125

ttc gag gcg tcg aag gac aag gac gac ccg cac gcc gac tgg tac tgg 432

Phe Glu Ala Ser Lys Asp Lys Asp Asp Pro His Ala Asp Trp Tyr Trp

130 135 140

tgg cgt ccc gcc cgc ccc ggc cac gag ccg ggc acg ccc ggc gcc gag 480

Trp Arg Pro Ala Arg Pro Gly His Glu Pro Gly Thr Pro Gly Ala Glu

145 150 155 160

ccg aat cag tgg ggc tcc tac ttc ggc ggt tcc gca tgg gag tac agc 528

Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp Glu Tyr Ser

165 170 175

ccg gag cgc ggc gag tac tac ctg cac cag ttc tcg aag aag cag cct 576

Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys Lys Gln Pro

180 185 190

gat ctc aac tgg gag aac ccg gcc gtg cgc cgc gcg gtg tac gac atg 624

Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val Tyr Asp Met

195 200 205

atg aac tgg tgg ctc gat cgc ggc atc gac ggc ttc cgt atg gat gtc 672

Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg Met Asp Val

210 215 220

atc acc ctg atc tcc aag cgc acc gac ccc aac ggc agg ctc ccc ggc 720

Ile Thr Leu Ile Ser Lys Arg Thr Asp Pro Asn Gly Arg Leu Pro Gly

225 230 235 240

gag acc ggt tcc gag ctc cag gac ctg ccg gtg ggg gag gag ggc tac 768

Glu Thr Gly Ser Glu Leu Gln Asp Leu Pro Val Gly Glu Glu Gly Tyr

245 250 255

tcc agc ccg aac ccg ttc tgc gcc gac ggt ccg cgt cag gac gag ttc 816

Ser Ser Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln Asp Glu Phe

260 265 270

ctc gcc gag atg cgc cgc gag gtg ttc gac ggg cgt gac ggc ttc ctc 864

Leu Ala Glu Met Arg Arg Glu Val Phe Asp Gly Arg Asp Gly Phe Leu

275 280 285

acc gtc ggc gag gca ccc ggc atc acc gcc gaa cgc aac gag cac atc 912

Thr Val Gly Glu Ala Pro Gly Ile Thr Ala Glu Arg Asn Glu His Ile

290 295 300

acc gac ccc gcc aac ggc gaa ctc gac atg ctc ttc ctg ttc gaa cac 960

Thr Asp Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu Phe Glu His

305 310 315 320

atg ggc gtc gac caa acc ccc gaa tcg aaa tgg gac gac aaa cca tgg 1008

Met Gly Val Asp Gln Thr Pro Glu Ser Lys Trp Asp Asp Lys Pro Trp

325 330 335

acg ccg gcc gac ctc gaa acc aag ctt gcc gaa caa cag gac gcc atc 1056

Thr Pro Ala Asp Leu Glu Thr Lys Leu Ala Glu Gln Gln Asp Ala Ile

340 345 350

gcc cga cgc ggc tgg gcc agc ctg ttc ctc gac aac cac gac cag ccg 1104

Ala Arg Arg Gly Trp Ala Ser Leu Phe Leu Asp Asn His Asp Gln Pro

355 360 365

cgt gtc gtc tcc cgt tgg ggc gac gac acc agc aag acc ggc cgc atc 1152

Arg Val Val Ser Arg Trp Gly Asp Asp Thr Ser Lys Thr Gly Arg Ile

370 375 380

cgc tcc gcc aag gcg ctc gcg ctg ctg ctg cac atg cac cgc ggc acc 1200

Arg Ser Ala Lys Ala Leu Ala Leu Leu Leu His Met His Arg Gly Thr

385 390 395 400

ccg tac gtc tac cag ggc gag gag ctc ggc atg acc aat gcg cac ttc 1248

Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn Ala His Phe

405 410 415

acc tcg ctc gac cag tac cgc gac ctc gaa tcc atc aac gcc tac cat 1296

Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Ile Asn Ala Tyr His

420 425 430

caa cgc gtc gag gaa acc ggg ata cgg aca tcg gag acc atg atg cga 1344

Gln Arg Val Glu Glu Thr Gly Ile Arg Thr Ser Glu Thr Met Met Arg

435 440 445

tcc ctc gcc cga tac ggc agg gac aac gcg cgc acc ccg atg caa tgg 1392

Ser Leu Ala Arg Tyr Gly Arg Asp Asn Ala Arg Thr Pro Met Gln Trp

450 455 460

gac gac tcc acc tac gcc ggc ttc acc atg ccc gac gcc ccg gtc gaa 1440

Asp Asp Ser Thr Tyr Ala Gly Phe Thr Met Pro Asp Ala Pro Val Glu

465 470 475 480

ccc tgg atc gcc gtc aac ccg aac cac acg gag atc aac gcc gcc gac 1488

Pro Trp Ile Ala Val Asn Pro Asn His Thr Glu Ile Asn Ala Ala Asp

485 490 495

gag acc gac gac ccc gac tcc gtg tac tcg ttc cac aaa cgg ctc atc 1536

Glu Thr Asp Asp Pro Asp Ser Val Tyr Ser Phe His Lys Arg Leu Ile

500 505 510

gcc ctg cgc cac acc gac ccc gtg gtc gcc gcc ggc gac tac cga cgc 1584

Ala Leu Arg His Thr Asp Pro Val Val Ala Ala Gly Asp Tyr Arg Arg

515 520 525

gtg gaa acc gga aac gac cgg atc atc gcc ttc acc aga acc ctc gac 1632

Val Glu Thr Gly Asn Asp Arg Ile Ile Ala Phe Thr Arg Thr Leu Asp

530 535 540

gag cga acc atc ctc acc gtc atc aac ctc tcg ccc aca cag gcc gca 1680

Glu Arg Thr Ile Leu Thr Val Ile Asn Leu Ser Pro Thr Gln Ala Ala

545 550 555 560

ccg gcc gga gaa ctg gaa acg atg ccc gac ggc acg atc ctc atc gcc 1728

Pro Ala Gly Glu Leu Glu Thr Met Pro Asp Gly Thr Ile Leu Ile Ala

565 570 575

aac acg gac gat ccc gta gga aac ctg aaa acc acg gga aca ctc gga 1776

Asn Thr Asp Asp Pro Val Gly Asn Leu Lys Thr Thr Gly Thr Leu Gly

580 585 590

cca tgg gag gcg ttc gcc atg gaa acc gat ccg gaa taa 1815

Pro Trp Glu Ala Phe Ala Met Glu Thr Asp Pro Glu

595 600

<210> 6

<211> 604

<212> БЕЛОК

<213> Bifidobacterium breve UCC2003

<400> 6

Met Thr Ser Phe Asn Arg Glu Pro Leu Pro Asp Ala Val Arg Thr Asn

1 5 10 15

Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val Tyr Gln Ile

20 25 30

Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Leu Gly Asp Leu

35 40 45

Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu Gly Val Asp

50 55 60

Val Leu Trp Leu Ser Pro Val Tyr Arg Ser Pro Gln Asp Asp Asn Gly

65 70 75 80

Tyr Asp Ile Ser Asp Tyr Arg Asp Ile Asp Pro Leu Phe Gly Thr Leu

85 90 95

Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg Gly Leu Lys

100 105 110

Ile Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu His Ala Trp

115 120 125

Phe Glu Ala Ser Lys Asp Lys Asp Asp Pro His Ala Asp Trp Tyr Trp

130 135 140

Trp Arg Pro Ala Arg Pro Gly His Glu Pro Gly Thr Pro Gly Ala Glu

145 150 155 160

Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp Glu Tyr Ser

165 170 175

Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys Lys Gln Pro

180 185 190

Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val Tyr Asp Met

195 200 205

Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg Met Asp Val

210 215 220

Ile Thr Leu Ile Ser Lys Arg Thr Asp Pro Asn Gly Arg Leu Pro Gly

225 230 235 240

Glu Thr Gly Ser Glu Leu Gln Asp Leu Pro Val Gly Glu Glu Gly Tyr

245 250 255

Ser Ser Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln Asp Glu Phe

260 265 270

Leu Ala Glu Met Arg Arg Glu Val Phe Asp Gly Arg Asp Gly Phe Leu

275 280 285

Thr Val Gly Glu Ala Pro Gly Ile Thr Ala Glu Arg Asn Glu His Ile

290 295 300

Thr Asp Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu Phe Glu His

305 310 315 320

Met Gly Val Asp Gln Thr Pro Glu Ser Lys Trp Asp Asp Lys Pro Trp

325 330 335

Thr Pro Ala Asp Leu Glu Thr Lys Leu Ala Glu Gln Gln Asp Ala Ile

340 345 350

Ala Arg Arg Gly Trp Ala Ser Leu Phe Leu Asp Asn His Asp Gln Pro

355 360 365

Arg Val Val Ser Arg Trp Gly Asp Asp Thr Ser Lys Thr Gly Arg Ile

370 375 380

Arg Ser Ala Lys Ala Leu Ala Leu Leu Leu His Met His Arg Gly Thr

385 390 395 400

Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn Ala His Phe

405 410 415

Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Ile Asn Ala Tyr His

420 425 430

Gln Arg Val Glu Glu Thr Gly Ile Arg Thr Ser Glu Thr Met Met Arg

435 440 445

Ser Leu Ala Arg Tyr Gly Arg Asp Asn Ala Arg Thr Pro Met Gln Trp

450 455 460

Asp Asp Ser Thr Tyr Ala Gly Phe Thr Met Pro Asp Ala Pro Val Glu

465 470 475 480

Pro Trp Ile Ala Val Asn Pro Asn His Thr Glu Ile Asn Ala Ala Asp

485 490 495

Glu Thr Asp Asp Pro Asp Ser Val Tyr Ser Phe His Lys Arg Leu Ile

500 505 510

Ala Leu Arg His Thr Asp Pro Val Val Ala Ala Gly Asp Tyr Arg Arg

515 520 525

Val Glu Thr Gly Asn Asp Arg Ile Ile Ala Phe Thr Arg Thr Leu Asp

530 535 540

Glu Arg Thr Ile Leu Thr Val Ile Asn Leu Ser Pro Thr Gln Ala Ala

545 550 555 560

Pro Ala Gly Glu Leu Glu Thr Met Pro Asp Gly Thr Ile Leu Ile Ala

565 570 575

Asn Thr Asp Asp Pro Val Gly Asn Leu Lys Thr Thr Gly Thr Leu Gly

580 585 590

Pro Trp Glu Ala Phe Ala Met Glu Thr Asp Pro Glu

595 600

<210> 7

<211> 1824

<212> ДНК

<213> Bifidobacterium breve UCC2003

<220>

<221> CDS

<222> (1)..(1821)

<223> agl1

<220>

<221> прочий_признак

<222> (1822)..(1824)

<223> стоп-кодон

<400> 7

atg atg act act ttc aac cgc gca ata att ccc gac gcc atc cgc acc 48

Met Met Thr Thr Phe Asn Arg Ala Ile Ile Pro Asp Ala Ile Arg Thr

1 5 10 15

aac ggc gcc acc ccc aat ccg tgg tgg tcc aac gcg gtg gtc tat cag 96

Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val Tyr Gln

20 25 30

att tac ccg cgt tct ttc caa gac acg aac ggc gat gga ttc ggc gat 144

Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Phe Gly Asp

35 40 45

ctt aag ggc atc acg tcg cgt ctt gat tac tta gct gat ctt ggc gtg 192

Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu Gly Val

50 55 60

gat gtg ctg tgg ctc tcc ccg gtc tat aag tcc ccg caa gac gac aac 240

Asp Val Leu Trp Leu Ser Pro Val Tyr Lys Ser Pro Gln Asp Asp Asn

65 70 75 80

ggc tat gac atc tct gac tat cag gac atc gac ccg ctg ttc ggc acg 288

Gly Tyr Asp Ile Ser Asp Tyr Gln Asp Ile Asp Pro Leu Phe Gly Thr

85 90 95

ctc gac gat atg gac gag ctg ctg gcc gaa gcg cat aag cgt ggg ctc 336

Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg Gly Leu

100 105 110

aaa gtc gtg atg gat ttg gtg gtc aat cac acc tcc gat gag cat gcc 384

Lys Val Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu His Ala

115 120 125

tgg ttt gag gcg tcc aag aac aag gac gac gag cat gcc gat tgg tat 432

Trp Phe Glu Ala Ser Lys Asn Lys Asp Asp Glu His Ala Asp Trp Tyr

130 135 140

tgg tgg cgt ccg gct cgt ccc ggc acc acg ccc ggc gag ccc ggc tcc 480

Trp Trp Arg Pro Ala Arg Pro Gly Thr Thr Pro Gly Glu Pro Gly Ser

145 150 155 160

gag ccc aat cag tgg ggc tcc tac ttt ggc ggt tcc gca tgg gaa tat 528

Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp Glu Tyr

165 170 175

tgc ccc gag cgt ggt gag tac tat ctc cac cag ttc tcg aag aag cag 576

Cys Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys Lys Gln

180 185 190

ccc gat ctg aac tgg gag aac ccg gcc gtg cgc cga gcc gtg tac gac 624

Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val Tyr Asp

195 200 205

atg atg aac tgg tgg ctt gac cga ggc atc gac ggc ttc cgc atg gat 672

Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg Met Asp

210 215 220

gtc atc acc ctg atc tcc aag cgt acg gat gca aac ggc agg ctg ccc 720

Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Ala Asn Gly Arg Leu Pro

225 230 235 240

ggc gag tac ggt tcc gag ctg gac gat ctg cct gtg ggc gag gaa ggc 768

Gly Glu Tyr Gly Ser Glu Leu Asp Asp Leu Pro Val Gly Glu Glu Gly

245 250 255

tat tcc aat ccc aac ccg ttc tgt gcc gat ggg ccg cgc caa gac gag 816

Tyr Ser Asn Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln Asp Glu

260 265 270

ttc ttg aag gaa atg cgt cgt gaa gtc ttt gcc gga cgc gag gga ttc 864

Phe Leu Lys Glu Met Arg Arg Glu Val Phe Ala Gly Arg Glu Gly Phe

275 280 285

ctc acc gtg ggc gag gct ccc ggc atc aca cct gtg cgc aac gaa cac 912

Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Pro Val Arg Asn Glu His

290 295 300

atc acc aat ccg gcc aat ggg gag ctg gat atg ctg ttc ctg ttc gat 960

Ile Thr Asn Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu Phe Asp

305 310 315 320

cat gtc gat ttt gat tgt gat ggc gtc aag tgg aag cct ctg ccg ctc 1008

His Val Asp Phe Asp Cys Asp Gly Val Lys Trp Lys Pro Leu Pro Leu

325 330 335

gat ttg ccg gga ttc aag cgg atc atg gcc gga tat cag act gct gtg 1056

Asp Leu Pro Gly Phe Lys Arg Ile Met Ala Gly Tyr Gln Thr Ala Val

340 345 350

gag aac gtg ggc tgg gca agc ttg ttc act ggt aac cac gat cag cca 1104

Glu Asn Val Gly Trp Ala Ser Leu Phe Thr Gly Asn His Asp Gln Pro

355 360 365

cgt gtg gtc tct cgt tgg ggc gat gac tcc tcg gag gaa tcc cgc gtg 1152

Arg Val Val Ser Arg Trp Gly Asp Asp Ser Ser Glu Glu Ser Arg Val

370 375 380

cgc tcg gcc aaa gcg ctt ggc ctg atg ttg cac atg cat cgc ggc act 1200

Arg Ser Ala Lys Ala Leu Gly Leu Met Leu His Met His Arg Gly Thr

385 390 395 400

ccg tac gta tat cag ggt gag gag ctg ggc atg acc aat gct cac ttc 1248

Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn Ala His Phe

405 410 415

acc agc ctc gat cag tac cgc gac ctt gaa tcc ctc aat gcc tat cgt 1296

Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Leu Asn Ala Tyr Arg

420 425 430

cag agg gtc gag gaa gcc aag gtg caa tcg ccg gaa tcg atg ttg gcg 1344

Gln Arg Val Glu Glu Ala Lys Val Gln Ser Pro Glu Ser Met Leu Ala

435 440 445

ggt atc gcc gcg cgc ggt cgc gac aat tcg cgt acc cca atg caa tgg 1392

Gly Ile Ala Ala Arg Gly Arg Asp Asn Ser Arg Thr Pro Met Gln Trp

450 455 460

gat ggt tct gcc tat gca ggt ttc acc gca ccg gat gca gcg acg gag 1440

Asp Gly Ser Ala Tyr Ala Gly Phe Thr Ala Pro Asp Ala Ala Thr Glu

465 470 475 480

ccg tgg att tcc gtc aac ccg aat cat gct gaa atc aat gcg gcc ggc 1488

Pro Trp Ile Ser Val Asn Pro Asn His Ala Glu Ile Asn Ala Ala Gly

485 490 495

gaa ttt gac gat cct gac tcg gtg tat gcc ttc tac aag aag ctc atc 1536

Glu Phe Asp Asp Pro Asp Ser Val Tyr Ala Phe Tyr Lys Lys Leu Ile

500 505 510

gcc ttg cgc cac aac agt tcg att gtg gcg gct ggc gag tgg cag ctg 1584

Ala Leu Arg His Asn Ser Ser Ile Val Ala Ala Gly Glu Trp Gln Leu

515 520 525

att gat gcg gat gac gcg cat gta tat gcg ttc acc cgc acg ctt ggc 1632

Ile Asp Ala Asp Asp Ala His Val Tyr Ala Phe Thr Arg Thr Leu Gly

530 535 540

aac gag cga ttg ctg gtt gtg gtt aac ctg tcc ggc cga acc gtc gac 1680

Asn Glu Arg Leu Leu Val Val Val Asn Leu Ser Gly Arg Thr Val Asp

545 550 555 560

ttg ccg cgt gaa tcc acc gag ctg att gcc ggc ggc gtc act gag cca 1728

Leu Pro Arg Glu Ser Thr Glu Leu Ile Ala Gly Gly Val Thr Glu Pro

565 570 575

gat atc att ctc tcc acg tac gac gcc cct cac act gtg gtc tcc ctc 1776

Asp Ile Ile Leu Ser Thr Tyr Asp Ala Pro His Thr Val Val Ser Leu

580 585 590

gcc aac cgt gag ctt gac ccg tgg gag gct gct gcc gtc cag ctg taa 1824

Ala Asn Arg Glu Leu Asp Pro Trp Glu Ala Ala Ala Val Gln Leu

595 600 605

<210> 8

<211> 607

<212> БЕЛОК

<213> Bifidobacterium breve UCC2003

<400> 8

Met Met Thr Thr Phe Asn Arg Ala Ile Ile Pro Asp Ala Ile Arg Thr

1 5 10 15

Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val Tyr Gln

20 25 30

Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Phe Gly Asp

35 40 45

Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu Gly Val

50 55 60

Asp Val Leu Trp Leu Ser Pro Val Tyr Lys Ser Pro Gln Asp Asp Asn

65 70 75 80

Gly Tyr Asp Ile Ser Asp Tyr Gln Asp Ile Asp Pro Leu Phe Gly Thr

85 90 95

Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg Gly Leu

100 105 110

Lys Val Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu His Ala

115 120 125

Trp Phe Glu Ala Ser Lys Asn Lys Asp Asp Glu His Ala Asp Trp Tyr

130 135 140

Trp Trp Arg Pro Ala Arg Pro Gly Thr Thr Pro Gly Glu Pro Gly Ser

145 150 155 160

Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp Glu Tyr

165 170 175

Cys Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys Lys Gln

180 185 190

Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val Tyr Asp

195 200 205

Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg Met Asp

210 215 220

Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Ala Asn Gly Arg Leu Pro

225 230 235 240

Gly Glu Tyr Gly Ser Glu Leu Asp Asp Leu Pro Val Gly Glu Glu Gly

245 250 255

Tyr Ser Asn Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln Asp Glu

260 265 270

Phe Leu Lys Glu Met Arg Arg Glu Val Phe Ala Gly Arg Glu Gly Phe

275 280 285

Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Pro Val Arg Asn Glu His

290 295 300

Ile Thr Asn Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu Phe Asp

305 310 315 320

His Val Asp Phe Asp Cys Asp Gly Val Lys Trp Lys Pro Leu Pro Leu

325 330 335

Asp Leu Pro Gly Phe Lys Arg Ile Met Ala Gly Tyr Gln Thr Ala Val

340 345 350

Glu Asn Val Gly Trp Ala Ser Leu Phe Thr Gly Asn His Asp Gln Pro

355 360 365

Arg Val Val Ser Arg Trp Gly Asp Asp Ser Ser Glu Glu Ser Arg Val

370 375 380

Arg Ser Ala Lys Ala Leu Gly Leu Met Leu His Met His Arg Gly Thr

385 390 395 400

Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn Ala His Phe

405 410 415

Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Leu Asn Ala Tyr Arg

420 425 430

Gln Arg Val Glu Glu Ala Lys Val Gln Ser Pro Glu Ser Met Leu Ala

435 440 445

Gly Ile Ala Ala Arg Gly Arg Asp Asn Ser Arg Thr Pro Met Gln Trp

450 455 460

Asp Gly Ser Ala Tyr Ala Gly Phe Thr Ala Pro Asp Ala Ala Thr Glu

465 470 475 480

Pro Trp Ile Ser Val Asn Pro Asn His Ala Glu Ile Asn Ala Ala Gly

485 490 495

Glu Phe Asp Asp Pro Asp Ser Val Tyr Ala Phe Tyr Lys Lys Leu Ile

500 505 510

Ala Leu Arg His Asn Ser Ser Ile Val Ala Ala Gly Glu Trp Gln Leu

515 520 525

Ile Asp Ala Asp Asp Ala His Val Tyr Ala Phe Thr Arg Thr Leu Gly

530 535 540

Asn Glu Arg Leu Leu Val Val Val Asn Leu Ser Gly Arg Thr Val Asp

545 550 555 560

Leu Pro Arg Glu Ser Thr Glu Leu Ile Ala Gly Gly Val Thr Glu Pro

565 570 575

Asp Ile Ile Leu Ser Thr Tyr Asp Ala Pro His Thr Val Val Ser Leu

580 585 590

Ala Asn Arg Glu Leu Asp Pro Trp Glu Ala Ala Ala Val Gln Leu

595 600 605

<210> 9

<211> 1920

<212> ДНК

<213> искусственная последовательность

<220>

<223> слитый ген tat-'agl2_cuo

<220>

<221> CDS

<222> (1)..(1917)

<223> последовательность, кодирующая слитый полипептид Tat-'Agl2

<220>

<221> прочая_сигнальная_последовательность

<222> (1)..(99)

<223> 5'-концевая последовательность cg0955, кодирующая

Tat-сигнальный пептид Cg0955

<220>

<221> прочий_признак

<222> (1)..(101)

<223> 5'-концевая последовательность cg0955

<220>

<221> прочий_признак

<222> (102)..(102)

<223> нуклеотидное основание гуанин

<220>

<221> прочий_признак

<222> (103)..(108)

<223> сайт рестрикции для SpeI

<220>

<221> прочий_признак

<222> (109)..(1917)

<223> 'agl2_cuo

<220>

<221> прочий_признак

<222> (1918)..(1920)

<223> стоп-кодон

<400> 9

atg caa ata aac cgc cga ggc ttc tta aaa gcc acc aca gga ctt gcc 48

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

act atc ggc gct gcc agc atg ttt atg cca aag gcc aac gcc ctt gga 96

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

gca atg act agt acc tcc ttc aac cgc gaa cca ctg cca gat gca gtg 144

Ala Met Thr Ser Thr Ser Phe Asn Arg Glu Pro Leu Pro Asp Ala Val

35 40 45

cgc acc aac ggt gca acc cca aac cca tgg tgg tcc aac gca gtg gtg 192

Arg Thr Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val

50 55 60

tac cag atc tac cca cgc tcc ttc cag gat acc aac ggc gac ggc ctg 240

Tyr Gln Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Leu

65 70 75 80

ggc gat ctg aag ggc atc acc tcc cgc ttg gat tac ctg gca gat ctg 288

Gly Asp Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu

85 90 95

ggc gtg gat gtg ctg tgg ctg tcc cca gtg tac cgc tcc cca cag gat 336

Gly Val Asp Val Leu Trp Leu Ser Pro Val Tyr Arg Ser Pro Gln Asp

100 105 110

gat aac ggc tac gat atc tcc gat tac cgc gat atc gat cca ctg ttc 384

Asp Asn Gly Tyr Asp Ile Ser Asp Tyr Arg Asp Ile Asp Pro Leu Phe

115 120 125

ggc acc ctg gat gat atg gat gaa ctg ctg gca gag gca cac aag cgt 432

Gly Thr Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg

130 135 140

ggc ctg aag atc gtg atg gat ctg gtg gtg aac cac acc tcc gat gaa 480

Gly Leu Lys Ile Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu

145 150 155 160

cac gca tgg ttc gaa gca tcc aag gat aag gat gat cca cac gca gat 528

His Ala Trp Phe Glu Ala Ser Lys Asp Lys Asp Asp Pro His Ala Asp

165 170 175

tgg tac tgg tgg cgt cca gca cgc cca ggc cac gaa cca ggc acc cca 576

Trp Tyr Trp Trp Arg Pro Ala Arg Pro Gly His Glu Pro Gly Thr Pro

180 185 190

ggc gca gaa cca aac cag tgg ggc tcc tac ttc ggt ggc tcc gca tgg 624

Gly Ala Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp

195 200 205

gaa tac tcc cca gaa cgc ggt gaa tac tac ctg cac cag ttc tcc aag 672

Glu Tyr Ser Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys

210 215 220

aag cag cca gat ctc aac tgg gaa aac cca gca gtg cgt cgc gca gtg 720

Lys Gln Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val

225 230 235 240

tac gat atg atg aac tgg tgg ttg gat cgc ggt atc gat ggc ttc cgc 768

Tyr Asp Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg

245 250 255

atg gat gtg atc acc ctg atc tcc aag cgc acc gat cca aac ggt cgc 816

Met Asp Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Pro Asn Gly Arg

260 265 270

ctg cca ggt gaa acc ggc tcc gaa ctc cag gat ctg cca gtg ggc gaa 864

Leu Pro Gly Glu Thr Gly Ser Glu Leu Gln Asp Leu Pro Val Gly Glu

275 280 285

gaa ggc tac tcc tcc cca aac cct ttc tgc gca gat ggc cct cgc cag 912

Glu Gly Tyr Ser Ser Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln

290 295 300

gat gaa ttc ctg gca gaa atg cgt cgc gaa gtt ttc gat ggc cgt gat 960

Asp Glu Phe Leu Ala Glu Met Arg Arg Glu Val Phe Asp Gly Arg Asp

305 310 315 320

ggc ttc ctg acc gtg ggc gaa gca cca ggc atc acc gca gaa cgc aac 1008

Gly Phe Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Ala Glu Arg Asn

325 330 335

gaa cac atc acc gat cca gca aac ggc gaa ctg gat atg ctg ttc ctg 1056

Glu His Ile Thr Asp Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu

340 345 350

ttc gaa cac atg ggc gtg gat cag acc cca gaa tcc aag tgg gat gat 1104

Phe Glu His Met Gly Val Asp Gln Thr Pro Glu Ser Lys Trp Asp Asp

355 360 365

aag cca tgg acc cca gca gat ctg gaa acc aag ctg gca gaa cag cag 1152

Lys Pro Trp Thr Pro Ala Asp Leu Glu Thr Lys Leu Ala Glu Gln Gln

370 375 380

gat gca atc gca cgc cgt ggc tgg gcc tcc ctg ttc ctg gat aac cac 1200

Asp Ala Ile Ala Arg Arg Gly Trp Ala Ser Leu Phe Leu Asp Asn His

385 390 395 400

gat cag cca cgc gtg gtg tcc cgc tgg ggt gat gat acc tcc aag acc 1248

Asp Gln Pro Arg Val Val Ser Arg Trp Gly Asp Asp Thr Ser Lys Thr

405 410 415

ggt cgc atc cgc tcc gca aag gca ctg gca ctg ctg ctg cac atg cac 1296

Gly Arg Ile Arg Ser Ala Lys Ala Leu Ala Leu Leu Leu His Met His

420 425 430

cgt ggc acc cca tac gtg tac cag ggc gaa gaa ctg ggc atg acc aac 1344

Arg Gly Thr Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn

435 440 445

gca cac ttc acc tcc ctg gat cag tac cgc gat ctg gaa tcc atc aac 1392

Ala His Phe Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Ile Asn

450 455 460

gca tac cac caa cgc gtg gaa gaa acc ggc atc cgc acc tcc gaa acc 1440

Ala Tyr His Gln Arg Val Glu Glu Thr Gly Ile Arg Thr Ser Glu Thr

465 470 475 480

atg atg cgc tcc ctg gca cgc tac ggt cgc gat aac gca cgc acc cca 1488

Met Met Arg Ser Leu Ala Arg Tyr Gly Arg Asp Asn Ala Arg Thr Pro

485 490 495

atg cag tgg gat gat tcc acc tac gca ggc ttc acc atg cca gat gcc 1536

Met Gln Trp Asp Asp Ser Thr Tyr Ala Gly Phe Thr Met Pro Asp Ala

500 505 510

cca gtg gaa cca tgg atc gca gtg aac cca aac cac acc gaa atc aac 1584

Pro Val Glu Pro Trp Ile Ala Val Asn Pro Asn His Thr Glu Ile Asn

515 520 525

gca gca gat gaa acc gat gat cca gat tcc gtg tac tcc ttc cac aag 1632

Ala Ala Asp Glu Thr Asp Asp Pro Asp Ser Val Tyr Ser Phe His Lys

530 535 540

cgc ctg atc gca ctg cgc cac acc gat cca gtg gtg gca gca ggc gat 1680

Arg Leu Ile Ala Leu Arg His Thr Asp Pro Val Val Ala Ala Gly Asp

545 550 555 560

tac cgt cgc gtg gaa acc ggc aac gat cgc atc att gca ttc acc cgc 1728

Tyr Arg Arg Val Glu Thr Gly Asn Asp Arg Ile Ile Ala Phe Thr Arg

565 570 575

acc ctg gac gaa cgc acc atc ctg acc gtg atc aac ctg tcc cca acc 1776

Thr Leu Asp Glu Arg Thr Ile Leu Thr Val Ile Asn Leu Ser Pro Thr

580 585 590

cag gca gca cca gca ggc gaa ctg gaa acc atg cca gac ggc acc atc 1824

Gln Ala Ala Pro Ala Gly Glu Leu Glu Thr Met Pro Asp Gly Thr Ile

595 600 605

ttg atc gca aac acc gat gac cca gtg ggc aac ctc aag acc acc ggc 1872

Leu Ile Ala Asn Thr Asp Asp Pro Val Gly Asn Leu Lys Thr Thr Gly

610 615 620

acc ctg ggt cca tgg gaa gca ttc gca atg gaa acc gat cca gaa taa 1920

Thr Leu Gly Pro Trp Glu Ala Phe Ala Met Glu Thr Asp Pro Glu

625 630 635

<210> 10

<211> 639

<212> БЕЛОК

<213> искусственная последовательность

<220>

<223> синтетическая конструкция

<400> 10

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

Ala Met Thr Ser Thr Ser Phe Asn Arg Glu Pro Leu Pro Asp Ala Val

35 40 45

Arg Thr Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val

50 55 60

Tyr Gln Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Leu

65 70 75 80

Gly Asp Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu

85 90 95

Gly Val Asp Val Leu Trp Leu Ser Pro Val Tyr Arg Ser Pro Gln Asp

100 105 110

Asp Asn Gly Tyr Asp Ile Ser Asp Tyr Arg Asp Ile Asp Pro Leu Phe

115 120 125

Gly Thr Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg

130 135 140

Gly Leu Lys Ile Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu

145 150 155 160

His Ala Trp Phe Glu Ala Ser Lys Asp Lys Asp Asp Pro His Ala Asp

165 170 175

Trp Tyr Trp Trp Arg Pro Ala Arg Pro Gly His Glu Pro Gly Thr Pro

180 185 190

Gly Ala Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp

195 200 205

Glu Tyr Ser Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys

210 215 220

Lys Gln Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val

225 230 235 240

Tyr Asp Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg

245 250 255

Met Asp Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Pro Asn Gly Arg

260 265 270

Leu Pro Gly Glu Thr Gly Ser Glu Leu Gln Asp Leu Pro Val Gly Glu

275 280 285

Glu Gly Tyr Ser Ser Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln

290 295 300

Asp Glu Phe Leu Ala Glu Met Arg Arg Glu Val Phe Asp Gly Arg Asp

305 310 315 320

Gly Phe Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Ala Glu Arg Asn

325 330 335

Glu His Ile Thr Asp Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu

340 345 350

Phe Glu His Met Gly Val Asp Gln Thr Pro Glu Ser Lys Trp Asp Asp

355 360 365

Lys Pro Trp Thr Pro Ala Asp Leu Glu Thr Lys Leu Ala Glu Gln Gln

370 375 380

Asp Ala Ile Ala Arg Arg Gly Trp Ala Ser Leu Phe Leu Asp Asn His

385 390 395 400

Asp Gln Pro Arg Val Val Ser Arg Trp Gly Asp Asp Thr Ser Lys Thr

405 410 415

Gly Arg Ile Arg Ser Ala Lys Ala Leu Ala Leu Leu Leu His Met His

420 425 430

Arg Gly Thr Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn

435 440 445

Ala His Phe Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Ile Asn

450 455 460

Ala Tyr His Gln Arg Val Glu Glu Thr Gly Ile Arg Thr Ser Glu Thr

465 470 475 480

Met Met Arg Ser Leu Ala Arg Tyr Gly Arg Asp Asn Ala Arg Thr Pro

485 490 495

Met Gln Trp Asp Asp Ser Thr Tyr Ala Gly Phe Thr Met Pro Asp Ala

500 505 510

Pro Val Glu Pro Trp Ile Ala Val Asn Pro Asn His Thr Glu Ile Asn

515 520 525

Ala Ala Asp Glu Thr Asp Asp Pro Asp Ser Val Tyr Ser Phe His Lys

530 535 540

Arg Leu Ile Ala Leu Arg His Thr Asp Pro Val Val Ala Ala Gly Asp

545 550 555 560

Tyr Arg Arg Val Glu Thr Gly Asn Asp Arg Ile Ile Ala Phe Thr Arg

565 570 575

Thr Leu Asp Glu Arg Thr Ile Leu Thr Val Ile Asn Leu Ser Pro Thr

580 585 590

Gln Ala Ala Pro Ala Gly Glu Leu Glu Thr Met Pro Asp Gly Thr Ile

595 600 605

Leu Ile Ala Asn Thr Asp Asp Pro Val Gly Asn Leu Lys Thr Thr Gly

610 615 620

Thr Leu Gly Pro Trp Glu Ala Phe Ala Met Glu Thr Asp Pro Glu

625 630 635

<210> 11

<211> 1932

<212> ДНК

<213> искусственная последовательность

<220>

<223> слитый ген tat-agl1_cuo

<220>

<221> CDS

<222> (1)..(1929)

<223> последовательность, кодирующая слитый полипептид Tat-Agl1

<220>

<221> прочая_сигнальная_последовательность

<222> (1)..(99)

<223> 5'-концевая последовательность cg0955, кодирующая

Tat-сигнальный пептид Cg0955

<220>

<221> прочий_признак

<222> (1)..(101)

<223> 5'-концевая последовательность cg0955

<220>

<221> прочий_признак

<222> (102)..(102)

<223> нуклеотидное основание аденин

<220>

<221> прочий_признак

<222> (102)..(107)

<223> сайт рестрикции для SpeI

<220>

<221> прочий_признак

<222> (108)..(108)

<223> нуклеотидное основание аденин

<220>

<221> прочий_признак

<222> (109)..(1929)

<223> agl1_cuo

<220>

<221> прочий_признак

<222> (1930)..(1932)

<223> стоп-кодон

<400> 11

atg caa ata aac cgc cga ggc ttc tta aaa gcc acc aca gga ctt gcc 48

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

act atc ggc gct gcc agc atg ttt atg cca aag gcc aac gcc ctt gga 96

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

gca ata cta gta atg atg acc acc ttc aac cgt gca atc atc cca gat 144

Ala Ile Leu Val Met Met Thr Thr Phe Asn Arg Ala Ile Ile Pro Asp

35 40 45

gca atc cgc acc aac ggt gca acc cca aac cca tgg tgg tcc aac gca 192

Ala Ile Arg Thr Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala

50 55 60

gtg gtg tac cag atc tac cca cgc tcc ttc cag gat acc aac ggc gac 240

Val Val Tyr Gln Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp

65 70 75 80

ggc ttc ggc gat ctg aag ggc atc acc tcc cgc ttg gat tac ctg gca 288

Gly Phe Gly Asp Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala

85 90 95

gat ctg ggc gtg gat gtg ctg tgg ctg tcc cca gtg tac aag tcc cca 336

Asp Leu Gly Val Asp Val Leu Trp Leu Ser Pro Val Tyr Lys Ser Pro

100 105 110

cag gat gat aac ggc tac gat atc tcc gat tac cag gat atc gat cca 384

Gln Asp Asp Asn Gly Tyr Asp Ile Ser Asp Tyr Gln Asp Ile Asp Pro

115 120 125

ctg ttc ggc acc ctg gat gat atg gat gaa ctg ctg gca gag gca cac 432

Leu Phe Gly Thr Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His

130 135 140

aag cgt ggc ctg aag gtg gtg atg gat ctg gtg gtg aac cac acc tcc 480

Lys Arg Gly Leu Lys Val Val Met Asp Leu Val Val Asn His Thr Ser

145 150 155 160

gat gaa cac gca tgg ttc gaa gca tcc aag aac aag gat gat gaa cac 528

Asp Glu His Ala Trp Phe Glu Ala Ser Lys Asn Lys Asp Asp Glu His

165 170 175

gcc gat tgg tac tgg tgg cgt cca gca cgc cca ggc acc acc cca ggt 576

Ala Asp Trp Tyr Trp Trp Arg Pro Ala Arg Pro Gly Thr Thr Pro Gly

180 185 190

gaa cca ggc tcc gaa cca aac cag tgg ggc tcc tac ttc ggt ggc tcc 624

Glu Pro Gly Ser Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser

195 200 205

gca tgg gaa tac tgc cca gaa cgc ggt gaa tac tac ctg cac cag ttc 672

Ala Trp Glu Tyr Cys Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe

210 215 220

tcc aag aag cag cca gat ctc aac tgg gaa aac cca gca gtg cgt cgc 720

Ser Lys Lys Gln Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg

225 230 235 240

gca gtg tac gat atg atg aac tgg tgg ttg gat cgc ggt atc gat ggc 768

Ala Val Tyr Asp Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly

245 250 255

ttc cgc atg gat gtg atc acc ctg atc tcc aag cgc acc gat gca aac 816

Phe Arg Met Asp Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Ala Asn

260 265 270

ggt cgc ctg cca ggt gaa tac ggc tcc gaa ctg gat gat ctg cca gtg 864

Gly Arg Leu Pro Gly Glu Tyr Gly Ser Glu Leu Asp Asp Leu Pro Val

275 280 285

ggc gaa gaa ggc tac tcc aac cca aac ccg ttc tgc gca gat ggc cct 912

Gly Glu Glu Gly Tyr Ser Asn Pro Asn Pro Phe Cys Ala Asp Gly Pro

290 295 300

cgc cag gat gaa ttc ctg aaa gaa atg cgt cgc gaa gtg ttc gca ggt 960

Arg Gln Asp Glu Phe Leu Lys Glu Met Arg Arg Glu Val Phe Ala Gly

305 310 315 320

cgc gaa ggc ttc ctg acc gtg ggc gaa gca cca ggc atc acc cct gtg 1008

Arg Glu Gly Phe Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Pro Val

325 330 335

cgc aac gaa cac atc acc aac cca gca aac ggc gaa ctg gat atg ctg 1056

Arg Asn Glu His Ile Thr Asn Pro Ala Asn Gly Glu Leu Asp Met Leu

340 345 350

ttc ctg ttc gat cac gtg gat ttc gat tgc gac ggc gtg aag tgg aag 1104

Phe Leu Phe Asp His Val Asp Phe Asp Cys Asp Gly Val Lys Trp Lys

355 360 365

cca ctg cca ctg gat ctg cca ggc ttc aag cgc atc atg gca ggc tac 1152

Pro Leu Pro Leu Asp Leu Pro Gly Phe Lys Arg Ile Met Ala Gly Tyr

370 375 380

cag acc gca gtg gaa aac gtg ggc tgg gca tcc ctg ttc acc ggc aac 1200

Gln Thr Ala Val Glu Asn Val Gly Trp Ala Ser Leu Phe Thr Gly Asn

385 390 395 400

cac gat cag cca cgc gtg gtg tcc cgc tgg ggt gat gat tcc tcc gaa 1248

His Asp Gln Pro Arg Val Val Ser Arg Trp Gly Asp Asp Ser Ser Glu

405 410 415

gaa tcc cgt gtg cgc tcc gca aag gca ctg ggc ctg atg ctg cac atg 1296

Glu Ser Arg Val Arg Ser Ala Lys Ala Leu Gly Leu Met Leu His Met

420 425 430

cac cgt ggc acc cca tac gtg tac cag ggc gaa gaa ctg ggc atg acc 1344

His Arg Gly Thr Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr

435 440 445

aac gca cac ttc acc tcc ctg gat cag tac cgc gat ctg gaa tcc ctg 1392

Asn Ala His Phe Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Leu

450 455 460

aac gca tac cgc cag cgc gtg gaa gag gca aag gtg cag tcc cca gaa 1440

Asn Ala Tyr Arg Gln Arg Val Glu Glu Ala Lys Val Gln Ser Pro Glu

465 470 475 480

tcc atg ctg gca ggt atc gca gca cgc ggt cgc gat aac tcc cgc acc 1488

Ser Met Leu Ala Gly Ile Ala Ala Arg Gly Arg Asp Asn Ser Arg Thr

485 490 495

cca atg cag tgg gat ggc tcc gca tac gca ggc ttc acc gca cca gat 1536

Pro Met Gln Trp Asp Gly Ser Ala Tyr Ala Gly Phe Thr Ala Pro Asp

500 505 510

gca gca acc gaa cca tgg atc tcc gtg aac cca aac cac gca gaa atc 1584

Ala Ala Thr Glu Pro Trp Ile Ser Val Asn Pro Asn His Ala Glu Ile

515 520 525

aac gca gca ggc gaa ttc gat gat cca gat tcc gtg tac gca ttc tac 1632

Asn Ala Ala Gly Glu Phe Asp Asp Pro Asp Ser Val Tyr Ala Phe Tyr

530 535 540

aag aag ctg atc gca ctg cgc cac aac tcc tcc atc gtg gca gct ggc 1680

Lys Lys Leu Ile Ala Leu Arg His Asn Ser Ser Ile Val Ala Ala Gly

545 550 555 560

gaa tgg cag ctg atc gat gca gat gat gca cac gtg tac gcc ttc acc 1728

Glu Trp Gln Leu Ile Asp Ala Asp Asp Ala His Val Tyr Ala Phe Thr

565 570 575

cgc acc ctg ggc aac gaa cgc ctg ctc gtg gtg gtc aac ctg tcc ggt 1776

Arg Thr Leu Gly Asn Glu Arg Leu Leu Val Val Val Asn Leu Ser Gly

580 585 590

cgc acc gtg gat ctg cca cgc gaa tcc acc gaa ctg atc gca ggc ggt 1824

Arg Thr Val Asp Leu Pro Arg Glu Ser Thr Glu Leu Ile Ala Gly Gly

595 600 605

gtg acc gaa cca gat atc atc ctg tcc acc tac gat gca cca cac acc 1872

Val Thr Glu Pro Asp Ile Ile Leu Ser Thr Tyr Asp Ala Pro His Thr

610 615 620

gtg gtg tcc ctg gca aac cgc gaa ctc gat cca tgg gaa gca gca gca 1920

Val Val Ser Leu Ala Asn Arg Glu Leu Asp Pro Trp Glu Ala Ala Ala

625 630 635 640

gtg cag ctg taa 1932

Val Gln Leu

<210> 12

<211> 643

<212> БЕЛОК

<213> искусственная последовательность

<220>

<223> синтетическая конструкция

<400> 12

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

Ala Ile Leu Val Met Met Thr Thr Phe Asn Arg Ala Ile Ile Pro Asp

35 40 45

Ala Ile Arg Thr Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala

50 55 60

Val Val Tyr Gln Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp

65 70 75 80

Gly Phe Gly Asp Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala

85 90 95

Asp Leu Gly Val Asp Val Leu Trp Leu Ser Pro Val Tyr Lys Ser Pro

100 105 110

Gln Asp Asp Asn Gly Tyr Asp Ile Ser Asp Tyr Gln Asp Ile Asp Pro

115 120 125

Leu Phe Gly Thr Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His

130 135 140

Lys Arg Gly Leu Lys Val Val Met Asp Leu Val Val Asn His Thr Ser

145 150 155 160

Asp Glu His Ala Trp Phe Glu Ala Ser Lys Asn Lys Asp Asp Glu His

165 170 175

Ala Asp Trp Tyr Trp Trp Arg Pro Ala Arg Pro Gly Thr Thr Pro Gly

180 185 190

Glu Pro Gly Ser Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser

195 200 205

Ala Trp Glu Tyr Cys Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe

210 215 220

Ser Lys Lys Gln Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg

225 230 235 240

Ala Val Tyr Asp Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly

245 250 255

Phe Arg Met Asp Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Ala Asn

260 265 270

Gly Arg Leu Pro Gly Glu Tyr Gly Ser Glu Leu Asp Asp Leu Pro Val

275 280 285

Gly Glu Glu Gly Tyr Ser Asn Pro Asn Pro Phe Cys Ala Asp Gly Pro

290 295 300

Arg Gln Asp Glu Phe Leu Lys Glu Met Arg Arg Glu Val Phe Ala Gly

305 310 315 320

Arg Glu Gly Phe Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Pro Val

325 330 335

Arg Asn Glu His Ile Thr Asn Pro Ala Asn Gly Glu Leu Asp Met Leu

340 345 350

Phe Leu Phe Asp His Val Asp Phe Asp Cys Asp Gly Val Lys Trp Lys

355 360 365

Pro Leu Pro Leu Asp Leu Pro Gly Phe Lys Arg Ile Met Ala Gly Tyr

370 375 380

Gln Thr Ala Val Glu Asn Val Gly Trp Ala Ser Leu Phe Thr Gly Asn

385 390 395 400

His Asp Gln Pro Arg Val Val Ser Arg Trp Gly Asp Asp Ser Ser Glu

405 410 415

Glu Ser Arg Val Arg Ser Ala Lys Ala Leu Gly Leu Met Leu His Met

420 425 430

His Arg Gly Thr Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr

435 440 445

Asn Ala His Phe Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Leu

450 455 460

Asn Ala Tyr Arg Gln Arg Val Glu Glu Ala Lys Val Gln Ser Pro Glu

465 470 475 480

Ser Met Leu Ala Gly Ile Ala Ala Arg Gly Arg Asp Asn Ser Arg Thr

485 490 495

Pro Met Gln Trp Asp Gly Ser Ala Tyr Ala Gly Phe Thr Ala Pro Asp

500 505 510

Ala Ala Thr Glu Pro Trp Ile Ser Val Asn Pro Asn His Ala Glu Ile

515 520 525

Asn Ala Ala Gly Glu Phe Asp Asp Pro Asp Ser Val Tyr Ala Phe Tyr

530 535 540

Lys Lys Leu Ile Ala Leu Arg His Asn Ser Ser Ile Val Ala Ala Gly

545 550 555 560

Glu Trp Gln Leu Ile Asp Ala Asp Asp Ala His Val Tyr Ala Phe Thr

565 570 575

Arg Thr Leu Gly Asn Glu Arg Leu Leu Val Val Val Asn Leu Ser Gly

580 585 590

Arg Thr Val Asp Leu Pro Arg Glu Ser Thr Glu Leu Ile Ala Gly Gly

595 600 605

Val Thr Glu Pro Asp Ile Ile Leu Ser Thr Tyr Asp Ala Pro His Thr

610 615 620

Val Val Ser Leu Ala Asn Arg Glu Leu Asp Pro Trp Glu Ala Ala Ala

625 630 635 640

Val Gln Leu

<210> 13

<211> 38

<212> ДНК

<213> Corynebacterium glutamicum

<220>

<221> терминатор

<222> (1)..(38)

<223> терминатор транскрипции гена gap (B. J. Eikmanns 1992, фиг. 3)

<220>

<221> прочий_признак

<222> (3)..(38)

<223> последовательность терминатора Tgap*

<400> 13

aatagcccgg ggtgtgcctc ggcgcacccc gggctatt 38

<210> 14

<211> 85

<212> ДНК

<213> искусственная последовательность

<220>

<223> промотор

<220>

<221> промотор

<222> (1)..(85)

<223> последовательность, обозначенная как PtacI у De Boer и соавт. (1983)

<220>

<221> промотор

<222> (1)..(75)

<223> промотор PtacI

<400> 14

gagctgttga caattaatca tcggctcgta taatgtgtgg aattgtgagc ggataacaat 60

ttcacacagg aaacagaatt ctatg 85

<210> 15

<211> 60

<212> ДНК

<213> Corynebacterium glutamicum

<220>

<221> промотор

<222> (1)..(60)

<223> промотор PdapBN1

<400> 15

taggtatgga tatcagcacc ttctgaacgg gtacgggtat aatggtgggc gtttgaaaaa 60

<210> 16

<211> 2096

<212> ДНК

<213> искусственная последовательность

<220>

<223> слитый ген tat-'agl2_cuo, содержащий промотор и терминатор

<220>

<221> прочий_признак

<222> (1)..(121)

<223> вышерасположенная последовательность

<220>

<221> промотор

<222> (32)..(91)

<223> промотор PdapBN1

<220>

<221> CDS

<222> (122)..(2038)

<223> последовательность, кодирующая слитый полипептид Tat-'Agl2

<220>

<221> прочий_признак

<222> (2039)..(2041)

<223> стоп-кодон

<220>

<221> прочий_признак

<222> (2053)..(2088)

<223> последовательность терминатора Tgap*

<400> 16

atcgttaaca acacagacca aaacggtcag ttaggtatgg atatcagcac cttctgaacg 60

ggtacgggta taatggtggg cgtttgaaaa actcttcgcc ccacgaaaat gaaggagcat 120

a atg caa ata aac cgc cga ggc ttc tta aaa gcc acc aca gga ctt gcc 169

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

act atc ggc gct gcc agc atg ttt atg cca aag gcc aac gcc ctt gga 217

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

gca atg act agt acc tcc ttc aac cgc gaa cca ctg cca gat gca gtg 265

Ala Met Thr Ser Thr Ser Phe Asn Arg Glu Pro Leu Pro Asp Ala Val

35 40 45

cgc acc aac ggt gca acc cca aac cca tgg tgg tcc aac gca gtg gtg 313

Arg Thr Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val

50 55 60

tac cag atc tac cca cgc tcc ttc cag gat acc aac ggc gac ggc ctg 361

Tyr Gln Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Leu

65 70 75 80

ggc gat ctg aag ggc atc acc tcc cgc ttg gat tac ctg gca gat ctg 409

Gly Asp Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu

85 90 95

ggc gtg gat gtg ctg tgg ctg tcc cca gtg tac cgc tcc cca cag gat 457

Gly Val Asp Val Leu Trp Leu Ser Pro Val Tyr Arg Ser Pro Gln Asp

100 105 110

gat aac ggc tac gat atc tcc gat tac cgc gat atc gat cca ctg ttc 505

Asp Asn Gly Tyr Asp Ile Ser Asp Tyr Arg Asp Ile Asp Pro Leu Phe

115 120 125

ggc acc ctg gat gat atg gat gaa ctg ctg gca gag gca cac aag cgt 553

Gly Thr Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg

130 135 140

ggc ctg aag atc gtg atg gat ctg gtg gtg aac cac acc tcc gat gaa 601

Gly Leu Lys Ile Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu

145 150 155 160

cac gca tgg ttc gaa gca tcc aag gat aag gat gat cca cac gca gat 649

His Ala Trp Phe Glu Ala Ser Lys Asp Lys Asp Asp Pro His Ala Asp

165 170 175

tgg tac tgg tgg cgt cca gca cgc cca ggc cac gaa cca ggc acc cca 697

Trp Tyr Trp Trp Arg Pro Ala Arg Pro Gly His Glu Pro Gly Thr Pro

180 185 190

ggc gca gaa cca aac cag tgg ggc tcc tac ttc ggt ggc tcc gca tgg 745

Gly Ala Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp

195 200 205

gaa tac tcc cca gaa cgc ggt gaa tac tac ctg cac cag ttc tcc aag 793

Glu Tyr Ser Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys

210 215 220

aag cag cca gat ctc aac tgg gaa aac cca gca gtg cgt cgc gca gtg 841

Lys Gln Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val

225 230 235 240

tac gat atg atg aac tgg tgg ttg gat cgc ggt atc gat ggc ttc cgc 889

Tyr Asp Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg

245 250 255

atg gat gtg atc acc ctg atc tcc aag cgc acc gat cca aac ggt cgc 937

Met Asp Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Pro Asn Gly Arg

260 265 270

ctg cca ggt gaa acc ggc tcc gaa ctc cag gat ctg cca gtg ggc gaa 985

Leu Pro Gly Glu Thr Gly Ser Glu Leu Gln Asp Leu Pro Val Gly Glu

275 280 285

gaa ggc tac tcc tcc cca aac cct ttc tgc gca gat ggc cct cgc cag 1033

Glu Gly Tyr Ser Ser Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln

290 295 300

gat gaa ttc ctg gca gaa atg cgt cgc gaa gtt ttc gat ggc cgt gat 1081

Asp Glu Phe Leu Ala Glu Met Arg Arg Glu Val Phe Asp Gly Arg Asp

305 310 315 320

ggc ttc ctg acc gtg ggc gaa gca cca ggc atc acc gca gaa cgc aac 1129

Gly Phe Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Ala Glu Arg Asn

325 330 335

gaa cac atc acc gat cca gca aac ggc gaa ctg gat atg ctg ttc ctg 1177

Glu His Ile Thr Asp Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu

340 345 350

ttc gaa cac atg ggc gtg gat cag acc cca gaa tcc aag tgg gat gat 1225

Phe Glu His Met Gly Val Asp Gln Thr Pro Glu Ser Lys Trp Asp Asp

355 360 365

aag cca tgg acc cca gca gat ctg gaa acc aag ctg gca gaa cag cag 1273

Lys Pro Trp Thr Pro Ala Asp Leu Glu Thr Lys Leu Ala Glu Gln Gln

370 375 380

gat gca atc gca cgc cgt ggc tgg gcc tcc ctg ttc ctg gat aac cac 1321

Asp Ala Ile Ala Arg Arg Gly Trp Ala Ser Leu Phe Leu Asp Asn His

385 390 395 400

gat cag cca cgc gtg gtg tcc cgc tgg ggt gat gat acc tcc aag acc 1369

Asp Gln Pro Arg Val Val Ser Arg Trp Gly Asp Asp Thr Ser Lys Thr

405 410 415

ggt cgc atc cgc tcc gca aag gca ctg gca ctg ctg ctg cac atg cac 1417

Gly Arg Ile Arg Ser Ala Lys Ala Leu Ala Leu Leu Leu His Met His

420 425 430

cgt ggc acc cca tac gtg tac cag ggc gaa gaa ctg ggc atg acc aac 1465

Arg Gly Thr Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn

435 440 445

gca cac ttc acc tcc ctg gat cag tac cgc gat ctg gaa tcc atc aac 1513

Ala His Phe Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Ile Asn

450 455 460

gca tac cac caa cgc gtg gaa gaa acc ggc atc cgc acc tcc gaa acc 1561

Ala Tyr His Gln Arg Val Glu Glu Thr Gly Ile Arg Thr Ser Glu Thr

465 470 475 480

atg atg cgc tcc ctg gca cgc tac ggt cgc gat aac gca cgc acc cca 1609

Met Met Arg Ser Leu Ala Arg Tyr Gly Arg Asp Asn Ala Arg Thr Pro

485 490 495

atg cag tgg gat gat tcc acc tac gca ggc ttc acc atg cca gat gcc 1657

Met Gln Trp Asp Asp Ser Thr Tyr Ala Gly Phe Thr Met Pro Asp Ala

500 505 510

cca gtg gaa cca tgg atc gca gtg aac cca aac cac acc gaa atc aac 1705

Pro Val Glu Pro Trp Ile Ala Val Asn Pro Asn His Thr Glu Ile Asn

515 520 525

gca gca gat gaa acc gat gat cca gat tcc gtg tac tcc ttc cac aag 1753

Ala Ala Asp Glu Thr Asp Asp Pro Asp Ser Val Tyr Ser Phe His Lys

530 535 540

cgc ctg atc gca ctg cgc cac acc gat cca gtg gtg gca gca ggc gat 1801

Arg Leu Ile Ala Leu Arg His Thr Asp Pro Val Val Ala Ala Gly Asp

545 550 555 560

tac cgt cgc gtg gaa acc ggc aac gat cgc atc att gca ttc acc cgc 1849

Tyr Arg Arg Val Glu Thr Gly Asn Asp Arg Ile Ile Ala Phe Thr Arg

565 570 575

acc ctg gac gaa cgc acc atc ctg acc gtg atc aac ctg tcc cca acc 1897

Thr Leu Asp Glu Arg Thr Ile Leu Thr Val Ile Asn Leu Ser Pro Thr

580 585 590

cag gca gca cca gca ggc gaa ctg gaa acc atg cca gac ggc acc atc 1945

Gln Ala Ala Pro Ala Gly Glu Leu Glu Thr Met Pro Asp Gly Thr Ile

595 600 605

ttg atc gca aac acc gat gac cca gtg ggc aac ctc aag acc acc ggc 1993

Leu Ile Ala Asn Thr Asp Asp Pro Val Gly Asn Leu Lys Thr Thr Gly

610 615 620

acc ctg ggt cca tgg gaa gca ttc gca atg gaa acc gat cca gaa 2038

Thr Leu Gly Pro Trp Glu Ala Phe Ala Met Glu Thr Asp Pro Glu

625 630 635

taagcggccg ctgttagccc ggggtgtgcc tcggcgcacc ccgggctatt tttctaga 2096

<210> 17

<211> 639

<212> БЕЛОК

<213> искусственная последовательность

<220>

<223> синтетическая конструкция

<400> 17

Met Gln Ile Asn Arg Arg Gly Phe Leu Lys Ala Thr Thr Gly Leu Ala

1 5 10 15

Thr Ile Gly Ala Ala Ser Met Phe Met Pro Lys Ala Asn Ala Leu Gly

20 25 30

Ala Met Thr Ser Thr Ser Phe Asn Arg Glu Pro Leu Pro Asp Ala Val

35 40 45

Arg Thr Asn Gly Ala Thr Pro Asn Pro Trp Trp Ser Asn Ala Val Val

50 55 60

Tyr Gln Ile Tyr Pro Arg Ser Phe Gln Asp Thr Asn Gly Asp Gly Leu

65 70 75 80

Gly Asp Leu Lys Gly Ile Thr Ser Arg Leu Asp Tyr Leu Ala Asp Leu

85 90 95

Gly Val Asp Val Leu Trp Leu Ser Pro Val Tyr Arg Ser Pro Gln Asp

100 105 110

Asp Asn Gly Tyr Asp Ile Ser Asp Tyr Arg Asp Ile Asp Pro Leu Phe

115 120 125

Gly Thr Leu Asp Asp Met Asp Glu Leu Leu Ala Glu Ala His Lys Arg

130 135 140

Gly Leu Lys Ile Val Met Asp Leu Val Val Asn His Thr Ser Asp Glu

145 150 155 160

His Ala Trp Phe Glu Ala Ser Lys Asp Lys Asp Asp Pro His Ala Asp

165 170 175

Trp Tyr Trp Trp Arg Pro Ala Arg Pro Gly His Glu Pro Gly Thr Pro

180 185 190

Gly Ala Glu Pro Asn Gln Trp Gly Ser Tyr Phe Gly Gly Ser Ala Trp

195 200 205

Glu Tyr Ser Pro Glu Arg Gly Glu Tyr Tyr Leu His Gln Phe Ser Lys

210 215 220

Lys Gln Pro Asp Leu Asn Trp Glu Asn Pro Ala Val Arg Arg Ala Val

225 230 235 240

Tyr Asp Met Met Asn Trp Trp Leu Asp Arg Gly Ile Asp Gly Phe Arg

245 250 255

Met Asp Val Ile Thr Leu Ile Ser Lys Arg Thr Asp Pro Asn Gly Arg

260 265 270

Leu Pro Gly Glu Thr Gly Ser Glu Leu Gln Asp Leu Pro Val Gly Glu

275 280 285

Glu Gly Tyr Ser Ser Pro Asn Pro Phe Cys Ala Asp Gly Pro Arg Gln

290 295 300

Asp Glu Phe Leu Ala Glu Met Arg Arg Glu Val Phe Asp Gly Arg Asp

305 310 315 320

Gly Phe Leu Thr Val Gly Glu Ala Pro Gly Ile Thr Ala Glu Arg Asn

325 330 335

Glu His Ile Thr Asp Pro Ala Asn Gly Glu Leu Asp Met Leu Phe Leu

340 345 350

Phe Glu His Met Gly Val Asp Gln Thr Pro Glu Ser Lys Trp Asp Asp

355 360 365

Lys Pro Trp Thr Pro Ala Asp Leu Glu Thr Lys Leu Ala Glu Gln Gln

370 375 380

Asp Ala Ile Ala Arg Arg Gly Trp Ala Ser Leu Phe Leu Asp Asn His

385 390 395 400

Asp Gln Pro Arg Val Val Ser Arg Trp Gly Asp Asp Thr Ser Lys Thr

405 410 415

Gly Arg Ile Arg Ser Ala Lys Ala Leu Ala Leu Leu Leu His Met His

420 425 430

Arg Gly Thr Pro Tyr Val Tyr Gln Gly Glu Glu Leu Gly Met Thr Asn

435 440 445

Ala His Phe Thr Ser Leu Asp Gln Tyr Arg Asp Leu Glu Ser Ile Asn

450 455 460

Ala Tyr His Gln Arg Val Glu Glu Thr Gly Ile Arg Thr Ser Glu Thr

465 470 475 480

Met Met Arg Ser Leu Ala Arg Tyr Gly Arg Asp Asn Ala Arg Thr Pro

485 490 495

Met Gln Trp Asp Asp Ser Thr Tyr Ala Gly Phe Thr Met Pro Asp Ala

500 505 510

Pro Val Glu Pro Trp Ile Ala Val Asn Pro Asn His Thr Glu Ile Asn

515 520 525

Ala Ala Asp Glu Thr Asp Asp Pro Asp Ser Val Tyr Ser Phe His Lys

530 535 540

Arg Leu Ile Ala Leu Arg His Thr Asp Pro Val Val Ala Ala Gly Asp

545 550 555 560

Tyr Arg Arg Val Glu Thr Gly Asn Asp Arg Ile Ile Ala Phe Thr Arg

565 570 575

Thr Leu Asp Glu Arg Thr Ile Leu Thr Val Ile Asn Leu Ser Pro Thr

580 585 590

Gln Ala Ala Pro Ala Gly Glu Leu Glu Thr Met Pro Asp Gly Thr Ile

595 600 605

Leu Ile Ala Asn Thr Asp Asp Pro Val Gly Asn Leu Lys Thr Thr Gly

610 615 620

Thr Leu Gly Pro Trp Glu Ala Phe Ala Met Glu Thr Asp Pro Glu

625 630 635

<210> 18

<211> 2222

<212> ДНК

<213> Corynebacterium glutamicum ATCC13032

<220>

<221> прочий_признак

<222> (1)..(3)

<223> стартовый кодон atg NCgl2176

<220>

<221> прочий_признак

<222> (1033)..(1035)

<223> стоп-кодон tga NCgl2176

<220>

<221> прочий_признак

<222> (1594)..(1596)

<223> кодон cta; стоп-кодон tag NCgl2177 в комплементарной нити

<220>

<221> прочий_признак

<222> (2020)..(2022)

<223> кодон cat; стартовый кодон atg NCgl2177 в комплементарной нити

<220>

<221> прочий_признак

<222> (2023)..(2222)

<223> последовательность, расположенная выше NCgl2177

<400> 18

atggcatttg cagacattgt gcgcagcgtc gaaaaccgca ccaacgcagc gaccctcaac 60

tggtccatca aaaatggctg gaagcccgaa gtcaccggat tttccgggta cggctccggg 120

cgtcgagtgc gcgtccttgc gcgcgtgctc atgtccaacc ccgaaaattt gcttgtcgac 180

gccccctccc aatcaattac ccaacaagca cagcgcggtt ggcgccagtt cttcaccatc 240

caagtgccca acctgccagt aactgtcacc gttggtggga aaacagttac ctcatccacc 300

aacgacaacg gctacgttga cctcctggtg gaagaccaca accttgaccc cggctggcac 360

accatccaga tccaagccga aggttccacc cccgccgaag cccgcgtcct catcgtggaa 420

aacaccgccc gaatcggact catctccgac atcgacgaca ccatcatggt cacctggctt 480

ccccgagcac tcctcgccgc atggaactcg tgggttttgc acaccaacac ccgcaaacca 540

gtccccggaa tgaaccgctt ctacgaagaa ctcctcaaag accaccccga cgcacccgtg 600

ttctacctct ccaccggcgc atggaacacc tttgaaaccc tccaagagtt catcaacaaa 660

cacgcactcc ccgacggccc catgctgctc accgactggg gaccaacccc cacaggacta 720

ttccgctcag gtcaagagca caagaaagtc caactgcgca acctgtttat cgaatacccc 780

gacatgaaat ggatcctcgt cggcgacgat ggccaacacg atcccctcat ctacggcgaa 840

gcagtcgaag aacaccccaa ccgcatcgca ggcgttgcaa tccgtgagct ctcccccggc 900

gaacatgtgc tctcccacgg aacaactgcg tcactgtcca ccatcacgac caacgggggc 960

caaggagtcc cagtagttca cggccgcgat ggatatgagt tgctgcagcg ctacgagacg 1020

aagccgttcg cctgagtcct actgggtgtc tcatgaacca aaccgggtga ccagcgtcgc 1080

cttaattttg ggttcctcgg tcacctagtt tggtccttgg ttgcgttcgc gtatggcata 1140

aatgggcact gactattttt ggggcggggc cccgaggtaa aaggcgattt aagaggttga 1200

gatccccaaa taggcttttg gtatggagga cgcccgttga ggctcttaaa accgattctg 1260

agagacctcg gctttgtgac cagtgggaca gatgagattc ctgcgagctt gctgatcaag 1320

aactcaccac aattgtgtgg ccagaccgtc aaatcgaaca tatttttgca ctaactagac 1380

ccaaacttgc aaaaacccac cacaaacact gtctcgccag caatctgtgg tgaattttcg 1440

cataattgtt cgaccaagag tccgacggta atcaacacgt cacaaaccac cccacaaagt 1500

gcgccaaaaa cccgtggggc ctccctcttc ctctagagag gccccacggg ctggtctatt 1560

tacaccccgc cgagctaaag aatcactggc tttctagtca acgattcgca gctcaacttc 1620

aaaacggtat tcatcagcca gagattccag cactcctcga agtttgtcga gttcgcgtgg 1680

agttccggtg atcacctctc gacactcagt gaggccaagt tcgaatgggt cacggcgcca 1740

tgcagtgaac catcgtgcgg tgagcgggtc cctgttggag ccggacagct ccgaaggact 1800

cggaatacac acaaccattg cggattccac ggtctgacgc agttcctttg gcattccgct 1860

gatttctaga acagcggtat gcattgggag ggctacatcg tcgatggatt cttcgatggt 1920

agttttcagt tggggcaacc ccatgtcttc ccagaagtct gccgtgagca aatccgcctg 1980

atgacgggtc cgggttggca cggttaatgc attgttcgtc atgttcggtt tccttcggca 2040

acacttaact gccttcaatt cccgcacaca tatacaagta gatatgtgca gttactaaag 2100

gaagtaagac gaggttcgtc ttccccaacg gcctcgagct cgcttcaaaa tcccttgaat 2160

gactacacag gcgattgtgg ttgagtaagt ggaccccggc aaccctcaac ttaagcttta 2220

tc 2222

<210> 19

<211> 2222

<212> ДНК

<213> Corynebacterium glutamicum ATCC13869

<220>

<221> прочий_признак

<222> (1)..(2222)

<223> последовательность, гомологичная SEQ ID NO: 18

<220>

<221> прочий_признак

<222> (1)..(3)

<223> стартовый кодон atg BBD29_10725

<220>

<221> прочий_признак

<222> (1033)..(1035)

<223> стоп-кодон tga BBD29_10725

<220>

<221> прочий_признак

<222> (1594)..(1596)

<223> кодон cta; стоп-кодон tag BBD29_10730 в комплементарной нити

<220>

<221> прочий_признак

<222> (2020)..(2022)

<223> кодон cat; стартовый кодон atg BBD29_10730 в комплементарной нити

<220>

<221> прочий_признак

<222> (2023)..(2222)

<223> последовательность, расположенная выше BBD29_10730

<400> 19

atggcatttg cagacattgt gcgcagcgtc gaaaaccgca ccaacgcagc gacccttaac 60

tggtccatca aaaagggctg gaagcccgaa gtcaccggat tttccgggta cggctccggg 120