ПОЛИПЕПТИДЫ, ОБЛАДАЮЩИЕ ЦЕЛЛЮЛАЗНОЙ АКТИВНОСТЬЮ Российский патент 2016 года по МПК C12N9/42 C12N15/56 C12N15/63 

Описание патента на изобретение RU2597289C2

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

Данная заявка претендует на приоритет согласно 35 U.S.C. §119 в отношении предварительной заявки США серийный №61/166993, поданной 6 апреля 2009, и 61/177882, поданной 13 мая 2009, описания которых включены в данную заявку посредством ссылки.

УКАЗАНИЕ ОТНОСИТЕЛЬНО ИССЛЕДОВАНИЯ, ФИНАНСИРУЕМОГО ИЗ ФЕДЕРАЛЬНОГО БЮДЖЕТА

Правительство США обладает определенными правами на данное изобретение в соответствии с Грантом № GM 068664, предоставленным Национальным институтом здравоохранения, и Грантом № DAAD 19-03-0D-0004, предоставленным ARO - US Army Robert Morris Acquisition Center (Центром материально-технического обеспечения армии США Роберта Морриса).

ОБЛАСТЬ ТЕХНИКИ

Изобретение относится к биомолекулярной инженерии и конструированию, и к белкам и нуклеиновым кислотам, полученным методами биоинженерии.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Качество целлюлазных смесей в процессах переработки биомассы зависит от многих свойств фермента, включая стабильность, ингибирование продуктом, синергизм среди различных целлюлазных ингредиентов, продуктивное связывание по сравнению с непродуктивной адсорбцией и рН зависимость, в дополнение к физическому состоянию и композиции целлюлозного субстрата. С учетом многовариантной природы гидролиза целлюлозы желательно иметь разнообразные целлюлазы для выбора из них с целью оптимизации ферментных препаратов для различных областей применения и исходного сырья.

КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

В изобретении предложены рекомбинантные полипептиды, обладающие целлюлазной активностью и повышенной термостойкостью и активностью по сравнению с белком дикого типа. В изобретении предложено и продемонстрировано, что химеры и нативные ферменты CBHII, имеющие мутацию Cys на Ser на С-конце (например, примерно в аминокислоте 310-315 в зависимости от нативной последовательности белка, см., например, SEQ ID NO:2 и 4), гидролизуют более твердую целлюлозу, чем нативный фермент, в анализах на долгосрочный гидролиз.

В изобретении предложен рекомбинантный полипептид, содержащий замену C→S в С-концевой области в мотиве, включающем последовательность GECDG (SEQ ID NO:2 от 312-316), где вариант включает повышенную термостойкость и целлюлазную активность по сравнению с целлобиогидролазой дикого типа. Например, в изобретении предложены полипептиды, обладающие повышенной термостойкостью и целлюлазной активностью, включающие последовательность, которая по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:2, содержащей C314S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:4, содержащей C311S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:12, содержащей C310S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:13, содержащей C312S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:14, содержащей C314S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:15, содержащей C315S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:16, содержащей C313S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:17, содержащей C311S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:19, содержащей C313S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:21, содержащей C312S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:22, содержащей C311S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:64, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:65, содержащей C407S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:66, содержащей C394S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:67, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:68, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:69, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:70, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:71, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:72, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:73, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:74, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:75, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:76, содержащей C407S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:77, содержащей C394S; или по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:78, содержащей C412S, где вышеуказанные полипептиды обладают целлюлазной активностью и улучшенной термостойкостью по сравнению с соответствующим исходным белком дикого типа, в котором отсутствует мутация Cys→Ser.

В изобретении также предложены по существу очищенные полипептиды, которые либо продуцированы рекомбинантным путем, либо получены синтетическим путем или созданы иным неприродным путем, где полипептид содержит последовательность, как изложено ниже, имеющую 1-10, 10-20 или 20-30 консервативных аминокислотных замен за исключением положения, идентифицированного ниже, где присутствует замена C→S: SEQ ID NO:2, содержащую C314S; SEQ ID NO:4, содержащую C311S; SEQ ID NO:12, содержащую C310S; SEQ ID NO:13, содержащую C312S; SEQ ID NO:14, содержащую C314S; SEQ ID NO:15, содержащую C315S; SEQ ID NO:16, содержащую C313S; SEQ ID NO:17, содержащую C311S; SEQ ID NO:19, содержащую C313S; SEQ ID NO:21, содержащую C312S; SEQ ID NO:22, содержащую C311S; SEQ ID NO:64, содержащую C400S; SEQ ID NO:65, содержащую C407S; SEQ ID NO:66, содержащую C394S; SEQ ID NO:67, содержащую C400S; SEQ ID NO:68, содержащую C400S; SEQ ID NO:69, содержащую C400S; SEQ ID NO:70, содержащую C400S; SEQ ID NO:71, содержащую C400S; SEQ ID NO:72, содержащую C400S; SEQ ID NO:73, содержащую C400S; SEQ ID NO:74, содержащую C400S; SEQ ID NO:75, содержащую C400S; SEQ ID NO:76, содержащую C407S; SEQ ID NO:77, содержащую C394S; или SEQ ID NO:78, содержащую C412S.

В изобретении предложен рекомбинантный полипептид, содержащий последовательность, выбранную из группы, состоящей из: (а) полипептида, обладающего по меньшей мере 85% или большей идентичностью SEQ ID NO:2, имеющей Ser в положении 314, где этот полипептид обладает целлюлазной активностью; (b) полипептида, обладающего по меньшей мере 70% или большей идентичностью SEQ ID NO:4, имеющей Ser в положении 311, где этот полипептид обладает целлюлазной активностью; (с) полипептида, обладающего 70% или большей идентичностью последовательности, выбранной из группы, состоящей из: (i) SEQ ID NO:12 и имеющей Ser в положении 310, (ii) SEQ ID NO:13 и имеющей Ser в положении 312, (iii) SEQ ID NO:14 и имеющей Ser в положении 314, (iv) SEQ ID NO:15 и имеющей Ser в положении 315, (v) SEQ ID NO:16 и имеющей Ser в положении 313, (vi) SEQ ID NO:17 и имеющей Ser в положении 311, (vii) SEQ ID NO:19 и имеющей Ser в положении 313, (viii) SEQ ID NO:21 и имеющей Ser в положении 312, и (ix) SEQ ID NO:22 и имеющей Ser в положении и имеющей Ser в положении 311, и где каждый из вышеуказанных полипептидов обладает целлюлазной активностью; и (d) химерного полипептида, содержащего по меньшей мере два домена от двух различных исходных целлобиогидролазных полипептидов, где эти домены содержат от N- к С-концу: (сегмент 1)-(сегмент 2)-(сегмент 3)-(сегмент 4)-(сегмент 5)-(сегмент 6)-(сегмент 7)-(сегмент 8); где: сегмент 1 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка примерно 1 до примерно x1 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 2 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка x1 до примерно x2 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 3 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка x2 до примерно x3 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 4 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка x3 до примерно x4 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 5 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка примерно x4 до примерно x5 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 6 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка x5 до примерно x6 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 7 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка x6 до примерно х7 SEQ ID NO:2 (″1″) или SEQ ID NO:4 (″2″); и сегмент 8 содержит последовательность, по меньшей мере на 50-100% идентичную от аминокислотного остатка x7 до примерно x8 SEQ ID NO:2 (″1″) или SEQ ID NO:4 (″2″); где x1 представляет собой остаток 43, 44, 45, 46 или 47 SEQ ID NO:2, либо остаток 42, 43, 44, 45 или 46 SEQ ID NO:4 или SEQ ID NO:6; x2 представляет собой остаток 70, 71, 72, 73 или 74 SEQ ID NO:2, либо остаток 68, 69, 70, 71, 72, 73 или 74 SEQ ID NO:4 или SEQ ID NO:6; x3 представляет собой остаток 113, 114, 115, 116, 117 или 118 SEQ ID NO:2, либо остаток 110, 111, 112, 113, 114, 115 или 116 SEQ ID NO:4 или SEQ ID NO:6; x4 представляет собой остаток 153, 154, 155, 156 или 157 SEQ ID NO:2, либо остаток 149, 150, 151, 152, 153, 154, 155 или 156 SEQ ID NO:4 или SEQ ID NO:6; x5 представляет собой остаток 220, 221, 222, 223 или 224 SEQ ID NO:2, либо остаток 216, 217, 218, 219, 220, 221, 222 или 223 SEQ ID NO:4 или SEQ ID NO:6; x6 представляет собой остаток 256, 257, 258, 259, 260 или 261 SEQ ID NO:2, либо остаток 253, 254, 255, 256, 257, 258, 259 или 260 SEQ ID NO:4 или SEQ ID NO:6; x7 представляет собой остаток 312, 313, 314, 315 или 316 SEQ ID NO:2, либо остаток 309, 310, 311, 312, 313, 314, 315 или 318 SEQ ID NO:4; и х8 представляет собой аминокислотный остаток, соответствующий С-концу полипептида, имеющего последовательность SEQ ID NO:2, SEQ ID NO:4 или SEQ ID NO:6, где химерный полипептид содержит Ser в положении 314 SEQ ID NO:2 или в положении 311 SEQ ID NO:4, и где химерный полипептид обладает целлюлазной активностью и улучшенной термостойкостью и/или рН стабильностью по сравнению с полипептидом СВН II, содержащим SEQ ID NO:2, 4 или 6. В одной форме осуществления рекомбинантного полипептида сегмент 1 содержит аминокислотные остатки от примерно 1 до примерно x1 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″) и имеет 1-10 консервативных аминокислотных замен; сегмент 2 составляют аминокислотные остатки от примерно x1 до примерно x2 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 3 составляют аминокислотные остатки от примерно x2 до примерно x3 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 4 составляют аминокислотные остатки от примерно x3 до примерно x4 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 5 составляют аминокислотные остатки от примерно x4 до примерно x5 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 6 составляют аминокислотные остатки от примерно x5 до примерно x6 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 7 составляют аминокислотные остатки от примерно х6 до примерно x7 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; и сегмент 8 составляют аминокислотные остатки от примерно x7 до примерно x8 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен за исключением положения 314 SEQ ID NO:2, положения 311 SEQ ID NO:4 или 313 SEQ ID NO:6. Еще в одной другой форме осуществления химерный полипептид содержит последовательность, которая по меньшей мере на 80%, 90%, 95%, 98% или 99% идентична последовательности, выбранной из группы, состоящей из SEQ ID NO:12-62 и 63.

В изобретении также предложен рекомбинантный полипептид, состоящий из последовательности, как представлено в SEQ ID NO:12-62 или 63.

В изобретении также предложен полинуклеотид, кодирующий любой из полипептидов, как описано выше, векторы, содержащие полинуклеотид, и клетки-хозяева, содержащие полинуклеотид или вектор.

В изобретении также предложен ферментный препарат, содержащий полипептид по изобретению по существу в очищенной форме или в виде части клеточного лизата.

В изобретении также предложен способ обработки биомассы, содержащей целлюлозу, включающий приведение биомассы в контакт с полипептидом или ферментным препаратом по изобретению.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

Фиг.1А-В Электрофорез в ДСН-ПААГ супернатантов дрожжевой экспрессионной культуры родительского гена-кандидата СВН II. (А) Дорожки геля (слева направо): 1 - Н. jecorina, 2 - пустой вектор, 3 - H. insolens, 4 - С. thermophilum, 5 - Н. jecorina (второй повтор), 6 - Р. chrysosporium, 7 - Т. emersonii, 8 - пустой вектор (второй повтор), 9 - Н. jecorina (третий повтор). Цифрами внизу геля представлена концентрация восстанавливающего сахара (мкг/мл), присутствующего в реакционной смеси анализа гидролиза PASC после 2 ч при 50°С. Последующее сравнение ДСН-ПААГ со стандартом БСА дало возможность оценки уровня экспрессии Н. insolens как 5-10 мг/л. (В) Показан анализ с помощью электрофореза в ДСН-ПААГ супернатантов экспрессионной культуры S. cerevisiae СВН II. Полосы СВН II видны непосредственно ниже стандарта молекулярной массы 60 кДа. Дорожки, слева направо, 1 - дикий тип Н. jeco, 2 - Н. jeco B7P3, 3 - Н. jeco C311S, 4 - дикий тип С. ther, 5 - дикий тип Н. inso, 6 - Н. inso B7P3, 7 - Н. inso C314S. Цифрами обозначены мкг эквиваленты глюкозы/мл объема реакционной смеси на мл эквивалент супернатанта экспрессионной культуры в ДСН-ПААГ, продуцированной в течение 100-минутной инкубации с PASC (1 мг/мл) при 50°С в 50 мМ ацетате натрия, рН 4,8. Значения для дорожек 1-4 разделены на 2 для коррекции на двукратный объем нанесенного концентрированного супернатанта культуры, где отсутствие этой коррекции сделало бы значения удельной активности ферментов Н. insolens искусственно низкими.

На фиг.2А-С показаны иллюстрации границ блоков библиотеки химер СВН II. (А) ленточная диаграмма каталитического домена Н. insolens СВН II с блоками, различающимися по цвету. Фермент СВН II образует комплекс с ингибитором гликозидазы изофагомином целлобиозного происхождения. (В) Линейное представление каталитического домена Н. insolens, показывающее элементы вторичной структуры, дисульфидные связи и деления на блоки, обозначенные черными стрелками. (С) Карта контактов боковых цепей, обозначающая контакты (тяжелые атомы боковых цепей в пределах 4,5 Å), которые могут быть разрушены посредством рекомбинации. Большинство разрушенных контактов возникает между блоками, следующими друг за другом.

На фиг.3 показано число разрушенных контактов (Е) и число мутаций по отношению к ближайшему родителю (m) для 23 секретированных/активных и 15 несекретированных/неактивных химер серии образцов.

На фиг.4 показана удельная активность, нормализованная на рН 5,0, как функция рН для родительских ферментов СВН II и трех термостойких химер. Представленные данные представляют собой средние для двух повторов, где ″усы″ для значений HJPlus и Н. jeco обозначают исследования для двух независимых испытаний. 16-часовая реакция, 300 мкг фермента/г PASC, 50°С, буфер 12,5 мМ цитрат натрия/12,5 мМ фосфат натрия при рН, как показано.

На фиг.5 показаны результаты анализа долговременного гидролиза целлюлозы (мкг эквиваленты восстанавливающего сахара глюкозы/мкг фермента СВН II) для родителей и термостойких химер на протяжении диапазона температур. ″Усы″ указывают стандартные ошибки для трех повторов ферментов СВН II HJPlus и Н. insolens. 40-часовая реакция, 100 мкг фермента/г PASC, 50 мМ ацетат натрия, рН 4,8.

На фиг.6 показаны нормализованные остаточные активности для оценки серии химер после 12-часовой инкубации при 63°С. Остаточные активности для ферментов СВН II в концентрированных супернатантах культуры определены в 2-часовом анализе с PASC в качестве субстрата, 50°С, буфер 25 мМ ацетат натрия, рН 4,8.

Фиг.7 Карта родительского и химерного экспрессионного вектора для фермента СВН II Yep352/PGK91-1-ss. Изображенный вектор содержит ген дикого типа Н. jecorina ceI6a (фермент СВН II). Как для химерного, так и для родительского фермента СВН II аминокислотная последовательность CBD/линкера, следующая за сайтом ss Lys-Arg Kex2, представляет собой:

ASCSSVWGQCGGQNWSGPTCCASGSTCVYSNDYYSQCLPGAASSSSSTRAA

STTSRVSPTTSRSSSATPPPGSTTTRVPPVGSGTATYS (SEQ ID NO:8).

На фиг.8 показаны наблюдаемые и предсказанные значения T50 для родительских СВН II и 51 химерного СВН II. Кривая обозначает уравнение модели линейной регрессии (параметры в таблице 7). Значения Т50 родительского СВН II обозначены в виде квадратов.

На фиг.9А-С показаны удельные активности СВН II в отношении Avicel в зависимости от температуры, (а) удельные активности родительского и химерного СВН II. (b) удельные активности родительского СВН II, мутанта C311S химеры В7Р3 с заменой одного блока. Реакции проводили в течение 16 часов в 50 мМ ацетате натрия, рН 4,8, при концентрации Avicel 15 мг/мл. (с) активности родительского СВН II, одиночного точечного мутанта химеры с заменой одного блока (мкг/глюкоза/мл реакционной смеси) в отношении Avicel в зависимости от температуры. Реакции проводили в течение 150 минут в 50 мМ ацетате натрия, рН 4,8, при концентрации Avicel 15 мг/мл. Супернатанты дрожжевой культуры СВН II дозировали до достижения приблизительно эквивалентных концентраций продукта восстанавливающего сахара при 55°С. Представленные данные представляют собой средние двух независимых повторов, где усы указывают значения активности двух повторов для каждой температурной точки.

На фиг.10 показано множественное выравнивание последовательностей ClustalW для блока 7 от родителя 1, Н. insolens, и родителя 3, C.thermophilum. Стрелками обозначены остатки, измененные в реверсионных мутантах.

На фиг.11 показаны значения Т50 для точечных мутантов химеры 21111331. Значения показаны в виде среднего двух независимых повторов, усы указывают значения Т50 двух повторов для каждого точечного мутанта. Инактивацию осуществляли в течение 10 минут при тестируемой температуре в 50 мМ натрийацетатном буфере, рН 4,8. Остаточную активность определяли путем инкубации с 1 г/л целлюлозы, набухшей в фосфорной кислоте (PASC), в вышеуказанном буфере в течение 100 минут при 50°С.

На фиг.12 показаны значения Т50 для родительских СВН II Н. insolens и Н. jecorina, одиночных точечных мутантов Ser химер с заменой блока В7Р3. Значения показаны в виде среднего трех независимых повторов, усы указывают одно стандартное отклонение для каждого СВН II. Инактивацию осуществляли в течение 10 минут при тестируемой температуре в 50 мМ натрийацетатном буфере, рН 4,8. Остаточную активность определяли путем инкубации с 1 г/л целлюлозы, набухшей в фосфорной кислоте (PASC), в вышеуказанном буфере в течение 100 минут при 50°С.

На фиг.13 показаны значения Т50 для химер СВН II 31311112, 13231111 и каталитического домена СВН II дикого типа из Р. chrysosporium (слитого с Н. jecorina CBM), гетерологично секретированных из S. cerevisiae. Значения показаны в виде двух независимых повторов, где усы показывают значения для каждого испытания. Инактивацию осуществляли в течение 10 минут при тестируемой температуре в 50 мМ натрийацетатном буфере, рН 4,8. Остаточную активность определяли путем инкубации с 1 г/л целлюлозы, набухшей в фосфорной кислоте (PASC), в вышеуказанном буфере в течение 100 минут при 50°С.

На фиг.14A-D показаны границы раздела блоков рекомбинации СВН II. (а) сайты между блоками, где возможны новые неродительские пары остатков (соединенные круги), обычно экспонированы на поверхности, потенциально давая возможность растворителю экранировать взаимодействия. (b) Примерная граница раздела (В5-В6) иллюстрирует консервативность каркаса (изображения выровненных Н. jecorina и Н. insolens), вариабельные остатки на поверхности и сравнительно редкую возможность новой углубленной пары при остатках 173 и 253 (стрелка), (с) блоки 1-4 от Н. jecorina (черный рисунок) совпадают с родственными блоками Н.insolens (рисунок с цветовой маркировкой) без больших отклонений, хотя наблюдается перемещение, обусловленное связыванием субстрата (стрелка), в участке ВЗ (желтый), (d) родственные блоки 5-8 также являются сходными, хотя вставка-делеция на стыке В6, В7 (стрелка) потребует конформационного изменения.

На фиг.15 показан структурный анализ мутации C314S и ее стабилизирующий эффект, (а) Положения водорода для структуры высокого разрешения H.insolens (1ocn) были добавлены с помощью REDUCE.1 (b) Реконструкция геометрии аналогичной сериновой структуры было смоделировано с помощью PyMOL (http:(//)www.pymol.org). Оптимизация боковых цепей в платформе моделирования SHARPEN2 (с функцией энергии всех атомов Rosetta) также позволила предположить, что, как Cys314, так и Ser314 будут донорами водородной связи для карбонила Pro339 и акцепторами водородной связи от амида Gly316. Наилучшая способность серина к водородному связыванию может играть роль в более высокой стабильности серинсодержащих вариантов. Другим возможным объяснением является геометрическая комплементарность. Конкретно, положение Cys из 1ocn проявляет данные о конформационном напряжении, при котором боковая цепь заметно согнута (то есть неправильный угол между двумя плоскостями от N-C-Cα-Cβ составляет 6° от стандартного положения), увеличивая расстояние до карбонила Pro. Цифры на фиг., которым не предшествуют буквы, обозначают расстояния водородных связей (Å).

ПОДРОБНОЕ ОПИСАНИЕ

Как используют в описании и в прилагаемой формуле изобретения, формы единственного числа включают ссылки на множественное число, если контекст четко не диктует иное. Так, например, ссылка на ″домен″ включает множество таких доменов, и ссылка на ″белок″ включает ссылку на один или более чем один белок, и т.д.

Также использование ″или″ означает ″и/или″, Если не указано иное. Подобным образом, ″содержат″, ″содержит″, ″содержащий″, ″включают″, ″включает″ и ″включающий″ являются взаимозаменяемыми и не предназначены для ограничения.

Кроме того, должно быть понятно, что, где в описаниях различных форм осуществления используют термин ″содержащий″, специалистам в данной области техники должно быть понятно, что в некоторых конкретных случаях форма осуществления может быть описана альтернативно, используя выражение ″состоящий по существу из″ или ″состоящий из″.

Хотя методы и материалы, подобные или эквивалентные описанным в данной заявке, можно использовать в практике раскрытых способов и композиций, в данной заявке описаны примерные способы, устройства и материалы.

Если не определено иное, все технические и научные термины, используемые в данной заявке, имеют такое же значение, как общепринято понимают обычные специалисты в области техники, к которой принадлежит данное изобретение. Таким образом, как используют на протяжении всей настоящей заявки, приведенные ниже термины имеют следующие значения.

В недавних исследованиях документированы превосходные характеристики целлюлаз из термофильных грибов относительно их мезофильных аналогов в процессах преобразования биомассы в лабораторном масштабе, где усиленная стабильность приводит к сохранению активности в течение более длительных периодов времени как при умеренных, так и при повышенных температурах. Целлюлазы грибов привлекательны, поскольку обладают высокой активностью и могут экспрессироваться в хозяевах-грибах, таких как Hypocrea jecorina (анаморф Trichoderma reesei), на уровнях вплоть до 40 г/л в супернатанте. К сожалению, набор документированных термостойких целлюлаз грибов мал. В случае процессивных ферментов целлобиогидролаз класса II (СВН II) менее 10 последовательностей природных термостойких генов аннотировано в базе данных CAZy.

Как более полно описано в данной заявке, с использованием рекурсивного создания химерных полипептидов и анализа конкретных стабилизированных доменов, наконец, были идентифицированы конкретные аминокислоты, придающие термостойкость и улучшенную активность.

Как более подробно описано ниже, изобретение основано, по меньшей мере частично, на создании и экспрессии новых ферментов, которые катализируют гидролиз целлюлозы. В одной форме осуществления предложены новые полипептиды, которые сконструированы для гидролиза целлюлозы при повышенных температурах. Такие полипептиды включают варианты целлобиогидролаз, которые изменены таким образом, что включают аминокислотные замены в указанных остатках. Хотя эти варианты описаны более подробно ниже, понятно, что полипептиды по изобретению могут содержать одну или более чем одну модифицированную аминокислоту. Присутствие модифицированных аминокислот может обладать преимуществом, например, при (а) увеличении периода полураспада полипептида, (b) термостойкости и (с) повышенному круговороту субстрата. Аминокислота(ы) модифицирована, например, котрансляционно или посттрансляционно во время рекомбинантного продуцирования (например, N-сцепленное гликозилирование при мотивах N-X-S/T во время экспрессии в клетках млекопитающих), либо модифицирована синтетическими способами. Соответственно, ″мутант″, ″вариант″ или ″модифицированный″ белок, фермент, полинуклеотид, ген или клетка означают белок, фермент, полинуклеотид, ген или клетку, которые изменены или преобразованы, либо являются каким-либо образом отличными или измененными по сравнению с родительским белком, фермент, полинуклеотид, ген или клеткой. Мутант или модифицированный белок или фермент обычно, хотя необязательно, экспрессирован с мутантного полинуклеотида или гена.

″Мутация″ означает любой процесс или механизм, результатом которого является мутантный белок, фермент, полинуклеотид, ген или клетка. Это включает любую мутацию, при которой белок, фермент, полинуклеотид или последовательность гена изменены, и любое обнаружимое изменение в клетке, возникающее в результате такой мутации. Типично мутация происходит в полинуклеотиде или последовательности гена в результате точечных мутаций, делеций или инсерций одного или множественных нуклеотидных остатков. Мутация включает как изменения полинуклеотида, возникающие в пределах кодирующей белок области гена, так и изменения в областях вне последовательности, кодирующей белок, таких как, но не ограниченных ими, регуляторные или промоторные последовательности. Мутация в гене может быть ″молчащей″, то есть не отражающейся в изменении аминокислоты при экспрессии, приводя к варианту гена ″консервативной последовательности″. Обычно это происходит, когда одна аминокислота соответствует более чем одному кодону.

Не ограничивающие примеры модифицированной аминокислоты включают гликозилированную аминокислоту, сульфатированную аминокислоту, пренилированную (например, фарнезилированную, геранилгеранилированную) аминокислоту, ацетилированную аминокислоту, ацилированную аминокислоту, пегилированную аминокислоту, биотинилированную аминокислоту, карбоксилированную аминокислоту, фосфорилированную аминокислоту и тому подобное. В литературе в изобилии имеются ссылки, адекватные для руководства специалиста в данной области техники по модификации аминокислот. Примерные протоколы находятся в Walker (1998) Protein Protocols on CD-ROM (Humana Press, Towata, N.J.).

Рекомбинантные способы продуцирования и выделения модифицированных полипептидов целлобиогидролаз по изобретению описаны в данной заявке. В дополнение к рекомбинантному продуцированию, полипептиды могут быть получены путем прямого синтеза пептидов с использованием твердофазных методов (например, Stewart et al. (1969) Solid-Phase Peptide Synthesis (WH Freeman Co, San Francisco); и Merrifield (1963) J. Am. Chem. Soc. 85: 2149-2154). Пептидный синтез можно осуществлять, используя ручные методы, или путем автоматизации. Автоматизированный синтез может быть достигнут, например, с использованием пептидного синтезатора Applied Biosystems 431A (Perkin Elmer, Foster City, Calif.) в соответствии с инструкциями, предоставленными изготовителем.

″Целлобиогидролаза II″ или ″фермент СВН II″ означает фермент из семейства целлюлаз из 6 белков, который широко распространен в бактериях и грибах. Эти ферменты вовлечены в гидролиз целлюлозы.

Под ″целлюлазной активностью″ подразумевают фермент, который способен к гидролизу целлюлозы. Целлюлаза относится к классу ферментов, продуцируемых грибами, бактериями и простейшими, которые катализируют гидролиз целлюлозы. Однако также существуют целлюлазы, продуцируемые другими типами организмов, такими как растения и животные. Номером ЕС для данной группы ферментов является ЕС 3.2.1.4. Существует пять общих типов целлюлаз, основанных на типе катализируемой реакции: эндоцеллюлаза; экзоцеллюлаза, где в пределах этой категории имеется два основных типа экзоцеллюлаз (или целлобиогидролаз, сокращенно СВН) - один тип работает процессивно с восстанавливающего конца, и один тип работает процессивно с нередуцирующего конца целлюлозы; гидролитические целлобиаза или бета-глюкозидаза; окислительные целлюлазы и целлюлозофосфорилазы, которые деполимеризуют целлюлозу, используя фосфаты вместо воды. Большинство грибных целлюлаз имеет два домена: каталитический домен и целлюлозосвязывающий домен, которые соединены гибким линкером. В конкретных формах осуществления изобретения целлюлазной активностью является активность СВН. Последовательности, описанные в данной заявке, включают в некоторых случаях и целлюлозосвязывающий домен, и каталитический домен, или только каталитический домен. В тех случаях, где предложена последовательность только каталитического домена, понятно, что целлюлозосвязывающий домен (CBD), такой как представлено в SEQ ID NO:8, может быть функционально сцеплен (либо как часть кодирующей последовательности, либо слит позже) с каталитическим доменом, непосредственно или посредством линкера.

″Белок″ или ″полипептид″, где эти термины используют в данной заявке взаимозаменяемо, включает одну или более чем одну цепь химических строительных блоков, называемых аминокислотами, которые связаны вместе химическими связями, называемыми пептидными связями. ″Фермент″ означает любое вещество, предпочтительно полностью или большей частью состоящее из белка, которое катализирует или стимулирует, более или менее специфично, одну или более чем одну химическую или биохимическую реакцию. ″Нативный″ или ″дикого типа″ белок, фермент, полинуклеотид, ген или клетка означает белок, фермент, полинуклеотид, ген или клетку, которые встречаются в природе.

″Аминокислотная последовательность″ представляет собой полимер из аминокислот (белок, полипептид и т.д.) или последовательность символов, представляющую аминокислотный полимер, в зависимости от контекста. Термины ″белок″, ″полипептид″ и ″пептид″ используют в данной заявке взаимозаменяемо. ″Аминокислота″ представляет собой молекулу, имеющую структуру, где центральный атом углерода связан с атомом водорода, группой карбоновой кислоты (атом углерода которой называют в данной заявке ″карбоксильным атомом углерода″), аминогруппой (атом азота которой называют в данной заявке ″амино-атомом азота″) и группой боковой цепи, R. Когда она включена в пептид, полипептид или белок, аминокислота теряет один или более чем один атом ее карбоксильных групп аминокислоты в реакции дегидрирования, которая связывает одну аминокислоту с другой. В результате, когда аминокислота включена в белок, ее называют ″аминокислотным остатком″.

Конкретная аминокислотная последовательность данного белка (то есть ″первичная структура″ полипептида, записанная от амино-конца к карбокси-концу) определяется нуклеотидной последовательностью кодирующего участка мРНК, который, в свою очередь, определен генетической информацией, типично геномной ДНК (включая ДНК органелл, например, митохондриальную или хлоропластную ДНК). Таким образом, определение последовательности гена помогает при предсказании первичной последовательности соответствующего полипептида и более конкретно роли или активности полипептидов или белков, кодируемых этим геном или полинуклеотидной последовательностью.

″Консервативная аминокислотная замена″ или просто ″консервативные вариации″ конкретной последовательности относятся к замене одной аминокислоты или группы аминокислот по существу идентичными аминокислотными последовательностями. Специалисту в данной области техники понятно, что результатом индивидуальных замен, делеций или добавлений, которые изменяют, добавляют или делегируют одну аминокислоту или процентную долю аминокислот в кодируемой последовательности, являются ″консервативные вариации″, где эти изменения приводят в результате к делеций аминокислоты, добавлению аминокислоты или замене аминокислоты химически подобной аминокислотой.

Таблицы консервативных замен, в которых приведены функционально подобные аминокислоты, хорошо известны в данной области техники. Например, одна группа консервативных замен включает аланин (А), серин (S) и треонин (Т). Другая группа консервативных замен включает аспарагиновую кислоту (D) и глутаминовую кислоту (Е). Другая группа консервативных замен включает аспарагин (N) и глутамин (Q). Еще одна другая группа консервативных замен включает аргинин (R) и лизин (К). Другая группа консервативных замен включает изолейцин (I), лейцин (L), метионин (М) и валин (V). Другая группа консервативных замен включает фенилаланин (F), тирозин (Y) и триптофан (W).

Таким образом, ″консервативные аминокислотные замены″ перечисленных полипептидных последовательностей (например, SEQ ID NO:2, 4, 6 и 12-78) включают замены процентной доли, типично менее 10%, аминокислот полипептидной последовательности консервативно подобранной аминокислотой той же группы консервативных замен. Соответственно, консервативно замененная вариация полипептида по изобретению может содержать 100, 75, 50, 25 или 10 замен консервативно замененной вариацией одной и той же группы консервативных замен.

Понятно, что добавление последовательностей, которое не изменяет кодируемую активность молекулы нуклеиновой кислоты, такое как добавление нефункциональной или некодирующей последовательности, является консервативной вариацией базовой нуклеиновой кислоты. ″Активность″ фермента является мерой его активность катализа реакции, то есть ″функции″, и может быть выражена как скорость, с которой образуется продукт реакции. Например, активность фермента может быть представлена как количество продукта, образующегося в единицу времени или на единицу фермента (например, концентрации или массы), либо в отношении констант сродства или диссоциации. Как взаимозаменяемо используют в данной заявке, ″целлобиогидролазная активность или целлюлазная активность″, ″биологическая активность целлобиогидролазы или целлюлазьГ или ″функциональная активность целлобиогидролазы или целлюлазы″ относится к активности, проявляемой белком, полипептидом, обладающим целлюлазной активностью, и в конкретных формах осуществления к целлобиогидролазной активности на целлюлозном субстрате, которая определена in vivo или in vitro в соответствии со стандартными методами.

Специалисту в данной области техники понятно, что многие консервативные вариации нуклеиново-кислотных конструкций, которые раскрыты, дают функционально идентичную конструкцию. Например, как описано выше, благодаря вырожденности генетического кода, ″молчащие замены″ (то есть замены в нуклеиново-кислотной последовательности, которые не приводят в результате к изменению кодируемого полипептида) являются подразумеваемым признаком каждой нуклеиново-кислотной последовательности, которая кодирует аминокислоту. Подобным образом, ″консервативные аминокислотные замены″ в одной или в нескольких аминокислотах в аминокислотной последовательности, замененные другими аминокислотами с высоко подобными свойствами, также легко идентифицируют как высоко подобные раскрытой конструкции. Такие консервативные вариации каждой раскрытой конструкции являются признаком полипептидов, предложенных в данной заявке.

″Консервативные варианты″ представляют собой белки или ферменты, в которых данный аминокислотный остаток изменен без изменения общей конформации и функции белка или фермента, включая, но не ограничиваясь ими, замену аминокислоты другой, обладающей подобными свойствами, включающими полярный или неполярный характер, размер, форму и заряд. Аминокислоты, иные, чем те, которые указаны как консервативные, могут отличаться в белке или ферменте таким образом, что процент подобия белковой или аминокислотной последовательности между двумя белками подобной функции может варьировать и может составлять, например, по меньшей мере 30%, по меньшей мере 50%, по меньшей мере 70%, по меньшей мере 80% или по меньшей мере 90%, как определено в соответствии со схемой выравнивания. В отношении данной заявки ″подобие последовательностей″ означает степень, до которой нуклеотидные или белковые последовательности являются родственными. Степень подобия между двумя последовательностями может быть основана на проценте идентичности и/или консервативности последовательности. ″Идентичность последовательности″ в данной заявке означает степень, до которой две нуклеотидные или аминокислотные последовательности являются инвариантными. ″Выравнивание последовательностей″ означает процесс построения двух или более чем двух последовательностей в одну колонку до достижения максимальных уровней идентичности (и, в случае аминокислотных последовательностей, консервативности) с целью оценки степени подобия. В данной области техники известны многочисленные способы выравнивания последовательностей и оценки подобия/идентичности, такие как, например, кластерный метод, где подобие основано на алгоритме MEGALIGN, а также BLASTN, BLASTP и FASTA (Lipman and Pearson, 1985; Pearson and Lipman, 1988). При использовании всех этих программ предпочтительными установками являются те, которые приводят в результате к самой высокой степени подобия.

Неконсервативными модификациями конкретного полипептида являются те, которые заменяют любую аминокислоту, не характеризующуюся как консервативная замена, например, любая замена, которая выходит за границы шести групп, изложенных выше. Они включают замены основных или кислых аминокислот на нейтральные аминокислоты (например, Asp, Glu, Asn или Gin на Val, lie, Leu или Met), ароматической аминокислоты на основные или кислые аминокислоты (например, Phe, Tyr или Trp на Asp, Asn, Glu или Gin) или любую другую замену, не заменяющую аминокислоту подобной аминокислотой. Основные боковые цепи включают лизин (К), аргинин (R), гистидин (Н); кислые боковые цепи включают аспарагиновую кислоту (D), глутаминовую кислоту (Е); незаряженные полярные боковые цепи включают глицин (G), аспарагин (N), глутамин (Q), серин (S), треонин (Т), тирозин (Y), цистеин (С); неполярные боковые цепи включают аланин (А), валин (V), лейцин (L), изолейцин (I), пролин (Р), фенилаланин (F), метионин (М), триптофан (W); бета-разветвленные боковые цепи включают треонин (Т), валин (V), изолейцин (I); ароматические боковые цепи включают тирозин (Y), фенилаланин (F), триптофан (W), гистидин (Н).

″Родительским″ белком, ферментом, полипептидом, геном или клеткой является любой белок, фермент, полипептид, ген или любая клетка, от которых имеют происхождение или получены другой белок, фермент, полипептид, ген или другая клетка с использованием любых способов, инструментов или методов, независимо от того, является ли сам родитель нативным или мутантным. Родительский полинуклеотид или ген кодирует родительский белок или фермент.

В дополнение к предложенным вариантам полипептидов СВН II предложены химерные полипептиды, которые содержат: 1) вариант домена, изолированного из первой родительской цепи и модифицированного таким образом, что включает аминокислотную замену; и 2) домен, изолированный из второй родительской цепи, либо немодифицированный, либо модифицированный таким образом, что включает новую активность или активность, которая комплементирует этот домен. Способы конструирования химерного полипептида по изобретению раскрыты в данной заявке.

В изобретении предложены варианты, мутанты и химеры целлюлазы и целлобиогидролазы (СВН) II, обладающие повышенной термостойкостью по сравнению с диким типом или родительским белком, где белок дикого типа состоит из SEQ ID NO:2, 4 или 6. Вариант содержит серин в С-концевой области в мотиве, включающем последовательность GEXDG, где Х представляет собой С, А или G (SEQ ID NO:107), где Х заменен серином, где этот вариант включает целлюлазную активность, и где полипептид обладает повышенной термостойкостью по сравнению с целлюлазой дикого типа, в которой отсутствует серин в последовательности GEXDG (SEQ ID NO:107). В одной форме осуществления варианты содержат по меньшей мере мутацию Cys→Ser в мотиве GECDG (см., например, SEQ ID NO:2, аминокислоты 312-316), обнаруженном в большинстве белков целлюлазы и целлобиогидролазы II (как более полно описано ниже), и могут содержать дополнительные мутации, которые улучшают термостойкость или активность. Идентичность между целлюлазами может быть достаточно низкой. Замена на серин, как описано выше, применима к любой целлюлазе, имеющей мотив SEQ ID NO:107 (например, где полипептид обладает по меньшей мере 60% или более высокой идентичностью SEQ ID NO:2 или 4).

Например, в изобретении предложены полипептиды, обладающие повышенной термостойкостью и целлюлазной активностью, включающие последовательность, которая по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:2, содержащей C314S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:4, содержащей C311S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:12, содержащей C310S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:13, содержащей C312S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:14, содержащей C314S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:15, содержащей C315S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:16, содержащей C313S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:17, содержащей C311S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:19, содержащей C313S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:21, содержащей C312S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:22, содержащей C311S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:64, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:65, содержащей C407S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:66, содержащей C394S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:67, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:68, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:69, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:70, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:71, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:72, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:73, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:74, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:75, содержащей C400S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:76, содержащей C407S; по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:77, содержащей C394S; или по меньшей мере на 85%, 90%, 95%, 98%, 99% идентична SEQ ID NO:78, содержащей C412S, где вышеуказанные полипептиды обладают целлюлазной активностью и улучшенной термостойкостью по сравнению с их соответствующим родительским (дикого типа) белком, в котором отсутствует мутация Cys→Ser.

Еще в одной другой форме осуществления в изобретении предложены полипептиды, как описано выше, однако, они дополнительно содержат по меньшей мере одну дополнительную мутацию, которая может быть определена путем выравнивания с SEQ ID NO:64, где SEQ ID NO:64 содержит Pro в положении 413, либо Ser или Thr в положении 231, либо Ser или Thr в положении 305, либо Gin или Asn в положении 410, либо Glu в положении 82, либо любую комбинацию вышеописанного. Подобные замены могут быть идентифицированы путем выравнивания последовательностей аминокислотной последовательности SEQ ID NO:64 с последовательностями SEQ ID NO:2, 4, 6, 12-63 и 65-78.

В изобретении также предложены по существу очищенные полипептиды, которые либо продуцированы рекомбинантным путем, либо получены синтетическим путем, либо образованы иным неприродным путем, где полипептид включает последовательность, как изложено ниже, имеющую 1-10, 10-20 или 20-30 консервативных аминокислотных замен за исключением положения, идентифицированного ниже, где присутствует замена C→S:

SEQ ID NO:2 содержащую C314S;

SEQ ID NO:4 содержащую C311S;

SEQ ID NO:12 содержащую C310S;

SEQ ID NO:13 содержащую C312S;

SEQ ID NO:14 содержащую C314S;

SEQ ID NO:15 содержащую C315S;

SEQ ID NO:16 содержащую C313S;

SEQ ID NO:17 содержащую C311S;

SEQ ID NO:19 содержащую C313S;

SEQ ID NO:21 содержащую C312S;

SEQ ID NO:22 содержащую C311S;

SEQ ID NO:64 содержащую C400S;

SEQ ID NO:65 содержащую C407S;

SEQ ID NO:66 содержащую C394S;

SEQ ID NO:67 содержащую C400S;

SEQ ID NO:68 содержащую C400S;

SEQ ID NO:69 содержащую C400S;

SEQ ID NO:70 содержащую C400S;

SEQ ID NO:71 содержащую C400S;

SEQ ID NO:72 содержащую C400S;

SEQ ID NO:73 содержащую C400S;

SEQ ID NO:74 содержащую C400S;

SEQ ID NO:75 содержащую C400S;

SEQ ID NO:76 содержащую C407S;

SEQ ID NO:77 содержащую C394S; или

SEQ ID NO:78 содержащую C412S.

″Изолированный полипептид″ относится к полипептиду, который отделен от других примесей, которые естественно сопровождают его, например, белков, липидов и полинуклеотидов. Этот термин охватывает полипептиды, которые извлечены или очищены из их естественной окружающей среды или экспрессионной системы (например, клетки-хозяина или синтеза in vitro).

″По существу чистый полипептид″ относится к композиции, в которой the полипептидное соединение является преобладающим присутствующим соединением (то есть на молярной или массовой основе он является более представленным, чем любые другие индивидуальные макромолекулярные соединения в композиции), и обычно представляет собой по существу очищенную композицию, где целевое соединение составляет по меньшей мере примерно 50 процентов моль/моль или % масс/масс присутствующих макромолекулярных соединений. Как правило, по существу чистая полипептидная композиция будет содержать примерно 60% или более, примерно 70% или более, примерно 80% или более, примерно 90% или более, примерно 95% или более и примерно 98% или более моль/моль или % масс/масс всех макромолекулярных соединений, присутствующих в композиции. В некоторых формах осуществления целевое соединение очищают по существу до гомогенности (то есть примесные соединения невозможно обнаружить в композиции общепринятыми способами обнаружения), где композиция состоит по существу из единственного макромолекулярного соединения. Соединение-растворитель, малые молекулы (<500 Дальтон) и элементарные ионные соединения не считают макромолекулярные соединениями.

″Референсная последовательность″ относится к определенной последовательности, используемой в качестве основы для сравнения последовательностей. Референсная последовательность может представлять собой подмножество большей последовательности, например, сегмент полноразмерного гена или полипептидной последовательности. Как правило, референсная последовательность может составлять по меньшей мере 20 нуклеотидов или аминокислотных остатков в длину, по меньшей мере 25 нуклеотидов или остатков в длину, по меньшей мере 50 нуклеотидов или остатков в длину или полную длину нуклеиновой кислоты или полипептида. Поскольку два полинуклеотида или полипептида могут каждый (1) включать последовательность (то есть участок полноразмерной последовательности), которая является подобной между двумя последовательностями, и (2) может дополнительно включать последовательность, которая является различающейся между двумя последовательностями, сравнения последовательности между двумя (или более) полинуклеотидами или полипептидами типично проводят путем сравнения последовательностей двух полинуклеотидов или полипептидов на протяжении ″окна сравнения″, чтобы идентифицировать и сравнить локальные области подобия последовательностей.

″Идентичность последовательности″ означает, что две аминокислотных последовательности по существу идентичны (то есть на основе последовательных аминокислот) на протяжении окна сравнения. Термин ″подобие последовательности″ относится к подобным аминокислотам, которые имеют общие биофизические характеристики. Термин ″процент идентичности последовательности″ или ″процент подобия последовательности″ вычисляют путем сравнения двух оптимально выровненных последовательностей на протяжении окна сравнения, определяя число положений, в которых идентичные остатки (или подобные остатки) встречаются в обеих полипептидных последовательностях, с получением числа совпадающих положений, деления числа совпадающих положений на общее число положений в окне сравнения (то есть на размер окна) и умножения результата на 100 с получением процента идентичности последовательности (или процента подобия последовательности). В отношении полинуклеотидных последовательностей термины идентичность последовательности и подобие последовательности имеют значение, сравнимое с описанным для белковых последовательностей, где термин ″процент идентичности последовательности″ указывает на то, что две полинуклеотидных последовательности идентичны (на основе последовательных нуклеотидов) на протяжении окна сравнения. Как таковой, процент идентичности полинуклеотидной последовательности (или процент подобия полинуклеотидной последовательности, например, для молчащих замен или других замен, на основании алгоритма анализа) может быть также вычислен. Максимальное соответствие можно определить путем использования одного из алгоритмов последовательности, описанных в данной заявке (или других алгоритмов, доступных обычным специалистам в данной области техники), или путем визуальной проверки.

Применительно к полипептидам термин существенная идентичность или существенное подобие означает, что две пептидные последовательности при оптимальном выравнивании, например, с помощью программ BLAST, GAP или BESTFIT с использованием массы гэпов по умолчанию или путем визуальной проверки, обладают идентичностью последовательности или подобием последовательности. Подобным образом, применительно к контексту двух нуклеиновых кислот термин существенная идентичность или существенное подобие означает, что две нуклеиново-кислотные последовательности при оптимальном выравнивании, например, с помощью программ BLAST, GAP или BESTFIT с использованием массы гэпов по умолчанию (описанной в данной заявке в другом месте) или путем визуальной проверки, обладают идентичностью последовательности или подобием последовательности.

Одним из примеров алгоритма, который пригоден для определения процента идентичности последовательности или подобия последовательности, является алгоритм FASTA, который описан в Pearson, W. R. & Lipman, D. J., (1988) Proc. Natl. Acad. Sci. USA 85:2444. См. также W. R. Pearson, (1996) Methods Enzymology 266:227-258. Предпочтительные параметры, используемые при выравнивании последовательностей ДНК FASTA для вычисления процента идентичности или процента подобия, оптимизированы, BL50 Matrix 15: -5, k-tuple = 2; штраф на соединение = 40, оптимизация = 28; штраф на гэп -12, штраф на длину гэпа = -2; и ширина = 16.

Другим примером полезного алгоритма является PILEUP. PILEUP создает множественное выравнивание последовательностей из группы родственных последовательностей с использованием прогрессивных попарных выравниваний, чтобы показать отношение и процент идентичности последовательностей или процент подобия последовательностей. Он также строит дерево или дендрограмму, показывающую кластерные отношения, используемые для создания выравнивания. PILEUP использует упрощение прогрессивного способа выравнивания Feng & Doolittle, (1987) J. Mol. Evol. 35:351-360. Используемый способ подобен способу, описанному Higgins & Sharp, CABIOS 5:151-153, 1989. Эта программа может выравнивать вплоть до 300 последовательностей, каждая максимальной длины 5000 нуклеотидов или аминокислот. Операция множественного выравнивания начинается с попарного выравнивания двух наиболее подобных последовательностей, создавая кластер двух выровненных последовательностей. Затем этот кластер выравнивают со следующей наиболее родственной последовательностью или кластером выровненных последовательностей. Два кластера последовательностей выравнивают путем простого распространения попарного выравнивания двух индивидуальных последовательностей. Конечное выравнивание достигается серией прогрессивных попарных выравниваний. Программа осуществляется путем определения конкретных последовательностей и их координат аминокислот или нуклеотидов для областей сравнения последовательности и путем определения параметров программы. Используя PILEUP, референсную последовательность сравнивают с другими тестируемыми последовательностями для определения отношения процента идентичности последовательностей (или процента подобия последовательностей) с использованием следующих параметров: взвешенные гэпы по умолчанию (3.00), взвешенная длина гэпов по умолчанию (0.10) и взвешенные концы гэпов. PILEUP может быть получена из пакета программ анализа последовательностей GCG, например, версии 7.0 (Devereaux et al., (1984) Nuc. Acids Res. 12:387-395).

Другим примером алгоритма, который пригоден для множественных выравниваний ДНК и аминокислотных последовательностей, является программа CLUSTALW (Thompson, J. D. et al., (1994) Nuc. Acids Res. 22:4673-4680). CLUSTALW проводит множественные попарные сравнения между группами последовательностей и собирает их в множественное выравнивание, основанное на идентичности последовательностей. Штрафы на открытие гэпа и удлинение гэпа составляют 10 и 0,05 соответственно. Для аминокислотных выравниваний можно использовать алгоритм BLOSUM в качестве весовой матрицы белков (Henikoff and Henikoff, (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919).

Как упомянуто выше, члены семейств целлобиогидролаз и целлюлаз могут быть идентифицированы с помощью выравнивания последовательностей, и получена замена в мотиве GECDG (см., например, SEQ ID NO:2, аминокислоты 312-316). Затем модифицированный полипептид можно анализировать на активность, как описано ниже, при различных температурах и условиях, чтобы идентифицировать те модификации, которые вводят благоприятную активность. Примерные последовательности можно найти в приведенных ниже номерах по каталогу GenBank, которые включены в данную заявку посредством ссылки.

Еще в одних других формах осуществления семейство вариантов целлюлазных полипептидов, обладающих улучшенной термостойкостью, включает приведенные в нижеследующей таблице, имеющие замену C→S, G→S или A→S. Кроме того, полипептиды, обладающие 85%, 90%, 95%, 98% или 99% идентичностью последовательности с любой из приведенных ниже последовательностей, имеющих идентифицированные замены, в нижеследующей таблице, обладающие целлюлазной активностью и термостойкостью, также охвачены изобретением.

Р07987 Q6E5B1 GUX2_TRIRE Q6E5B1_9AGAR Q9HEY8 В7Х920 Q9HEY8_TRIRE В7Х920_СОРС1 Q7LSP2 A8NEJ3 Q7LSP2_RIKO A8NEJ3_СОРС7 Q6UJX9 Q96V98 Q6UJX9 TRIVI Q96V98 ORPSP A3QVU7 Q7Z7X6 A3QVU7_TRIVI Q727X6_PIREQ 1HCL5 Q870B2 Q1HCL5_TRIKO Q870B2_9FUNG Q66PN1 Q874E1 Q66PN1_9HYPO Q874E1_ORPSP B5TWC7 A9FHT2 B5TWC7_9HYPO A9FHT2_SORC5 Q9C1S9 BOFEV9 GUX6_HUMIN BOFEV9_9FUNG

Q2GMP2 Q6EY63 Q2GMP2_CHAGB Q6EY63_9FUNG A7E6G7 Q6EH22 A7E6G7_SCLS1 Q6EH22_NEOPR QOUPA5 66EA50 QOUPA5_PHANO B6EA50_NEOPA A6S7A6 80FEV4 A6S7A6_BOTFB 80FEV_NEOPA P49075 6EIY8 GUX3_AGABI Q6EIY8_NEOPR Q02321 Q9UW10 Q02321_PHACH Q9UW10_9FUNG Q9C1R4 Q12646 Q9C1R4_LENED Q12646_NEOPA Q96VU2 Q6A4K7 Q96VU2_LENED Q6A4K7_9FUNG B2ABX7 Q9UW11 B2ABX7_PODAN Q9UW11_9FUNG A4RPH6 Q9P8Q8 A4RPH6_MAGGR Q9P8Q8_9FUNG BOFEV8 BOFEV8_9FUNG

Еще в одних других формах осуществления семейство вариантов целлюлазных полипептидов, обладающих улучшенной термостойкостью, включает приведенные в нижеследующей таблице, имеющие замену C→S, G→S или A→S. Кроме того, полипептиды, обладающие 85%, 90%, 95%, 98% или 99% идентичностью последовательности с любой из приведенных ниже последовательностей, имеющих замены, идентифицированные в нижеследующей таблице, и обладающие целлюлазной активностью и термостойкостью, также охвачены изобретением.

Выравнивание группирования аминокислотного каркаса Н. jecorina CBH II Cys311 на белковые последовательности, обладающие самой высокой идентичностью Н. jecorina CBH II. Показаны остатки в положении, эквивалентном 311, полужирным шрифтом и подчеркиванием. Последовательности рекомбинантных Н. insolens и Р. chrys CBH II, исследованных в данной работе, обозначены как Н. inso и Р. chrys. Пятьдесят четыре из 250 наиболее идентичных последовательностей было исключено вследствие избыточности (то есть точечных мутантов для структурных исследований или >95% идентичных изоформ). Идентифицирован номер по каталогу для целлюлазы, и соответствующая последовательность включена в данную заявку посредством ссылки в виде прямого копирования из номера по каталогу базы данных. Последовательности, соответствующие номерам по каталогу, указаны как SEQ ID NO:79-106. Остаток, подчеркнутый жирным шрифтом (например, С, А или G), заменен S. Номер в скобках, следующий за идентифицированной последовательностью, соответствует SEQ ID NO:)

Для целей изобретения полипептид по изобретению проявляет улучшенную термостойкость по сравнению с соответствующим родительским полипептидом, если он имеет T50, которое по меньшей мере примерно на 4°С или по меньшей мере примерно на 9°С выше, чем для родительской целлюлазы, или целлобиогидролаза имеет Т50 от примерно 4°С до примерно 30°С или на любое количество между ними выше, или Т50 от примерно 9°С до примерно 30°С или на любое количество между ними выше по сравнению с родительской целлобиогидролазой. Т50 представляет собой температуру, при которой модифицированный или природный фермент сохраняет 50% его остаточной активности после предварительной инкубации в течение 15 минут, и определенной с помощью анализа, подробно описанного в приведенных ниже Примерах, или как известно в данной области техники.

Модифицированные целлобиогидролазы или целлюлазы по изобретению могут иметь T50, которое от примерно 4°С до примерно 30°С или на любой интервал между ними выше, чем для соответствующей родительской целлобиогидролазы (например, SEQ ID NO:2, 4 или 6), от примерно 5°С до примерно 20°С или на любой интервал между ними выше, от примерно 8°С до примерно 15°С или на любой интервал между ними выше или от примерно 9°С до примерно 15°С или на любой интервал между ними выше. Например, модифицированная целлюлаза может иметь Т50, которое по меньшей мере примерно на 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28 или 30°С выше, чем для соответствующей родительской целлобиогидролазы.

Варианты, идентифицированные в данной заявке, можно также использовать для создания химерных целлобиогидролаз. Например, SCHEMA использована ранее для создания семейств сотен активных химер ферментов β-лактамазы и цитохрома Р450. SCHEMA использует данные белковой структуры для определения границ непрерывных аминокислотных ″блоков″, которые минимизируют <Е>, библиотечное среднее число контактов боковых цепей аминокислот, когда блоки обмениваются между различными родителями. Показано, что вероятность того, что химера β-лактамазы является уложенной и активной, связана обратной связью со значением Е для этой последовательности. Алгоритм RASPP (Recombination as Shortest Path Problem, рекомбинация как кратчайший путь к решению проблемы) использовали, чтобы идентифицировать границы блоков, которые минимизируют <E> относительно библиотечного среднего числа мутаций, <m>. Более 20% ~500 уникальных химер, охарактеризованных из коллекции β-лактамаз, состоящих из 8 блоков от 3 родителей (38=6561 возможных последовательностей), были каталитически активными. С помощью подобного подхода было получено семейство химер от 3 родителей, 8 блоков цитохрома Р450, содержащее более чем 2300 новых каталитически активных ферментов. Химеры из этих коллекций характеризовались высоким числом мутаций, 66 и 72 аминокислоты в среднем от ближайшего родителя, соответственно. Таким образом, программа SCHEMA/RASPP обеспечила разработку семейств химер, обладающих значительным разнообразием последовательностей и заметной долей функциональных членов.

Также показано, что термостойкости химер SCHEMA могут быть предсказаны на основании данных стабильности последовательности из малой выборки последовательностей. Моделированные данных термической инактивации методом линейной регрессии для 184 химер цитохрома Р450 показало, что блоки SCHEMA вносили аддитивный вклад в термостойкость. С помощью этой модели более 300 химер было предсказано как термостойкие, и все 44, которые были протестированы, были более стабильны, чем наиболее стабильный родитель. Было установлено, что всего лишь 35 измерений термостойкости можно использовать для предсказания наиболее термостойких химер. Кроме того, термостойкие химеры Р450 проявляли уникальные профили активности и специфичности, демонстрируя, что химерогенез может привести к дополнительным полезным свойствам ферментов. В данной заявке рекомбинация ферментов СВН II по SCHEMA может создать химерные целлюлазы, которые активны на целлюлозе, набухающей в фосфорной кислоте (PASC), при высоких температурах, в течение пролонгированных периодов времени и в широких диапазонах рН.

Используя способы, раскрытые в данной заявке, был создан ряд химерных полипептидов, обладающих целлобиогидролазной активностью, обладающих улучшенными характеристиками по сравнению с родительскими белками СВН II дикого типа.

Разнообразное семейство новых ферментов СВН II был сконструировано путем обмена блоков последовательности из трех грибных ферментов СВН II. Двадцать три из 48 химерных последовательностей, отобранных из данной серии, секретировались в активной форме S. cerevisiae, и пять имели период полураспада при 63°С, который был выше, чем у самого стабильного родителя. Учитывая, что данная 48-членная серия образцов составляет менее 1% возможных суммарно 6561 последовательностей, авторы изобретения предсказывают, что данная коллекция химер уже содержит сотни активных термостойких ферментов СВН II, число, которое значительно превышает примерно двадцать грибных ферментов СВН II в базе данных CAZy.

Подход использования данных по стабильности последовательности серии образцов для идентификации блоков, которые вносят положительный вклад в термостойкость химеры, оценивали в результате обнаружения того, что все 10 каталитически активных химер во второй серии оценивания СВН II были более термостойкими, чем наиболее термостойкий родитель, естественно термостойкий СВН II из термостойких грибов, Н. insolens. Это открытие, таким образом, дополнительно позволило создать суммарно 33 новых фермента СВН II, которые экспрессируются в каталитически активной форме в S. cerevisiae, 15 из которых являются более термостойкими, чем наиболее стабильный родитель, из которого они были сконструированы. Эти 15 термостойких ферментов являются различными по последовательности, отличающимися друг от друга и от их ближайших природных гомологов более чем по 94 и 58 положениям аминокислот, соответственно.

Анализ термостойкости химер СВН II в комбинированном образце и в серии оценок показывает, что четыре идентифицированных термостабилизирующих блока, В1Р1, В6Р3, В7Р3 и В8Р2, вносят кумулятивный вклад в термостойкость, когда присутствуют в одной и той же химере. Четыре из пяти химер из серии образцов, которые являются более термостойкими, чем Н. insolens СВН II, содержат два или три из этих термостабилизирующих блоков (Таблица 1). Десять дополнительных членов этой серии оценок, два из которых более стабильны, чем фермент Н. insolens, содержат по меньшей мере два стабилизирующих блока, где пять или шесть термостойких химер в этой группе содержат либо три, либо четыре стабилизирующих блока.

Изобретение демонстрирует, что стабилизирующие блоки можно перекомбинировать, чтобы создать новые высоко стабильные, активные целлюлазы. Регрессионная модель стабильности предсказывает, что библиотека СВН II программы SCHEMA содержит 2026 химер, которые более стабильны, чем наиболее стабильный родительский фермент. Эти химеры являются разнообразными и отличными от нативных целлюлаз: они отличаются о т родителей примерно на 8 и 72 мутации (в среднем на 50) и друг от друга в среднем на 63 мутации. Суммарно 33 гена из этой серии было синтезировано и экспрессировано в S. cerevisiae: было обнаружено, что каждый из этих СВН II более стабилен, чем наиболее стабильная родительская целлюлаза из термофильного гриба Н. insolens, как измерено либо на основании ее полураспада, либо на основании ее инактивации при 63°С или Т50. Уменьшение сложности последовательности путем создания химер только из восьми блоков дало возможность создания модели стабильности последовательности и идентификации одного высоко стабилизирующего блока последовательности. За счет тестирования только десяти аминокислотных замен в этом блоке была идентифицирована единственная высоко стабилизирующая замена. Очень большой стабилизирующий эффект замены C313S (в отношении последовательности SEQ ID NO:6; C314S, SEQ ID NO:2 и 0311S, SEQ ID NO:4), наблюдаемый во всех химерах и в нативных ферментах СВН II Р. chrysosporium, Н. insolens и Н. Jecorina, позволил предположить, что мутация любого остатка в данном положении на Ser может стабилизировать любое семейство 6 целлюлаз, в которое она введена.

Минимизация числа разрушенных контактов при рекомбинации (Фиг.2С) дает возможность аппроксимировать блоки как несвязанные единицы, которые вносят независимый вклад в стабильность всего белка, приводя, таким образом, к кумулятивным или даже аддитивным вкладам в термостойкость химеры. Для рекомбинации данного фермента СВН II алгоритм SCHEMA был эффективен при минимизации таких разрушенных контактов: если в кристаллической структуре родительского СВН II Н. insolens определено суммарно 303 межблочных контакта, дизайн СВН II библиотеки SCHEMA приводит в результате только к 33 потенциальным разрушенным контактам. С учетом того, что фермент СВН II родителей не характеризуется очевидными структурными субдоменами, и только четыре из восьми блоков (1, 5, 7 и 8) напоминают компактные структурные единицы или модули, низкое число разрушенных контактов демонстрирует, что алгоритм SCHEMA/RASPP эффективен для случаев, в которых число блоков оказывается более высоким, чем число структурных подразделений. Как наблюдали ранее для химер β-лактамазы и цитохрома Р450, низкие значения Е были предсказательными для укладки и активности химер. Хотя это не использовано в данной заявке, данное отношение должно быть значимым для конструирования серий химерных образцов, которые содержат высокую долю активных членов.

В изобретении также использована химера, чтобы определить, можно ли улучшить стабильность рН в ферментах СВН II. Если удельная активность Н. jecorina СВН II резко снижается, когда рН повышается выше оптимального значения 5, HJPlus, созданный путем замещения стабилизирующих блоков на наиболее промышленно релевантном ферменте Н. jecorina СВН II, сохраняет значительно более высокую активность при этих более высоких рН (Фиг.4). Термостойкие химеры 11113132 и 13311332, а также родительские целлюлазы Н. insolens и С. thermophilum СВН II имеют даже более широкие профили рН/активности, чем HJPlus. Узкий профиль рН/активности Н. jecorina СВН II считают связанным с депротонированием нескольких пар карбоксил-карбоксилат, которое дестабилизирует белок выше рН ~6. Замещение родителя 3 в блоке 7 в HJPlus изменяет аспартат 277 на гистидин, элиминируя пару карбоксил-карбоксилат между D277 и D316 (блока 8). Замещение D277 положительно заряженным гистидином может предотвратить дестабилизирующее отталкивание зарядом при некислом рН, давая возможность HJPlus сохранять активность при более высоком рН, чем Н. jecorina СВН II. Даже более широкие профили рН/активности двух остальных термостойких химер и родительских ферментов СВН II Н. insolens и С.thermophilum может быть следствием отсутствия кислых остатков в положениях, соответствующих паре карбоксил-карбоксилат Е57-Е119 HJPlus и Н. jecorina СВН II.

HJPlus проявляет как относительно высокую удельную активность, так и высокую термостойкость. На фиг.5 показано, что эти свойства приводят к хорошим характеристикам в экспериментах по долговременному гидролизу: HJPlus гидролизовал целлюлозу при температурах на 7-15°С выше, чем родительские ферменты СВН II, а также обладал значительно повышенной долговременной активностью относительно всех родителей при их температурном оптимуме, улучшая Н. jecorina CBH II в 1,7 раза. С учетом того, что удельная активность химеры HJPlus меньше, чем у родителя Н. jecorina CBH II, эту повышенную долговременную активность можно считать следствием способности термостойкой HJPlus к сохранению активности при оптимальных температурах гидролиза в течение более длительного времени реакции.

Две другие термостойкие химеры имели общий с HJPlus широкий температурный диапазон. Это наблюдение подтверждает положительную корреляцию между t1/2 при повышенной температуре и максимумом рабочей температуры, и позволяет предположить, что многие термостойкие химеры среди 6561 последовательностей химер CBH II будут также способны к расщеплению целлюлозы при повышенных температурах. Хотя эта способность к гидролизу аморфного субстрата PASC при повышенных температурах хорошо предсказывает потенциальную пользу термостойких химер грибного CBH II, исследования с более проблемными кристаллическими субстратами и субстратами, содержащими лигнин, обеспечат более полную оценку релевантности этих новых семейств фермента CBH II для применений при расщеплении биомассы.

В большинстве процессов преобразования биомассы используют смеси грибных целлюлаз (прежде всего CBH II, целлобиогидролазы класса I (CBH I), эндоглюканаз и β-глюкозидазы) для достижения высоких уровней гидролиза целлюлозы. Создание разнообразной группы термостойких химер фермента CBH II является первой стадией в построении материального запаса стабильных, высокоактивных целлюлаз, из которых можно готовить смеси ферментов и оптимизировать для конкретных применений и исходного сырья.

″Пептидный сегмент″ относится к участку или фрагменту большего полипептида или белка. Пептидный сегмент необязательно сам обладает собственной функциональной активностью, хотя в некоторых случаях пептидный сегмент может соответствовать домену полипептида, где этот домен обладает своей собственной биологической активностью. Пептидным сегментом, обусловливающим стабильность, является пептидный сегмент, находящийся в полипептиде, который стимулирует стабильность, функцию и укладку по сравнению с родственным полипептидом, в котором отсутствует этот пептидный сегмент. Пептидным сегментом, обусловливающим дестабилизацию, является пептидный сегмент, который идентифицирован как вызывающий утрату стабильности, функции или укладки, когда он присутствует в полипептиде.

″Слитый″, ″оперативно сцепленный″ и ″оперативно связанный″ используют в данной заявке взаимозаменяемо для широкой ссылки на химическое или физическое сочетание двух доменов или пептидных сегментов, отличающихся во всем остальном, где каждый домен или пептидный сегмент при оперативном сцеплении может обеспечить функциональный полипептид, обладающий желаемой активностью. Домены или пептидные сегменты могут быть соединены посредством пептидных линкеров таким образом, что они являются функциональными, или могут быть слиты посредством других промежуточных соединений или химических связей. Например, два домена могут составлять часть одной и той же кодирующей последовательности, где полинуклеотиды находятся в одной рамке считывания, так что этот полинуклеотид при транскрипции кодирует единую мРНК, которая при трансляции включает оба домена в виде единого полипептида. Альтернативно оба домена могут экспрессироваться по отдельности в виде индивидуальных полипептидов, и их сливают друг с другом, используя химические способы. Типично кодирующие домены сцеплены ″в рамке″ либо непосредственно, либо разделены пептидным линкером, и кодируются в виде единого полипептида. Различные кодирующие последовательности для пептидных линкеров и пептида известны в данной области техники.

″Полинуклеотид″ или ″нуклеиново-кислотная последовательность″ относится к полимерной форме нуклеотидов. В некоторых случаях полинуклеотид относится к последовательности, которая не является непосредственно примыкающей к любой из кодирующих последовательностей, к которой она непосредственно примыкает (либо на 5′ конце, либо на 3′ конце) в природном геноме организма, от которого она имеет происхождение. Этот термин, таким образом, включает, например, рекомбинантную ДНК, которую встраивают в вектор; в автономно реплицирующуюся Плазмиду или вирус; либо в геномную ДНК прокариота или эукариота, либо которая существует в виде отдельной молекулы (например, кДНК) независимо от других последовательностей. Нуклеотиды по изобретению могут представлять собой рибонуклеотиды, дезоксирибонуклеотиды или модифицированные формы любого нуклеотида. Полинуклеотиды, как используют в данной заявке, относятся среди прочего к одно- и двунитевой ДНК, ДНК, которая представляет собой смесь одно- и двунитевых участков, одно- и двунитевой РНК и РНК, которая представляет собой смесь одно- и двунитевых участков, к гибридным молекулам, содержащим ДНК и РНК, которые могут быть однонитевыми или, более типично, двунитевыми или представлять собой смесь одно- и двунитевых участков. Термин полинуклеотид охватывает как геномную ДНК или РНК (в зависимости от организма, то есть РНК геном вирусов), так и мРНК, кодируемую геномной ДНК, и кДНК.

″Нуклеиново-кислотный сегмент,″ ″олигонуклеотидный сегмент″ или ″полинуклеотидный сегмент″ относится к участку большей полинуклеотидной молекулы. Полинуклеотидный сегмент необязательно должен соответствовать кодируемому функциональному домену белка; однако, в некоторых случаях сегмент кодирует функциональный домен белка. Полинуклеотидный сегмент может составлять примерно 6 нуклеотидов или более в длину (например, 6-20, 20-50, 50-100, 100-200, 200-300, 300-400 или более нуклеотидов в длину). Пептидный сегмент, обусловливающий стабильность, может кодироваться полинуклеотидным сегментом, обусловливающим стабильность, где этот пептидный сегмент стимулирует стабильность, функцию или укладку по сравнению с полипептидом, в котором отсутствует этот пептидный сегмент.

″Химера″ относится к комбинации по меньшей мере двух сегментов по меньшей мере двух различных родительских белков. Как понятно специалисту в данной области техники, сегменты необязательно действительно происходят от каждого из родителей, то есть представляют собой конкретную последовательность, которая является релевантной, а не сами по себе физические нуклеиновые кислоты. Например, химерные грибные целлобиогидролазы класса II (целлюлазы СВН II) будут иметь по меньшей мере два сегмента от двух различных родительских полипептидов СВН II. Эти два сегмента соединены таким образом, что приводят в результате к новому полипептиду, обладающему целлюлазной активностью. Иными словами, белок не будет химерой, если он имеет идентичную последовательность любому из полноразмерных родителей. Химерный полипептид может содержать более чем два сегмента от двух различных родительских белков. Например, для каждой конечной химеры или библиотеки химер может быть 2, 3, 4, 5-10, 10-20 или более родителей. Сегмент каждого родительского полипептида может быть очень коротким или очень длинным, где сегменты могут иметь диапазон длины непрерывных аминокислот от 1 до 90%, 95%, 98% или 99% всей длины белка. В одной форме осуществления минимальная длина составляет 10 аминокислот. В одной форме осуществления единый кроссоверный сайт определен для двух родителей. Положение кроссовера определяет, где останавливается аминокислотный сегмент одного родителя и где начинается аминокислотный сегмент следующего родителя. Таким образом, простая химера будет иметь только одно положение кроссовера, где сегмент перед этим положением кроссовера будет принадлежать одному родителю, а сегмент после этого положения кроссовера будет принадлежать второму родителю. В одной форме осуществления химера имеет более чем одно положение кроссовера, например, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-30 положений кроссовера или более. Ниже обсуждается, как эти положения кроссовера называют и определяют. В форме осуществления, где имеется два положения кроссовера и два родителя, будет первый непрерывный сегмент от первого родителя, за которым следует второй непрерывный сегмент от второго родителя, за которым следует третий непрерывный сегмент от первого родителя. Непрерывный подразумевают как означающий, что прерывание сегментов не происходит. Эти непрерывные сегменты соединены с образованием непрерывной аминокислотной последовательности. Например, химера СВН II от Humicola insolens (далее в данной заявке ″1″) и Н. jecori (далее в данной заявке ″2″) с двумя кроссоверами в положениях 100 и 150 может иметь первые 100 аминокислот от 1, за которыми следуют следующие 50 от 2, за которыми следуют остальные аминокислоты от 1, где все они соединены в одну непрерывную цепь аминокислот. Альтернативно химера СВН II может иметь первые 100 аминокислот от 2, за которыми следуют следующие 50 от 1, за которыми следуют остальные от 2. Как понятно специалисту в данной области техники, существуют как варианты, так и точные последовательности химер. Таким образом, не 100% каждого сегмента обязательно должно присутствовать в конечной химере, если она является вариантом химеры. Количество, которое может быть изменено, либо посредством дополнительных остатков, либо удаления или изменения остатков, будет определяться так, как определено термином вариант. Конечно, как понятно специалисту в данной области техники, приведенное выше обсуждение применимо не только к аминокислотам, но также к нуклеиновым кислотам, которые кодируют аминокислоты.

Кроме конкретных вариантов, в изобретении описаны варианты, которые можно использовать для создания химер СВН II. Библиотеку направленной рекомбинации SCHEMA использовали для создания ферментов целлобиогидролаз на основе особенно хорошо изученного члена этого семейства разнообразных ферментов, и более конкретно ферментов целлобиогидролаз II: Н. insolens является родителем ″1″ (SEQ ID NO:2), H. jecorina является родителем ″2″ (SEQ ID NO:4), и С. thermophilum является родителем ″3″ (SEQ ID NO:6). SCHEMA представляет собой способ на компьютерной основе для предсказания того, какие фрагменты гомологичных белков могут рекомбинировать, не влияя на структурную целостность белка (см., например, Meyer et al., (2003) Protein Sci., 12:1686-1693). С помощью этого компьютерного подхода идентифицировали семь точек рекомбинации в родительских белках СВН II, что дало возможность создания библиотеки химерных полипептидов СВН II, где каждый полипептид содержит восемь сегментов. Химеры с более высокой стабильностью являются идентифицируемыми путем определения аддитивного вклада каждого сегмента в общую стабильность, либо путем использования линейной регрессии данных по стабильности, либо основываясь на консенсусном анализе MSA уложенных белков по сравнению с развернутыми. Рекомбинация SCHEMA гарантирует, что химеры сохраняют биологическую функцию и проявляют высокое разнообразие последовательности за счет сохранения важных функциональных остатков при обмене толерантных остатков.

Таким образом, как проиллюстрировано различными формами осуществления данной заявки, в изобретении предложены полипептиды СВН II, содержащие химеры родительских доменов, из которых родительская цепь полученной в результате химерной кодирующей последовательности может быть модифицирована таким образом, что содержит замену C→S, как описано выше. В некоторых формах осуществления полипептид содержит химеру, имеющую множество доменов от N- до С-конца из различных родительских белков СВН II: (сегмент 1)-(сегмент 2)-(сегмент 3)-(сегмент 4)-(сегмент 5)-(сегмент 6)-(сегмент 7)-(сегмент 8);

где сегмент 1 включает аминокислотные остатки от примерно 1 до примерно x1 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 2 составляют аминокислотные остатки от примерно x1 до примерно x2 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 3 составляют аминокислотные остатки от примерно x2 до примерно x3 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 4 составляют аминокислотные остатки от примерно x3 до примерно x4 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 5 составляют аминокислотные остатки от примерно x4 до примерно x5 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 6 составляют аминокислотные остатки от примерно x5 до примерно x6 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 7 составляют аминокислотные остатки от примерно х6 до примерно х7 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); и сегмент 8 составляют аминокислотные остатки от примерно х7 до примерно х8 SEQ ID NO:2 (″1″), SEQ ID NQ:4 (″2″) или SEQ ID NO:6 (″3″);

где: x1 представляет собой остаток 43, 44, 45, 46 или 47 SEQ ID NO:2, или остаток 42, 43, 44, 45 или 46 SEQ ID NO:4 или SEQ ID NO:6; x2 представляет собой остаток 70, 71, 72, 73 или 74 SEQ ID NO:2, или остаток 68, 69, 70, 71, 72, 73 или 74 SEQ ID NO:4 или SEQ ID NO:6; x3 представляет собой остаток 113, 114, 115, 116, 117 или 118 SEQ ID NO:2, или остаток 110, 111, 112, 113, 114, 115 или 116 SEQ ID NO:4 или SEQ ID NO:6; x4 представляет собой остаток 153, 154, 155, 156 или 157 SEQ ID NO:2, или остаток 149, 150, 151, 152, 153, 154, 155 или 156 SEQ ID NO:4 или SEQ ID NO:6; x5 представляет собой остаток 220, 221, 222, 223 или 224 SEQ ID NO:2, или остаток 216, 217, 218, 219, 220, 221, 222 или 223 SEQ ID NO:4 или SEQ ID NO:6; x6 представляет собой остаток 256, 257, 258, 259, 260 или 261 SEQ ID NO:2, или остаток 253, 254, 255, 256, 257, 258, 259 или 260 SEQ ID NO:4 или SEQ ID NO:6; x7 представляет собой остаток 312, 313, 314, 315 или 316 SEQ ID NO:2, или остаток 309, 310, 311, 312, 313, 314, 315 или 318 SEQ ID NO:4 или SEQ ID NO:6; и x8 представляет собой аминокислотный остаток, соответствующий С-концу полипептида, имеющего последовательность SEQ ID NO:2, SEQ ID NO:4 или SEQ ID NO:6.

Используя приведенные выше соотношения доменов, был создан ряд химерных структур, которые приведены в таблице 1.

1588 последовательностей химер СВН II, для которых предсказаны более высокие значения T50, чем измеренное значение Т50 64,8°С для родительского СВН II Н. insolens

31313232 13132231 13212231 21113231 2211233 33211132 22223232 32123131 31323333 11221233 13331133 21133232 2122213 33211131 31213132 11221333 11212133 33123232 13232232 22221133 3233313 12311232 22223231 11211231 31313231 33123231 13232231 21133231 3233313 12321333 22322232 11231232 31333232 21311333 22121133 23211232 2213233 33231132 31213131 11231231 11232133 21331333 33223232 23221333 2213233 12311231 31312132 33123332 31333231 32213332 23111232 23211231 3331333 33231131 22322231 33123331 21323112 32213331 23121333 23231232 3331333 12331232 31312131 31321232 21323111 32312332 33223231 11311333 3333333 12331231 31233132 31321231 32113332 21211133 33322232 23231231 3333333 23122232 31233131 33122132 32113331 32312331 23111231 21122133 3321313 23122231 31332132 33122131 31223133 13321(12 33322231 11331333 3321313 11113232 31332131 12123232 21111133 32233332 23131232 11211133 3331213 11123333 23321133 12123231 31322133 13321111 23131231 11231133 3331213 11113231 23222232 32121332 32133332 32233331 11323112 33113132 1231323 11133232 23222231 32121331 32133331 32332332 11323111 33113131 1232333 12221133 11213232 21323133 21131133 21231133 11111133 33133132 3323313 11133231 11223333 13122232 32112132 32332331 11131133 33133131 1231323 31111332 11213231 13122231 32112131 32121232 32221232 31321133 3323313 31111331 11312232 22113132 32132132 32121231 32221231 31222232 3333213 31131332 11322333 22113131 32132131 13313133 22313232 31222231 3333213 13211232 11312231 22133132 21321312 32212132 22323333 12123133 1233323 31131331 11233232 22133131 33112332 32212131 22313231 32111132 1233323 13221333 11233231 23113332 21321311 13333133 22333232 13113232 3231133 13211231 11332232 23113331

33112331 32232132 22333231 13123333 3231133 13231232 11332231 23133332 11223233 32232131 31122232 32111131 3233133 22212332 31211332 23133331 33132332 33212332 31122231 13113231 3233133 13231231 31211331 12212332 11322233 33212331 11321312 32131132 1222313 22212331 31231332 21311232 33132331 22123133 11321311 13133232 1232213 11122133 31231331 12212331 31211232 33232332 22223133 32131131 3111333 22232332 12112332 21321333 31221333 33232331 22322133 13133231 3111333 22232331 31323232 21311231 31211231 23113232 23213232 33111332 3113333 33321232 12112331 12232332 21313333 23123333 23223333 33111331 3221113 33321231 11222133 21331232 31231232 23113231 23213231 33131332 1321323 23323133 31323231 12232331 31231231 23133232 23312232 11321233 3113333 31213332 12132332 21331231 21221112 23133231 23322333 33131331 1322333 31213331 12132331 23112132 21333333 11121112 23312231 13122133 3221113 31312332 321233.3 23112131 21221111 12311133 23233232 12111232 1321323 31312331 32123331 23132132 12112232 11121111 11313333 12121333 1331223 31233332 21121133 23132131 12122333 12212232 23233231 12111231 1332233 31233331 32122132 32223332 1211223 12222333 23332232 12131232 13312231 31332332 32122131 2211133 1213223 12212231 23332231 12131231 32231132 31332331 33122332 3222333 1213223 2:1321233 11221112 32313332 13233232 31121232 33122331 3232233 2121313 12331133 11333333 32313331 32231131 31121231 31221232 2211133 2131213 12232232 11221111 21311133 13233231 22321133 31221231 2122113 1332311 12232231 23222133 21212232 13332232 22222232 21313232 3232233 1332311 13311333 11213133 21222333 13332231 31212132 21323333 2213133 2123313 23122133 11312133 32333332 33211332 22222231 21313231 2213133 2133213 13331333 11233133 21212231 33211331 31212131 21333232 1332313 3212323 11113133 11332133 32333331 33231332 31232132 21333231 322Z213 3212323 11133133 22211232 21331133 33231331 31232131 12122232 3222213 1311113 32223232 22221333 21232232 22122232 23311232 12122231 3331113 1313113 22111232 22211231 21232231 31112132 23321333 22113332 3331113 1232111 22121333 22231232 32213132 22122231 23311231 22113331 3322233 1232111 32223231 22231231 32213131 31112131 23331232 21223133 3322233 3312223 32322232 31323133 32312132 31132132 23331231 21322133 3333113 3312223 22111231 21112232 32312131 33323232 21123133 22133332 3333113 2121133 32322231 21122333 32233132 31132131 23221133 22133331 2312323 1332131 22131232 21112231 32233131 13222133 11311133 13121133 2312323 1332131 22131231 21132232 32332132 33323231 11212232 22112132 1232113 2123133 13211133 21132231 32332131 12211232 11222333 22112131 1222223 1112311 13231133 32113132 33213332 12221333 11212231 22132132 1222223 1231313 11323312 32113131 33213331 12211231 11331133 22132131 1331123 1112311 11323311 11211333 33312332 12231232 11232232 33313132 1332133 2132323 33321133 32133132 33312331 12231231 11232231 33313131 1331123 1233313 33222232 32133131 33233332 23121133 31223232 23112332 2221333 1331333 33222231 11231333 33233331 11112232 21111232 23112331 1333123 3221233 11111333 33113332 33332332 11122333 21121333 33333132 2221333 3221233 11131333 33113331 33332331 11112231 31223231 33333131 2231233 1322111 11223112 33133332 33121232 11132232 31322232 23132332 1333123 1333333 11223111 11323233 33121231 32321232 21111231 23132331 2231233

1322111 11322112 33133331 33212132 11132231 31322231 21211232 1112313 3223233 11322111 31311232 33212131 32321231 21131232 21221333 2223333 3223233 13321233 31321333 12213232 31123232 21131231 21211231 2223333 2211323 22213232 31311231 12223333 31123231 32122332 21231232 2233233 2212333 22223333 31331232 12213231 22323133 32122331 21231231 2233233 2211323 22213231 31331231 12312232 33221232 13123133 12323133 2212123 2213323 22312232 21321112 12322333 33221231 33111132 32311132 3111113 2213323 22322333 33112132 33232132 23313232 33111131 13313232 2212123 1321313 22312231 21321111 12312231 23323333 33131132 13323333 3111113 1331213 22233232 33112131 33232131 23313231 33131131 32311131 3113113 1323313 22233231 12113232 12233232 23333232 21213232 13313231 3113113 1333213 22332232 12123333 12233231 23333231 21223333 32222332 1322113 1112131 22332231 12113231 12332232 11321112 21213231 32222331 2221213 1231133 31121133 33132132 12332231 11321111 21312232 32331132 2221213 1112131 11221312 33132131 32211332 23223133 21322333 13333232 2223213 2212213 11221311 12133232 32211331 23322133 21312231 32331131 2223213 1233133 22222133 12133231 23123133 11313133 21233232 13333231 2321233 3332313 23311133 32111332 32231332 11333133 21233231 33311332 2321233 2311223 23212232 32111331 32231331 22311232 21332232 33311331 2323233 3312233 23222333 31221133 32323232 22321333 21332231 33331332 2323233 2311223 23212231 32131332 12222133 22311231 12121133 22123232 1111123 1111333 23331133 21313133 32323231 31212332 13111232 33331331 1112133 2313223 11213333 32131331 31112332 31212331 13121333 31113132 1111123 2313223 23232232 21333133 31112331 22331232 13111231 22123231 1113123 1113333 11312333 12122133 13311133 22331231 32313132 31113131 1113123 1221113 23232231 13112232 31132332 31232332 32313131 31133132 3131333 2122123 11233333 13122333 13212232 31232331 13131232 31133131 3131333 1223113 11332333 13112231 31132331 21113232 22112332 13223133 3133333 1321133 11121233 13132232 13222333 21123333 13131231 13322133 3133333 2213113 22331331 13111331 33323132 33321132 22121132 11311132 1132113 3322333 21113332 13131332 33323131 33321131 22121131 11311131 1132113 2311133 21113331 13131331 23122332 11111332 23121332 11222332 1132313 3322333 21133332 21212132 23122331 11111331 23121331 11222331 1132313 3332233 22211132 21212131 11113332 11131332 11111132 11331132 1132133 2311133 21133331 21232132 11113331 11131331 11111131 11331131 1132133 3332233 22211131 21232131 11133332 13321232 11131132 21121332 1122113 2313133 22231132 12313332 12211132 13321231 11131131 21121331 1122113 2313133 22231131 12313331 11133331 22223332 22323332 13123132 2132113 3322213 23211332 12333332 12211131 22223331 22323331 13123131 2132113 3322213 23211331 12333331 21221232 22322332 22223132 21223332 1332113 1222323 23231332 33121132 21221231 22322331 22223131 21223331 1332113 1222323 23231331 33121131 12231132 31121132 22322132 21322332 1112113 1232223 21112132 12213132 12231131 31121131 22322131 21322331 1112113 1232223 21112131 12213131 13211332 22222132 23223332 12121132 1132333 3222133 21132132 12312132 13211331 22222131 23223331 12121131 1132333 3222133 23323232 12312131 13231332 23311132 23322332 13121332 1122313

2231333 21132131 21223232 13231331 23311131 23322331 13121331 1122313 2231333 23323231 21223231 11112132 23222332 11313332 21222132 1132213 2233333 11323133 21322232 11112131 23222331 11313331 21222131 1132213 2233333 22321232 12233132 11132132 23331132 11333332 12323332 1122133 3112233 31311132 21322231 32321132 11213332 11333331 12323331 1122133 3112233 22321231 12233131 13323232 23331131 23222132 12223132 2132313 1332113 31311131 12332132 11132131 11213331 23222131 12223131 2132313 1322223 31222332 12332131 32321131 11312332 11213132 12322132 2132133 1322223 31222331 13213332 13323231 11312331 11213131 12322131 2132133 2221313 31331132 13213331 33321332 11233332 11312132 13223332 2122113 2221313 31331131 13312332 33321331 11233331 11312131 13223331 2122113 2231213 12113132 13312331 31123132 11332332 11233132 13322332 1332313 2231213 12113131 13233332 31123131 11332331 11233131 13322331 1332313 2223313 21123232 13233331 33221132 11121232 11332132 13222132 1232113 2223313 21123231 13332332 33221131 11121231 11332131 13222131 1232113 2233213 12133132 13332331 23313132 31323332 22221332 12221332 1332133 2233213 12133131 13121232 12321232 11212132 22221331 12221331 1332133 2321333 13113332 13121231 23313131 31323331 31323132 23121132 1112313 2321333 13113331 32323132 12321231 11212131 31323131 23121131 1112313 2331233 13133332 32323131 23333132 11232132 21122332 11122332 1322113 2331233 13133331 22122332 23333131 11232131 21122331 11122331 1322113 2323333 23221232 22122331 11123232 31223132 11211332 22323132 1112133 2323333 23221231 33323332 11123231 21111132 11211331 22323131 1112133 2333233 11311232 13212132 31121332 31223131 11231332 23323332 2332113 2333233 11321333 33323331 31121331 31322132 11231331 23323331 2332113 2312123 11311231 13212131 13221232 21111131 11323232 23223132 1122333 2312123 11331232 13232132 13221231 31322131 11323231 23223131 1122333 2321213 11331231 13232131 22311132 21131132 31321332 23322132 1132233 2321213 1311213:2 12211332 22311131 21131131 31321331 23322131 1132233 2323213 13112131 12211331 22222332 11223232 12123332 11313132 1122213 2323213 13132132 12231332 22222331 11223231 12123331 11313131 1122213 2221133 13132131 12231331 22331132 11322232 31221132 11333132 2112113 2221133 12111332 33223132 22331131 11322231 31221131 11333131 2112113 1112113 12111331 23111132 23311332 31221332 21313132 22321332 2132333 2223133 11221133 33223131 23311331 31221331 21313131 22321331 2132333 2223133 12131332 33322132 23331332 21313332 21333132 21123332 2122313 2232323 12131331 23111131 23331331 21313331 21333131 21123331 2122313 3131313 33123132 33322131 21113132 21333332 12122132 22221132 2132213 2232323 33123131 12323232 21113131 21333331 12122131 22221131 2132213 3131313 21212332 12323231 21133132 12122332 13132332 23221332 1312113 2111233 21212331 23131132 21133131 12122331 13122331 23221331 1312113 2111233 21232332 23131131 23211132 21213132 11221232 11311332 2122133 3133313 21232331 11112332 23211131 21213131 11221231 11311331 2122133 3133313 32121132 11112331 23231132 21312132 21311332 21122132 1232313 2113233 13123232 11132332 23231131 21312131 21311331 21122131 1232313 2113233 32121131 32321332 11212332 21233132 21331332 11331332 1332333

2322323 13123231 11132331 11212331 21233131 21331331 11331331 1332333 2322323 33121332 32321331 11232332 21332132 21211132 11211132 1322313 2332223 33121331 31123332 11232331 21332131 21211131 11211131 1322313 2332223 12213332 31123331 31223332 13111132 21231132 11231132 1332213 1131323 12213331 32221132 21111332 13111131 21231131 11231131 1332213 1132333 12312332 13223232 31223331 13131132 13313132 31321132 1232133 1131323 12312331 32221131 31322332 13131131 13313131 31321131 1232133 1133323 12233332 13223231 21111331 21211332 13333132 12123132 1112333 1133323 12233331 13322232 31322331 21211331 13333131 12123131 1112333 3131133 12332332 13322231 21131332 21231332 22123132 13123332 1222113 3131133 12332331 22313132 21131331 21231331 22123131 13123331 1222113 3133133 23113132 22313131 31222132 12313132 23123332 11321232 1322133 3133133 121212:32 22333132 31222131 12313131 23123331 11321231 1322133 1211333 23113131 33221332 23321232 21323232 12311132 13122132 1112213 1211333 12121231 22333131 23321231 21323231 12311131 13122131 1112213 1122313 23133132 33221331 13113132 12333132 12222332 12121332 2332313 1132213 23133131 23313332 13113131 12333131 21321232 12121331 2332313 1213333 32323332 23313331 13133132 13313332 12222331 21311132 2232113 1213333 12212132 31122132 13133131 13313331 21321231 21311131 2232113 2222123 32323331 23333332 11321133 13333332 12331132 21222332 2332133 3121113 12212131 31122131 11222232 13333331 12331131 21222331 2332133 2222123 21321133 23333331 11222231 22123332 13311332 21331132 2112313 3121113 21222232 23213132 21213332 22123331 13311331 21331131 2112313 3123113 21222231 12221232 21213331 13213132 23122132 12223332 2322113 3123113 12232132 23213131 21312332 13213131 23122131 12223331 2322113 1211213 12232131 23312132 21312331 13312132 13331332 12322332 1211213 13212332 12221231 21233332 13312131 13331331 12322331 2112223 13212331 23312131 21233331 13233132 11113132 23123132 2112223 13232332 23233132 21332332 13233131 11113131 23123131 1213213 13232331 23233131 12111132 13332132 11133132 12222132 1213213 32223132 23332132 21332331 13332131 11133131 12222131 1311233 22111132 23332131 12111131 12311332 22121332 13311132 1311233 32223131 22311332 21121232 12311331 22121331 13311131 1313233 32322132 22311331 21121231 22122132 13211132 13222332 1313233 22111131 11122232 12131132 22122131 13211131 13222331 3212313 32322131 22331332 12131131 12331332 13231132 13331132 1121123 22131132 11122231 13111332 12331331 13231131 13331131

Ссылаясь на приведенную выше таблицу, каждая цифра относится к домену химерного полипептида СВН II. Номер обозначает родительскую цепь, от которой этот домен имеет происхождение. Например, химерный полипептид СВН II, имеющий последовательность 12111131, указывает на то, что этот полипептид включает последовательность от N-конца к С-концу: аминокислоты от примерно 1 до x1 SEQ ID NO:2 (″1″), сцепленные с аминокислотами от примерно x1 до x2 SEQ ID NO:4 (″2″), сцепленными с аминокислотами от примерно x2 до примерно x3 SEQ ID NO:2, сцепленными с аминокислотами от примерно x3 до примерно x4 SEQ ID NO:2, сцепленными с аминокислотами от примерно x4 до примерно x5 SEQ ID NO:2, сцепленными с аминокислотами от примерно x5 до примерно x6 SEQ ID NO:2, сцепленными с аминокислотами от примерно х6 до x7 SEQ ID NO:6 (″3″), сцепленными с аминокислотами от примерно х7 до x8 (например, с С-концом) SEQ ID NO:2.

В некоторых формах осуществления полипептид СВН II имеет химерную сегментную структуру, выбранную из группы, состоящей из: 11113132, 21333331, 21311131, 22232132, 33133132, 33213332, 13333232, 12133333, 13231111, 11313121. 11332333, 12213111, 23311333, 13111313, 31311112, 23231222, 33123313, 22212231, 21223122, 21131311, 23233133, 31212111 и 32333113.

В некоторых формах осуществления полипептид обладает улучшенной термостойкостью по сравнению с полипептидом дикого типа SEQ ID NO:2, 4 или 6. Активность полипептида может быть измерена с любым из субстратов или их комбинацией, как описано в примерах. Как очевидно специалисту в данной области техники, другие соединения в пределах класса соединений, примеры которых приведены и обсуждены в примерах, можно тестировать и использовать.

В некоторых формах осуществления полипептид может иметь различные изменения аминокислотной последовательности по отношению к референсной последовательности. Эти изменения могут представлять собой замену, делецию или инсерцию одной или более чем одной аминокислоты. Где изменение представляет собой замену, эта замена может представлять собой консервативную, неконсервативную замену или комбинацию консервативных и неконсервативных замен. Например, химера может содержать замену C→S в С314 SEQ ID NO:2 или С311 SEQ ID NO:4.

Таким образом, в некоторых формах осуществления полипептиды могут включать общую структуру от N-конца к С-концу: (сегмент 1)-(сегмент 2)-(сегмент 3)-(сегмент 4)-(сегмент 5)-(сегмент 6)-(сегмент 7)-(сегмент 8),

где сегмент 1 содержит аминокислотный остаток от примерно 1 до примерно x1 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″) и имеет 1-10 консервативных аминокислотных замен; сегмент 2 составляют аминокислотные остатки от примерно x1 до примерно x2 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 3 составляют аминокислотные остатки от примерно x2 до примерно x3 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 4 составляют аминокислотные остатки от примерно x3 до примерно x4 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 5 составляют аминокислотные остатки от примерно x4 до примерно x5 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 6 составляют аминокислотные остатки от примерно x5 до примерно х6 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; сегмент 7 составляют аминокислотные остатки от примерно x6 до примерно x7 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен; и сегмент 8 составляют аминокислотные остатки от примерно x7 до примерно x8 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″), и он имеет примерно 1-10 консервативных аминокислотных замен;

где x1 представляет собой остаток 43, 44, 45, 46 или 47 SEQ ID NO:2, или остаток 42, 43, 44, 45 или 46 SEQ ID NO:4 или SEQ ID NO:6; x2 представляет собой остаток 70, 71, 72, 73 или 74 SEQ ID NO:2, или остаток 68, 69, 70, 71, 72, 73 или 74 SEQ ID NO:4 или SEQ ID NO:6; x3 представляет собой остаток 113, 114, 115, 116, 117 или 118 SEQ ID NO:2, или остаток 110, 111, 112, 113, 114, 115 или 116 SEQ ID NO:4 или SEQ ID NO:6; x4 представляет собой остаток 153, 154, 155, 156 или 157 SEQ ID NO:2, или остаток 149, 150, 151, 152, 153, 154, 155 или 156 SEQ ID NO:4 или SEQ ID NO:6; x5 представляет собой остаток 220, 221, 222, 223 или 224 SEQ ID NO:2, или остаток 216, 217, 218, 219, 220, 221, 222 или 223 SEQ ID NO:4 или SEQ ID NO:6; x6 представляет собой остаток 256, 257, 258, 259, 260 или 261 SEQ ID NO:2, или остаток 253, 254, 255, 256, 257, 258, 259 или 260 SEQ ID NO:4 или SEQ ID NO:6; x7 представляет собой остаток 312, 313, 314, 315 или 316 SEQ ID NO:2, или остаток 309, 310, 311, 312, 313, 314, 315 или 318 SEQ ID NO:4 или SEQ ID NO:6; и x8 представляет собой аминокислотный остаток, соответствующий С-концу полипептида, имеющего последовательность SEQ ID NO:2, SEQ ID NO:4 или SEQ ID NO:6, и где химера имеет алгоритм, представленный в таблице 1, и где химера содержит замену C→S, соответствующую С314 SEQ ID NO:2 или 0311 SEQ ID NO:4.

В некоторых формах осуществления число замен может составлять 2, 3, 4, 5, 6, 8, 9 или 10, или большее число аминокислотных замен (например, 10-20, 21-30, 31-40 и тому подобное число аминокислотных замен).

В некоторых формах осуществления функциональные полипептиды СВН II могут обладать целлюлазной активностью параллельно с повышенной термостойкостью, как, например, для определенного субстрата, обсуждаемого в примерах, а также обладает уровнем идентичности аминокислотной последовательности с референсной целлобиогидролазой или ее сегментами. Референсный фермент или сегмент может быть дикого типа (например, встречающийся в природе) или представлять собой сконструированный фермент. Таким образом, в некоторых формах осуществления полипептиды по изобретению могут содержать общую структуру от N-конца к С-концу:

где сегмент 1 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от примерно 1 до примерно x1 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 2 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от x1 до примерно x2 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 3 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от x2 до примерно x3 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 4 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от x3 до примерно x4 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 5 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от примерно x4 до примерно x5 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 6 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от x5 до примерно x6 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); сегмент 7 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от x6 до примерно x7 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″); и сегмент 8 содержит последовательность, которая по меньшей мере на 50-100% идентична аминокислотным остаткам от х7 до примерно x8 SEQ ID NO:2 (″1″), SEQ ID NO:4 (″2″) или SEQ ID NO:6 (″3″);

где x1 представляет собой остаток 43, 44, 45, 46 или 47 SEQ ID NO:2, или остаток 42, 43, 44, 45 или 46 SEQ ID NO:4 или SEQ ID NO:6; x2 представляет собой остаток 70, 71, 72, 73 или 74 SEQ ID NO:2, или остаток 68, 69, 70, 71, 72, 73 или 74 SEQ ID NO:4 или SEQ ID NO:6; x3 представляет собой остаток 113, 114, 115, 116, 117 или 118 SEQ ID NO:2, или остаток 110, 111, 112, 113, 114, 115 или 116 SEQ ID NO:4 или SEQ ID NO:6; x4 представляет собой остаток 153, 154, 155, 156 или 157 SEQ ID NO:2, или остаток 149, 150, 151, 152, 153, 154, 155 или 156 SEQ ID NO:4 или SEQ ID NO:6; x5 представляет собой остаток 220, 221, 222, 223 или 224 SEQ ID NO:2, или остаток 216, 217, 218, 219, 220, 221, 222 или 223 SEQ ID NO:4 или SEQ ID NO:6; x6 представляет собой остаток 256, 257, 258, 259, 260 или 261 SEQ ID NO:2, или остаток 253, 254, 255, 256, 257, 258, 259 или 260 SEQ ID NO:4 или SEQ ID NO:6; x7 представляет собой остаток 312, 313, 314, 315 или 316 SEQ ID NO:2, или остаток 309, 310, 311, 312, 313, 314, 315 или 318 SEQ ID NO:4 или SEQ ID NO:6; и x8 представляет собой аминокислотный остаток, соответствующий С-концу полипептида, имеющего последовательность SEQ ID NO:2, SEQ ID NO:4 или SEQ ID NO:6, и где химера имеет алгоритм, представленный в таблице 1, и где химера содержит замену C→S, соответствующую С314 SEQ ID NO:2 или С311 SEQ ID NO:4.

В некоторых формах осуществления каждый сегмент химерного полипептида может обладать по меньшей мере 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% или 99% или большей идентичностью последовательности по сравнению с референсным сегментом, указанным для каждого из (сегмент 1), (сегмент 2), (сегмент 3), (сегмент 4), (сегмент 5), (сегмент 6), (сегмент 7) и (сегмент 8) SEQ ID NO:2, SEQ ID NO:4 или SEQ ID NO:6.

В некоторых формах осуществления варианты полипептидов могут обладать улучшенной термостойкостью по сравнению с ферментативной активностью полипептида дикого типа SEQ ID NO:2, 4 или 6, и где содержит замену C→S, соответствующую С314 SEQ ID NO:2 или С311 SEQ ID NO:4.

Химерные ферменты, описанные в данной заявке, могут быть получены в различных формах, таких как лизаты, грубые экстракты или изолированные препараты. Полипептиды можно растворять в подходящих растворах; готовить в виде порошков, таких как ацетоновый порошок (со стабилизаторами или без стабилизаторов); либо готовить в виде лиофилизатов. В некоторых формах осуществления полипептид может представлять собой изолированный полипептид.

В некоторых формах осуществления полипептиды могут находиться в форме наборов. Ферменты могут находиться в растворимой форме, например, в виде растворов в лунках микротитрационных планшетов, либо иммобилизованы на субстрате. Субстрат может представлять собой твердый субстрат или пористый субстрат (например, мембрану), который может состоять из органических полимеров, таких как полистирол, полиэтилен, полипропилен, полифторэтилен, полиэтиленокси и полиакриламид, а также из их сополимеров и привитых сополимеров. Твердый носитель может быть также неорганическим, таким как стекло, кремнезем, стекло с контролируемым размером пор (CPG), обращенно-фазовый кремнезем или металл, такой как золото или платина. Конфигурация субстрата может представлять собой форму шариков, сфер, частиц, гранул, геля, мембраны или поверхности. Поверхности могут быть плоскими, по существу плоскими или не плоскими. Твердые носители могут быть пористыми или непористыми, и могут обладать набухающими или не набухающими свойствами. Твердый носитель может иметь конфигурацию лунки, выемки или другого контейнера, сосуда, оборудования или положения. Множество носителей может иметь конфигурацию на матрице различных положений с электронной адресацией для робототехнической доставки реагентов или способов обнаружения и/или инструментов.

В изобретении также предложены полинуклеотиды, кодирующие сконструированные полипептиды СВН II, раскрытые в данной заявке. Полинуклеотиды могут быть оперативно сцеплены с одной или более чем одной гетерологичной регуляторной или контролирующей последовательностью, которая контролирует экспрессию гена, чтобы создать рекомбинантный полинуклеотид, способный к экспрессии экспрессируемого полипептида. Экспрессионные конструкции, содержащие гетерологичный полинуклеотид, кодирующий химеру СВН II, можно вводить в соответствующие клетки-хозяева для экспрессии полипептида.

С учетом знания конкретных последовательностей химерных ферментов СВН II (например, сегментной структуры химерного СВН II) полинуклеотидные последовательности будут очевидны специалисту в данной области техники на основании аминокислотной последовательности сконструированных химерных ферментов СВН II. Знание кодонов, соответствующих различным аминокислотам, в сочетании со знанием аминокислотной последовательности полипептидов дает возможность специалистам в данной области техники получать различные полинуклеотиды, кодирующие полипептиды по изобретению, таким образом, в изобретении рассмотрены все до единой возможные вариации полинуклеотидов, которые могут быть получены путем подбора комбинаций на основании возможных выборов кодонов, и все такие вариации следует считать конкретно раскрытыми для любого из полипептидов, описанных в данной заявке.

В некоторых формах осуществления полинуклеотиды кодируют полипептиды, описанные в данной заявке, но обладают примерно 80% или большей идентичностью последовательности, примерно 85% или большей идентичностью последовательности, примерно 90% или большей идентичностью последовательности, примерно 91% или большей идентичностью последовательности, примерно 92% или большей идентичностью последовательности, примерно 93% или большей идентичностью последовательности, примерно 94% или большей идентичностью последовательности, примерно 95% или большей идентичностью последовательности, примерно 96% или большей идентичностью последовательности, примерно 97% или большей идентичностью последовательности, примерно 98% или большей идентичностью последовательности или примерно 99% или большей идентичностью последовательности на нуклеотидном уровне с референсным полинуклеотидом, кодирующим варианты полипептидов или химерные полипептиды СВН II, имеющие замену C→S, как описано выше (например, где полипептид или химера содержит замену C→S, соответствующую С314 SEQ ID NO:2 или С311 SEQ ID NO:4).

В некоторых формах осуществления изолированные полинуклеотиды, кодирующие полипептиды, можно подвергать разнообразным манипуляциям, чтобы обеспечить экспрессию полипептида. Манипуляции с изолированным полинуклеотидом перед его вставкой в вектор могут быть желательными или необходимыми в зависимости от экспрессионного вектора. Способы модификации полинуклеотидов и нуклеиново-кислотных последовательностей с использованием методов рекомбинантных ДНК хорошо известны в данной области техники. Руководство приведено в Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press; и в Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, обновления до 2007.

В некоторых формах осуществления полинуклеотиды оперативно сцеплены с контролирующими последовательностями для экспрессии полинуклеотидов и/или полипептидов. В некоторых формах осуществления контролирующая последовательность может представлять собой соответствующую промоторную последовательность, которая может быть получена из генов, кодирующих внеклеточные или внутриклеточные полипептиды, либо гомологичные, либо гетерологичные для клетки-хозяина. Для бактериальных клеток-хозяев подходящие промоторы для направления транскрипции нуклеиново-кислотных конструкций по настоящему изобретению включают промоторы, полученные из lac оперона Е. соli, генов xylA и xylB Bacillus subtilis, генов утилизации ксилозы Bacillus megatarium (например, Rygus et al. (1991) Appl. Microbiol. Biotechnol. 35:594-599; Meinhardt et al., (1989) Appl. Microbiol. Biotechnol. 30:343-350), прокариотического гена бета-лактамазы (Villa-Kamaroff et al., (1978) Proc. Natl Acad. Sci. USA 75: 3727-3731), а также промотор tac (DeBoer et al., (1983) Proc. Natl Acad. Sci. USA 80:21-25). Различные подходящие промоторы описаны в ″Useful proteins from recombinant bacteria″ в Scientific American, 1980, 242:74-94; и в Sambrook et al., см. выше.

В некоторых формах осуществления контролирующая последовательность может также представлять собой соответствующую последовательность терминации транскрипции, последовательность, распознаваемую клеткой-хозяином для терминации транскрипции. Терминаторная последовательность оперативно сцеплена с 3′ концом нуклеиново-кислотной последовательности, кодирующей полипептид. Можно использовать любой терминатор, который является функциональным в выбранной клетке-хозяине.

В некоторых формах осуществления контролирующая последовательность может также представлять собой соответствующую лидерную последовательность, нетранслируемый участок мРНК, который важен для трансляции клеткой-хозяином. Эта лидерная последовательность оперативно сцеплена с 5′ концом нуклеиново-кислотной последовательности, кодирующей полипептид. Можно использовать любую лидерную последовательность, которая является функциональной в выбранной клетке-хозяине.

В некоторых формах осуществления контролирующая последовательность может также представлять собой участок, кодирующий сигнальный пептид, который кодирует аминокислотную последовательность, сцепленную с амино-концом полипептида, и направляет кодируемый полипептид в секреторный биохимический путь клетки. 5′ конец кодирующей последовательности нуклеиново-кислотной последовательности может естественно содержать участок, кодирующий сигнальный пептид, естественно сцепленный в рамке считывания трансляции с сегментом кодирующей области, который кодирует секретируемый полипептид. Альтернативно 5′ конец кодирующей последовательности может содержать участок, кодирующий сигнальный пептид, который является чужеродным для кодирующей последовательности. Чужеродный участок, кодирующий сигнальный пептид, может требоваться, где кодирующая последовательность естественно не содержит участок, кодирующий сигнальный пептид. Эффективными участками, кодирующими сигнальный пептид, для бактериальных клеток-хозяев могут быть участки, кодирующие сигнальный пептид, полученные из генов для мальтогенной амилазы Bacillus NCIB 11837, альфа-амилазы Bacillus stearothermophilus, субтилизина Bacillus licheniformis, бета-лактамазы Bacillus licheniformis, нейтральных протеаз Bacillus stearothermophilus (nprT, nprS, nprM) и prsA Bacillus subtilis. Дополнительные сигнальные пептиды описаны Simonen and Palva, (1993) Microbiol Rev 57:109-137.

Далее изобретение направлено на рекомбинантный экспрессионный вектор, содержащий полинуклеотид, кодирующий сконструированный вариант полипептида или химерный полипептид СВН II, и один или более чем один участок регуляции экспрессии, такой как промотор и терминатор, точка начала репликации и т.д., в зависимости от типа хозяев, в которых их вводят. При создании экспрессионного вектора кодирующую последовательность располагают в векторе таким образом, что кодирующая последовательность оперативно сцеплена с соответствующими контролирующими последовательностями для экспрессии.

Рекомбинантный экспрессионный вектор может представлять собой любой вектор (например, плазмиду или вирус), который можно удобно подвергать методам рекомбинантных ДНК, и который может вызывать экспрессию полинуклеотидной последовательности. Выбор вектора типично зависит от совместимости вектора с клеткой-хозяином, в которую нужно вводить этот вектор. Векторы могут представлять собой линейные или замкнутые кольцевые плазмиды.

Экспрессионный вектор может представлять собой автономно реплицирующийся вектор, то есть вектор, который существует в виде экстрахромосомной молекулы, репликация которой независима от хромосомной репликации, например, плазмиду, экстрахромосомный элемент, минихромосому или искусственную хромосому. Вектор может содержать любые средства для обеспечения саморепликации. Предпочтительно вектор может быть таким, который при введении в клетку-хозяина интегрирует в геном и реплицируется вместе с хромосомой(ами), в которую он интегрирован. Кроме того, можно использовать один вектор или плазмиду, либо два или более чем два вектора или две плазмиды, которые вместе содержат суммарную ДНК для введения в геном клетки-хозяина, либо транспозон.

В некоторых формах осуществления экспрессионный вектор по изобретению содержит один или более чем один селективный маркер, который дает возможность легко обнаружить трансформированные клетки. Селективный маркер представляет собой ген, продукт которого обеспечивает устойчивость к биоциду или вирусу, устойчивость к тяжелым металлам, прототрофность для ауксотрофов и тому подобное. Примерами бактериальных селективных маркеров являются гены dal от Bacillus subtilis или Bacillus licheniformis, или маркеры, которые придают устойчивость к антибиотикам, таким как ампициллин, канамицин, хлорамфеникол (пример 1) или устойчивость к тетрациклину. Другие полезные маркеры очевидны специалисту в данной области техники.

В другой форме осуществления в изобретении предложена клетка-хозяин, содержащая полинуклеотид, кодирующий вариант полипептида или химерный полипептид СВН II, где полинуклеотид оперативно сцеплен с одной или более чем одной контролирующей последовательностью для экспрессии полипептида в клетке-хозяине. Клетки-хозяева для использования при экспрессии полипептидов, кодируемых экспрессионными векторами по изобретению, хорошо известны в данной области техники и включают, но не ограничены ими, бактериальные клетки, такие как Е. coli и Bacillus megaterium; эукариотические клетки, такие как клетки дрожжей, клетки СНО и тому подобное, клетки насекомых, такие как клетки Drosophila S2 и Spodoptera Sf9; клетки животных, такие как СНО, COS, BHK, 293 и клетки меланомы Боуэса; а также клетки растений. Другие подходящие клетки-хозяева будут очевидны специалистам в данной области техники. Соответствующие культуральные среды и условия выращивания для вышеописанных клеток-хозяев хорошо известны в данной области техники.

Варианты полипептидов или химерные полипептиды СВН II по изобретению могут быть получены путем использования способов, хорошо известных в данной области техники. Полинуклеотиды можно синтезировать с помощью рекомбинантных методов, таких как предложено в Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press; и Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, обновления до 2007. Полинуклеотиды, кодирующие ферменты, или праймеры для амплификации могут быть также получены стандартными твердофазными способами в соответствии с известными способами синтеза, например, используя фосфорамидитный метод, описанный Beaucage et al., (1981) Tet Lett 22:1859-69, или метод, описанный Matthes et al., (1984) EMBO J. 3:801-05, например, как типично практикуют при автоматизированных способах синтеза. Кроме того, по существу любая нуклеиновая кислота может быть получена из любого из разнообразных коммерческих источников, таких как The Midland Certified Reagent Company, Midland, TX, The Great American Gene Company, Ramona, CA, ExpressGen Inc. Chicago, IL, Operon Technologies Inc., Alameda, CA, и многих других.

Сконструированные ферменты, экспрессированные в клетках-хозяевах, можно выделить из клеток или из культуральной среды, используя любой один или более чем один из хорошо известных методов очистки белка, включая среди прочего обработку лизоцимом, соникацию, фильтрование, высаливание, ультрацентрифугирование, хроматографию и аффинное разделение (например, антитела, связанные с субстратом). Подходящие растворы для лизиса и высокоэффективной экстракции белков из бактерий, таких как Е. coli, имеются в продаже под торговым названием CelLytic BTM от Sigma-Aldrich St. Louis МО.

Хроматографические методы выделения полипептидов включают среди прочего хроматографию с обращенной фазой, высокоэффективную жидкостную хроматографию, ионообменную хроматографию, гель-электрофорез и аффинную хроматографию. Условия очистки конкретного фермента будут зависеть отчасти от таких факторов, как суммарный заряд, гидрофобность, гидрофильность, молекулярная масса, молекулярная форма и т.д., и будут очевидны специалистам в данной области техники.

Описания направленной рекомбинации SCHEMA и синтеза химерных полипептидов приведены в примерах данной заявки, а также в Otey et al., (2006), PLoS Biol. 4(5):e112; Meyer et al., (2003) Protein Sci., 12:1686-1693; заявке на патент США №12/024515, поданной 1 февраля 2008; и заявке на патент США №12/027885, поданной 7 февраля 2008; такие ссылки полностью включены в данную заявку посредством ссылки.

Как обсуждено выше, полипептид можно использовать в ряде областей применения, таких как среди прочего создание биотоплива, расщепление целлюлозы и тому подобное.

Приведенные ниже примеры подразумевают дополнительное объяснение, но не ограничение приведенного выше описания или прилагаемой формулы изобретения.

ПРИМЕРЫ

Конструирование экспрессионной плазмиды СВН II. Родительские и химерные гены, кодирующие ферменты СВН II, клонировали в дрожжевом экспрессионном векторе YEp352/PGK91-1-αss (Фиг.6). Последовательности ДНК, кодирующие родительские и химерные каталитические домены СВН II, конструировали со сдвигом кодонов для S. cerevisiae, используя программное обеспечение GeneDesigner (DNA2.0), и синтезировали с помощью DNA2.0. Гены каталитического домена СВН II расщепляли Xhol и Kpnl, лигировали в векторе между сайтами Xhol и Kpnl и трансформировали в E. coli XL-1 Blue (Stratagene). Гены СВН II секвенировали, используя праймеры: CBH2L (5′-GCTGAACGTGTCATCGGTTAC-3′ (SEQ ID NO:9) и RSQ3080 (5′-GCAACACCTGGCAATTCCTTACC-3′ (SEQ ID NO:10)). Родительские и химерные конструкции СВН II с С-концевым His6 были получены путем амплификации гена СВН II с прямым праймером CBH2LPCR (5′-GCTGAACGTGTCATCGTTACTTAG-3′ (SEQ ID NO:11)) и обратными праймерами, комплементарными соответствующему гену СВН II с выступающим концом Hise и стоп-кодонами. Продукты ПЦР лигировали, трансформировали и секвенировали, как описано выше.

Экспрессия фермента СВН II в S. cerevisiae. Штамм S. cerevisiae YDR483W BY4742 (Mata his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0 ΔKRE2, ATCC No. 4014317) делали компетентным, используя набор для трансформации дрожжей EZ Yeast II (Zymo Research), трансформировали плазмидной ДНК и высевали на синтетический агар без урацила. Колонии собирали в 5 мл ночные культуры синтетической среды с декстрозой и казаминовыми кислотами (SDCAA) (20 г/л декстрозы, 6,7 г/л дрожжевых азотистых оснований Difco, 5 г/л казаминовых кислот Bacto, 5,4 г/л Na2HPO4, 8,56 г/л NaH2PO4·H2O) с добавлением 20 мкг/мл триптофана и выращивали в течение ночи при 30°С, 250 об/мин. 5 мл культуры наращивали в 40 мл SDCAA в 250 мл колбах Tunair (Shelton Scientific) и встряхивали при 30°С, 250 об/мин в течение 48 часов. Культуры центрифугировали, и супернатанты концентрировали до 500 мкл, используя ячейку для ультрафильтрации Amicon, оборудованную мембраной 30-кДа ПЭС (полиэфирсульфон), для использования в анализах t1/2. Концентрированные супернатанты доводили до 1 мМ фенилметилсульфонилфторида и 0,02% NaN3. HiS6-меченые белки СВН II очищали, используя спин-колонки Ni-NTA (Qiagen) согласно протоколу изготовителя, и белки обменивали в 50 мМ ацетате натрия, рН 4,8, используя обессоливающие колонки Zeba-Spin (Pierce). Концентрацию белка определяли, используя реагент для белков Кумасси-плюс Pierce, с БСА в качестве стандарта. Анализ с помощью электрофореза в ДСН-ПААГ проводили путем нанесения либо 20 мкл концентрированного супернатанта культуры, либо примерно 5 мкг очищенного фермента СВН II на гель с 7,5% Трис-HCl (Biorad) и окрашивания безопасным красителем SimplyBlue (Invitrogen). Супернатанты или очищенные белки СВН II обрабатывали EndoH (New England Biolabs) в течение 1 ч при 37°С в соответствии с инструкциями изготовителя. Активность фермента СВН II в концентрированных супернатантах дрожжевой культуры измеряли путем добавления 37,5 мкл концентрированного супернатанта культуры к 37,5 мкл PASC и инкубации в течение 2 ч при 50°С. Образовавшиеся эквиваленты восстанавливающего сахара определяли с помощью анализа Шомоди-Нельсона, как описано ниже.

Измерения периода полураспада, удельной активности, рН-активности и долговременного гидролиза целлюлозы. Готовили целлюлозу, набухшую в фосфорной кислоте (PASC). Для усиления активности фермента СВН II на субстрате PASC предварительно инкубировали при концентрации 10 г/л с 10 мг/мл эндоглюканазы A. niger (Sigma) в 50 мМ ацетате натрия, рН 4,8 в течение 1 ч при 37°С. Эндоглюканазу инактивировали нагреванием при 95°С в течение 15 минут, PASC дважды промывали 50 мМ ацетатным буфером и ресуспендировали при 10 г/л в деионизованной воде.

Значения t1/2 фермента СВН II измеряли путем добавления концентрированного супернатанта экспрессионной культуры СВН II к 50 мМ ацетату натрия, рН 4,8 при концентрации, дающей А520 0,5, как измерено в анализе восстанавливающего сахара Шомоди-Нельсона после инкубации с обработанной PASC, как описано выше. 37,5 мкл смесей фермент СВН II/буфер инактивировали в водяной бане при 63°С. После инактивации добавляли 37,5 мкл PASC, обработанной эндоглюканазой, и проводили гидролиз в течение 2 ч при 50°С. Реакционные супернатанты фильтровали через планшеты Multiscreen HTS (Millipore). Значения анализа Шомоди-Нельсона log(A520), полученные с использованием считывающего устройства для планшетов SpectraMax (Molecular Devices), скорректированные на фоновое поглощение, наносили на график против времени, и периоды полураспада фермента СВН II получали на основании линейной регрессии, используя Microsoft Excel.

Для измерений удельной активности очищенный фермент СВН II добавляли к PASC до получения конечного объема реакции 75 мкл 25 мМ ацетат натрия, рН 4,8, с 5 г/л PASC и концентрации фермента СВН II 3 мг фермента/г PASC. Инкубация происходила в течение 2 ч в 50°С водяной бане, и определяли концентрацию восстанавливающего сахара. Для измерений профиля рН/активности очищенный фермент СВН II добавляли при концентрации 300 мкг/г PASC в объеме реакции 75 мкл. Реакционные смеси забуферивали 12,5 мМ цитратом натрия/12,5 мМ фосфатом натрия, проводили в течение 16 ч при 50°С и определяли восстанавливающий сахар. Измерения долговременного гидролиза целлюлозы проводили с объемами 300 мкл 1 г/л обработанной PASC в 100 мМ ацетате натрия, рН 4,8, 20 мМ NaCl. Очищенный фермент СВН II добавляли при 100 мкг/г PASC, и реакции проводили в водяных банях в течение 40 ч перед определением восстанавливающего сахара.

Пять родительских генов-кандидатов, кодирующих ферменты СВН II, были синтезированы со сдвигом кодонов для S. cerevisiae. Все пять содержали идентичные N-концевые кодирующие последовательности, где остатки 1-89 соответствуют целлюлозосвязывающему модулю (СВМ), гибкий линкерный участок и пять N-концевых остатков каталитического домена Н. jecorina. Два из ферментов-кандидатов СВН II от Humicola insolens и Chaetomium thermophilum секретировались из S. cerevisiae при значительно более высоких уровнях, чем три другие от Hypocrea jecorina, Phanerochaete chrysosporium и Talaromyces emersonii (Фиг.1). Поскольку полосы в ДСН-ПААГ геле для трех слабо экспрессирующихся родителей-кандидатов был трудно увидеть, проводили анализы активности, в которых концентрированные супернатанты культуры инкубировали с целлюлозой, набухшей в фосфорной кислоте (PASC), чтобы подтвердить присутствие активной целлюлазы. Значения для образовавшегося восстанавливающего сахара, представленные на Фиг.1, подтвердили присутствие активного СВН II в концентрированных супернатантах культуры S. cerevisiae для всех ферментов за исключением СВН II Т. emersonii. Последовательности Н. insolens и С. thermophilum были выбраны для рекомбинации с наиболее промышленно релевантным ферментом грибов СВН II из Н. jecorina. Идентичности соответствующих последовательностей каталитических доменов составляют 64% (1:2), 66% (2:3) и 82% (1:3), где Н. insolens является родителем 1, Н. jecorina является родителем 2 и С. thermophilum является родителем 3. Эти соответствующие каталитические домены содержат 360, 358 и 359 аминокислотных остатков.

Экспрессию гетерологичного белка в мицелиальном грибе Н. jecorina, организме, чаще всего используемом для продуцирования целлюлаз для промышленных применений, значительно более труднодоступна, чем в Saccharomyces cerevisiae. Наблюдаемая секреция СВН II Н. jecorina из S. cerevisiae мотивировала выбор гетерологичного хозяина. Чтобы минимизировать избыточное гликозилирование, которое, как сообщили, снижает активность рекомбинантных целлюлаз, рекомбинантные гены СВН II экспрессировали в штамме dKRE2 S. cerevisiae с дефицитом гликозилирования. Ожидают, что данный штамм присоединяет олигомеры маннозы меньшего размера к обоим сайтам N-связанного и O-связанного гликозилирования, чем штаммы дикого типа, что ближе всего напоминает гликозилирование нативно продуцируемого фермента СВН II Н. jecorina. Анализ белков СВН II в электрофорезе ДСН-ПААГ, как с обработкой, так и без обработки EndoH для удаления структур с высоким содержанием маннозы, показал, что обработка EndoH не увеличивает электрофоретическую подвижность ферментов, секретируемых из этого штамма, что подтверждает отсутствие разветвленных маннозных группировок, которые штаммы S. cerevisiae дикого типа присоединяют к сайтам гликозилирования в рекомбинантных белках.

Высокое разрешение структуры Н. insolens (pdb entry 1ocn) использовали в качестве матрицы для SCHEMA, чтобы идентифицировать контакты, которые могли бы быть разрушены при рекомбинации. Алгоритм RASPP выдал четыре библиотеки-кандидата, где для каждой значение <E> было ниже 15. Все библиотеки-кандидаты имели более низкое значение <Е>, чем ранее сконструированные библиотеки химер, что позволяет предположить, что приемлемая доля уложенных, активных химер может быть получена для относительно высокого значения <m>. Разнообразие химерных последовательностей было увеличено до максимума за счет выбора границ блоков, приводящего к самому высокому значению <m> = 50. Блоки для данного дизайна проиллюстрированы на Фиг.2В и подробно описаны в таблице 2.

Каталитический домен СВН II Н. insolens имеет α/β бочковидную структуру, в которой восемь спиралей определяют периметр бочонка, а семь параллельных β-складок образуют активный центр (Фиг.2А). Две протяженные петли образуют крышу над активным центром, создавая туннель, через который проходят целлюлозные цепи субстрата в процессе гидролиза. Пять из семи границ блоков попадают между элементами вторичной структуры, тогда как блок 4 начинается и заканчивается в середине следующих друг за другом α-спиралей (Фиг.2А, 2В). Большинство межблочных контактов боковых цепей встречается между блоками, которые являются примыкающими в первичной структуре (Фиг.2С).

Серия образцов из 48 химерных генов была сконструирована в виде трех групп по 16 химер, имеющих пять блоков от одного родителя и три блока либо от одного, либо от обоих остальных двух родителей (таблица 3); последовательности были выбраны так, чтобы выровнять присутствие каждого родителя в положении каждого блока. Соответствующие гены были синтезированы и экспрессированы.

Таблица 3: Последовательности серии образцов химер ферментов СВН II Неактивные Активные 13121211 11332333 12122221 21131311 33332321 31212111 33321331 22232132 21322232 33213332 21112113 23233133 31121121 13231111 32312222 12213111 23223223 31311112 31313323 11113132 32121222 13111313 12121113 21311131 22133222 11313121 33222333 21223122 11131231 22212231 11112321 23231222 12111212 32333113 31222212 12133333 22322312 13333232 12222213 33123313 12221122 21333331 22212323 23311333 23222321 33133132 32333223 33331213

Двадцать три из серии 48 образцов концентрированных супернатантов культуры S. cerevisiae проявляли гидролитическую активность в отношении PASC. Эти результаты позволяют предположить, что тысячи из 6561 возможных химерных последовательностей СВН II (см., например, таблицу 1) кодируют активные ферменты. 23 активные химеры СВН II серии образцов проявляют значительное разнообразие последовательностей, отличающихся от ближайшей родительской последовательности и друг от друга по меньшей мере 23 и 36 аминокислотными заменами, и не менее 54 и 123, соответственно. Их средний уровень мутаций <m> составляет 36.

Поскольку авторами Meyer et аl. обнаружены корреляции между Е, m и вероятностью того, что химера является уложенной и активной, был проведен анализ, существуют ли подобные корреляции для серии образцов химер СВН II. Количество активности фермента СВН II в концентрированных супернатантах экспрессионных культур, измеренное путем количественного определения активности на PASC, коррелировало с интенсивностью полос СВН II в ДСН-ПААГ гелях (Фиг.1). Как для родительского СВН II Н. jecorina, активность можно было обнаружить для некоторых химер СВН II с необнаружимыми полосами в геле. Химер СВН II, представленных полосами в геле, но с отсутствием активности, не наблюдали. Вероятность того, что химера СВН II секретируется в активной форме, была связана обратной связью как с Е, так и с m (Фиг.3).

Периоды полураспада термической инактивации (t1/2) измеряли при 63°С для концентрированных супернатантов культур родительского и активных химерных ферментов СВН II. Периоды полураспада для СВН II родителей Н. insolens, Н. jecorina и С.thermophilum составляли 95, 2 и 25 минут соответственно (таблица 1). Активные химеры серии образцов проявляли более широкий диапазон периодов полураспада, от менее 1 минуты до более 3000. Пять из 23 активных химер имели периоды полураспада выше, чем наиболее термостойкий родительский СВН II Н. insolens.

При попытке конструирования предсказательной количественной модели для периода полураспада химеры СВН II было использовано пять различных алгоритмов, моделирующих данные линейной регрессии (таблица 4). Каждый алгоритм использовали для конструирования модели, связывающей составы блоков каждой химеры серии образцов СВН II и родителей с log(t1/2). С помощью этих моделей получили взвешенные значения термостойкости, которые количественно определяли вклад блока в log(t1/2). Для всех пять алгоритмов моделирования этот процесс повторяли 1000 раз с двумя случайно выбранными последовательностями, исключенными из каждого вычисления, так что каждый алгоритм давал 1000 взвешенных значений для каждого из 24 блоков. Среднее и стандартное отклонение (SD) вычисляли для взвешенной термостойкости каждого блока. Предсказательную точность каждого алгоритма модели оценивали путем измерения, насколько хорошо каждая модель предсказывала значения t1/2 двух исключенных последовательностей. Корреляция между измеренными и предсказанными значениями для 1000 итераций алгоритма является баллом перекрестной проверки достоверности модели для алгоритма. Для всех пяти моделей баллы перекрестной проверки достоверности (X-val) были меньшими или равными 0,57 (таблица 4), что показывает, что моделирование линейной регрессии неприменимо для данной малой серии данных t1/2 23 химер для количественного предсказания периода полураспада химеры СВН II.

Таблица 4: Значения перекрестной проверки достоверности для применения 5 алгоритмов линейной регрессии к баллам стабильности блоков химер фермента СВН II. Сокращения алгоритма: гребневая регрессия (RR), частичная регрессия методом наименьших квадратов (PLSR), регрессия методом опорных векторов (SVMR), регрессия с линейным программированием методом опорных векторов (LPSVMR) и повышающая регрессия с линейным программированием (LPBoostR). Метод Гребневая PLS SVMR LSVM LPBoost X-val 0,56 0,55 0,50 0,42 0,43

Моделирование линейной регрессии использовали для качественной классификации блоков как стабилизирующих, дестабилизирующих или нейтральных. Влияние каждого блока на термостойкость химеры характеризовали, используя балльную систему, которая основана на вкладе в термостойкость, определенном с помощью каждого из алгоритмов регрессии. Для каждого алгоритма блоки с взвешенным значением термостойкости более 1 SD выше нейтрального оценивали ″+1″, блоки в пределах 1 SD нейтрального оценивали как ноль, и блоки на 1 или более SD ниже нейтрального оценивали как ″-1″. ″Балл стабильности″ для каждого блока получали путем суммирования баллов стабильности 1, 0, -1 от каждой из пяти моделей. В таблице 5 суммированы баллы для каждого блока. Блок 1/родитель 1 (В1Р1), В6РЗ, В7РЗ и В8Р2 были идентифицированы как обладающие самыми высокими стабилизирующими эффектами, тогда как было обнаружено, что В1РЗ, В2Р1, ВЗР2, В6Р2, В7Р1, В7Р2 и В8РЗ являются наиболее сильно дестабилизирующими блоками.

Таблица 5: Результаты качественной классификации блоков, полученные с помощью пяти алгоритмов линейной регрессии для серии образцов химер фермента СВН II. Балл +1 обозначает блок с взвешенной термостойкостью (отвлеченной мерой для вклада блока в термостойкость химеры) выше, чем одно стандартное отклонение выше нейтрального значения (стабилизирующий), балл 0 обозначает блок с взвешенным значением в пределах одного стандартного отклонения от нейтрального, и -1 обозначает блок с взвешенным значением более чем на одно стандартное отклонение ниже нейтрального (дестабилизирующий). Гребневая PLS S\*R LSVM LPBoost Сумма Блок В1Р1 1 0 1 1 0 3 B1R2 0 0 0 -1 0 -1 В1Р3 -1 0 -1 -1 -1 -4 В2Р1 -1 0 0 -1 -1 -3 В2Р2 1 0 0 0 0 1 B2R3 1 0 0 0 0 1 В3Р1 1 0 1 0 0 2 В3Р2 -1 0 -1 -1 -1 -4 B3R3 1 0 1 0 0 2 В4Р1 0 0 0 0 0 0 В4Р2 0 0 0 0 0 0 B4R3 0 0 0 -1 0 -1 В5Р1 0 0 0 0 0 0 В5Р2 0 0 0 0 -1 -1 B5R3 -1 0 0 -1 0 -2 В6Р1 1 0 0 -1 -1 -1 В6Р2 -1 0 -1 -1 -1 -4 B6R3 1 1 1 1 1 5 В7Р1 -1 0 -1 -1 -1 -4 В7Р2 -1 0 -1 -1 -1 -4 В7Р3 1 0 1 1 1 4 В8Р1 1 0 1 -1 0 1 В8Р2 1 0 1 1 0 3 В8Р3 -1 0 -1 -1 -1 -4

Вторую серию генов, кодирующих химеры фермента СВН II, синтезировали с целью проверки достоверности предсказанных стабилизирующих блоков и идентификации целлюлаз, более термостойких, чем наиболее термостойкий родитель. В 24 химерах, включенных в данную серию проверки (таблица 6), отсутствовало семь блоков, предсказанных как наиболее дестабилизирующие, и они были обогащены четырьмя наиболее стабилизирующими блоками, где присутствие было смещено в направлении баллов более высокой стабильности.

Кроме того, была сконструирована химера ″HJPlus″ 12222332 путем замены предсказанных наиболее стабилизирующих блоков в ферменте СВН II Н. jecorina (родитель 2).

Таблица 6: Последовательности 24 химер фермента СВН II серии проверки достоверности, девять из которых экспрессировались в активной форме Неактивные Активные 12122132 12111131 12132332 12132331 12122331 12131331 12112132 12332331 13122332 13332331 13111132 13331332 13111332 13311331 13322332 13311332 22122132 22311331 22322132 22311332 23111332 23321131 23321332 23321331

Концентрированные супернатанты экспрессионных культур S. cerevisiae для девяти из 24 химер серии проверки достоверности, а также химеры HJPlus, проявляли активность в отношении PASC (таблица 6). Из 15 химер, для которых активность не была обнаружена, девять содержали блок В4Р2. Из 16 химер, содержащих В4Р2 в первоначальной серии образцов, только одна проявляла активность в отношении PASC. Суммируя обе серии химер и HJPlus, только две из 26 химер, характеризующихся В4Р2, были активными, что указывает на то, что данный конкретный блок является в высокой степени разрушительным для экспрессии активной целлюлазы в S. cerevisiae.

Были проверены стабильности 10 функциональных химерных ферментов СВН II из серии проверки достоверности. Поскольку стабильные ферменты уже имели периоды полураспада более 50 часов, остаточную гидролитическую активность в отношении PASC после 12-часовой термической инактивации при 63°С использовали как меру для предварительной проверки. Эта 12-часовая инкубация приводила к измеримому снижению активности наиболее термостойкой химеры серии образцов, 11113132, и полностью инактивировала наиболее термостойкий родительский СВН II Н. insolens. Все десять функциональных химер серии проверки достоверности сохранили более высокую долю своей активности, чем наиболее стабильный родительский СВН II Н. insolens.

Проанализировали активности отобранных термостойких химер с использованием очищенных ферментов. Родительские ферменты СВН II и три термостойкие химеры, наиболее термостойкую химеру серии образцов 11113132, наиболее термостойкую химеру серии проверки достоверности 13311332 и химеру HJPlus 12222332 экспрессировали с С-концевыми метками Hiss для очистки и очищали. Для минимизации термической инактивации ферментов СВН II во время теста на активность авторы изобретения использовали более кратковременную двухчасовую инкубацию с субстратом PASC при 50°С, рН 4,8. Как показано в таблице 3, удельные активности родительских и химерных СВН II находились в пределах коэффициента четыре наиболее активного родительского фермента СВН II от Н. jecorina. Удельная активность HJPlus была выше, чем у всех других протестированных ферментов СВН II за исключением СВН II Н. jecorina.

Зависимость от рН целлюлазной активности также важна, поскольку широкий профиль рН/активности дал бы возможность использовать химеру СВН II при более широком диапазоне потенциальных условий гидролиза целлюлозы. Наблюдали, что СВН II Н. jecorina обладает оптимальной активностью в диапазоне рН от 4 до 6, причем вне этих значений активность заметно снижается. 16 На Фиг.4 показано, что ферменты СВН II Н. insolens и С. thermophilum и все три очищенные термостойкие химеры СВН II имели профили рН/активности, которые являются значительно более широкими, чем у СВН II Н. jecorina. Хотя Liu et al. сообщают оптимальный рН 4 для СВН II С. thermophilum, оптимальный рН рекомбинантного фермента в данной заявке составлял около 7. Нативный СВН II Н. insolens имел широкий профиль рН/активности при максимальной активности около рН 9 и примерно 60% этой максимальной активности при рН 4. Подобно широкий профиль наблюдали для рекомбинантного фермента. Химера HJPlus имела значительно более широкий профиль рН/активности, чем СВН II Н. jecorina, проявляя зависимость от рН, подобную двум другим родительским ферментам СВН II.

Достижение активности при повышенной температуре и сохранение активности в течение пролонгированных интервалов времени являются двумя основными мотивациями для конструирования высоко стабильных ферментов СВН II. Характеристики термостойких химер СВН II при гидролизе целлюлозы тестировали на протяжении диапазона температур в течение 40-часового интервала времени. Как показано на Фиг.5, все три термостойкие химеры проявляли активность на PASC при более высоких температурах, чем родительские ферменты СВН II. Химеры сохраняли активность при 70°С, тогда как СВН II Н. jecorina не гидролизовал PASC выше 57°С, и стабильный фермент Н. insolens не проявлял гидролиза при 63°С. Активность HJPlus в анализе долговременного гидролиза целлюлозы превышала активность всех родителей при их соответствующих оптимальных температурах.

Библиотека СВН II имела меньшие потенциальные прерывания по нескольким причинам. В дополнение к более высокой идентичности родительских последовательностей СВН II, бочковидная топология укладки СВН II ограничивает число контактов большого радиуса действия, которые могут быть разрушены рекомбинацией. Межблочные контакты (тяжелые атомы в пределах 4,5 Å) составляют только 27% (503/1831) всех контактов на карте контактов структуры Н.insolens 1ocn. Когда только учтенные контакты, для которых новые пары остатков возможны в химерах, суммарные межблочные контакты снижены до 23% (68/294). Кроме того, большинство этих взаимодействий происходит между остатками на поверхности белка, и возможность улавливания растворителя дополнительно снижает шансы резко деструктивных взаимодействий между остатками (Фиг.14а). Одно исключение, углубленное взаимодействие между положениями 176 и 256, проиллюстрировано на Фиг.14b. В этом сайте химеры с В6Р2 и либо В5Р1, либо В5Р3 спаривают Met173:Trp253 (большей аминокислотой, чем родительская пара Met176:Phe256 или Leu173:Trp253). Тем не менее, при исследовании родительских кристаллографических моделей стерическое столкновение в данном положении считали невероятным вследствие движения в участке белкового каркаса, которое располагает Trp253, и собственной гибкости боковых цепей Met. Примечательно, что одна охарактеризованная химера соответствует данному паттерну (13333232) и является более стабильной, чем родители (67°С), при приведении в соответствие с регрессионной моделью (68°С).

Другой механизм, посредством которого может происходить спаривание, структурная дивергенция блоков, не зависит от присутствия новых пар остатков на границах блоков, вместо этого, по мере того как дивергируют родительские последовательности, могут дивергировать внутренние структуры блоков, затрудняя модульные пересадки блоков. В случае библиотеки СВН II высокие значения идентичности родительских пар (82%, 66% и 64%) предполагают, что вероятны только минорные отклонения структуры (среднее квадратичное отклонение, RMSD,<1 Å). Эту возможность можно оценить путем сравнения кристаллографических структур для СВН II H.insolens и H.jecorina (у СВН II C. therinophilum отсутствует кристаллическая структура, но он на 82% идентичен Н. insolens). Выравнивания блоков из структур для каждого родителя (1ocn и 1cb2) создает низкие значения RMSD альфа-углерода (RMSD 0.5, 0.5, 0.6, 0.5, 0.3, 0.7, 0.3 и 0.4 Å). Блоки Н. jecorina, наложенные на Н. insolens, проиллюстрированы в дополнении к Фиг.5 с.Для проверки контекст-зависимых эффектов была проведена структурная рекомбинация in silico со сплайсингом каждого выровненного блока на структуре противоположного хозяина. Возможно сконструировать структурные модели без столкновений (альфа-атомы углерода на расстоянии более 3 Å) для всех химер с заменой одного блока (например, 11112111 или 22122222), за исключением минорного столкновения (2,65 Å) при использовании В7Р2 (11111121) вследствие инсерции Asn между блоками 6 и 7 (Фиг.14D).

Следующие эксперименты были проведены, чтобы определить вклады различных блоков/сегментов в стабильность химеры и улучшенную термостойкость и/или рН стабильность. Родительские и химерные гены, кодирующие ферменты СВН II, клонировали в дрожжевом экспрессионном векторе YEp352/PGK91-1-αss и экспрессировали в синтетической среде с декстрозой и казаминовыми кислотами (SDCAA). Для анализов активности на Avicel супернатанты дрожжевых культур на среде с пептоном и декстрозой (YPD) доводили до 1 мМ фенилметилсульфонилфторида и 0,02% NaN3 и использовали без концентрирования. Ферментативную активность СВН II в концентрированных супернатантах дрожжевых культур на SDCAA измеряли путем добавления разведении концентрированного супернатанта культуры в 37,5 мкл PASC и 225 мкл 50 мМ ацетата натрия, рН 4,8 и инкубации в течение 2 ч при 50°С. Эквиваленты образовавшегося восстанавливающего сахара определяли с помощью анализа Шомоди-Нельсона.

Значения T50 фермента СВН II измеряли путем добавления концентрированного супернатанта экспрессионной культуры в SDCAA к 50 мМ ацетату натрия, рН 4,8, при концентрации, дающей А520 0,5 при измерении в анализе на восстанавливающий сахар Шомоди-Нельсона после инкубации с PASC, обработанной эндоглюканазой. Смеси 200 мкл фермента СВН II/буфера инкубировали в водяной бане при интересующей температуре в течение 10 минут. После инкубации добавляли 37,5 мкл PASC, обработанной эндоглюканазой, и 62,5 мкл 50 мМ ацетата натрия, и гидролиз проводили в течение 2 ч при 50°С. температуру инкубации, при которой фермент терял половину своей активности, определяли путем линейной интерполяции значений А520 анализа Шомоди-Нельсона, нанесенных на график против температуры.

Для измерений долговременного гидролиза Avicel PH101 (Fluka) 0,3 мкг очищенного СВН II инкубировали с 3 мг Avicel в 270 мкл 50 мМ ацетата натрия, рН 4,8, в пробирках для ПЦР, помещенных в водяную баню, в течение 16 часов. Пробирки охлаждали в водяной бане комнатной температуры в течение 10 минут, центрифугировали при 1000 g в течение 10 минут, и супернатанты отбирали на анализ восстанавливающего сахара.

Для оценки активности СВН II в супернатантах экспрессионных культур в YPD объемы супернатантов в диапазоне от 2 мл до 40 мл добавляли к 800 мкл 33 мг/мл Avicel, суспендированного в 50 мМ ацетате натрия, рН 4,8, в конических пробирках. Ферментам СВН II давали возможность связаться с Avicel при 4°С в течение одного часа, центрифугировали при 2000 g в течение 2 минут и дважды промывали 50 мМ ацетатом натрия, рН 4,8. После второй промывки СВН II-связанный Avicel ресуспендировали в 2,75 мл натрийацетатного буфера, делили на аликвоты по 270 мкл и инкубировали при 50°С в течение 2,5 часов. Центрифугирование и анализ восстанавливающего сахара проводили, как описано выше.

Пакет программ линейной регрессии в Mathematica использовали для приведения в соответствие данных Т50 химер СВН II с 17-параметрической аддитивной моделью блока и также использовали для анализа перекрестной проверки достоверности. Эффекты блока сообщают относительно референсного состояния родителя 1 (Н. insolens СВН II) с 16 параметрами, представляющими замену каждого из 8 блоков блоками от родителей 2 и 3.

Значения T50, определенные в данной заявке как температура, при которой фермент теряет 50% его активности во время десятиминутной инкубации, были определены для трех родительских целлобиогидролаз, 33 активных химер СВН II из предшествующих экспериментов и 18 дополнительных химер, предсказанных качественным моделированием стабильности как находящиеся среди наиболее термостойких, то есть не содержащие ни одного из 7 предсказанных дестабилизирующих блоков и содержащие либо 3, либо 4 из 4 предсказанных стабилизирующих блоков. Последовательности всех химер в количестве 51 приведены в таблице 8. Повторное культивирование и повторное концентрирование всех предсказанных термостойких химер, ранее классифицированных как несекретируемые, дало возможность получения достаточных количеств СВН II 12112132, 13111132 и 13322332 для определения Тбо. Полная серия значений Т50 для химер и родительских СВН II приведена в таблице 8. Аминокислотные последовательности для всех этих СВН II показаны в таблице 7. Все предсказанные протестированные термостойкие химеры в количестве 31 имели значения Т50 более чем на два градуса выше, чем наиболее термостойкий родительский фермент (64,8°С). В таблице также идентифицирован остаток Cys в блоке/домене 7, который может быть мутирован на Ser для получения повышенной термостойкости. Соответственно, в изобретении предложен полипептид любой из нижеследующих последовательностей, где подчеркнутый/выделенный курсивом/выделенный полужирным шрифтом Cys заменен остатком Ser, и где полученный в результате полипептид обладает улучшенной термостойкостью по сравнению с ферментом дикого типа.

Таблица 7: Аминокислотные последовательности родительских и химерных каталитических доменов СВН II, представленных в таблице 8. В таблицу также включен каталитический домен СВН II Р. chrysosporium. Все рекомбинантные СВН II имеют общий N-концевой СВМ и линкер от нативного СВН II Н. jecorina,

Таблица 8: Значения Т50 (°С) двух независимых повторов для родительских СВН II, 23 химер СВН II первоначальной серии образцов и предсказанных термостойких химер СВН II. 18 химер, синтезированных для данной работы, обозначены звездочками впереди. Химеры серии образцов и родители Предсказанные термостойкие химеры Последовательность Т50(1) T50(2) Среднее Т50 Последовательность T50(1) T50(2) Среднее Т50 32333113 52 51 51,5 12332331 66,5 67 66,8 13111313 56 53,5 54,8 *13112332 67 67 67

11313121 55 55,5 55,3 22311331 68 68 68 21131311 57,5 57 57,3 *12111332 68 68 68 31212111 59 58 58,5 *12112332 68,5 67,5 68 Родитель 2 60 58 59 12131331 68,5 69 68.8 23233133 61 61 61 *12131332 70 67,5 68,8 31311112 60 62 61 *12332332 69 69 69 22212231 63 61 62 12111131 70 68,5 69,3 13231111 63 6,5 63,3 12311332 70 69 69,5 12213111 63 63,5 63,3 13332331 70 69 69,5 Родитель 3 63,5 64,5 64 12132331 70,5 69 69,8 12133333 64 64 64 *12132332 70,5 69 69,8 Родитель 1 64 65,5 64,8 *13332332 69,5 70 69,8 33133132 65 66 65 12112132 71 68,5 69,8 11332333 64,5 66 65,3 13322332 71 68,5 69,8 23311333 65 66 65,5 *13131332 70 70 70 33213332 66 66 66 *12331332 71 69 70 13333232 67,5 67 67,3 *13312332 70 70 70 22232132 68 68 68 *11113332 69,5 70,5 70 11113132 71,5 71 71,3 *13113132 70,5 69,5 70 21333331 73,5 75,5 74,5 *11112132 70,5 70 70,3 21311131 75,5 75,5 75 *12113132 70,5 70,5 70,5 *13132332 69,5 71,5 70,5 *11111132 71 70,5 70,8 13331332 72 70 71 *13111132 72 69,5 71,3 *12222132 72,5 70 71,3 12222332 72 69,5 71,3 13311332 71 71,5 71,7 13311331 73,5 72,5 73

Применение линейной регрессии к данным последовательности - стабильности привело в результате к десятипараметрической модели, которая соответствует наблюдаемым значениям Т50 с R2=0,88 (Фиг.8). Чтобы лучше оценить предсказательную способность регрессионной модели вне испытательной серии, была проведена одиннадцатикратная проверка достоверности, которая привела в результате к R2 0,57, где удаление двух резко отклоняющихся значений (11313121 и 22222222) повышает достоверность перекрестной проверки R2 до 0,76. В регрессионной модели использован наиболее стабильный родитель 1 (Н. insolens) в качестве референсного значения Т50, и она включает девять дополнительных элементов, имеющих значение р ≤ 0,1. Параметры модели (таблица 9) показывают, что единственный блок, блок 7 от родителя 3 (В7Р3), вне всяких сомнений вносит самый сильный вклад в термостойкость химер относительно СВН II Н. insolens. Этот блок от СВН II С. thermophilum вносит вклад примерно 8,5°С в стабильность химер, которые его содержат. Было обнаружено, что два из 8 остальных блоков со значениями р ≤ 0,1 вносят меньшие вклады в стабильность, 1,2°С и 2,7°С, тогда как другие шесть снижают стабильность.

Таблица 9: Параметры и значения р модели линейной регрессии Т50. Значения параметров с р ≤ 0,1, используемые для вычисления соответствия регрессионной кривой Фиг.1, выделены полужирным шрифтом. Эффекты блоков представлены относительно референсного значения родителя 1 (СВН II Н. insolens) с 16 параметрами, представляющими замену каждого из 8 блоков от родителей 2 и 3. Блок Параметр
Значение
Значение р
Родитель 1 62,8 0,00 В12 -0,9 0,35 В13 -3,5 0,00 В22 -1,7 0,06 В23 -1,1 0,25 В32 0,5 0,68 B33 1.2 0,10 В42 2,7 0,05 В43 0,0 0,99 В52 -1,3 0,10 В53 -0,6 0,50 В62 -3,5 0,02 В63 -0,7 0,37 В72 -3,8 0,05 В73 8,5 0,00 В82 0,0 1,00 В83 -5,6 0,00

Выравнивание последовательностей В7Р1 и В7Р3 (Фиг.10) показывает, что блок 7 различается на 10 из 56 положений аминокислот в ферментах Н. insolens и С. thermophilum. В генетическом фоне химеры с самым высоким значением T50, 21311131, каждый остаток в В7Р3 (сегмент 7 родителя 3 (SEQ ID NO:6)) был индивидуально мутирован до соответствующего остатка в В7Р1 (сегмент 7 родителя 1 (SEQ ID NO:2)), и определены значения Т50 для каждого из полученных точечных мутантов. Мутация, S313C, значительно изменяла термостойкость химеры: данная одиночная мутация снижала Т50 21311131 примерно на 10°С (Фиг. 11).

Для изучения эффекта обратной мутации в различных генетических фонах гены для родительских СВН II Н. insolens и H. jecorina, кодирующие замену C313S (C314S в Н. insolens и C311S в Н. jecorina) были сконструированы, экспрессированы, и определены значения Т50 ферментов. Также количественно определяли стабильности химер 11111131 и 22222232, в которых стабилизирующий блок В7Р3 заменен с образованием ферментов дикого типа Н. insolens и Н. jecorina. Как замена блока В7Р3, так и точечная мутация Cys-Ser значительно стабилизировала родительские СВН II; самым высоким эффектом было ~8°С повышение Т50 для СВН II H. jecorina, содержащего замену C311S (Фиг.12). Мутацию Cys-Ser также тестировали в двух химерах, 31311112 и 13231111, которые не содержат В7Р3, а также в гомологичном СВН II (от Phanerochaete chrysosporium), который отсутствовал в рекомбинантной серии родителей. Каталитический домен СВН II Р. chrysosporium только на 55-56% идентичен каталитическим доменам родительских СВН II. Все эти ферменты стабилизировались в результате замены Cys-Ser; СВН II Р. chrysosporium был значительно стабилизирован на 10°С (Фиг.13).

Восемь из термостойких химер СВН II и родительских ферментов, содержащих эквивалентную мутацию C313S, были мечены His6-меткой и очищены таким образом, чтобы можно было определить их удельные активности. Как показано в таблице 10А, удельные активности, которые измеряли на аморфной целлюлозе (PASC) при 50°С, для этих химер и нативных ферментов, содержащих мутацию Cys-Ser, сходны с таковыми для родителей дикого типа. Таким образом, повышенная термостойкость осуществляется не за счет удельной активности.

Таблица 10А: Значения удельной активности (мкг эквивалент восстанавливающего сахара глюкозы/(мкг фермента СВН II × мин × 102)) для нативного СВН II, точечного мутанта и отобранных термостойких химер СВН II. Усы показывают стандартные ошибки, где стандартную ошибку определяют как стандартное отклонение/квадратный корень (n) для трех повторов. 2-часовая реакция, 3 мг фермента/г PASC, 50°С, 25 мМ ацетат натрия, рН 4,8. Фермент СВН II Удельная активность мкг восстанавливающего сахара/(мкг фермента × мин) × 102 Humicola insolens (Родитель 1) 5,3 +/- 0,5 Hypocrea jecorina (Родитель 2) 8,4 +/- 0,4 Chaetomium thermophilum (Родитель 3) 4,8 +/- 0,3 Phanerochaete chyrsosporium 7,7 +/- 0,3

Humicola insolens C314S 5,3 +/- 0,9 Hypocrea jecorina C311S 7,8 +/- 0,5 Phanerochaete chyrsosporium C311S 8,5 +/-0,1 HJPlus (Химера 12222332) 9,6 +/- 0,8 Химера 13111132 8,5 +/- 0,3 Химера 22222232 7,7 +/- 0,3 Химера 13311332 6,8 +/-0,6 Химера 13311331 6,2 +/- 0,3 Химера 11111131 6,1 +/-0,9 Химера 13112332 5,6 +/- 0,4 Химера 21311131 5,5 +/- 0,3 Химера 11113132 5,3 +/-0,5 Химера 21333331 3,8 +/- 0,4 Таблица 10 В: суммарная активность в супернатантах как синтетической (SDCAA), так и богатой (YPD) среды экспрессионной культуры для СВН II дикого типа Н. jecorina и Н. insolens, точечного мутанта C313S и СВН II с заменой блока В7Р3. Представленные значения представляют собой значения анализа активности мкг глюкозы/мл целлюлазы на мл эквивалент супернатанта экспрессионной культуры СВН II, добавленного в анализ целлюлазной активности. Для культур SDCAA использовали концентрированные супернатанты культуры SDCAA, и измеряли активность в отношении целлюлозы, набухшей в фосфорной кислоте (1 мг/мл), при 50°С в течение 100 минут в 50 мМ ацетате натрия, рН 4,8. Супернатант YPD СВН II концентрировали путем связывания с Avicel и измеряли активность в отношении Avicel (15 мг/мл) при 55°С в течение 150 минут в 50 мМ ацетате натрия, рН 4,8. CBHII SDCAA(1) SDCAA (2) SDCAA Среднее YPD (1) YPD (2) YPD Среднее H. jecorina 19 17 18 0,4 0,4 0,4 H. jeco C3HS 50 43 47 6,1 5,6 5,9 H. jeco B7P3 35 33 34 3,9 3,6 3,8 Н. insolens 73 83 78 6,2 6,0 6,1 H. insoC314S 100 97 98 8,8 8,0 8,4 Н. inso В7Р3 42 40 4,4 4,1 4,2

Затем те же восемь термостойких химер (Т50 на 2-10°С выше, чем для наиболее стабильного родителя) тестировали на активность на кристаллической целлюлозе в течение 16-часовой инкубации на протяжении диапазона температур, включающего температуры, где родительские ферменты проявляют малую активность или не проявляют никакой активности. На Фиг.9а показано, что 7 из 8 протестированных термостойких химер обладали максимальной активностью в отношении Avicel при 60-65°С, причем все 8 химер сохраняли активность при 70°С, самой высокой тестируемой температуре. Напротив, три родительские СВН II проявляют максимальную активность при 50°С и полностью или почти полностью неактивны при 70°С. Кроме того, семь химер с повышенными оптимальными температурами активности гидролизуют значительно большее количество Avicel, чем любой из родительских ферментов СВН II. Как показано на Фиг.9b, подобное поведение наблюдают для родителей Н. insolens и Н. jecorina, содержащих точечную мутацию Cys-Ser. Точечная мутация Cys-Ser также повышала гидролиз Avicel и максимальную рабочую температуру для СВН II Р. chrysosporium. Замена блока РЗВ7, которую осуществляли в родителях Н. insolens и Н. jecorina, повышала как рабочую температуру, так и гидролиз СВН II Н. insolens, но, несмотря на повышение максимальной рабочей температуры, не улучшала общий гидролиз целлюлозы ферментом Н. jecorina.

Низкую (менее 1 мг/л) секрецию СВН II Н. jecorina дикого типа из гетерологичного хозяина экспрессии S. cerevisiae. Мутация C311S в ферменте СВН II Н. jecorina дикого типа значительно повышает суммарную секретируемую активность СВН II (таблица 11). В синтетической среде (SDCAA) замены C311S и В7Р3 повышают суммарную секретируемую активность СВН II Н. jecorina в два раза, тогда как в богатой среде (YPD) повышение активности является десятикратным. Для родительского СВН II Н. insolens, который экспрессируется на значительно более высоких уровнях, чем два других родительских СВН II, мутация C314S повышала секретируемую активность примерно в 1,5 раза, тогда как замена блока В7Р3 снижала ее. Поскольку дикий тип и мутанты Cys-Ser Н. insolens и Н. jecorina все обладают сходными удельными активностями (таблица 10), увеличение суммарной секретируемой целлюлазной активности является результатом улучшенной секреции функционального фермента. Наблюдается корреляция между секрецией гетерологичного белка S. cerevisiae и стабильностью белка, что позволяет предположить, что повышенная секреция мутанта Cys-Ser СВН II может отражать его более высокие стабильности.

Таблица 11: Значения удельной активности (мкг эквивалент восстанавливающего сахара глюкозы/(мкг фермента СВН II × мин × 102)) для нативного СВН II, точечного мутанта и отобранных термостойких химерных СВН II. Усы показывают стандартные ошибки, где стандартную ошибку определяют как стандартное отклонение/квадратный корень (n) для трех повторов. 2-часовая реакция, 3 мг фермента/г PASC, 50°С, 25 мМ ацетат натрия, рН 4,8. Фермент СВН II Удельная активность мкг восстанавливающего сахара/(мкг фермента × мин) × 102

Humicola insolens (Родитель 1) 5,3 +/- 0,5 Hypocrea jecorina (Родитель 2) 8,4 +/- 0,4 Chaetomium thermophilum (Родитель 3) 4,8 +/- 0,3 Phanerochaete chyrsosporium 7,7 +/- 0,3 Humicola insolens C314S 5,3 +/- 0,9 Hypocrea jecorina C311S 7,8 +/- 0,5 Phanerochaete chyrsosporium C311S 8,5 +/- 0,1 HJPlus (Химера 12222332) 9,6 +/- 0,8 Химера 13111132 8,5 +/- 0,3 Химера 22222232 7,7 +/- 0,3 Химера 13311332 6,8 +/- 0,6 Химера 13311331 6,2 +/- 0,3 Химера 11111131 6,1 +/- 0,9 Химера 13112332 5,6 +/- 0,4 Химера 21311131 5,5 +/- 0,3 Химера 11113132 5,3 +7- 0,5 Химера 21333331 3,8 +/- 0,4

Для моделирования мутации Cys-Ser использовали высокое разрешение кристаллической структуры СВН II Н. insolens 1ocn. Сначала оптимизировали сеть водородных связей с помощью REDUCE. Было предсказано, что Cys314 образует водородную связь с карбонилом Pro 339. Для подтверждения этого предсказания укладку боковых цепей оптимизировали, используя платформу моделирования SHARPEN. Предсказано, что Ser314 осуществляет взаимодействия, подобные Cys314, приводящие в результате к более сильному водородному связыванию и более благоприятной геометрии (Фиг.14).

Ряд эффектов может объяснить, почему мутация Cys-Ser стабилизирует широкий ряд СВН II, включая нативные СВН II и химеры. Cys и Ser являются подобными (хотя не изостерическими), и эти две аминокислоты доминируют в выравниваниях последовательностей в этом положении по сравнению с другими альтернативами. Схемы водородного связывания для этого остатка являются структурными элементами (амид Gly316 и карбонил Pro339), и поэтому менее вероятно зависят от вариаций третьесторонних аминокислот. Кроме того, непосредственно примыкающие боковые цепи для этого кармана (Asn283, Pro339, Phe345) являются консервативными среди всех четырех исследованных нативных целлюлаз СВН II.

Высокое разрешение (1.3 Å) кристаллической структуры Н. insolens (pdb entry 1ocn6) показывает, что Cys314 составляет часть сети водородных связей (Фиг.15). Повышенная способность к водородному связыванию Ser относительно Cys может позволить предположить роль более сильных взаимодействий водородного связывания в стабилизации. Кристаллическая структура также позволяет предположить, что Ser может быть предпочтительным по стерическим причинам. Конкретно, когда боковая цепь Cys заново строится с каноническими углами связей, наклон 6° исчезает, и Cys проталкивается ближе к карбонилу Pro339, создавая неблагоприятное стерическое взаимодействие.

Выравнивание 196 белковых последовательностей, обладающих самой высокой идентичностью с СВН II Н. jecorina. Пятьдесят четыре из 250 наиболее идентичных последовательностей было исключено из выравнивания вследствие избыточности (то есть точечных мутаций для структурных исследований или более 95% идентичных изоформ). Существует предпочтительный сдвиг в направлении Ser311: 158 последовательностей имеет Ser, 20 имеет Ala, 10 имеет Cys, 5 имеет делецию, и 3 имеет Gly. Однако существует 42 других положения, где наиболее частый выбор осуществляется более чем с двукратной частотой аминокислоты Н. jecorina.

Большой стабилизирующий эффект мутации Cys-Ser создает возможность, что Ser в данном положении является глобальным показателем термостойкости нативной целлюлазы. Однако Т50 64,8°С для СВН II Н. insolens, который характеризуется Cys в данном положении, является более высокой, чем для СВН II С.thermophilum (64,0°C), указывая на то, что Ser является не единственной детерминантой стабильности.

Термостойкость является не единственным свойством, представляющим интерес для промышленных целлюлаз. Важны также удельная активность, изменения в связывании целлюлозы и эффекты на экспрессию и ингибирование продуктом. Представленные в данной заявке химеры и данные демонстрируют, что рекомбинация образует химеры СВН II, улучшенная термостойкость которых происходит не за счет удельной активности, измеренной в анализах кратковременного (например, 2-часового) гидролиза целлюлозы. Подобные наблюдения были сделаны для СВН II, содержащих термостабилизирующую мутацию Cys-Ser. В анализах долговременного гидролиза несколько из химер СВН II и все три протестированных мутанта Cys-Ser СВН II гидролизовали большее количество целлюлозы, чем нативные СВН II. Данное лучшее качество, вероятно, является результатом обладания удельной активностью, сравнимой с родительскими СВН II, параллельно с более высокой термостойкостью, которая позволяет ферменту продолжать функционировать в течение более длительного времени при повышенных температурах, поскольку эти анализы проводили с равными количествами очищенного родительских ферментов, химерных ферментов и мутантов Cys-Ser, наблюдаемые улучшения высокотемпературного гидролиза не являются результатом повышенной секреции из хозяина экспрессии S. cerevisiae. Следовательно, доказано, что термостойкие химеры и мутанты Cys-Ser могут быть полезными компонентами препаратов ферментов для расщепления целлюлозы.

Хотя проиллюстрированы и описаны различные конкретные формы осуществления, понятно, что можно произвести различные изменения без отклонения от сущности и объема изобретения.

Похожие патенты RU2597289C2

название год авторы номер документа
ЦЕЛЛЮЛОЗНЫЕ БЕЛКИ СЛИЯНИЯ И ИХ ПРИМЕНЕНИЕ 2007
  • Алапуранен Марика
  • Валтакари Лина
  • Каллио Ярно
  • Ойапало Пентти
  • Вехмааперя Яри
RU2458127C2
КОМПОЗИЦИИ И СПОСОБЫ, ВКЛЮЧАЮЩИЕ ВАРИАНТЫ ЦЕЛЛЮЛАЗЫ СО СНИЖЕННЫМ СРОДСТВОМ К НЕЦЕЛЛЮЛОЗНЫМ МАТЕРИАЛАМ 2009
  • Каскао-Перейра Луис Г.
  • Капер Тейс
  • Келемен Брэдли Р.
  • Лю Эми
RU2486242C2
Чистящие композиции, содержащие варианты амилазы в соответствии с перечнем последовательностей 2012
  • Джексон Мишель
  • Соутер Филип Фрэнк
  • Бевик Линдсей Сюзанн
  • Каасгаард Свенд
  • Оебро Йенс
  • Ларсен Сигне Ескилдсен
  • Свендсен Аллан
  • Йохансен Аннетт Хелле
  • Скйоет Майкл
  • Андерсен Карстен
  • Бейер Ларс
  • Фриис Есбен Петер
  • Тоскано Мигель Дуарте Гильерме Перейра
  • Бйоернвад Мадс
  • Расмуссен Фрэнк Винтер
  • Христиансен Лив Спаангнер
RU2617954C2
СКОНСТРУИРОВАННЫЕ ПЕСТИЦИДНЫЕ БЕЛКИ И СПОСОБЫ КОНТРОЛЯ ВРЕДИТЕЛЕЙ РАСТЕНИЙ 2017
  • Чхэ Хюнсук С.
RU2772947C2
СПОСОБЫ ПОВЫШЕНИЯ УСИЛИВАЮЩЕЙ ЦЕЛЛЮЛОЛИТИЧЕСКОЙ АКТИВНОСТИ ПОЛИПЕПТИДА 2008
  • Макфарланд Кейт
  • Харрис Пол
RU2510417C2
ВАРИАНТЫ СЕМЕЙСТВА, СОСТОЯЩЕГО ИЗ 44 КСИЛОГЛЮКАНАЗ 2009
  • Бесенматтер,Вернер
  • Фриис,Эсбен Петер
  • Гибсон,Кит
  • Расмуссен,Франк Винтер
  • Скьот,Микаэль
RU2545721C2
СПОСОБЫ УСИЛЕНИЯ ДЕГРАДАЦИИ ИЛИ ПРЕВРАЩЕНИЯ ЦЕЛЛЮЛОЗНОГО МАТЕРИАЛА 2006
  • Харрис Пол
  • Рей Майкл
  • Дин Ханьшу
RU2441912C2
УЛУЧШЕННАЯ ПРОДУКЦИЯ БЕЛКА В BACILLUS 2008
  • Сервен Маргерит А.
  • Феррари Эудженио
  • Пауэр Скотт Д.
RU2515112C2
БЕТА-ГЛЮКАНАЗЫ TALAROMYCES EMERSONII 2001
  • Ван Ден Хомберг Йоханнес Петрус Теодорус Вильхельмус
  • Ван Дер Лан Ян-Метске
  • Дарен Жан-Марк Жорж
  • Хервейер Маргарета Адриана
  • Тойфель Даниэль Пауль
RU2321635C2
МОЮЩИЕ КОМПОЗИЦИИ, СОДЕРЖАЩИЕ ЛИПАЗЫ 2018
  • Паттерсон, Стивен, Джордж
  • Момин, Назармохаммад, Гуламхуссейн
  • Тоскано, Мигель, Д.Г.П.
  • Поульсен, Томас, А.
  • Хансен, Карстен, Х.
  • Баунсгор, Лоне
  • Гибсон, Кит
RU2775700C2

Иллюстрации к изобретению RU 2 597 289 C2

Реферат патента 2016 года ПОЛИПЕПТИДЫ, ОБЛАДАЮЩИЕ ЦЕЛЛЮЛАЗНОЙ АКТИВНОСТЬЮ

Настоящее изобретение относится к области биохимии. Предложен рекомбинантный полипептид, имеющий мутацию с заменой цистеина на серин в С-концевой области и обладающий целлюлазной активностью и улучшенной термостойкостью. Также представлен полинуклеотид, кодирующий полипептид по изобретению, экспрессионный вектор, клетка-хозяин, ферментный препарат и способ обработки биомассы. Полипептид по настоящему изобретению может найти дальнейшее применение в качестве компонента препаратов для расщепления целлюлозы. 9 н.п. ф-лы, 15 ил., 11 табл.

Формула изобретения RU 2 597 289 C2

1. Рекомбинантный полипептид, включающий последовательность SEQ ID NO: 2, содержащую C314S; SEQ ID NO: 4, содержащую C311S; SEQ ID NO: 12, содержащую C310S; SEQ ID NO: 19, содержащую C313S; SEQ ID NO: 21, содержащую C312S; SEQ ID NO: 34; SEQ ID NO: 108 или SEQ ID NO: 109, где вышеуказанный полипептид обладает целлюлазной активностью и улучшенной термостойкостью по сравнению с соответствующим родительским (дикого типа) белком, не имеющим мутации С→S.

2. Полинуклеотид, кодирующий полипептид по п.1, где полипептид обладает целлюлазной активностью и улучшенной термостойкостью по сравнению с соответствующим родительским белком.

3. Экспрессионный вектор, содержащий полинуклеотид по п.2.

4. Клетка-хозяин для получения полипептида по п.1, содержащая полинуклеотид по п.2.

5. Клетка-хозяин для получения полипептида по п.1, содержащая вектор по п.3.

6. Ферментный препарат, обладающий целлюлазной активностью, содержащий функциональное количество полипептида по п.1.

7. Ферментный препарат, обладающий целлюлазной активностью, содержащий указанный полипептид, продуцированный клеткой-хозяином по п.4.

8. Способ обработки биомассы, содержащей целлюлозу, включающий приведение биомассы в контакт с полипептидом по п.1.

9. Способ обработки биомассы, содержащей целлюлозу, включающий приведение биомассы в контакт с ферментным препаратом по п.6.

Документы, цитированные в отчете о поиске Патент 2016 года RU2597289C2

US 7348168 B2, 25.03.2008
MATS SANDGREN, et al., "Structural and biochemical studies of GH family 12 cellulases: improved thermal stability, and ligand complexes", Progress in Biophysics and Molecular Biology 89 (2005) 246-291;
US 5871550 A, 16.02.1999
Y.-H
PERCIVAL ZHANG, et al., "Outlook for cellulase improvement: Screening and selection

RU 2 597 289 C2

Авторы

Арнольд Фрэнсис Х.

Хайнцельман Пит

Даты

2016-09-10Публикация

2010-04-06Подача