ОБЛАСТЬ ТЕХНИКИ
В настоящем изобретении раскрыты новые полинуклеотидные последовательности генов, кодирующих членов семейства CLC хлоридных каналов из растений рода Nicotiana, и их варианты, гомологи, фрагменты и мутанты. Также раскрыты полипептидные последовательности и их варианты, гомологи, фрагменты и мутанты. Также раскрыта модификация экспрессии одного или нескольких из этих генов или активности белка, кодируемого ими, для модулирования уровней табак-специфичных нитрозаминов (TSNA) в растении или его составной части.
УРОВЕНЬ ТЕХНИКИ
Табак-специфичные нитрозамины (TSNA) образуются главным образом во время сушки и первичной переработки табачных листьев. Сушка табака представляет собой процесс физических и биохимических изменений, которые выявляют аромат и вкус каждой разновидности табака. Считается, что количество TSNA в высушенном табачном листе зависит от накопления нитритов, которые накапливаются во время смерти растительной клетки и образуются во время сушки при восстановлении нитратов в приближающихся к анаэробным (дефицит кислорода) условиях окружающей среды. Восстановление нитратов до нитритов, как полагают, происходит под действием бактерий на поверхности листа в анаэробных условиях, и это восстановление особенно выражено при определенных условиях. После того, как образуются нитриты, эти соединения, как полагают, соединяются с различными алкалоидами табака, в том числе, пиридин-содержащими соединениями, с образованием нитрозаминов.
Четыре основных TSNA, то есть те, присутствие которых, как правило, обнаруживается в самых высоких концентрациях, это N-нитрозоникотин (NNN); 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK), N-нитрозоанабазин (NAB) и N-нитрозоанатабин (NAT). Второстепенные соединения, то есть те, которые, как правило, обнаруживаются на значительно более низких уровнях, чем основные TSNA, включают в себя 4-(метилнитрозамино)-4-(3-пиридил)бутаналь (NNA), 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанол (NNAL), 4-(метилнитрозамино)-4-(3-пиридил)-1-бутанол (изо-NNAL) и 4-(метилнитрозамино)-4-(3-пиридил)-1-масляную кислоту (изо-NNAC). Сообщалось, что по меньшей мере NNN и NNK являются канцерогенными при применении в отношении животных в лабораторных исследованиях.
Снижение концентрации соединений, ответственных за нитрозирование алкалоидов до TSNA, может привести к снижению уровня TSNA в высушенных листьях. Основным нитрозирующим средством в табачных листьях является нитрит (NO2-), образуемый в результате восстановления свободного нитрата (NO3-) в ферментативной реакции, возможно, катализируемой бактериями во время сушки. Исследования с использованием удобрений, изменяющих уровни нитрата в растениях табака Burley, приводили к различным уровням TSNA в высушенных листьях и дыме. Нитраты являются основным источником азота, доступным в почве. В растениях они поглощаются эпидермальными клетками корней и транспортируются по всему растению, первоначально, с восстановлением до нитритов, которые в дальнейшем восстанавливаются до аммиака и затем ассимилируются в аминокислотах. К сожалению, ограничение азота во время роста табака Burley приводит к неблагоприятным агрономическим фенотипам, таким как низкий выход биомассы и задержка созревания растений и, следовательно, не является коммерчески выгодным подходом к снижению уровней TSNA. Попытка управлять накоплением нитратов в табачном листе представляет собой серьезную проблему.
В WO 98/58555 описана обработка табачных листьев до или во время дымовой сушки в микроволновой печи для снижения TSNA. В патенте США №5810020 описан способ удаления TSNA из табака путем контакта табачного материала с улавливающим поглотителем, где улавливающий поглотитель содержит выбранный комплекс переходного металла, который легко нитрозируется с образованием нитрозильного комплекса с небольшим кинетическим или термодинамическим барьером. В патенте США №6202649 описан способ по существу предотвращения образования TSNA путем, среди прочего, сушки табака в контролируемой среде, имеющей достаточный воздушный поток, чтобы по существу предотвратить анаэробные условия в непосредственной близости от табачного листа. Контролируемую среду обеспечивают путем управления одним или несколькими параметрами сушки, такими как воздушный поток, влажность и температура. Однако такие способы, как эти, могут добавить значительную стоимость и время к производству табака и, следовательно, с меньшей вероятностью будут приняты в табачной промышленности. Таким образом, остается потребность в эффективном и относительно недорогом способе снижения TSNA.
Молекулярные способы снижения уровней TSNA в растениях весьма желательны, поскольку они не требуют дорогих и зачастую комплексных способов для достижения сниженных уровней TSNA. Один из таких молекулярных подходов раскрыт в WO 2011/088180. Раскрыты композиции и способы для ингибирования экспрессии или функции полипептидов корень-специфической никотиндеметилазы, которые участвуют в метаболическом превращении никотина в норникотин в корнях растений табака. Раскрыта генная последовательность гена никотиндеметилазы CYP82E10. Было обнаружено, что снижение экспрессии этого гена снижает уровни NNN в высушенных табачных листьях. Хотя могут быть получены сниженные уровни NNN, существует более чем один TSNA, являющийся, как сообщалось, канцерогенным, который все еще останется в модифицированных растениях. Другие гены никотиндеметилазы включают в себя CYP82E4 и CYP82E5, которые участвуют в превращении никотина в норникотин и описаны в WO 2006091194, WO 2008070274 и WO 2009064771.
Существует постоянная потребность в данной области в разработке молекулярных стратегий для снижения уровней TSNA в высушенных табачных листьях. Настоящее изобретение направлено на решение этой потребности.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Авторы настоящего изобретения клонировали новые гены, кодирующие различных членов семейства CLC хлоридных каналов из растений, принадлежащих к роду Nicotiana, и обозначили как CLC-Nt2 и NtCLCe. Две копии ортологичного гена, происходящего от двух предков, N.tomentosiformis и N.sylvestris, встречаются в Nicotiana tabacum и обозначены в данном документе как CLC-Nt2-t и CLC-Nt2-s или NtCLCe-t и NtCLCe-s, соответственно. Полинуклеотидные последовательности этих генов изложены в SEQ ID NO: 1-4, 10 и 11 и полипептидные последовательности этих генов изложены в SEQ ID NO: 5-7 и 12-14. При снижении экспрессии этих генов в растениях табака обнаружено снижение уровня нитратов в растениях. В частности, обнаружено снижение уровня нитратов в зеленых листьях. Общее содержание TSNA после сушки листьев у этих растений снижено. Это означает, что низкие уровни нитратов могут вызвать образование более низких уровней TSNA в высушенном растительном материале, таком как высушенные листья. Авторы настоящего изобретения неожиданно обнаружили, что снижение по меньшей мере NNK обнаружено в высушенном растительном материале растений как NtCLCe-RNAi, так и CLC-Nt2-RNAi. Наблюдалось также снижение общего содержания TSNA. Снижение экспрессии NtCLCe и/или CLC-M2, таким образом, способствует снижению уровня нитратов в табачных листьях. После сушки может снизиться по меньшей мере NNK и, необязательно, другие TSNA, которые могут включать в себя NNN, или NAB, или NAT, или комбинацию двух или более из них. Кроме того, внешний вид растений по существу не изменен, что является важным критерием для принятия промышленностью и для максимизации урожайности растений и тому подобного. Кроме того, уровни биомассы по существу не изменены, что является еще одним важным критерием для принятия промышленностью и для максимизации урожайности растений и тому подобного. Настоящее изобретение может, таким образом, быть особенно полезным для модулирования (например, увеличения или уменьшения) уровня нитратов или общих TSNA в растениях, включая по меньшей мере NNK. В частности, настоящее изобретение может быть особенно полезным в комбинации с другими способами, которые способны снизить уровни TSNA. Таким образом, может быть желательно в некоторых вариантах осуществления снизить экспрессию одного или нескольких полинуклеотидов, описанных в данном документе, вместе со снижением экспрессии одного или нескольких генов никотиндеметилазы в растении табака. Эта комбинация, как ожидается, будет снижать уровни по меньшей мере NNK и NNN в высушенном растительном материале, что будет весьма желательно, поскольку сообщалось, что как NNK, так и NNN являются канцерогенными при применении у животных в лабораторных исследованиях. Табачные изделия, полученные из растений табака, описанных в данном документе, могут найти применение в способах для снижения потенциала канцерогенности этих табачных изделий и снижения воздействия на человека канцерогенных нитрозаминов. Мутанты полипептидных последовательностей, описанных в данном документе, которые могут модулировать содержание нитратов в растениях, также описаны.
АСПЕКТЫ И ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ
Аспекты и варианты осуществления настоящего изобретения изложены в прилагаемой формуле изобретения.
В первом аспекте описана мутантная, не встречающаяся в природе или трансгенная растительная клетка, содержащая: (i) полинуклеотид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептид, кодируемый полинуклеотидом, изложенным в (i); (iii) полипептид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; или (iv) конструкцию, вектор или вектор экспрессии, содержащий выделенный полинуклеотид, изложенный в (i), и где экспрессию или активность полинуклеотида или полипептида модулируют по сравнению с контрольным растением, содержащим контрольную растительную клетку, и где уровни нитратов в мутантном, не встречающемся в природе или трансгенном растении, содержащем мутантную, не встречающуюся в природе или трансгенную растительную клетку, модулируют по сравнению с контрольным растением, содержащим контрольную растительную клетку. Путем снижения экспрессии одного или нескольких генов в растениях табака могут быть снижены уровни нитратов. Общее содержание TSNA и/или уровни NNK могут быть снижены в высушенном растительном материале.
В одном варианте осуществления указанная мутантная, не встречающаяся в природе или трансгенная растительная клетка содержит одну или несколько мутаций в раскрытых полипептидах и полинуклеотидах, которые снижают уровень нитратов в мутантном, не встречающемся в природе или трансгенном растении, содержащем мутантную, не встречающуюся в природе или трансгенную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку. Мутация (мутации) может включать в себя мутацию по типу замены в положении G163 из SEQ ID NO: 5.
В одном варианте осуществления указанная мутантная, не встречающаяся в природе или трансгенная растительная клетка содержит одну или несколько мутаций в раскрытых полипептидах и полинуклеотидах, которые увеличивают уровень нитратов в мутантном, не встречающемся в природе или трансгенном растении, содержащем мутантную, не встречающуюся в природе или трансгенную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку. Мутация (мутации) может включать в себя мутацию по типу замены в положении Р143 из SEQ ID NO: 13.
В дополнительном аспекте описано мутантное, не встречающееся в природе или трансгенное растение или его составная часть, содержащая растительную клетку, описанную в данном документе.
В дополнительном аспекте описан способ модулирования содержания по меньшей мере нитратов (например, 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK)) в растении или его составной части, включающий этапы: (а) модулирования экспрессии или активности: (i) полинуклеотида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептида, кодируемого полинуклеотидом, изложенным в (i); или (iii) полипептида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; (b) измерение содержания по меньшей мере нитратов (например, NNK) по меньшей мере в части мутантного, не встречающегося е природе или трансгенного растения, полученного на этапе (а); и (с) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором содержание по меньшей мере нитратов (например, NNK) изменено по сравнению с контрольным растением, в котором экспрессию или активность полинуклеотида или полипептида, изложенного в (а), не модулировали.
В дополнительном аспекте описан способ модулирования содержания по меньшей мере нитратов (например, 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK)) в растении или его составной части, включающий этапы: (а) модулирования экспрессии или активности: (i) полинуклеотида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептида, кодируемого полинуклеотидом, изложенным в (i); или (iii) полипептида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; (b) измерение содержания по меньшей мере нитратов (например, NNK) по меньшей мере в части мутантного, не встречающегося в природе или трансгенного растения, полученного на этапе (а); и (с) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором содержание по меньшей мере нитратов (например, NNK) изменено по сравнению с контрольным растением, в котором экспрессию или активность полинуклеотида или полипептида, изложенного в (а), не модулировали.
Соответственно, содержание нитратов например, NNK) и/или общее содержание TSNA и/или содержание никотина модулируют в растении, таком как высушенный растительный материал.
Соответственно, содержание NNN является по существу таким же, как в контрольном растении.
Соответственно, составная часть растения представляет собой лист, соответственно, высушенный лист или высушенный табак.
В дополнительном аспекте описано растение или его составная часть, полученная или получаемая способами, описанными в данном документе.
В дополнительном аспекте описано мутантное, не встречающееся в природе или трансгенное растение, в котором содержание NNK составляет приблизительно 110 нг/г или менее, необязательно, где содержание нитратов составляет приблизительно 7 мг/г или менее. Соответственно, растение находится в виде высушенного растительного материала.
В дополнительном аспекте описано мутантное растение, в котором содержание нитратов составляет приблизительно 6 мг/г или менее и содержание никотина составляет приблизительно 13 мг/г или менее.
Соответственно, экспрессию: (i) полинуклеотида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептида, кодируемого полинуклеотидом, изложенным в (i); или (iii) полипептида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 модулируют по сравнению с контрольным растением.
В дополнительном аспекте описан растительный материал, в том числе биомасса, семена, стебли или листья растений, описанных в данном документе.
В дополнительном аспекте описано табачное изделие, содержащее растительную клетку, по меньшей мере часть растения или растительный материал, описанный в данном документе.
В дополнительном аспекте описан способ получения высушенного растительного материала, такого как листья, со сниженными уровнями NNK в них, включающий этапы: (а) обеспечения по меньшей мере части растения или растительного материала, описанного в данном документе; (b) необязательно, сбор растительного материала с растения и (с) сушку растительного материала в течение периода времени, достаточного для снижения в нем по меньшей мере уровней NNK.
В дополнительном аспекте описан выделенный полинуклеотид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 99,1% идентичности последовательности с SEQ ID NO: 1, или 97,1% идентичности последовательности с SEQ ID NO: 2, или 63% идентичности последовательности с SEQ ID NO: 3, или 61% идентичности последовательности с SEQ ID NO: 4, или 60% идентичности последовательности с SEQ ID NO: 10, или 60% идентичности последовательности с SEQ ID NO: 11.
В дополнительном аспекте описан выделенный полипептид, кодируемый полинуклеотидом(-ами), описанным в данном документе.
В дополнительном аспекте описан выделенный полипептид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 99,1% идентичности последовательности с SEQ ID NO: 5, или по меньшей мере 98,1% идентичности последовательности с SEQ ID NO: 6, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 7, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 12, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 13, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 14.
В дополнительном аспекте описана конструкция, вектор или вектор экспрессии, содержащий один или более выделенных полинуклеотидов, описанных в данном документе.
В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций в: (i) полинуклеотиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептиде, кодируемом полинуклеотидом, изложенным в (i); или (iii) полипептиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; и где указанная одна или несколько мутаций модулируют экспрессию или активность полинуклеотида или полипептида по сравнению с контрольным растением, содержащим контрольную растительную клетку, и где уровни нитратов в мутантном растении, содержащем мутантную растительную клетку, модулируют по сравнению с контрольным растением.
В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций в: (i) полинуклеотиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептиде, кодируемом полинуклеотидом, изложенным в (i); или (iii) полипептиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; и где указанная одна или несколько мутаций модулируют экспрессию или активность полинуклеотида или полипептида по сравнению с контрольным растением, содержащим контрольную растительную клетку, и где уровни нитратов в мутантном растении, содержащем мутантную растительную клетку, модулируют по сравнению с контрольным растением.
В дополнительном аспекте обеспечен способ снижения канцерогенного потенциала табачного изделия, при этом указанный способ включает получение указанного табачного изделия из растения табака или части растения или его потомства, как описано в данном документе.
В дополнительном аспекте описано использование конструкции, описанной в данном документе, в способе изготовления растений, имеющих модулированные уровни нитратов и/или NNK и/или общих TSNA относительно контрольного растения.
В дополнительном аспекте описано использование полинуклеотида или полипептида, описанного в данном документе, для модулирования уровней нитратов и/или NNK и/или общих TSNA в растении относительно контрольного растения.
В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций, которые уменьшают уровень нитратов в мутантном растении, содержащем мутантную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку, где указанная мутация (мутации) включает в себя мутацию по типу замены в положении G163 из SEQ ID NO: 5.
В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций, которые уменьшают уровень нитратов в мутантном растении, содержащем мутантную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку, где указанная мутация (мутации) включает в себя мутацию по типу замены в положении Р143 из SEQ ID NO: 13.
В дополнительном аспекте раскрыта полипептидная последовательность, содержащая или состоящая из последовательности, изложенной в SEQ ID NO: 5, с мутацией по типу замены в положении G163, соответственно, G163R.
В дополнительном аспекте раскрыта полипептидная последовательность, содержащая или состоящая из последовательности, изложенной в SEQ ID NO: 13, с мутацией по типу замены в положении Р143, соответственно, P143L.
В дополнительном аспекте мутантные полипептиды, как описано в данном документе, раскрыты.
Каждый из вариантов осуществления, обсуждаемых выше, раскрыт в виде вариантов осуществления каждого из аспектов настоящего изобретения. Предполагаются комбинации одного или нескольких вариантов осуществления.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фигура 1: Полуколичественная ПЦР в реальном времени трех представителей линий NtCLCe-RNAi (дорожки 1, 2 и 3), wt (дорожки 4, 5 и 6) и линий CLC-Nt2-RNAi (дорожки 7, 8 и 9), показывающая экспрессию транскриптов тубулина (ген «домашнего хозяйства»), NtCLCe и CLC-Nt2.
Фигура 2: Анализ уровня никотина и нитратов в зеленых листьях растений wt (n=11), NtCLCe-RNAi (n=5) и CLC-Nt2-RNAi (n=5) (А); общее содержание TSNA в соответствующих листьях после процесса теневой сушки. В этом эксперименте растения выращивали в 3-литровых горшках, и самое высокое общее значение TSNA соответствует 200 нг/г.
Фигура 3: Анализ уровня никотина, нитратов в зеленых листьях (А), вес листьев (В) и количество листьев (С) растений wt (n=4), NtCLCe-RNAi и CLC-Nt2-RNAi (n=8), лишенных одновременно транскриптов CLC-Nt2 и NtCLCe (линии CLC-RNAi). Листья собрали через 10 недель роста в 10-литровых горшках в контролируемых тепличных условиях. В данном эксперименте максимальные значения для никотина и нитратов составили 29,6 и 6,4 мг/г, соответственно.
Фигура 4: Процентное содержание NNK в листьях теневой сушки растений wt, NtCLCe-RNAi и CLC-Nt2-RNAi после выращивания в 10-литровых горшках, как показано на Фигуре 3. В данном эксперименте самое высокое значение NNK соответствовало 108 нг/г.
Фигура 5: Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных растений G163R CLCNt2-s. Цельные листья собирают с середины стебля выращенных в поле гомозиготных растений G163R CLCNt2-s (треугольник) и внесегрегантных растений дикого типа (ромб), растущих в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигуре. Раннее утро = 8:00-9:00; середина утра = 9:30-10:30; позднее утро = 11:00-12:00.
Фигура 6: Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных растений P143L NtCLCe-t. Цельные листья собирают с середины стебля выращенных в поле гомозиготных растений P143L NtCLCe-t (квадрат) и внесегрегантных растений дикого типа (ромб), растущих в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигуре. Раннее утро = 8:00-9:00; середина утра = 9:30-10:30; позднее утро = 11:00-12:00.
ОПРЕДЕЛЕНИЯ
Техническим терминам и выражениям, используемым в пределах объема данной заявки, следует придавать значение, которое обычно применяется к ним е данной области биологии растений и молекулярной биологии. Все нижеследующие определения терминов применяют ко всему содержанию данной заявки. Слово «содержащий» не исключает другие элементы или этапы и неопределенный артикль не исключает множество. Один этап может выполнять функции нескольких признаков, определенных в формуле изобретения. Термины «приблизительно», «по существу» и «примерно» в контексте данного цифрового значения или диапазона относятся к значению или диапазону, который находится в пределах 20%, в пределах 10%, или в пределах 5%, 4%, 3%, 2% или 1% от заданного значения или диапазона.
Термин «выделенный» относится к любому объекту, который взят из его естественной среды, но этот термин не подразумевает какой-либо степени очистки.
«Вектор экспрессии» представляет собой средство доставки нуклеиновой кислоты, которое содержит комбинацию компонентов нуклеиновой кислоты для обеспечения экспрессии нуклеиновой кислоты. Подходящие векторы экспрессии включают в себя эписомы, способные к экстра-хромосомной репликации, такие как кольцевые плазмиды из двухцепочечной нуклеиновой кислоты; линеаризованные плазмиды из двухцепочечной нуклеиновой кислоты и другие функционально эквивалентные векторы экспрессии любого происхождения. Вектор экспрессии содержит по меньшей мере промотор, расположенный выше по цепи и функционально связанный с нуклеиновой кислотой, конструкции нуклеиновых кислот или конъюгат нуклеиновых кислот, как определено ниже.
Термин «конструкция» относится к двухцепочечному фрагменту рекомбинантной нуклеиновой кислоты, содержащему один или несколько полинуклеотидов. Конструкция содержит «матричную цепь», основания которой спарены с комплементарной «смысловой или кодирующей цепью». Данная конструкция может быть встроена в вектор в двух возможных ориентациях, либо в той же (или смысловой) ориентации, или в обратной (или антисмысловой) ориентации по отношению к ориентации промотора, расположенного в векторе, таком как вектор экспрессии.
«Вектор» относится к средству доставки нуклеиновой кислоты, которое содержит комбинацию компонентов нуклеиновой кислоты для обеспечения транспорта нуклеиновой кислоты, конструкций нуклеиновых кислот и конъюгатов нуклеиновых кислот и тому подобного. Подходящие векторы включают в себя эписомы, способные к экстра-хромосомной репликации, такие как кольцевые плазмиды из двухцепочечной нуклеиновой кислоты; линеаризованные плазмиды из двухцепочечной нуклеиновой кислоты и другие векторы любого происхождения.
«Промотор» относится к элементу/последовательности нуклеиновой кислоты, как правило расположенной выше по цепи и функционально связанной с фрагментом двухцепочечной ДНК. Промоторы могут быть получены целиком из областей вблизи нативного представляющего интерес гена, или могут состоять из разных элементов, полученных из различных нативных промоторов или сегментов синтетической ДНК.
Термины «гомология, идентичность или сходство» относятся к степени сходства последовательностей между двумя полипептидами или между двумя молекулами нуклеиновых кислот, сравниваемых путем выравнивания последовательностей. Степень гомологии между двумя отдельными сравниваемыми последовательностями нуклеиновых кислот является функцией количества идентичных или совпадающих нуклеотидов в сопоставимых положениях. Процент идентичности может быть определен путем визуального осмотра и математических расчетов. В качестве альтернативы, процент идентичности двух последовательностей нуклеиновых кислот можно определить путем сравнения информации о последовательностях с использованием компьютерной программы, такой как ClustalW, BLAST, FASTA или Smith-Waterman. Можно использовать параметры по умолчанию для данных программ.
Термин «растение» относится к любому растению на любой стадии его жизненного цикла или развития и его потомству. В одном варианте осуществления растение представляет собой «растение табака», которое относится к растению, принадлежащему к роду Nicotiana. Предпочтительные виды растения табака описаны в данном документе.
«Растительная клетка» относится к структурной и физиологической единице растения. Растительная клетка может находиться в виде протопласта без клеточной стенки, выделенной отдельной клетки или культивируемой клетки, или как часть более организованной единицы, такой как, помимо прочего, растительная ткань, растительный орган или целое растение.
Термин «растительный материал» относится к любой твердой, жидкой или газообразной композиции, или их комбинации, получаемой из растения, включая биомассу, листья, стебли, корни, цветки или части цветка, плоды, пыльцу, яйцеклетки, зиготы, семена, черенки, секреты, экстракты, клеточные или тканевые культуры, или любые другие части или продукты растения. В одном варианте осуществления растительный материал содержит или состоит из биомассы, стеблей, семян или листьев. В другом варианте осуществления растительный материал содержит или состоит из листьев.
Термин «разновидность» относится к популяции растений, которые разделяют постоянные характеристики, отделяющие их от других растений того же вида. Имея один или несколько отличительных признаков, разновидность дополнительно характеризуется очень небольшим общим варьированием между особями в пределах этой разновидности. Разновидность часто продается на коммерческой основе.
Термин «линия» или «линия разведения», используемый в данном документе, обозначает группу растений, которые используют во время селекции растений. Линия отличается от разновидности, поскольку демонстрирует небольшую вариабельность между особями по одному или нескольким представляющим интерес признакам, хотя может присутствовать некоторая вариабельность между особями по другим признакам.
Термин «модулирование» может относиться к снижению, ингибированию, увеличению или иному влиянию на экспрессию или активность полипептида. Этот термин может также относиться к снижению, ингибированию, увеличению или иному влиянию на активность гена, кодирующего полипептид, которое может включать в себя, помимо прочего, модулирование транскрипционной активности.
Термин «снижение» или «сниженный», используемый в данном документе, относится к снижению от приблизительно 10% до приблизительно 99%, или снижению от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100% или более от количества или активности, такой как, помимо прочего, полипептидная активность, транскрипционная активность и экспрессия белка.
Термин «ингибировать» или «ингибирование», используемый в данном документе, относится к снижению от приблизительно 98% до приблизительно 100%, или снижению от по меньшей мере 98%, по меньшей мере 99%, но в особенности 100% от количества или активности, такой как, помимо прочего, полипептидная активность, транскрипционная активность и экспрессия белка.
Термин «увеличение» или «увеличенный», используемый в данном документе, относится к увеличению от приблизительно 5% до приблизительно 99%, или увеличению от по меньшей мере 5%, по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100% или более от количества или активности, такой как, помимо прочего, полипептидная активность, транскрипционная активность и экспрессия белка.
Термин «контроль» в контексте контрольного растения означает растение или растительную клетку, в которой не была модифицирована экспрессия или активность фермента (например, увеличена или снижена), и поэтому он может обеспечить сравнение с растением, в котором была модифицирована экспрессия или активность фермента. Контрольное растение может содержать пустой вектор. Контрольное растение или растительная клетка может соответствовать растению дикого типа или растительной клетке дикого типа.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В одном варианте осуществления предусмотрен выделенный полинуклеотид, содержащий, состоящий или состоящий по существу из полинуклеотидной последовательности, имеющей по меньшей мере 60% идентичности последовательности с любой из последовательностей, описанных в данном документе, включая любой из полинуклеотидов, показанный в списке последовательностей. Соответственно, выделенный полинуклеотид содержит, состоит или состоит по существу из последовательности, имеющей по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99% или 100% идентичности последовательности с ним.
В другом варианте осуществления предусмотрен выделенный полинуклеотид, содержащий, состоящий или состоящий по существу из полинуклеотидной последовательности, имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: l, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11. Соответственно, выделенный полинуклеотид содержит, состоит или состоит по существу из последовательности, имеющей по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
В другом варианте осуществления предусмотрены полинуклеотиды, содержащие, состоящие или состоящие по существу из полинуклеотидов со значительной гомологией (то есть, сходством последовательности) или значительной идентичностью с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
В другом варианте осуществления предусмотрены полинуклеотидные варианты, которые имеют по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8% или 99,9% идентичности последовательности с последовательностью SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
В другом варианте осуществления предусмотрены фрагменты SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11 и фрагменты SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11 со значительной гомологией (то есть, сходством последовательности) или значительной идентичностью с ними, которые имеют по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 61%, 68%, 69%, 70%, 15%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с соответствующими фрагментами из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
В другом варианте осуществления предусмотрены полинуклеотиды, содержащие достаточную или значительную степень идентичности или сходства с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11, которые кодируют полипептид, функционирующий в качестве члена семейства CLC хлоридных каналов.
В другом варианте осуществления предусмотрен полимер из полинуклеотидов; который содержит, состоит или состоит по существу из полинуклеотида, обозначенного в данном документе как SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
Соответственно, полинуклеотиды, описанные в данном документе, кодируют членов семейства CLC хлоридных каналов. CLC составляют семейство потенциалозависимых каналов. В растениях хлоридные каналы способствуют ряду специфических растительных функций, таких как регуляция тургора, устьичное движение, перенос питательных веществ и/или устойчивость к металлам и тому подобное. Нитрат/протонный антипортер AtCLCa опосредует накопление нитратов в растительных вакуолях (см. Nature (2006) 442 (7105): 939-42). В данной публикации показано, что AtClCa функционирует как обменник 2NO3-/1H+, который способен накапливать нитраты в вакуоли с использованием электрофизиологических подходов. Подобный подход можно использовать при испытании активности транспорта нитратов у CLC-Nt2. Solute transporters in plant thylakoid membranes: Key players during photosynthesis and light stress by Spetea C, Schoefs B. Communicative & Integrative Biology. 2010; 3(2)122-129 and Monachello et al, New Phytol. 2009; 183(1): 88-94 раскрывают, что AtClCe no прогнозам будет участвовать в транслокации нитритов из стромы в просвет тилакоида, перенимая их от транспортера нитритов оболочки хлоропластов. Способы, описанные там для измерения этой активности, можно использовать для измерения активности NtCLCe.
Комбинации из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11 также предполагаются. Эти комбинации включают в себя различные комбинации из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11, включая комбинацию SEQ ID NO: 1 и SEQ ID NO: 2; комбинацию SEQ ID NO: 1 и SEQ ID NO: 3; комбинацию SEQ ID NO: 1 и SEQ ID NO: 4; комбинацию SEQ ID NO: 1 и SEQ ID NO: 10; комбинацию SEQ ID NO: 1 и SEQ ID NO: 11; комбинацию SEQ ID NO: 2 и SEQ ID NO: 3; комбинацию SEQ ID NO: 2 и SEQ ID NO: 4; комбинацию SEQ ID NO: 2 и SEQ ID NO: 10; комбинацию SEQ ID NO: 2 и SEQ ID NO: 11; комбинацию SEQ ID NO: 3 и SEQ ID NO: 4, комбинацию SEQ ID NO: 3 и SEQ ID NO: 10; комбинацию SEQ ID NO: 3 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 3; комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 4; комбинацию SEQ ID NO: 1, SEQ ID NO: 3 и SEQ ID NO: 4; комбинацию SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 4; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 4; или комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 3; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 3 SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 4; или комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 3 и т.д.
Полинуклеотид, описанный в данном документе, может включать в себя полимер нуклеотидов, который может быть немодифицированной или модифицированной дезоксирибонуклеиновой кислотой (ДНК) или рибонуклеиновой кислотой (РНК). Соответственно, полинуклеотид может быть, без ограничения, геномной ДНК, комплементарной ДНК (кДНК), иРНК или антисмысловой РНК или их фрагментом(-ами). Кроме того, полинуклеотид может быть одноцепочечной или двухцепочечной ДНК, ДНК, которая является смесью одноцепочечных и двухцепочечных областей, гибридной молекулой, содержащей ДНК и РНК, или гибридной молекулой со смесью одноцепочечных и двухцепочечных областей или их фрагментом(-ами). Кроме того, полинуклеотид может быть составлен из трехцепочечных областей, содержащих ДНК, РНК или обе, или их фрагмент(ы). Полинуклеотид может содержать одно или несколько модифицированных оснований, таких как фосфотиоаты, и может представлять собой пептидную нуклеиновую кислоту. Как правило, полинуклеотиды могут быть собраны из выделенных или клонированных фрагментов кДНК, геномной ДНК, олигонуклеотидов или отдельных нуклеотидов, или комбинации вышеперечисленного. Хотя полинуклеотидные последовательности, описанные в данном документе, представлены в виде последовательностей ДНК, последовательности включают в себя их соответствующие последовательности РНК и их комплементарные (например, полностью комплементарные) последовательности ДНК или РНК, в том числе, их обратно комплементарные цепи.
Полинуклеотид, описанный в данном документе, обычно содержит фосфодиэфирные связи, хотя в некоторых случаях включены полинуклеотидные аналоги, которые могут иметь альтернативные основы, содержащие, например, фосфороамидатные, фосфоротиоатные, фосфородитиоатные или О-метилфосфороамидитные связи; и пептидные полинуклеотидные основы и связи. Другие аналоги полинуклеотидов включают в себя полинуклеотиды с положительно заряженными основами, неионными основами и безрибозными основами. Модификации рибозо-фосфатной основы можно сделать по целому ряду причин, например, для увеличения стабильности и периода полураспада таких молекул в физиологических средах или в качестве зондов на биочипе. Можно изготовить смеси природных полинуклеотидов и аналогов; в качестве альтернативы, можно изготовить смеси разных полинуклеотидных аналогов и смеси природных полинуклеотидов и аналогов.
Известно множество полинуклеотидных аналогов, включая, например, фосфороамидатные, фосфоротиоатные, фосфородитиоатные или О-метилфосфороамидитные связи и пептидные полинуклеотидные основы и связи. Другие аналоги полинуклеотидов включают в себя полинуклеотиды с положительно заряженными основами, неионными основами и безрибозными основами. Полинуклеотиды, содержащие один или несколько
карбоциклических Сахаров, также включены.
Другие аналоги включают в себя пептидные полинуклеотиды, которые представляют собой пептидные полинуклеотидные аналоги. Эти основы являются по существу неионными в нейтральных условиях в отличие от высоко заряженной фосфодиэфирной основы природных полинуклеотидов. Это может привести к преимуществам. Во-первых, пептидная полинуклеотидная основа может проявлять улучшенную кинетику гибридизации. Пептидные полинуклеотиды имеют большие изменения температуры плавления для несоответствующих по сравнению с прекрасно соответствующими парами оснований. ДНК и РНК, как правило, проявляют 2-4°С понижения температуры плавления из-за внутреннего несоответствия. С неионной пептидной полинуклеотидной основой падение составляет ближе к 7-9°С. Подобным образом, из-за их неионной природы гибридизация оснований, присоединенных к этим основам, является относительно нечувствительной к концентрации солей. Кроме того, пептидные полинуклеотиды могут не разлагаться или разлагаться в меньшей степени клеточными ферментами, и, таким образом, могут быть более стабильными.
Среди применений раскрытых полинуклеотидов и их фрагментов находится использование фрагментов в качестве зондов в анализах с гибридизацией нуклеиновых кислот или праймеров для использования в анализах с амплификацией нуклеиновых кислот. Такие фрагменты обычно содержат по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более смежных нуклеотидов из последовательности ДНК. В других вариантах осуществления фрагмент ДНК содержит по меньшей мере приблизительно 10, 15, 20, 30, 40, 50 или 60 или более смежных нуклеотидов из последовательности ДНК. Таким образом, в одном аспекте также обеспечен способ обнаружения полинуклеотида, кодирующего член семейства CLC хлоридных каналов, включающий использование зондов или праймеров или обоих из них.
Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий описаны в Sambrook J., Е.F. Fritsch и Т. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). Используя знания о генетическом коде в комбинации с аминокислотными последовательностями, описанными в данном документе, можно получить наборы вырожденных олигонуклеотидов. Такие олигонуклеотиды пригодны в качестве праймеров, например, в полимеразных цепных реакциях (ПЦР), с помощью которых выделяют и амплифицируют фрагменты ДНК. В определенных вариантах осуществления вырожденные праймеры можно использовать в качестве зондов для генетических библиотек. Такие библиотеки будут включать в себя, помимо прочего, библиотеки кДНК, геномные библиотеки и даже электронные библиотеки меток экспрессируемых последовательностей или ДНК. Гомологичные последовательности, выявленные этим способом, будут затем использованы в качестве зондов для идентификации гомологов последовательностей, выявленных в данном документе.
Кроме того, потенциал использования имеют полинуклеотиды и олигонуклеотиды (например, праймеры или зонды), которые гибридизируются в условиях пониженной жесткости, как правило, в условиях средней жесткости, и обычно, в условиях высокой жесткости с полинуклеотидом(-ами), описанным в данном документе. Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий изложены в Sambrook J., Е.F. Fritsch и Т. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) и могут быть легко определены обычными специалистами в данной области на основе, например, длины или композиции оснований полинуклеотида.
Один из путей достижения умеренно жестких условий включает в себя использование раствора предварительного отмывания, содержащего 5х стандартный цитрат натрия, 0,5% додецилсульфата натрия, 1,0 мМ этилендиаминтетрауксусной кислоты (рН 8,0), буфера гибридизации с приблизительно 50% формамида, 6х стандартного цитрата натрия и температуры гибридизации приблизительно 55°С (или других подобных растворов гибридизации, таких как содержащий приблизительно 50% формамида с температурой гибридизации около 42°С) и условий отмывания с приблизительно 60°С в 0,5х стандартного цитрата натрия, 0,1% додецилсульфат натрия. Как правило, условия высокой жесткости определяются как условия гибридизации, как описано выше, но с отмыванием при примерно 68°С, 0,2х стандартный цитрат натрия, 0,1% додецилсульфат натрия. SSPE (1x SSPE представляет собой 0,15 М хлорида натрия, 10 мМ фосфата натрия, 1,25 мМ этилендиаминтетрауксусной кислоты, рН 7,4) может быть заменен на стандартный цитрат натрия (1х стандартный цитрат натрия представляет собой 0,15 М хлорида натрия и 15 мМ цитрата натрия) в буферах гибридизации и отмывания; омывание выполняют в течение 15 минут после завершения гибридизации. Следует понимать, что температуру отмывания и концентрацию солей отмывания можно скорректировать по мере необходимости для достижения требуемой степени жесткости с применением основных принципов, которые регулируют реакции гибридизации и стабильность двойной спирали, как это известно специалистам в данной области и дополнительно описано ниже (см., например, Sambrook, J., Е.F. Fritsch и Т. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). При гибридизации полинуклеотида с целевым полинуклеотидом с неизвестной последовательностью длина гибрида предполагается такой, как у гибридизируемого полинуклеотида. Когда гибридизируют полинуклеотиды с известными последовательностями, длина гибрида может быть определена путем выравнивания последовательностей полинуклеотидов и идентификации области или областей с оптимальной комплементарностью последовательности. Температура гибридизации для гибридов, которые предположительно составят менее чем 50 пар оснований в длину, должна быть на 5-10°С меньше, чем температура плавления гибрида, где температуру плавления определяют в соответствии со следующими уравнениями. Для гибридов менее 18 пар оснований в длину температура плавления (°С) = 2(количество оснований А+Т) + 4(количество оснований G+C). Для гибридов свыше 18 пар оснований в длину температура плавления (°С)=81,5+16,6(log10[Na+])+0,41(%G+C)-(600/N), где N - количество оснований в гибриде и [Na+] - концентрация ионов натрия в буфере гибридизации ([Na+] для 1х стандартный цитрат натрия = 0,165М). Как правило, каждый такой гибридизируемый полинуклеотид имеет длину, которая составляет по меньшей мере 25% (обычно, по меньшей мере 50%, 60% или 70%, и наиболее часто, по меньшей мере 80%) от длины полинуклеотида, с которым он гибридизируется, и имеет по меньшей мере 60% идентичности последовательности (например, по меньшей мере 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100%) с полинуклеотидом, с которым он гибридизируется.
Как будет понятно специалисту в данной области, линейная ДНК имеет две возможные ориентации: направление 5-3' и направление 3'-5'. Например, если эталонная последовательность расположена в направлении 5'-3', и если вторая последовательность расположена в направлении 5'-3' в той же полинуклеотидной молекуле/цепи, то эталонная последовательность и вторая последовательность ориентированы в одном направлении или имеют одинаковую ориентацию. Как правило, последовательность промотора и представляющий интерес ген, находящийся под контролем данного промотора, расположены в одинаковой ориентации. Однако если по отношению к эталонной последовательности, расположенной в направлении 5'-3', вторая последовательность расположена в направлении 3'-5' в той же полинуклеотидной молекуле/цепи, тогда эталонная последовательность и вторая последовательность ориентированы в антисмысловом направлении или имеют антисмысловую ориентацию. Две последовательности, имеющие антисмысловые ориентации по отношению друг к другу, могут быть альтернативно описаны как имеющие одинаковую ориентацию, если эталонная последовательность (направление 5'-3') и обратно комплементарная последовательность эталонной последовательности (эталонной последовательности, расположенной в 5'-3') расположены в пределах одной полинуклеотидной молекулы/цепи. Последовательности, изложенные в данном документе, показаны в направлении 5'-3'.
Рекомбинантные конструкции, предусмотренные в данном документе, могут быть использованы для трансформации растений или растительных клеток для того, чтобы модулировать уровни экспрессии или активности белка. Рекомбинантная полинуклеотидная конструкция может содержать полинуклеотид, кодирующий один или несколько полинуклеотидов, описанных в данном документе, функционально связанный с регуляторной областью, подходящим для экспрессии полипептида в растении или растительной клетке. Таким образом, полинуклеотид может содержать кодирующую последовательность, которая кодирует полипептид, описанный в данном документе. Растения, в которых модулируют уровни экспрессии или активности белка, могут включать в себя мутантные растения, не встречающиеся в природе растения, трансгенные растения, искусственные растения или созданные методами генной инженерии растения. Соответственно, трансгенное растение содержит геном, который был изменен с помощью стабильной интеграции рекомбинантной ДНК. Рекомбинантная ДНК включает в себя ДНК, которая была создана методами генной инженерии и сконструирована за пределами клетки, и включает в себя ДНК, содержащую природную ДНК или кДНК или синтетическую ДНК. Трансгенное растение может включать в себя растение, регенерированное из первоначально трансформированной растительной клетки, и потомство трансгенных растений от более поздних поколений, или гибриды трансформированного растения. Соответственно, трансгенная модификация изменяет экспрессию или активность полинуклеотида или полипептида, описанного в данном документе, по сравнению с контрольным растением.
Полипептид, кодируемый рекомбинантным полинуклеотидом, может быть нативным полипептидом, или может быть гетерологичным по отношению к клетке. В некоторых случаях рекомбинантная конструкция содержит полинуклеотид, который модулирует экспрессию, функционально связанный с регуляторной областью. Примеры подходящих регуляторных областей описаны в данном документе.
Также предусмотрены векторы, содержащие рекомбинантные полинуклеотидные конструкции, такие как те, которые описаны в данном документе. Подходящие основы для векторов включают в себя, например, те, которые обычно используют в данной области, такие как плазмиды, вирусы, искусственные хромосомы, искусственные хромосомы бактерий, искусственные хромосомы дрожжей или искусственные хромосомы бактериофагов. Подходящие векторы экспрессии включают в себя, без ограничения, плазмиды и вирусные векторы, полученные из, например, бактериофага, бакуловирусов и ретровирусов. Многочисленные векторы и системы экспрессии являются доступными для приобретения.
Векторы могут также включать в себя, например, репликаторы, области крепления каркаса или маркеры. Маркерный ген может придавать селектируемый фенотип растительной клетке. Например, маркер может придать биоцидную устойчивость, такую как устойчивость к антибиотику (например, к канамицину, G418, блеомицину или гигромицину), или к гербициду (например, к глифосату, хлорсульфурону или фосфинотрицину). Кроме того, вектор экспрессии может включать в себя последовательность метки, предназначенную для облегчения манипуляций или обнаружения (например, очистки или локализации) экспрессированного полипептида. Последовательности меток, такие как последовательности люциферазы, бета-глюкуронидазы, зеленого флуоресцентного белка, глутатион S-трансферазы, полигистидина, с-myc или гемагглютинина, как правило, экспрессируются в виде слияния с кодируемым полипептидом. Такие метки могут быть вставлены в любом месте в пределах полипептида, в том числе на карбоксильном или амино-конце.
Растение или растительную клетку можно трансформировать путем интегрирования рекомбинантного полинуклеотида в ее геном с получением стабильной трансформации. Растение или растительная клетка, описанная в данном документе, может быть стабильно трансформированной. Стабильно трансформированные клетки, как правило, сохраняют введенный полинуклеотид с каждым клеточным делением. Растение или растительную клетку также можно временно трансформировать таким образом, что рекомбинантный полинуклеотид не интегрирован в ее геном. Временно трансформированные клетки, как правило, теряют весь или некоторую часть введенного рекомбинантного полинуклеотида с каждым клеточным делением, так что введенный рекомбинантный полинуклеотид нельзя обнаружить в дочерних клетках после достаточного числа клеточных делений.
Существует ряд способов, доступных в данной области для трансформации растительной клетки, все из которых охвачены в данном документе, в том числе, биолистика, методики генной пушки, Agrobacterium-опосредованная трансформация, опосредованная вирусным вектором трансформация и электропорация. Система Agrobacterium для интеграции чужеродной ДНК в хромосомы растений была тщательно изучена, модифицирована и использована для генной инженерии растений. Голые молекулы рекомбинантной ДНК, содержащие последовательности ДНК, соответствующие исследуемому очищенному белку табака, функционально связанные в смысловой или антисмысловой ориентации с регуляторными последовательностями, соединяют с соответствующими последовательностями Т-ДНК с помощью обычных способов. Их вводят в протопласты табака при помощи метода с полиэтиленгликолем или методом электропорации, оба из которых являются стандартными. В качестве альтернативы, такие векторы, содержащие молекулы рекомбинантной ДНК, кодирующие исследуемый очищенный белок табака, вводят в живые клетки Agrobacterium, которые затем переносят ДНК в растительные клетки табака. Трансформацию с помощью голой ДНК без сопутствующих векторных последовательностей Т-ДНК можно выполнить посредством слияния протопластов табака с ДНК-содержащими липосомами или посредством электропорации. Голую ДНК, не сопровождаемую векторными последовательностями Т-ДНК, также можно использовать для трансформации клеток табака с помощью инертных, высокоскоростных микрочастиц.
Если клетку или культивируемую ткань используют в качестве реципиентной ткани для трансформации, растения можно регенерировать из трансформированных культур, при желании, с помощью методик, известных специалистам в данной области.
Выбор регуляторных областей, которые будут включены в рекомбинантную конструкцию, зависит от нескольких факторов, в том числе, помимо прочего, от эффективности, селективности, индуцибельности, желаемого уровня экспрессии и клеточной или тканевой предпочтительности экспрессии. Обычным делом для специалиста в данной области является модулирование экспрессии кодирующей последовательности путем соответствующего выбора и размещения регуляторных областей по отношению к кодирующей последовательности. Транскрипцию полинуклеотида можно модулировать подобным образом. Некоторые подходящие регуляторные области инициируют транскрипцию исключительно или преимущественно в определенных типах клеток. Способы идентификации и установления характеристик регуляторных областей в растительной геномной ДНК хорошо известны в данной области.
Подходящие промоторы включают в себя тканеспецифичные промоторы, распознаваемые тканеспецифичными факторами, присутствующими в разных тканях или типах клеток (например, корень-специфичные промоторы, побег-специфичные промоторы, ксилема-специфичные промоторы), или присутствующими на различных стадиях развития, или присутствующими в ответ на разные условия окружающей среды. Подходящие промоторы включают в себя конститутивные промоторы, которые могут быть активированы в большинстве типов клеток, не требуя специфических индукторов. Примеры подходящих промоторов для управления получением полипептидов при РНКи включают в себя промотор 35S вируса мозаики цветной капусты (CaMV/35S), SSU, OCS, lib4, usp, STLS1, В33, nos или промоторы гена убиквитина или гена фазеолина. Специалисты в данной области способны генерировать множество вариантов рекомбинантных промоторов.
Тканеспецифичные промоторы представляют собой элементы управления транскрипцией, которые активны только в определенных клетках или тканях в определенное время в ходе развития растений, например, в вегетативных тканях или репродуктивных тканях. Тканеспецифичная экспрессия может быть выгодной, например, когда экспрессия полинуклеотидов в определенных тканях является предпочтительной. Примеры тканеспецифичных промоторов под управлением развития включают в себя промоторы, которые могут инициировать транскрипцию только (или в основном только) в определенных тканях, таких как вегетативные ткани, например, корни или листья, или репродуктивные ткани, такие как плоды, семяпочки, семена, пыльца, тычинки, цветы или любая эмбриональная ткань. Репродуктивные тканеспецифичные промоторы могут быть, например, пыльник-специфичными, семяпочкаспецифичными, эмбриоспецифичными, эндосперм-специфичными, интегумент-специфичными, специфичными для семян и кожуры семян, специфичными для пыльцы, лепесток-специфичными, чашелистик-специфичными или их комбинациями.
Подходящие лист-специфичные промоторы включают в себя промотор пируватортофосфатдикиназы (PPDK) из растения С4 (кукуруза), промотор cab-mlCa+2 из кукурузы, промотор родственных myb генов из Arabidopsis thaliana (Atmyb5), промоторы рибулозобифосфаткарбоксилазы (RBCS) (например, гены томата RBCS1, RBCS2 и RBCS3A, экспрессируемые в листьях и выращенных на свету саженцах, RBCS1 и RBCS2, экспрессируемые в развивающихся плодах томата, или промотор рибулозобифосфаткарбоксилазы, экспрессируемый на высоких уровнях почти исключительно в мезофильных клетках листовых пластинок и листовых пазух).
Подходящие специфичные для старения промоторы включают в себя промотор томата, активный во время созревания плодов, старения и опадания листьев, промотор гена кукурузы, кодирующего цистеиновую протеазу. Можно использовать подходящие пыльник-специфичные промоторы. Можно выбрать подходящие предпочтительные для корней промоторы, известные специалистам в данной области. Подходящие предпочтительные для семян промоторы включают в себя как семяспецифичные промоторы (промоторы, активные в процессе развития семян, такие как промоторы запасаемых белков семян), так и промоторы прорастающих семян (промоторы, активные во время прорастания семян). Такие предпочтительные для семян промоторы включают в себя, помимо прочего, промотор гена Ciml (цитокинин-индуцированное сообщение); cZ19B1 (зеин 19 кДа кукурузы); milps (миоинозитол-1-фосфатсинтаза); mZE40-2, также известный как Zm-40; nuclc и celA (целлюлозосинтаза). Промотор гена гамма-зеина представляет собой эндосперм-специфичный промотор. Промотор гена Glob-1 представляет собой эмбриоспецифичный промотор. Для двудольных семяспецифичные промоторы включают в себя, помимо прочего, промотор гена бета-фазеолина фасоли, гена напина, гена β-конглицинина, гена лектина сои, гена круциферина и т.п. Для однодольных семяспецифичные промоторы включают в себя, помимо прочего, промотор гена зеина 15 кДа кукурузы, промотор гена зеина 22 кДа, промотор гена зеина 27 кДа, промотор гена g-зеина, промотор гена гамма-зеина 27 кДа (такой как промотор gzw64A, см. инвентарный номер S78780 в Genbank), промотор гена waxy, промотор гена shrunken 1, промотор гена shrunken 2, промотор гена глобулина 1 (см. инвентарный номер L22344 в Genbank), промотор гена Itp2, промотор гена cim1, промоторы генов end1 и end2 кукурузы, промотор гена nuc1, промотор гена Zm40, промотор гена eep1 и еер2; промотор гена lec1, промотор гена тиоредоксина Н; промотор гена mlip15, промотор гена PCNA2 и промотор гена shrunken-2.
Примеры индуцибельных промоторов включают в себя промоторы, реагирующие на нападение патогена, анаэробные условия, повышенную температуру, свет, засуху, холодную температуру или высокую концентрацию солей. Патоген-индуцибельные промоторы включают в себя промоторы связанных с патогенезом белков (белки PR), которые индуцируются после инфицирования патогеном (например, белки PR, белки SAR, бета-1,3-глюканаза, хитиназа).
В дополнение к растительным промоторам можно получить другие подходящие промоторы бактериального происхождения (например, промотор гена октопинсинтазы, промотор гена нопалинсинтазы и другие промоторы, полученные из Ti плазмид), или их можно получить из вирусных промоторов (например, 35S и 19S РНК промоторы вируса мозаики цветной капусты (CaMV), конститутивные промоторы вируса табачной мозаики, промоторы 19S и 35S вируса мозаики цветной капусты (CaMV) или промотор 35S вируса мозаики норичника).
В другом аспекте предусмотрен выделенный полипептид, содержащий, состоящий или состоящий по существу из полипептидной последовательности, имеющей по меньшей мере 60% идентичности последовательности с любой из последовательностей, описанных в данном документе, включая любые полипептиды, приведенные в перечне последовательностей. Соответственно, выделенный полипептид содержит, состоит или состоит по существу из последовательности, имеющей по меньшей мере 60%, 61%, 62%, 63%, 64%. 65%. 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с ним.
В одном варианте осуществления предусмотрен полипетид, кодируемый SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
В другом варианте осуществления предусмотрен выделенный полипептид, содержащий, состоящий или состоящий по существу из последовательности, имеющей по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14.
В другом варианте осуществления предусмотрен полипептидный вариант, содержащий, состоящий или состоящий по существу из аминокислотной последовательности, кодируемой полинуклеотидным вариантом с по меньшей мере приблизительно 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8% или 99,9% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.
В другом варианте осуществления предусмотрены фрагменты полипептида SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 и фрагменты SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, которые имеют по меньшей мере приблизительно 60%, 65%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%,99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с соответствующими фрагментами из SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, соответственно.
Полипептид также включает в себя последовательности, содержащие достаточный или существенный процент идентичности или сходства с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 для функционирования в качестве члена семейства CLC хлоридных каналов. Данные фрагменты полипептида(-ов) как правило сохраняют некоторую или всю активность последовательности полной длины.
Полипептиды также включают в себя мутантов, полученных путем введения любого типа изменений (например, инсерции, делеции или замены аминокислот; изменения состояний гликозилирования, изменения, которые влияют на повторную укладку или изомеризацию, трехмерные структуры или состояния самоассоциации), которые могут быть намеренно спроектированы или легко выделены при условии, что они сохраняют некоторую или всю свою функциональность или активность в качестве члена семьи CLC хлоридных каналов.
Полипептиды могут быть в линейной форме или циклизованными с использованием известных способов.
Полипептид, кодируемый SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, который имеет 100% идентичности последовательности с ним, или полипептид, содержащий, состоящий или состоящий по существу из последовательности, изложенной в SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, который имеет 100% идентичности последовательности с ним, также раскрыт.
Различные комбинации SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 также предполагаются. Эти комбинации включают в себя любые комбинации из SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 или SEQ ID NO: 14, включая комбинацию SEQ ID NO: 5 и SEQ ID NO: 6; комбинацию SEQ ID NO: 5 и SEQ ID NO: 7; комбинацию SEQ ID NO: 6 и SEQ ID NO: 7; комбинацию SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7; комбинацию SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID N: 7; комбинацию SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 6, SEQ ID NO: 7 SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14 и т.д.
Полипептиды включают в себя варианты, полученные путем введения любого типа изменений (например, инсерции, делеции или замены аминокислот; изменения состояний гликозилирования, изменения, которые влияют на повторную укладку или изомеризацию, трехмерные структуры или состояния самоассоциации), которые могут быть намеренно спроектированы или легко выделены. Делеция относится к удалению одной или нескольких аминокислот из белка. Инсерция относится к одному или нескольким аминокислотным остаткам, вводимым в заранее определенное место в полипептиде. Инсерции могут содержать инсерции внутри последовательности одной или нескольких аминокислот. Замена относится к замещению аминокислот полипептида другими аминокислотами, имеющими подобные свойства (такие как подобная гидрофобность, гидрофильность, антигенность, склонность к образованию или разрыву а-спиральных структур или β-складчатых структур). Аминокислотные замены происходят, как правило, по отдельным остаткам, но могут быть сгруппированы в зависимости от функциональных ограничений, накладываемых на полипептид, и могут варьироваться от приблизительно 1 до приблизительно 10 аминокислот. Аминокислотные замены являются предпочтительно консервативными аминокислотными заменами, как описано ниже. Аминокислотные замены, делеции и/или инсерции можно выполнить с использованием методик пептидного синтеза, таких как твердофазный пептидный синтез, или с помощью манипулирования с рекомбинантной ДНК. Способы манипулирования последовательностями ДНК с получением вариантов белка с заменой, инсерцией или делецией хорошо известны в данной области. Вариант может иметь изменения, которые производят молчащее изменение и приводят к функционально эквивалентному белку. Преднамеренные аминокислотные замены можно сделать на основе сходства полярности, заряда, растворимости, гидрофобности, гидрофильности и амфипатической природы остатков до тех пор, пока вторичная связывающую активность вещества сохраняется. Например, отрицательно заряженные аминокислоты включают в себя аспарагиновую кислоту и глутаминовую кислоту; положительно заряженные аминокислоты включают лизин и аргинин и аминокислоты с незаряженными полярными головными группами, имеющие подобные значения гидрофильности, включают в себя лейцин, изолейцин, валин, глицин, аланин, аспарагин, глутамин, серии, треонин, фенилаланин и тирозин. Консервативные замены можно сделать, например, в соответствии с приведенной ниже Таблицей. Аминокислоты в одном и том же блоке во втором столбце и предпочтительно в одной и той же строке в третьем столбце можно заменить друг на друга:
Полипептид может быть зрелым белком или незрелым белком, или белком, полученным из незрелого белка. Полипептиды могут быть в линейной форме или циклизованными с использованием известных способов. Полипептиды, как правило, содержат по меньшей мере 10, по меньшей мере 20, по меньшей мере 30, или по меньшей мере 40 смежных аминокислот.
Мутантные варианты полипептида можно использовать для создания мутантных, не встречающихся в природе или трансгенных растений (например, мутантных, не встречающихся в природе, трансгенных, искусственных или созданных методами генной инженерии), содержащих один или несколько мутантных вариантов полипептида. Соответственно, мутантные варианты полипептида сохраняют активность немутантного полипептида. Активность мутантного варианта полипептида может быть выше, ниже или приблизительно такой же, как немутированного полипептида.
Мутации в нуклеотидных последовательностях и полипептидах, описанных в данном документе, могут включать в себя искусственные мутации или синтетические мутации, или созданные методами генной инженерии мутации. Мутации в нуклеотидных последовательностях и полипептидах, описанных в данном документе, могут быть мутациями, которые получены или являются получаемыми посредством процесса, который включает в себя манипуляционный этап in vitro или in vivo. Мутации в нуклеотидных последовательностях и полипептидах, описанных в данном документе, могут быть мутациями, которые получены или являются получаемыми посредством процесса, который включает в себя вмешательство человека.
Примеры мутаций в полипептидных последовательностях, описанных в данном документе, показаны в Таблице 1. Соответственно, дополнительный аспект относится к мутантным полипептидам, как изложено в Таблице 1.
Мутация (мутации) может модулировать активность кодируемого полипептида. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень нитратов в растении модулируется. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень нитратов в растении увеличивается или уменьшается. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень NNK в растении, таком как высушенный растительный материал, модулируется. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень NNK в растении, таком как высушенный растительный материал, увеличивается или уменьшается. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что общий уровень TSNA в растении, таком как высушенный растительный материал, модулируется. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что общий уровень TSNA в растении, таком как высушенный растительный материал, увеличивается или уменьшается.
В одном варианте осуществления SEQ ID NO: 5 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 503, 471, 659, 566, 637, 597, 711, 135, 151, 690, 737, 135, 163, 480, 520, 514, 518, 476, 739, 517, 585 или 677 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делению, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из G503E, G471R, V659I, S566N, P637S, А597Т, P711L, G135R, A151V, G690D, G737R, G135R, G163R, P480S, S520F, А514Т, A518V, G476E, R739S, G517E, E585K или V677I или комбинации из двух или более из них.
В одном варианте осуществления SEQ ID NO: 6 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 514, 537, 593, 749, 524, 408, 503, 547, 691, 478, 749, 713, 550, 586, 670, 678, 631, 657, 737, 525, 597, 674 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из А514Т, L537F, R593I, А749Т, G524D, S408F, G503R, P547S, G691D, A478V, A749V, T713I, M550I, P586S, R670K, R678K, D631N, L657F, G737R, S525L, А597Т, E674K или комбинации из двух или более из них.
В одном варианте осуществления SEQ ID NO: 7 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 21, 58, 141, 175, 5, 34, 124, 40, 8, 35, 30, 177, 42, 88, 155, 158, 170, 174, 126 или 131 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из E21K, L58F, P141S, G175E, S5N, A34V, M124I, L40F, D8N, C35Y, A30V, A177V, G42D, G88D, G155R, D158N, A170V, A174V, A126V или G131R или комбинации двух или более из них.
Последовательность, показанная в SEQ ID NO: 12, соответствует последовательности, показанной в SEQ ID NO: 7, с дополнительными 88 аминокислотами на 5'-конце. SEQ ID NO: 12 может включать в себя такие же соответствующие мутации, как и SEQ ID NO: 7. SEQ ID NO: 12 может включать в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 109, 146, 229, 263, 93, 122, 212, 128, 96, 123, 118, 265, 130, 176, 243, 246, 258, 262, 214, или 219 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из E109K, L146F, P229S, G263E, S93N, A122V, M212I, L128F, D96N, C123Y, A118V, A265V, G130D, G176D, G243R, D246N, A258V, A262V, A214V или G219R или комбинации двух или более из них.
В одном варианте осуществления SEQ ID NO: 13 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 184, 89, 166, 18, 76, 173, 143, 1, 4, 154, 89, 128, 137 или 181 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из P184S, G89D, K166N, G18R, G76R, G173R, P143L, M1I, S4N, V154I, G89D, A128V, S137F или G181S или комбинации двух или более из них.
Последовательность, показанная в SEQ ID NO: 14, соответствует последовательности, показанной в SEQ ID NO: 13, с дополнительными 88 аминокислотами на 5'-конце. В одном варианте осуществления SEQ ID NO: 14 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 272, 177, 254, 106, 164, 261, 231, 89, 92, 242, 177, 269 или 225 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из P272S, G177D, K254N, G106R, G164R, G261R, P231L, M89I, S92N, V242I, G177D, A269V, S225F или G269S или комбинации двух или более из них.
Соответственно, мутация представляет собой мутацию в положении G163 из SEQ ID NO: 5. Соответственно, мутация представляет собой гомозиготную мутацию в положении G163 из SEQ ID NO: 5. Соответственно, мутация представляет собой мутацию по типу замены. Соответственно, мутация по типу замены представляет собой мутацию G163R. Соответственно, мутация представляет собой гомозиготную мутацию по типу замены в положении G163R. Если полипептид, содержащий данную мутацию, экспрессируется в мутантном растении, уровень нитратов в мутантном растении становится ниже, чем в контрольном растении, в период раннего утра или в середине утра. Соответствующие мутации можно выполнить в SEQ ID NO: 14, которая соответствует последовательности SEQ ID NO: 7 с дополнительными аминокислотами на ее 5'-конце.
Соответственно, мутация представляет собой мутацию в положении G163 из SEQ ID NO: 5. Соответственно, мутация по типу замены представляет собой G163R. Соответственно, мутация представляет собой гомозиготную мутацию по типу замены в положении G163R. Данная мутация может уменьшать уровень нитратов в мутантном растении, содержащем данную мутацию. Гомозиготное мутантное G163R растение табака имеет сниженный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов снижается с приблизительно 11 мг/г в контрольном растении до приблизительно 6 мг/г в мутантном растении. Уровень нитратов продолжает уменьшаться в середине утра. Уровень нитратов снижается с приблизительно 7 мг/г в контрольном растении до приблизительно 4,5 мг/г в мутантном растении. К позднему утру уровень нитратов увеличился в мутантном растении по сравнению с серединой утра и достигает уровня нитратов, присутствующих ранним утром. Для контроля уровень нитратов в контрольном растении продолжает уменьшаться. К позднему утру уровень нитратов увеличивается до приблизительно 6 мг/г в мутантном растении и уменьшается до приблизительно 3 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра. Уровень никотина меняется от приблизительно 13 мг/г до приблизительно 11 мг/г для мутантного растения и от приблизительно 9 мг/г до приблизительно 13 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.
Соответственно, мутация представляет собой мутацию в положении Р143 из SEQ ID NO: 13. Соответственно, мутация по типу замены представляет собой P143L. Соответственно, мутация представляет собой гомозиготную мутацию по типу замены в положении P143L. Данная мутация может увеличивать уровень нитратов в мутантном растении, содержащем данную мутацию. Гомозиготное мутантное P143L растение табака имеет увеличенный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов увеличивается с приблизительно 7 мг/г в контрольном растении до приблизительно 14 мг/г в мутантном растении. Уровень нитратов уменьшается в середине утра в мутантном растении и несколько увеличивается в контрольном растении. Уровень нитратов в мутантном растении снижен до приблизительно 9 мг/г и уровень нитратов в контрольном растении увеличивается до приблизительно 9 мг/г.К позднему утру уровень нитратов продолжил уменьшаться в мутантном растении по сравнению с серединой утра. Для контроля уровень нитратов в контрольном растении уменьшается. К позднему утру уровень нитратов уменьшается до приблизительно 2 мг/г в мутантном растении и уменьшается до приблизительно 4 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра для каждого из мутантного и контрольного растений. Уровень никотина меняется от приблизительно 20 мг/г до приблизительно 24 мг/г для мутантного растения и от приблизительно 15 мг/г до приблизительно 17 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.
Суточная регуляция метаболизма нитратов известна и интенсивно исследуется (см. Stitt & Krapp Plant, Cell and Environment 22, 583-621 (1999)). В богатых азотом растениях уровень транскрипта для нитратредуктаз является высоким в конце ночи, резко падает в течение дня и восстанавливается в течение ночи. Активность NIA увеличивается в три раза в первой половине светового периода, уменьшается в течение второй половины светового периода и остается низкой в течение ночи. Увеличение активности NIA после освещения происходит в результате увеличения количества белка NIA.
Также является раскрытым способ модулирования уровня нитратов, общего содержания TSNA или NNK в растении табака или в части этого растения, при этом указанный способ включает этапы: (i) введения в геном указанного растения одной или нескольких мутаций в пределах по меньшей мере одного аллеля одной или нескольких полинуклеотидных последовательностей, описанных в данном документе; и (ii) получение мутантного растения, в котором указанная мутация модулирует экспрессию указанных полинуклеотидных последовательностей или активность полипептида, кодируемого ими, по сравнению с контролем, и растение табака или часть этого растения имеет модулированный уровень нитратов и/или общего содержания TSNA и/или NNK. В определенных вариантах осуществления растение табака или часть этого растения представляет собой высушенный растительный материал.
Способы получения мутантов хорошо известны в данной области и могут включать в себя мутагенез с использованием экзогенно добавленных химических веществ, таких как мутагенные, тератогенные или канцерогенные органические соединения, например этилметансульфонат (EMS), которые производят случайные мутации в генетическом материале. В качестве дополнительного примера способ может включать в себя один или несколько этапов генной инженерии, таких как один или несколько этапов генной инженерии, которые описаны в данном документе, или их комбинации. В качестве дополнительного примера способ может включать в себя один или несколько этапов скрещивания растений. Также может быть использован TILLING, как описано в другом месте данного документа.
Полипептид можно получить путем культивирования трансформированных или рекомбинантных клеток-хозяев в условиях культивирования, подходящих для экспрессии полипептида. Полученный экспрессированный полипептид затем можно очистить от такой культуры с помощью известных способов очистки. Очистка полипептида может включать в себя аффинную колонку, содержащую средства, которые связываются с полипептидом; один или несколько этапов колонки с такими аффинными смолами; один или несколько этапов с участием гидрофобной хроматографии или иммуноаффинную хроматографию. В качестве альтернативы, полипептид можно также экспрессировать в форме, которая будет облегчать очистку. Например, его можно экспрессировать в виде полипептида слияния, такого как с мальтозосвязывающий полипептид, глутатион-5-трансферазой или тиоредоксином. Наборы для экспрессии и очистки полипептидов слияния являются доступными для приобретения. Полипептид можно пометить эпитопом и затем очистить с использованием специфического антитела, направленного к такому эпитопу. Один или несколько этапов жидкостной хроматографии, такой как обращенно-фазовая высокоэффективная жидкостная хроматография, можно использовать для дополнительной очистки полипептида. Некоторые или все из вышеуказанных этапов очистки в различных комбинациях можно использовать для обеспечения по существу гомогенного рекомбинантного полипептида. Очищенный таким образом полипептид может быть по существу свободным от других полипептидов и определен в данном документе как «по существу очищенный полипептид»; такие очищенные полипептиды включают полипептиды, фрагменты, варианты и т.п. Экспрессию, выделение и очистку полипептидов и фрагментов можно выполнить при помощи любой подходящей методики, в том числе, помимо прочего, способами, описанными в данном документе.
Кроме того, можно использовать аффинную колонку, такую как с моноклональным антителом, сгенерированным против полипептидов, для аффинной очистки экспрессированных полипептидов. Эти полипептиды можно удалить из аффинной колонки с помощью общепринятых методик, например, в элюирующем буфере с высоким содержанием солей с последующим диализованием в буфер с низким содержанием солей для использования, или посредством изменения рН или других компонентов в зависимости от используемой аффинной матрицы, или путем конкурентного удаления с помощью естественного субстрата аффинного фрагмента.
Полипептид можно также получить с помощью известных общепринятых методов химического синтеза. Способы конструирования полипептидов или их фрагментов синтетическими средствами известны специалистам в данной области. Синтетически сконструированные полипептидные последовательности в силу разделения первичных, вторичных или третичных структурных или конформационных характеристик с нативными полипептидами могут обладать биологическими свойствами, общими с ними, включая биологическую активность.
Термин «не встречающийся в природе», используемый в данном документе, описывает объект (например, полинуклеотид, генетическую мутацию, полипептид, растение, растительную клетку и растительный материал), который не образован естественным путем или не существует в природе. Такие не встречающиеся в природе объекты или искусственные объекты можно изготовить, синтезировать, инициировать, модифицировать, подвергнуть вмешательству или манипуляции способами, описанными в данном документе, или которые известны в данной области. Такие не встречающиеся в природе объекты или искусственные объекты можно изготовить, синтезировать, инициировать, модифицировать, подвергнуть вмешательству или манипуляции человеком. Таким образом, в качестве примера, не встречающееся в природе растение, не встречающаяся в природе растительная клетка или не встречающийся в природе растительный материал можно изготовить с использованием традиционных методик селекции растений, таких как обратное скрещивание, или путем генетических манипуляционных технологий, таких как антисмысловая РНК, интерферирующая РНК, мегануклеаза и т.п. В качестве дополнительного примера, не встречающееся в природе растение, не встречающаяся в природе растительная клетка или не встречающийся в природе растительный материал можно изготовить с использованием интрогрессии или путем передачи одной или нескольких генетических мутаций (например, одного или нескольких полиморфизмов) из первого растения или растительной клетки во второе растение или растительную клетку (которые сами по себе могут быть встречающимися в природе), таким образом, что полученное растение, растительная клетка или растительный материал или их потомство содержит генетическую конструкцию (например, геном, хромосому или ее сегмент), который не образован естественным путем, или который не существует в природе. Полученное растение, растительная клетка или растительный материал, таким образом, является искусственным или не встречающимся в природе. Соответственно, искусственное или не встречающееся в природе растение или растительную клетку можно изготовить путем модификации генетической последовательности в первом встречающемся в природе растении или растительной клетке, даже если полученная генетическая последовательность встречается в природе во втором растении или растительной клетке, которая содержит другой генетический фон из первого растения или растительной клетки. В определенных вариантах осуществления мутация не является встречающейся в природе мутацией, которая существует в природе в нуклеотидной последовательности или полипептиде, таких как ген или белок.
Различия в генетическом фоне можно обнаружить по фенотипическим различиям или с помощью методик молекулярной биологии, известных в данной области, таких как секвенирование нуклеиновых кислот, наличие или отсутствие генетических маркеров (например, маркеров микросателлитной РНК).
Также предусмотрены антитела, которые являются иммунореактивными по отношению к полипептидам, описанным в данном документе. Полипептиды, фрагменты, варианты, полипептиды слияния и т.п., изложенные в данном документе, можно использовать в качестве «иммуногенов» при получении антител, иммунореактивных по отношению к ним. Такие антитела могут специфически связываться с полипептидом через антиген-связывающие активные центры антитела. Специфически связывающимися антителами являются те, которые будут специфически распознавать и связываться с полипептидом, гомологами и вариантами, но не с другими молекулами. В одном варианте осуществления антитела являются специфичными для полипептидов, имеющих аминокислотную последовательность, изложенную в данном документе, и не проявляют перекрестной реактивности с другими полипептидами.
Более конкретно, полипептиды, фрагмент, варианты, полипептиды слияния и т.п. содержат антигенные детерминанты или эпитопы, которые вызывают образование антител. Данные антигенные детерминанты или эпитопы могут быть линейными или конформационными (прерывистыми). Линейные эпитопы состоят из одного отрезка аминокислот полипептида, тогда как конформационные или прерывистые эпитопы состоят из аминокислотных отрезков из различных областей полипептидной цепи, которые были приведены в непосредственную близость при сворачивании полипептида. Эпитопы можно выявить любыми способами, известными в данной области. Кроме того, эпитопы из полипептидов можно использовать в качестве исследовательских реагентов, в анализах и для очистки специфически связывающихся антител от веществ, таких как поликлональные сыворотки или супернатанты из культивируемых гибридом. Такие эпитопы или их варианты можно получить с использованием методик, известных в данной области, например, путем твердофазного синтеза, химического или ферментативного расщепления полипептида, или с помощью технологии рекомбинантной ДНК.
Как поликлональные, так и моноклональные антитела против полипептидов можно получить с помощью общеизвестных методик. Клеточные линии гибридом, которые продуцируют моноклональные антитела, специфичные для полипептидов, также предполагаются в данном документе. Такие гибридомы можно получить и выявить с помощью общеизвестных методик. Для получения антител различных животных-хозяев можно иммунизировать инъекцией с полипептидом, его фрагментом, вариантом или мутантами. Такие животные-хозяева могут включать, помимо прочего, кроликов, мышей и крыс, к примеру. Различные адъюванты можно использовать для увеличения иммунологического ответа. В зависимости от вида хозяина такие адъюванты включают, помимо прочего, адъюванты Фрейнда (полные и неполные), минеральные гели, такие как гидроксид алюминия, поверхностно-активные вещества, такие как лизолецитин, плюрониловые полиолы, полианионы, пептиды, масляные эмульсии, гемоцианин лимфы улитки, динитрофенол и потенциально полезные человеческие адъюванты, такие как BCG (бацилла Кальметта-Герена) и Corynebacterium parvum. Моноклональные антитела можно выделить общепринятыми методиками. Такие моноклональные антитела могут быть иммуноглобулинами любого класса, в том числе IgG, IgM, IgE, IgA, IgD, и любого их подкласса.
Антитела можно также использовать в анализах для обнаружения присутствия полипетидов или фрагментов либо in vitro, либо in vivo. Антитела можно также использовать для очистки полипептидов или фрагментов с помощью иммуноаффинной хроматографии.
Композиции, которые могут модулировать экспрессию или активность одного или нескольких полинуклеотидов или полипептидов, описанных в данном документе (или любой их комбинации, описанной в данном документе), включают, помимо прочего, специфичные для последовательности полинуклеотиды, которые могут препятствовать транскрипции одного или более эндогенного гена(-ов); специфичные для последовательности полинуклеотиды, которые могут препятствовать трансляции транскриптов РНК (например, двухцепочечные РНК, миРНК, рибозимы); специфичные для последовательности полинуклеотиды, которые могут препятствовать стабильности одного или нескольких белков; специфичные для последовательности полинуклеотиды, которые могут препятствовать ферментативной активности одного или нескольких белков или активности связывания одного или нескольких белков с соответствующими субстратами или регуляторными белками; антитела, которые проявляют специфичность в отношении одного или нескольких белков; низкомолекулярные соединения, которые могут препятствовать стабильности одного или нескольких белков или ферментативной активности одного или нескольких белков или активности связывания одного или нескольких белков; белки цинковых пальцев, которые связывают один или несколько полинуклеотидов; и мегануклеазы, которые имеют активность по отношению к одному или нескольким полинуклеотидам. Технологии редактирования гена, генетические технологии редактирования и технологии редактирование генома хорошо известны в данной области.
Один из способов редактирования гена предусматривает использование подобных активатору транскрипции эффекторных нуклеаз (TALEN), вызывающих двухцепочечные разрывы, на которые клетка может отвечать с привлечением механизмов репарации. Сращивание негомологичных концов повторно соединяет ДНК с обеих сторон двухцепочечного разрыва, где очень мало или отсутствует перекрывание последовательности для отжига. Этот механизм репарации вызывает ошибки в геноме посредством инсерции или делеции, либо хромосомной перестройки. Любые такие ошибки могут сделать генные продукты, закодированные в этом месте, не функциональными.
Другой способ редактирования гена предусматривает использование бактериальной системы CRISPR/Cas. Бактерии и археи проявляют хромосомные элементы, названные кластеризованными с регулярными интервалами короткими палиндромными повторами (CRISPR), которые являются частью адаптивной иммунной системы, защищающей от вторжения вирусной и плазмидной ДНК. В системах CRISPR II типа, CRISPR РНК (crPHK) функционирует с транс-активирующей crPHK (tracrPHK) и CRISPR-ассоциированными (Cas) белками с внесением двухцепочечных разрывов в целевую ДНК. Целевое расщепление с помощью Cas9 требует спаривания оснований между crPHK и tracrPHK, а также спаривание оснований между crPHK и целевой ДНК. Целевое распознавание облегчается наличием короткого мотива, названного прилегающим к протоспейсеру мотивом (РАМ), который соответствует последовательности NGG. Данную систему можно использовать для редактирования генома. Cas9 обычно программируется двойной РНК, состоящей из crPHK и tracrPHK. Тем не менее, основные компоненты этих РНК могут быть объединены в единую гибридную «руководящую РНК» для нацеливания Cas9. Использование некодирующего РНК-ориентира с нацеливанием ДНК для сайт-специфического расщепления обещает быть значительно более простым, чем существующие технологии, такие как TALEN. Использование стратегии CRISPR/Cas с перенацеливанием нуклеазного комплекса требует всего лишь введения новой последовательности РНК и нет необходимости в перестройке специфичности факторов транскрипции белка. Антисмысловая технология представляет собой другой известный способ, который можно использовать для модулирования экспрессии полипептида. Полинуклеотид гена, который должен быть репрессирован, клонируют и функционально связывают с регуляторной областью и последовательностью терминации транскрипции, так что антисмысловая цепь РНК транскрибируется. Затем рекомбинантную конструкцию трансформируют в растения и получают антисмысловую цепь РНК. Полинуклеотид не обязательно является полной последовательностью гена, который должен быть репрессирован, но как правило будет по существу комплементарным по меньшей мере части смысловой цепи гена, который должен быть репрессирован.
Полинуклеотид можно транскрибировать в рибозим или каталитическую РНК, которая влияет на экспрессию иРНК. Рибозимы можно спроектировать для специфического спаривания с практически любой целевой РНК и расщепления фосфодиэфирной основы в определенном месте, тем самым функционально инактивируя целевую РНК. Гетерологичные полинуклеотиды могут кодировать рибозимы, спроектированные для расщепления конкретных транскриптов иРНК, таким образом предотвращая экспрессию полипептида. Рибозимы типа hammerhead пригодны для разрушения конкретных иРНК, хотя можно использовать различные рибозимы, которые расщепляют иРНК с сайт-специфическим распознаванием последовательностей. Рибозимы типа hammerhead расщепляют иРНК в местах, диктуемых фланкирующими областями, которые формируют комплементарные пары оснований с целевой иРНК. Единственным требованием является то, что целевая РНК должна содержать нуклеотидную последовательность 5'-UG-3'. Конструирование и производство рибозимов типа hammerhead известно в данной области. Последовательности рибозимов типа hammerhead можно встроить в стабильную РНК, такую как транспортная РНК (тРНК) для увеличения эффективности расщепления in vivo.
В одном варианте осуществления специфичный для последовательности полинуклеотид, который может препятствовать трансляции транскрипта(-ов) РНК, представляет собой интерферирующую РНК. РНК-интерференция или РНК-сайленсинг представляет собой эволюционно консервативный процесс, в котором конкретные иРНК могут быть нацелены для ферментативной деградации. Двухцепочечную РНК (двухцепочечная РНК) вводят или производят в клетке (например, двухцепочечный РНК-вирус или полинуклеотиды интерферирующей РНК) для инициации пути интерферирующей РНК. Двухцепочечную РНК можно преобразовать в несколько двойных спиралей малых интерферирующих РНК 21-23 п.о. в длину с помощью РНКазы III, которая представляет собой специфичную для двухцепочечной РНК эндонуклеазу. Малые интерферирующие РНК можно впоследствии распознать РНК-индуцированными комплексами сайленсинга, которые способствуют раскручиванию малых интерферирующих РНК с помощью АТФ-зависимого процесса. Раскрученная антисмысловая цепь малой интерферирующей РНК направляет активированные РНК-индуцированные комплексы сайленсинга к нацеленной иРНК, содержащей последовательность, комплементарную антисмысловой цепи малой интерферирующей РНК. Нацеленная иРНК и антисмысловая цепь могут образовывать А-форму спирали, и большую бороздку А-формы спирали можно распознать активированными РНК-индуцированными комплексами сайленсинга. Целевую иРНК можно расщепить с помощью активированных РНК-индуцированных комплексов сайленсинга в одном сайте, определенном сайтом связывания 5'-конца цепи малой интерферирующей РНК. Активированные РНК-индуцированные комплексы сайленсинга могут рециркулировать для катализа еще одного акта расщепления.
Векторы экспрессии интерферирующей РНК могут содержать конструкции интерферирующей РНК, кодирующие полинуклеотиды интерферирующей РНК, которые проявляют активность РНК-интерференции путем снижения уровня экспрессии иРНК, пре-иРНК или родственных вариантов РНК. Векторы экспрессии могут содержать промотор, расположенный выше по цепи и функционально связанный с конструкцией интерферирующей РНК, как дополнительно описано в данном документе. Векторы экспрессии интерферирующей РНК могут содержать подходящий минимальный основной промотор, представляющую интерес конструкцию интерферирующей РНК, расположенную выше по цепи (5') регуляторную область, расположенную ниже по цепи(3') регуляторную область, в том числе, сигналы терминации транскрипции и полиаденилирования, и другие последовательности, известные специалистам в данной области, такие как различные маркеры отбора.
Полинуклеотиды можно получить в различных формах, в том числе в виде двухцепочечных структур (то есть, двухцепочечную молекулу РНК, содержащую антисмысловую цепь и комплементарную ей смысловую цепь), двухцепочечных шпилькообразных структур или одноцепочечных структур (то есть, молекула ssRNA, содержащая только антисмысловую цепь). Структуры могут содержать вторичную структуру двойной спирали, асимметричной двойной спирали, шпильки или асимметричной шпильки, имеющую самокомплементарную смысловую и антисмысловую цепи. Двухцепочечную интерферирующую РНК можно ферментативно превратить в двухцепочечные малые интерферирующие РНК. Одну из цепей двойной спирали малой интерферирующей РНК можно отжечь с комплементарной последовательностью в целевой иРНК и родственных вариантах РНК. Двойные спирали из малой интерферирующей РНК/иРНК распознаются РНК-индуцированными комплексами сайленсинга, которые могут расщепить РНК в нескольких сайтах зависимым от последовательности образом, приводя к распаду целевой иРНК и родственных вариантов РНК.
Молекулы двухцепочечной РНК могут включать молекулы малой интерферирующей РНК, собранные из одного олигонуклеотида в структуре стебель-петля, где самокомплементарные смысловая и антисмысловая области молекулы малой интерферирующей РНК соединены с помощью основанного на полинуклеотидах или не основанного на полинуклеотидах линкера(-ов), а также кольцевую одноцепочечную РНК, имеющую две или более петлевые структуры и стебель, содержащий самокомплементарные смысловую и антисмысловую цепи, где кольцевую РНК можно обработать либо in vivo, или in vitro с генерированием активной молекулы малой интерферирующей РНК, способной опосредовать интерферирование РНК.
Также предполагается использование молекул малой шпилечной РНК. Они содержат специфичную антисмысловую последовательность в дополнение к обратно комплементарной (смысловой) последовательности, как правило, отделенной спейсером или последовательностью петли. Расщепление спейсера или петли обеспечивает молекулу одноцепочечной РНК и ее обратно комплементарную цепь, так что их можно отжечь с образованием двухцепочечной молекулы РНК (необязательно, с дополнительными этапами обработки, которые могут привести к добавлению или удалению одного, двух, трех или более нуклеотидов с 3'-конца или 5'-конца одной или обеих цепей). Спейсер может иметь достаточную длину, чтобы позволить отжиг антисмысловой и смысловой последовательностей и образование двухцепочечной структуры (или стебля) до расщепления спейсера (и, необязательно, последующих этапов обработки, которые могут привести к добавлению или удалению одного, двух, трех, четырех или более нуклеотидов с 3'-конца или 5'-конца одной или обеих цепей). Спейсерная последовательность представляет собой, как правило, неродственную нуклеотидную последовательность, которая находится между двух комплементарных областей нуклеотидной последовательности, которая при отжиге в двухцепочечный полинуклеотид содержит малую шпилечную РНК. Спейсерная последовательность обычно содержит от приблизительно 3 до приблизительно 100 нуклеотидов.
Любой представляющий интерес полинуклеотид РНК можно получить путем выбора подходящей композиции последовательности, размера петли и длины стебля для получения двойной спирали шпильки. Подходящий диапазон для проектирования длины стебля двойной спирали шпильки включает в себя длину стебля по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеотидов, например, приблизительно 14-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов, приблизительно 200-300 нуклеотидов, приблизительно 300-400 нуклеотидов, приблизительно 400-500 нуклеотидов, приблизительно 500-600 нуклеотидов и приблизительно 600-700 нуклеотидов. Подходящий диапазон для проектирования длины петли двойной спирали шпильки включает в себя длину петли приблизительно 4-25 нуклеотидов, приблизительно 25-50 нуклеотидов или длиннее, если длина стебля двойной спирали шпильки является значительной. В определенных вариантах осуществления молекула двухцепочечной РНК или ssPHK составляет от приблизительно 15 до приблизительно 40 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 15 до приблизительно 35 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 17 до приблизительно 30 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 19 до приблизительно 25 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 21 до приблизительно 23 нуклеотидов в длину. В определенных вариантах осуществления структуры шпильки с областями двойной спирали длиннее, чем 21 нуклеотид, могут способствовать эффективному направленному к малой интерферирующей РНК сайленсингу вне зависимости от последовательности и длины петли. Примеры последовательностей для РНК-интерференции изложены в SEQ ID NO: 8, или SEQ ID NO: 9.
Целевая последовательность иРНК составляет, как правило, от приблизительно 14 до приблизительно 50 нуклеотидов в длину. Целевую иРНК можно, таким образом, проверить на наличие областей от приблизительно 14 до приблизительно 50 нуклеотидов в длину, которые предпочтительно соответствуют следующим критериям для целевой последовательности: соотношение A+T/G+C от приблизительно 2:1 до приблизительно 1:2; динуклеотид АА или динуклеотид СА на 5'-конце целевой последовательности; последовательность из по меньшей мере 10 смежных нуклеотидов, уникальных для целевой иРНК (то есть, последовательность не присутствует в других последовательностях иРНК из этого же растения); и нет «полос» из более чем трех смежных гуаниновых (G) нуклеотидов или более чем трех смежных цитозиновых (С) нуклеотидов. Данные критерии можно оценить с помощью различных методик, известных в данной области, например, компьютерные программы, такие как BLAST, можно использовать для поиска общедоступных баз данных, чтобы определить, является ли выбранная целевая последовательность уникальной для целевой иРНК. В качестве альтернативы, можно выбрать целевую последовательность (и спроектировать последовательность малой интерферирующей РНК) с помощью доступного для приобретения компьютерного программного обеспечения (например, OligoEngine, Target Finder и Design Tool для малых интерферирующих РНК, которые являются доступными для приобретения).
В одном варианте осуществления выбраны целевые последовательности иРНК, которые составляют от приблизительно 14 до приблизительно 30 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше, В другом варианте осуществления выбраны целевые последовательности, которые составляют от приблизительно 16 до приблизительно 30 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше. В дополнительном варианте осуществления выбраны целевые последовательности, которые составляют от приблизительно 19 до приблизительно 30 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше. В другом варианте осуществления выбраны целевые последовательности, которые составляют от приблизительно 19 до приблизительно 25 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше.
В примерном варианте осуществления молекулы малой интерферирующей РНК содержат специфическую антисмысловую последовательность, которая комплементарна по меньшей мере 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или более смежным нуклеотидам из любой из описанных в данном документе полинуклеотидных последовательностей.
Специфическая антисмысловая последовательность, содержащаяся в молекуле малой интерферирующей РНК, может быть идентичной или по существу идентичной комплементарной цепи целевой последовательности. В одном варианте осуществления специфическая антисмысловая последовательность, содержащаяся в молекуле малой интерферирующей РНК, является по меньшей мере приблизительно на 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичной комплементарной цепи последовательности целевой РНК. Способы определения идентичности последовательности известны в данной области, и ее можно определить, например, с помощью программы BLASTN программного обеспечения Computer Group (GCG) Университета штата Висконсин, или предоставленной на веб-сайте NCBI.
Специфическая антисмысловая последовательность из молекул малой интерферирующей РНК может проявлять изменчивость по различиям (например, по нуклеотидной замене, в том числе, транзицию или трансверсию) в одном, двух, трех, четырех или более нуклеотидах из последовательности целевой иРНК. Если такие нуклеотидные замены находятся в антисмысловой цепи молекулы двухцепочечной РНК, комплементарный нуклеотид в смысловой цепи, с которым замещенный нуклеотид, как правило, должен образовывать водородные связи при спаривании оснований, может быть или может не быть соответственно замещенным. Молекулы двухцепочечной РНК, в которых одна или несколько нуклеотидных замен происходят в смысловой последовательности, но не в антисмысловой цепи, также предполагаются. Если антисмысловая последовательность из молекулы малой интерферирующей РНК содержит одно или несколько несовпадений между нуклеотидной последовательностью малой интерферирующей РНК и целевой нуклеотидной последовательностью, как описано выше, эти несоответствия можно найти на 3'-конце, 5'-конце, или в центральной части антисмысловой последовательности.
В другом варианте осуществления молекулы малой интерферирующей РНК содержат специфичную антисмысловую последовательность, которая способна селективно гибридизироваться в жестких условиях с частью встречающегося в природе целевого гена или целевой иРНК. Как известно специалистам в данной области, вариации жесткости условий гибридизации могут быть достигнуты путем изменения времени, температуры или концентрации растворов, используемых для этапов гибридизации и отмывания. Подходящие условия могут также частично зависеть от конкретных используемых нуклеотидных последовательностей, например, последовательности целевой иРНК или гена.
Одним из способов индукции сайленсинга двухцепочечной РНК в растениях является трансформация генной конструкцией, производящей шпилечную РНК (см. Smith et al. (2000) Nature, 407, 319-320). Такие конструкции содержат инвертированные области последовательности целевого гена, отделенные соответствующим спейсером. Вставка функциональной растительной интронной области в качестве спейсерного фрагмента дополнительно увеличивает эффективность индукции сайленсинга гена из-за генерации шпилечной РНК, сплайсированной с интроном (Wesley et al. (2001) Plant J., 27, 581-590). Соответственно, длина стебля составляет приблизительно от 50 нуклеотидов до приблизительно 1 тысячи нуклеотидов в длину. Способы получения шпилечной РНК, сплайсированной с интроном, хорошо описаны в данной области (см., например, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617).
Молекулы интерферирующей РНК, имеющие двуспиральную или двухцепочечную структуру, например, двухцепочечная РНК или малая шпилечная РНК, могут иметь «тупые» концы, или могут иметь 3' или 5' «липкие» концы. Использованный в данном документе «липкий конец» относится к неспаренному нуклеотиду или нуклеотидам, которые выступают из двуспиральной структуры, если 3'-конец одной цепи РНК выходит за пределы 5'-конца другой цепи (3' липкий конец), или наоборот (5' липкий конец). Нуклеотиды, содержащие липкие концы, могут быть рибонуклеотидами, дезоксирибонуклеотидами или их модифицированными версиями. В одном варианте осуществления по меньшей мере одна цепь молекулы интерферирующей РНК имеет 3' липкий конец от приблизительно 1 до приблизительно 6 нуклеотидов в длину. В других вариантах осуществления 3' липкий конец составляет от приблизительно 1 до приблизительно 5 нуклеотидов, от приблизительно 1 до приблизительно 3 нуклеотидов и от приблизительно 2 до приблизительно 4 нуклеотидов в длину.
Если молекула интерферирующей РНК содержит 3' липкий конец с одного конца молекулы, другой конец может быть с тупыми концами, или также иметь липкий конец (5' или 3'). Если молекула интерферирующей РНК содержит липкий конец с обоих концов молекулы, длина липких концов может быть одинаковой или разной. В одном варианте осуществления молекула интерферирующей РНК содержит 3' липкие концы от приблизительно 1 до приблизительно 3 нуклеотидов на обоих концах молекулы. В дополнительном варианте осуществления молекула интерферирующей РНК представляет собой двухцепочечную РНК, имеющую 3' липкий конец из 2 нуклеотидов с обоих концов молекулы. В еще одном варианте осуществления нуклеотиды, включающие в себя липкий конец интерферирующей РНК, представляют собой динуклеотиды ТТ или динуклеотиды UU.
При определении процентной идентичности молекулы интерферирующей РНК, содержащей один или несколько липких концов, с последовательностью целевой иРНК, липкий конец (концы) может учитываться или не учитываться. Например, нуклеотиды с 3' липкого конца и вплоть до 2 нуклеотидов с 5'- или 3'-конца двойной цепи могут быть модифицированы без существенной потери активности молекулы малой интерферирующей РНК.
Молекулы интерферирующей РНК могут содержать одну или несколько структур 5' или 3'-кэпа. Молекула интерферирующей РНК может содержать структуру кэпа на 3'-конце смысловой цепи, антисмысловой цепи или как смысловой, так и антисмысловой цепи; или с 5'-конца смысловой цепи, антисмысловой цепи или как смысловой, так и антисмысловой цепи молекулы интерферирующей РНК. В качестве альтернативы, молекула интерферирующей РНК может содержать структуру кэпа как с 3'-конца, так и с 5'-конца молекулы интерферирующей РНК. Термин «структура кэпа» относится к химической модификации, встроенной с любого конца олигонуклеотида, которая защищает молекулу от расщепления эндонуклеазой и может также облегчать доставку или локализацию внутри клетки.
Другой модификацией, применяемой к молекулам интерферирующей РНК, является химическое связывание с молекулой интерферирующей РНК одного или нескольких фрагментов или конъюгатов, которые повышают активность, клеточное распределение, клеточный захват, биодоступность или стабильность молекулы интерферирующей РНК. Полинуклеотиды можно синтезировать или модифицировать с помощью способов, хорошо обоснованных в данной области. Химические модификации могут включать, помимо прочего, 2'-модификации, введение неприродных оснований, ковалентное присоединение лиганда и замещение фосфатных связей тиофосфатными связями. В данном варианте осуществления целостность двуспиральной структуры усиливают с помощью по меньшей мере одной и, как правило, двух химических связей. Химическое связывание может достигаться с помощью любого из множества хорошо известных методик, например, путем введения ковалентных, ионных или водородных связей; гидрофобных взаимодействий, Ван-дер-Ваальсовых или стекинговых взаимодействий; посредством металл-ионной координации или благодаря использованию пуриновых аналогов.
Нуклеотиды на одной или обеих из двух одинарных цепей можно модифицировать для модулирования активации клеточных ферментов, таких как, например, без ограничения, определенные нуклеазы. Методики для снижения или ингибирования активации клеточных ферментов известны в данной области и включают, помимо прочего, 2'-аминомодификации, 2'-фтормодификации, 2'-алкилмодификации, модификации незаряженной основой, морфолиновые модификации, 2'-O-метилмодификации и фосфорамидат. Таким образом, по меньшей мере одну 2'-гидроксильную группу нуклеотидов на двухцепочечной РНК замещают химической группой. Также, по меньшей мере один нуклеотид можно модифицировать с образованием закрытого нуклеотида. Такой закрытый нуклеотид содержит метиленовый или этиленовый мостик, который соединяет 2'-кислород рибозы с 4'-углеродом рибозы. Введение закрытого нуклеотида в олигонуклеотид улучшает аффиность к комплементарной последовательности и увеличивает температуру плавления на несколько градусов.
Можно конъюгировать лиганды с молекулой интерферирующей РНК, например, для повышения в отношении нее клеточной абсорбции. В определенных вариантах осуществления гидрофобный лиганд конъюгируют с молекулой для облегчения прямого прохождения сквозь клеточную мембрану. Данные подходы использованы для облегчения прохождения в клетку антисмысловых олигонуклеотидов. В определенных случаях конъюгация катионного лиганда с олигонуклеотидами часто приводит к улучшенной устойчивости к нуклеазам. Типичные примеры катионных лигандов включают пропиламмоний и диметилпропиламоний. Антисмысловые олигонуклеотиды могут сохранять свою высокую аффинность связывания с иРНК, когда катионный лиганд рассредоточен по всему олигонуклеотиду.
Молекулы и полинуклеотиды, описанные в данном документе, можно получить с помощью хорошо известных методик твердофазного синтеза. Любые другие средства для такого синтеза, известные в данной области, можно использовать дополнительно или в качестве альтернативы.
«Targeted Induced Local Lesions In Genomes» (нацеленные индуцированные локальные повреждения в геноме, TILLING) представляет собой еще одну технологию мутагенеза, которую можно использовать для создания и/или идентификации полинуклеотидов, кодирующих полипептиды с модифицированной экспрессией и/или активностью. TILLING также позволяет отбор растений, несущих такие мутации. В TILLING комбинируют мутагенез высокой плотности со способами высокопроизводительного скрининга. Способы для проведения TILLING хорошо известны в данной области (см. McCallum et al, (2000) Nat Biotechnol 18: 455-457 и Stemple (2004) Nat Rev Genet 5(2): 145-50).
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или конструкций интерферирующей РНК, которые содержат один или несколько полинуклеотидов, описанных в данном документе.
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или одну или несколько конструкций интерферирующей РНК, описанных в данном документе.
Различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или одну или несколько конструкций интерферирующей РНК, кодирующих один или несколько полинуклеотидов интерферирующей РНК, описанных в данном документе, которые способны к самоотжигу с образованием структуры шпильки, в которых конструкция содержит (а) один или несколько полинуклеотидов, описанных в данном документе; (b) вторую последовательность, кодирующую спейсерный элемент, который образует петлю структуры шпильки; и (с) третью последовательность, содержащую обратно комплементарную
последовательность первой последовательности, расположенную в той же ориентации, как и первая последовательность, где вторая последовательность расположена между первой последовательностью и третьей последовательностью и вторая последовательность функционально связана с первой последовательностью и третьей последовательностью.
Раскрытые последовательности можно использовать для конструирования различных полинуклеотидов, которые не образуют структуры шпильки. Например, двухцепочечную РНК можно образовать посредством (1) транскрибирования первой цепи ДНК путем функционального связывания с первым промотором и (2) транскрибирования обратно комплементарной последовательности фрагмента ДНК первой цепи путем функционального связывания со вторым промотором. Каждую цепь полинуклеотида можно транскрибировать из одного вектора экспрессии, или из разных векторов экспрессии. Двойную спираль РНК, имеющую активность РНК-интерференции, можно ферментативно превратить в малые интерферирующие РНК для модулирования уровней РНК.
Таким образом, различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или конструкций интерферирующей РНК, описанных в данном документе, кодирующих полинуклеотиды интерферирующей РНК, способные к самоотжигу, в которых конструкция содержит (а) один или несколько полинуклеотидов, описанных в данном документе; и (b) вторую последовательность, содержащую комплементарную (например, обратно комплементарную) последовательность первой последовательности, расположенную в той же ориентации, что и первая последовательность.
Предусмотрены различные композиции и способы для модулирования уровней эндогенной экспрессии одного или нескольких полипептидов, описанных в данном документе (или любой их комбинации, описанной в данном документе) путем стимулирования косупрессии экспрессии гена. Феномен косупрессии возникает как результат введения множества копий трансгена в растительную клетку-хозяина. Интеграция множества копий трансгена может приводить к модулированию экспрессии трансгена и нацеленного эндогенного гена. Степень косупрессии зависит от степени идентичности последовательности между трансгеном и нацеленным эндогенным геном. Сайленсинг как эндогенного гена, так и трансгена может происходить из-за обширного метилирования подавляемых локусов (то есть, эндогенного промотора и эндогенного представляющего интерес гена), что может нарушать транскрипцию. В качестве альтернативы, в некоторых случаях косупрессия эндогенного гена и трансгена может происходить посредством пост-транскрипционного сайленсинга гена, при котором транскрипты могут быть получены, но повышенные уровни расщепления препятствуют накоплению транскриптов. Механизм косупрессии посредством пост-транскрипционного сайленсинга генов, как полагают, напоминает РНК-интерференцию в том, что РНК, по-видимому, важна как инициатор и мишень в этих процессах, и может быть опосредован, по меньшей мере частично, с помощью того же молекулярного механизма, возможно, через РНК-направляемое расщепление иРНК.
Косупрессию нуклеиновых кислот можно достичь путем введения множества копий нуклеиновой кислоты или ее фрагментов в качестве трансгенов в геном представляющего интерес растения. Растение-хозяина можно
трансформировать вектором экспрессии, содержащим промотор, функционально связанный с такой нуклеиновой кислотой или ее фрагментами. Различные варианты осуществления направлены на векторы экспрессии для способствования косупрессии эндогенных генов, содержащих промотор, функционально связанный с полинуклеотидом.
Различные варианты осуществления направлены на способы модулирования уровня экспрессии одного или более полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, как описано в данном документе) путем введения множества копий полинуклеотида (полинуклеотидов) в геном растения (табака), включающие: трансформирование растительной клетки-хозяина вектором экспрессии, который содержит промотор, функционально связанный с полинуклеотидом.
Различные композиции и способы предусмотрены для модулирования уровня экспрессии эндогенного гена путем модулирования трансляции иРНК. Растительную клетку-хозяина (табака) можно трансформировать вектором экспрессии, содержащим: промотор, функционально связанный с полинуклеотидом, расположенным в антисмысловой ориентации по отношению к промотору для обеспечения возможности экспрессии полинуклеотидов РНК, имеющих последовательность, комплементарную участку иРНК.
Различные векторы экспрессии для модулирования трансляции иРНК могут содержать: промотор, функционально связанный с полинуклеотидом, в антисмысловой ориентации по отношению к промотору. Длина полинуклеотидов антисмысловой РНК может варьировать и составлять от приблизительно 15-20 нуклеотидов, приблизительно 20-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-75 нуклеотидов, приблизительно 75-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов и приблизительно 200-300 нуклеотидов.
Способы получения мутантных полинуклеотидов и полипептидов также предусмотрены. Любое представляющее интерес растение, в том числе растительную клетку или растительный материал, можно генетически модифицировать различными способами, известными для индукции мутагенеза, в том числе сайт-направленный мутагенез, олигонуклеотид-направленный мутагенез, химически индуцированный мутагенез, индуцированный облучением мутагенез, мутагенез с использованием модифицированных оснований, мутагенез с использованием содержащей разрывы двуспиральной ДНК, мутагенез двухцепочечных разрывов, мутагенез с использованием дефицитных по репарации штаммов хозяев, мутагенез посредством общего генного синтеза, перетасовка ДНК и другие эквивалентные способы.
В качестве альтернативы, гены можно нацелить для инактивации путем введения транспозонов (например, IS-элементов) в геномы представляющих интерес растений. Данные мобильные генетические элементы можно ввести путем полового перекрестного опыления и инсерционных мутантов можно проверить на потерю активности белка. Разрушенный ген родительского растения можно ввести в другие растения путем скрещивания родительского растения с растением, не подвергнутым индуцированному транспозоном мутагенезу, например, путем полового перекрестного опыления. Можно использовать любые стандартные методики селекции, известные специалистам в данной области. В одном варианте осуществления один или несколько генов можно инактивировать путем инсерции одного или нескольких транспозонов. Мутации могут привести к гомозиготному разрушению одного или нескольких генов, к гетерозиготному разрушению одного или нескольких генов, или к комбинации гомозиготных и гетерозиготных разрушений, если разрушен более чем один ген. Подходящие перемещающиеся элементы включают в себя ретротранспозоны, ретропозоны и SINE-подобные элементы. Такие способы известны специалистам в данной области.
В качестве альтернативы, гены можно нацелить для инактивации путем введения рибозимов, полученных из ряда малых кольцевых РНК, которые способны к саморасщеплению и репликации в растениях. Данные РНК могут реплицироваться либо самостоятельно (РНК вироида), или с вспомогательным вирусом (сателлитные РНК). Примеры подходящих РНК включают полученные из вироида солнечной пятнистости авокадо и сателлитные РНК, полученные из вируса кольцевой пятнистости табака, вируса временной полосатости люцерны, вируса бархатной пятнистости табака, вируса пятнистости Solanum nodiflorum к вируса пятнистости клевера подземного. Различные специфичные к целевой РНК рибозимы известны специалистам в данной области.
В некоторых вариантах осуществления экспрессию полипептида модулируют нетрансгенными средствами, такими как создание мутации в гене. Способы, с помощью которых вводят случайную мутацию в генную последовательность, могут включать химический мутагенез, мутагенез EMS и радиационный мутагенез. Способы, с помощью которых вводят одну или несколько нацеленных мутаций в клетку, включают, помимо прочего, технологию редактирования генома, в частности, мутагенез, опосредованный нуклеазой цинкового пальца, TILLING (нацеленные индуцированные локальные повреждения в геноме), гомологичную рекомбинацию, олигонуклеотид-направленный мутагенез и мутагенез, опосредованный мегануклеазой.
Некоторые неоганичивающие примеры мутаций представляют собой делеции, инсерции и миссенс-мутации по меньшей мере одного нуклеотида, однонуклеотидные полиморфизмы и простую повторяющуюся последовательность. После мутации можно провести скрининг для выявления мутаций, которые создают ранние стоп-кодоны или другим образом нефункциональные гены. После мутации можно провести скрининг для выявления мутаций, которые создают функциональные гены, способные экспрессироваться на повышенных уровнях. Скриниг мутантов можно выполнить путем секвенирования, или с использованием одного или нескольких зондов или праймеров, специфичных для данного гена или белка. Можно также создать в полинуклеотидах конкретные мутации, которые приводят к модулированию экспрессии гена, модулированию стабильности иРНК или модулированию стабильности белка. Такие растения названы в данном документе как «не встречающиеся в природе» или «мутантные» растения. Как правило, мутантные или не встречающиеся в природе растения будут включать в себя по меньшей мере часть чужеродной или синтетической или искусственной нуклеиновой кислоты (например, ДНК или РНК), которая не представлена в растении до манипулирования им. Чужеродная нуклеиновая кислота может быть одним нуклеотидом, двумя или более нуклеотидами, двумя или более смежными нуклеотидами или двумя или более несмежными нуклеотидами, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 или 1500 более смежными или несмежными нуклеотидами.
Мутантные или не встречающиеся в природе растения могут иметь любую комбинацию одной или нескольких мутаций, которая приводит к модулированию уровней белка. Например, мутантные или не встречающиеся в природе растения могут иметь одну мутацию в одном гене; несколько мутаций в одном гене; одну мутацию в двух или более, или трех или более генах; или несколько мутаций в двух или более, или трех или более генах. В качестве дополнительного примера, мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций в конкретной области гена(-оз), например, в области гена, которая кодирует активный сайт белка или его часть. В качестве дополнительного примера, мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций в области вне одного или более гена(-ов), например, в области выше по цепи или ниже по цепи гена, который он регулирует, при условии, что они модулируют активность или экспрессию гена(-ов). Элементы, расположенные выше по цепи, могут включать в себя промоторы, энхансеры или транскрипционные факторы. Некоторые элементы, такие как энхансеры, могут располагаться выше по цепи или ниже по цепи гена, который они регулируют. Элемент(ы) не обязательно расположен рядом с геном, который он регулирует, поскольку некоторые элементы, как было обнаружено, расположены на несколько тысяч пар оснований выше по цепи или ниже по цепи гена, который они регулируют. Мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций, расположенных в первых 100 нуклеотидах гена(-ов), в первых 200 нуклеотидах гена(-ов), в первых 300 нуклеотидах гена(-ов), в первых 400 нуклеотидах гена(-ов), в первых 500 нуклеотидах гена(-ов), в первых 600 нуклеотидах гена(-ов), в первых 700 нуклеотидах гена(-ов), в первых 800 нуклеотидах гена(-ов), в первых 900 нуклеотидах гена(-ов), в первой 1000 нуклеотидов гена(-ов), в первых 1100 нуклеотидах гена(-ов), в первых 1200 нуклеотидах гена(-ов), в первых 1300 нуклеотидах гена(-ов), в первых 1400 нуклеотидах гена(-ов) или в первых 1500 нуклеотидах гена(-ов). Мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций, расположенных в первом, втором, третьем, четвертом, пятом, шестом, седьмом, восьмом, девятом, десятом; одиннадцатом, двенадцатом, тринадцатом, четырнадцатом или пятнадцатом наборе из 100 нуклеотидов гена(-ов) или их комбинации. Раскрыты мутантные или не встречающиеся в природе растения (например, мутантные, не встречающиеся в природе или трансгенные растения и тому подобное, как описано в данном документе), содержащие варианты мутантного полипептида.
В одном варианте осуществления семена растений подвергают мутагенезу и затем выращивают из них мутантные растения первого поколения. Затем растениям первого поколения позволяют самоопылиться и из семян от растений первого поколения выращивают растения второго поколения, которые затем проверяют на мутации в их локусах. Не смотря на то, что подвергнутый мутации растительный материал можно проверить на мутации, преимуществом скрининга растений второго поколения является то, что все соматические мутации соответствуют зародышевым мутациям. Специалисту в данной области будет понятно, что различный растительный материал, в том числе, помимо прочего, семена, пыльцу, растительные ткани или растительные клетки, можно подвергнуть мутагенезу для того, чтобы создать мутантные растения. Однако тип растительного материала, подвергнутого мутагенезу, может иметь значение, когда растительную нуклеиновую кислоту проверяют на мутации. Например, когда пыльцу подвергают мутагенезу до опыления не подвергнутого мутагенезу растения, из семян, полученных при этом опылении, выращивают растения первого поколения. Каждая клетка растений первого поколения будет содержать мутации, созданные в пыльце; таким образом, эти растения первого поколения можно затем проверить на мутации вместо того, чтобы ждать появления второго поколения.
Мутагены, которые создают главным образом точечные мутации и короткие делеции, инсерции, трансверсии и/или транзиции, включая химические мутагены и облучение, можно использовать для создания мутаций. Мутагены включают, помимо прочего, этилметансульфонат, метилметансульфонат, N-этил-N-нитрозомочевину, триэтилмеламин, N-метил-N-нитрозомочевину, прокарбазин, хлорамбуцил, циклофосфамид, диэтилсульфат, мономер акриламида, мельфалан, азотистый иприт, винкристин, диметилнитрозамин, N-метил-N'-нитро-нитрозогуанидин, нитрозогуанидин, 2-аминопурин, 7,12 диметил-бенз(а)антрацен, этиленоксид, гексаметилфосфорамид, бисульфан, диэпоксиалканы (диэпоксиоктан, диэпоксибутан и т.п.), 2-метокси-6-хлор-9[3-(этил-2-хлорэтил)аминопропиламино]акридина дигидрохлорид и формальдегид.
Спонтанные мутации в локусе, которые могут не быть непосредственно вызванными мутагеном, также предполагаются при условии, что они приводят к желаемому фенотипу. Подходящие мутагенные средства могут также включать в себя, например, ионизирующее излучение, например, рентгеновское излучение, гамма-излучение, излучение быстрых нейтронов и ультрафиолетовое излучение. Любой способ подготовки растительной нуклеиновой кислоты, известный специалистам в данной области, можно использовать для подготовки растительной нуклеиновой кислоты для скрининга мутаций.
Подготовленную нуклеиновую кислоту из отдельных растений, растительных клеток или растительного материала можно необязательно объединить для того, чтобы ускорить скрининг на мутации в популяции растений, происходящих из подвергнутых мутагенезу растительных тканей, клеток или материала. Можно проверить одно или несколько следующих поколений растений, растительных клеток или растительного материала. Размер необязательно объединенной группы зависит от чувствительности используемого способа скрининга.
После того, как образцы нуклеиновых кислот необязательно объединили, их можно подвергнуть методикам полинуклеотид-специфичной амплификации, таким как полимеразная цепная реакция. Любой один или несколько праймеров или зондов, специфичных для гена или последовательности, непосредственно примыкающей к гену, можно использовать для амплификации последовательностей в необязательно объединенном образце нуклеиновых кислот. Соответственно, один или несколько праймеров или зондов проектируют для амплификации областей локуса, в которых с наибольшей вероятностью возникают пригодные мутации. Наиболее предпочтительно праймер проектируют для обнаружения мутаций в областях полинуклеотида. Дополнительно, предпочтительным для праймера(-ов) и зонда(-ов) было бы избегать известных полиморфных сайтов для того, чтобы облегчить скрининг точечных мутаций. Для облегчения обнаружения продуктов амплификации один или несколько праймеров или зондов можно пометить с использованием любого общепринятого способа нанесения метки. Праймер(ы) или зонд(ы) можно спроектировать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области.
Для облегчения обнаружения продуктов амплификации праймер(ы) или зонд(ы) можно пометить с использованием любого общепринятого способа нанесения метки. Их можно спроектировать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области.
Полиморфизмы можно идентифицировать с помощью средств, известных в данной области, и некоторых из описанных в литературе.
В дополнительном аспекте предусмотрен способ получения мутантного растения. Способ включает получение по меньшей мере одной клетки растения, содержащей ген, кодирующий функциональный полинуклеотид, описанный в данном документе (или любую из комбинацию, описанную в данном документе). Далее, эту по меньшей мере одну клетку растения обрабатывают в условиях, эффективных для модулирования активности полинуклеотида(-ов). описанного в данном документе. По меньшей мере одну мутантную растительную клетку затем размножают в мутантное растение, где мутантное растение имеет модулированный уровень описанного полипептида(-ов) (или любой их комбинации, описанной в данном документе) по сравнению с уровнем у контрольного растения. В одном варианте осуществления данного способа изготовления мутантного растения этап обработки включает подвергание по меньшей мере одной клетки воздействию химического мутагенного средства, как описано выше по цепи, и в условиях, эффективных для получения по меньшей мере одной мутантной растительной клетки. В другом варианте осуществления данного способа этап обработки включает подвергание по меньшей мере одной клетки воздействию источника излучения в условиях, эффективных для получения по меньшей мере одной мутантной растительной клетки. Термин «мутантное растение» включает мутантные растения, в которых генотип модифицирован по сравнению с контрольным растением, соответственно, с помощью средств помимо генной инженерии и генетической модификации.
В определенных вариантах осуществления мутантное растение, мутантная растительная клетка или мутантный растительный материал может содержать одну или несколько мутаций, которые встречаются в природе в другом растении, растительной клетке или растительном материале и предоставляют желаемый признак. Эту мутацию можно встроить (например, путем интрогрессии) в другое растение, растительную клетку или растительный материал (например, растение, растительную клетку или растительный материал с другим генетическим фоном относительно растения, из которого получили мутацию) для предоставления ему признака. Таким образом, в качестве примера, мутацию, которая встречается в природе в первом растении, можно ввести во второе растение, например, второе растение с другим генетическим фоном относительно первого растения. Специалист в данной области, таким образом, способен вести поиск и идентифицировать растение, несущее естественным образом в своем геноме один или несколько мутантных аллелей генов, описанных в данном документе, которые предоставляют желаемый признак. Мутантный аллель(-и), который встречается в природе, можно перенести во второе растение различными способами, включая селекцию, обратное скрещивание и интрогрессию с получением линий, разновидностей или гибридов, которые имеют одну или несколько мутаций в генах, описанных в данном документе. Растения, демонстрирующие желаемый признак, можно отобрать из пула мутантных растений. Соответственно, отбор выполняют с использованием сведений о нуклеиновых кислотах, описанных в данном документе. В результате можно провести отбор генетического признака по сравнению с контролем. Такой скрининговый подход может включать применение общепринятых методик амплификации и/или гибридизации нуклеиновых кислот, как обсуждается в данном документе. Таким образом, дополнительный аспект настоящего изобретения относится к способу идентификации мутантного растения, который включает этапы: (а) получения образца, содержащего нуклеиновую кислоту из растения; и (b) определения последовательности нуклеиновых кислот полинуклеотида, где различие в последовательности полинуклеотида по сравнению с полинуклеотидной последовательностью контрольного растения свидетельствует, что указанное растение является мутантным растением. В другом аспекте предусмотрен способ идентификации мутантного растения, которое накапливает сниженные уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением, включающий этапы: (а) получения образца из растения, подлежащего скринингу; (b) определения того, содержит ли указанный образец одну или несколько мутаций в одном или нескольких полинуклеотидах, описанных в данном документе; и (с) определения (i) содержания нитратов и/или (ii) по меньшей мере содержания NNK в указанном растении. Соответственна содержание по меньшей мере NNK и/или нитратов определяют в зеленых листьях. В другом аспекте предусмотрен способ получения мутантного растения, которое имеет сниженные уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением, включающий этапы: (а) получения образца из первого растения; (b) определения того, содержит ли указанный образец одну или несколько мутаций в одном или нескольких полинуклеотидах, описанных в данном документе, которые приводят к сниженным уровням по меньшей мере NNK и/или нитратов; и (с) перенос одной или нескольких мутаций во второе растение. Соответственно, содержание NNK и/или нитратов определяют в зеленых листьях. Мутацию (мутации) можно перенести во второе растение с помощью различных способов, которые известны в данной области, например, с помощью генной инженерии, генетической манипуляции, интрогрессии, селекции растений, обратного скрещивания и т.п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение имеет другой генетический фон относительно первого растения. В другом аспекте предусмотрен способ получения мутантного растения, которое имеет сниженные уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением, включающий этапы: (а) получения образца из первого растения; (b) определения того, содержит ли указанный образец одну или несколько мутаций в одном или нескольких полинуклеотидах, описанных в данном документе, которые приводят к сниженным уровням по меньшей мере NNK и/или нитратов; и (с) интрогрессии одной или нескольких мутаций из первого растения во второе растение. Соответственно, содержание NNK и/или нитратов определяют в зеленых листьях. В одном варианте осуществления этап интрогрессии включает в себя селекцию растений, необязательно включая обратное скрещивание и т.п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение имеет другой генетический фон относительно первого растения. В одном варианте осуществления первое растение не представляет собой сорт или элитный сорт. В одном варианте осуществления второе растение представляет собой сорт или элитный сорт. Следующий аспект относится к мутантному растению (включая мутантное растение сорта или элитного сорта), полученное или получаемое с помощью способов, описанных в данном документе. В определенных вариантах осуществления «мутантные растения» могут иметь одну или несколько мутаций, локализованных только в конкретной области растения, например, в последовательности одного или более полинуклеотида(-ов), описанного в данном документе. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения будет такой же или по существу такой же, как у растения до мутагенеза.
В определенных вариантах осуществления «мутантные растения» могут иметь одну или несколько мутаций, локализованных в более чем одной области растения, например, в последовательности одного или нескольких полинуклеотидов, описанных в данном документе, и в одном или нескольких дополнительных областях генома. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения не будет такой же или не будет по существу такой же, как у растения до мутагенеза. В определенных вариантах осуществления мутантные растения могут не иметь одну или несколько мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более экзонах полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более интронах полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в промоторе полинуклеотида(-ов),' описанного в данном документе; или могут не иметь одну или несколько мутаций в 3'-нетранслируемой области полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в 3'-нетранслируемой области полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в кодирующей области полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в некодирующей области полинуклеотида(-ов), описанного в данном документе; или любую комбинацию двух или более, трех или более, четырех или более, пяти или более или шести или более из их частей.
В следующем аспекте предусмотрен способ идентификации растения, растительной клетки или растительного материала, содержащего мутацию в гене, кодирующем полинуклеотид, описанный в данном документе, включающий: (а) подвергание растения, растительной клетки или растительного материала мутагенезу; (b) получение образца нуклеиновой кислоты из указанного растения, растительной клетки или растительного материала или их потомков; и (с) определение последовательности нуклеиновых кислот гена, кодирующего полинуклеотид, описанный в данном документе, или его вариантов или фрагментов, где различие в указанной последовательности свидетельствует об одной или нескольких мутациях в ней.
Белки цинкового пальца можно использовать для модулирования экспрессии или активности одного или нескольких полинуклеотидов, описанных в данном документе. В различных вариантах осуществления последовательность геномной ДНК, содержащую часть или всю кодирующую последовательность полинуклеотида, модифицируют путем мутагенеза, опосредованного нуклеазой цинкового пальца. В последовательности геномной ДНК проводят поиск уникального сайта связывания белка цинкового пальца. В качестве альтернативы, в последовательности геномной ДНК проводят поиск двух уникальных сайтов связывания белка цинкового пальца, где оба сайта находятся на противоположных цепях и близко друг к другу, например, 1, 2, 3, 4, 5, 6 или более пар оснований в сторону. Соответственно, предусмотрены белки цинкового пальца, которые связываются с полинуклеотидами.
Белок цинкового пальца можно сконструировать для распознавания выбранного целевого сайта в гене. Белок цинкового пальца может содержать любую комбинацию мотивов, полученных из природных ДНК-связывающих доменов цинкового пальца и неприродных ДНК-связывающих доменов цинкового пальца путем усечения или расширения или процесса сайт-направленного мутагенеза в сочетании со способом отбора, таким как, помимо прочего, отбор фагового дисплея, бактериальный двугибридный отбор или бактериальный одногибридный отбор. Термин «неприродный ДНК-связывающий домен цинкового пальца» относится к ДНК-связывающему домену цинкового пальца, который связывает последовательность из трех пар оснований в целевой нуклеиновой кислоте и который не происходит из клетки или организма, содержащего нуклеиновую кислоту, которая должна быть модифицирована. Способы проектирования белка цинкового пальца, который связывает специфические нуклеиновые последовательности, являющиеся уникальными для целевого гена, известны в данной области.
Нуклеазу цинкового пальца можно сконструировать путем изготовления слияния между первым полинуклеотидом, кодирующим белок цинкового пальца, который связывается с полинуклеотидом, и вторым полинуклеотидом, кодирующим неспецифическую эндонуклеазу, такую как, помимо прочего, эндонуклеаза типа IIS. Белок слияния между белком цинкового пальца и нуклеазой может содержать спейсер, состоящий из двух пар оснований или, в качестве альтернативы, спейсер, состоящий из трех, четырех, пяти, шести, семи или более пар оснований. В различных вариантах осуществления нуклеаза цинкового пальца вводит двухцепочечный разрыв в регуляторную область, кодирующую область или некодирующую область последовательности геномной ДНК полинуклеотида и приводит к снижению уровня экспрессии полинуклеотида или снижению активности белка, кодируемого им. Расщепление с помощью нуклеаз цинкового пальца часто приводит к делеции ДНК в сайте расщепления с последующей репарацией ДНК путем сращивания негомологичных концов.
В других вариантах осуществления белок цинкового пальца можно выбрать для связывания с регуляторной последовательностью полинуклеотида. Более конкретно, регуляторная последовательность может содержать сайт инициации транскрипции, стартовый кодон, область экзона, границу раздела экзон-интрон, терминатор или стоп-кодон. Соответственно, данное изобретение предусматривает мутантное, не встречающееся в природе или трансгенное растение или растительную клетку, полученную с помощью мутагенеза, опосредованного нуклеазой цинкового пальца, вблизи от или в одном или нескольких полинуклеотидах, описанных в данном документе, и способы изготовления такого растения или растительной клетки с помощью мутагенеза, опосредованного нуклеазой цинкового пальца. Способы доставки белка цинкового пальца и нуклеазы цинкового пальца в растение табака подобны описанным ниже для доставки мегануклеазы.
В другом аспекте описаны способы получения мутантных, не встречающихся в природе или трансгенных или другим образом генетически модифицированных растений с использованием мегануклеаз, таких как I-CreI. Встречающиеся в природе мегануклеазы, а также рекомбинантные мегануклеазы можно использовать для того, чтобы специфически вызвать двухцепочечный разрыв в одном сайте или в относительно небольшом числе сайтов в геномной ДНК растения с разрушением одного или нескольких полинуклеотидов, описанных в данном документе. Мегануклеаза может быть сконструированной мегануклеазой с измененными свойствами распознавания ДНК. Белки мегануклеаз можно доставить в растительные клетки с помощью ряда различных механизмов, известных в данной области.
Настоящее изобретение охватывает использование мегануклеаз для инактивации полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, описанной в данном документе), в растительной клетке или растении. В частности, настоящее изобретение предусматривает способ инактивации полинуклеотида в растении с помощью мегануклеазы, включающий: (а) получение растительной клетки, содержащей полинуклеотид, описанный в данном документе; (b) введение мегануклеазы или конструкции, кодирующей мегануклеазу, в указанную растительную клетку и (с) предоставление возможности мегануклеазе по существу инактивировать полинуклеотид(ы)
Мегануклеазы можно использовать для расщепления сайтов распознавания мегануклеазы в кодирующих областях полинуклеотида. Такое расщепление часто приводит к делеции ДНК в сайте распознавания мегануклеазы с последующей репарацией мутагенной ДНК путем сращивания негомологичных концов. Такие мутации в кодирующей последовательности гена являются, как правило, достаточными для инактивации гена. Этот способ модификации растительной клетки включает, во-первых, доставку кассеты экспрессии мегануклеазы в растительную клетку с помощью подходящего способа трансформации. Для достижения максимальной эффективности желательно связать кассету экспрессии мегануклеазы с селектируемым маркером и отобрать успешно трансформированные клетки в присутствии средства отбора. Этот подход приведет к интеграции кассеты экспрессии мегануклеазы в геном, что, однако, может быть нежелательным, если растение, скорее всего, потребует нормативного утверждения. В таких случаях кассету экспрессии мегануклеазы (и связанный селектируемый маркерный ген) можно выделить из последующих поколений растения с использованием традиционных методик селекции. В качестве альтернативы, растительные клетки можно изначально трансформировать кассетой экспрессии мегануклеазы без селектируемого маркера и можно вырастить на средах без средства отбора. В таких условиях часть обработанных клеток приобретет кассету экспрессии мегануклеазы и будет экспрессировать сконструированную мегануклеазу временно без интеграции кассеты экспрессии мегануклеазы в геном. Поскольку это не приводит к эффективности трансформации, последняя методика трансформации требует скрининга большего количества обработанных клеток для получения желаемой модификации генома. Описанный выше подход можно также применить для модификации растительной клетки при использовании белка цинкового пальца или нуклеазы цинкового пальца.
После доставки кассеты экспрессии мегануклеазы растительные клетки выращивают, изначально, в условиях, которые являются типичными для конкретной процедуры трансформации, которую использовали. Это может означать, что трансформированные клетки растут на средах при температуре ниже 26°С, часто в темноте. Такие стандартные условия можно использовать в течение периода времени, предпочтительно 1-4 дня, чтобы позволить растительной клетке восстановиться после процесса трансформации. В любой момент после этого начального периода восстановления температуру роста можно поднять для стимулирования активности сконструированной мегануклеазы относительно расщепления и мутирования сайта распознавания мегануклеазы.
Для определенных применений может быть желательным точно удалить полинуклеотид из генома растения. В таких применениях можно использовать пару сконструированных мегануклеаз, каждая из которых расщепляет сайт распознавания мегануклеазы по обе стороны от предполагаемой делеции. Также можно использовать эффекторные нуклеазы TAL (TALEN), которые способны распознавать и связываться с геном и вводить двухцепочечный разрыв в геном. Таким образом, в другом аспекте предполагаются способы получения мутантных, не встречающихся в природе или трансгенных или другим образом генетически модифицированных растений, описанных в данном документе, с помощью эффекторных нуклеаз TAL.
Растения, пригодные для использования в генетической модификации, включают, помимо прочего, однодольные и двудольные растения и системы растительных клеток, в том числе виды из одного из следующих семейств: Acanthaceae, Alliaceae, Alstroemeriaceae, Amaryllidaceae, Apocynaceae, Arecaceae. Asteraceae, Berberidaceae, Bixaceae, Brassicaceae, Bromeliaceae, Cannabaceae, Caryophyllaceae, Cephalotaxaceae, Chenopodiaceae, Colchicaceae, Cucurbitaceae, Dioscoreaceae, Ephedraceae, Erythroxylaceae, Euphorbiaceae, Fabaceae, Lamiaceae, Linaceae, Lycopodiaceae, Malvaceae, Melanthiaceae, Musaceae, Myrtaceae, Nyssaceae, Papaveraceae, Pinaceae, Plantaginaceae, Poaceae, Rosaceae, Rubiaceae, Salicaceae, Sapindaceae, Solanaceae, Taxaceae, Theaceae или Vitaceae.
Подходящие виды могут включать членов рода Abelmoschus, Abies, Acer, Agrostis, Allium, Alstroemeria, Ananas, Andrographis, Andropogon, Artemisia, Arundo, Atropa, Berberis, Beta, Bixa, Brassica, Calendula, Camellia, Camptotheca, Cannabis, Capsicum, Carthamus, Catharanthus, Cephalotaxus, Chrysanthemum, Cinchona, Citrullus, Coffea, Colchicum, Coleus, Cucumis, Cucurbita, Cynbdon, Datura, Dianthus, Digitalis, Dioscorea, Elaeis, Ephedra, Erianthus, Erythroxylum, Eucalyptus, Festuca, Fragaria, Galanthus, Glycine, Gossypium, Helianthus, Hevea, Hordeum, Hyoscyamus, Jatropha, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Lycopodium, Manihot, Medicago, Mentha, Miscanthus, Musa, Nicotiana, Oryza, Panicum, Papaver, Parthenium, Pennisetum, Petunia, Phalaris, Phleum, Pinus, Poa, Poinsettia, Populus, Rauwolfia, Ricinus, Rosa, Saccharum, Salix, Sanguinaria, Scopolia, Secale, Solanum, Sorghum, Spartina, Spinacea, Tanacetum, Taxus, Theobroma, Triticosecale, Triticum, Uniola, Veratrum, Vinca, Vitis и Zea.
Подходящие виды могут включать Panicum spp., Sorghum spp., Miscanthus spp., Saccharum spp., Erianthus spp., Populus spp., Andropogon gerardii (бородач), Pennisetum purpureum (слоновая трава), Phalaris arundinacea (двукисточник тростниковидный), Cynodon dactylon (свинорой пальчатый), Festuca arundinacea (овсяница тростниковая), Spartina pectinata (травянистое растение рода Spartina), Medicago sativa (люцерна), Arundo donax (арундо тростниковый), Secale cereale (рожь), Salix spp.(ива), Eucalyptus spp.(эвкалипт), Triticosecale (тритикале), бамбук, Helianthus annuus (подсолнечник), Carthamus tinctorius (сафлор), Jatropha curcas (ятрофа), Ricinus communis (клещевина), Elaeis guineensis (масличная пальма), Linum usitatissimum (лен), Brassica juncea, Beta vulgaris (сахарная свекла), Manihot esculenta (маниок), Lycopersicon esculentum (томат), Lactuca sativa (латук), Musyclise alca (банан), Solanum tuberosum (картофель), Brassica oleracea (брокколи, цветная капуста, брюссельская капуста), Camellia sinensis (чай), Fragaria ananassa (земляника), Theobroma cacao (какао), Coffe81ycliseca (кофе), Vitis vinifera (виноград), Ananas comosus (ананас), Capsicum annum (горький и сладкий перец), Allium сера (лук), Cucumis melo (дыня), Cucumis sativus (огурец), Cucurbita maxima (тыква гигантская), Cucurbita moschata (тыква мускатная), Spinacea oleracea (шпинат), Citrullus lanatus (арбуз), Abelmoschus esculentus (бамия), Solanum melongena (баклажан), Rosa spp.(роза), Dianthus caryophyllus (гвоздика), Petunia spp.(петуния), Poinsettia pulcherrima (пуансеттия), Lupinus albus (люпин), Uniola paniculata (овес), полевица (Agrostis spp.), Populus tremuloides (тополь осинообразный), Pinus spp.(сосна), Abies spp: (пихта), Acer spp.(клен), Hordeum vulgare (ячмень), Poa pratensis (мятлик), Lolium spp.(плевел) и Phleum pratense (тимофеевка), Panicum virgatum (просо), Sorghu82yclise82or (сорго, суданская трава), Miscanthus giganteus (мискантус), Saccharum sp.(сахарный тростник), Populus balsamifera (тополь), Zea mays (кукуруза), Glycine max (соя), Brassica napus (канола), Triticum aestivum (пшеница), Gossypium hirsutum (хлопок), Oryza sativa (рис), Helianthus annuus (подсолнечник), Medicago sativa (люцерна), Beta vulgaris (сахарная свекла) или Pennisetum glaucum (просо жемчужное).
Различные варианты осуществления направлены на мутантные растения табака, не встречающиеся в природе растения табака или трансгенные растения табака, модифицированные для модулирования уровней экспрессии гена, в результате чего получают растение, например, растение табака, в котором уровень экспрессии полипептида модулируют в тканях растения, представляющего интерес, по сравнению с контрольным растением. Раскрытые композиции и способы можно применить к любому виду рода Nicotiana, в том числе N.rustica и N.tabacum (например, LA В21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 и Petico). Другие виды включают N.acaulis, N46yclise4646ta, N82yclise4646ta var. multiflora, N46yclise46na, N.alata, N.amplexicaulis, N.arentsii, N46yclise4646ta, N.benavidesii, N.benthamiana, N.bigelovii, N.bonariensis, N.cavicola, N.clevelandii, N.cordifolia, N.corymbosa, N.debneyi, N.excelsior, N.forgetiana, N.fragrans, N.glauca, N.glutinosa, N.goodspeedii, N.gossei, N.hybrid, N.ingulba, N.kawakamii, N.knightiana, N.langsdorffii, N.linearis, N.longiflora, N46yclise46ma, N.megalosiphon, N.miersii, N.noctiflora, N.nudicaulis, N.obtusifolia, N.occidentalis, N.occidentalis subsp. hesperis, N.otophora, N.paniculata, N.pauciflora, N.petunioides, N.plumbaginifolia, N.quadrivalvis, N.raimondii, N.repanda, N.rosulata, N.rosulata subsp.ingulba, N.rotundifolia, N.setchellii, N.simulans, N.solanifolia, N.spegazzinii, N.stocktonii, N.suaveolens, N.sylvestris, N.thyrsiflora, N.tomentosa, N.tomentosiformis, N.trigonophylla, N.umbratica, N46yclise46ta, N.velutina, N.wigandioides и N. x sanderae.
Использование сортов табака и элитных сортов табака также предполагается в данном документе. Трансгенное, не встречающееся в природе или мутантное растение, следовательно, может быть разновидностью табака или элитным сортом табака, который содержит один или несколько трансгенов или одну или несколько генетических мутаций или их комбинацию. Генетическая мутация (мутации) (например, один или несколько полиморфизмов) может быть мутацией, которая не существует в природе в отдельной разновидности табака или сорте табака (например, элитном сорте табака), или может быть генетической мутацией (мутациями), которая существует в природе при условии, что мутация не существует в природе в отдельной разновидности табака или сорте табака (например, в элитном сорте табака).
Особенно пригодные разновидности Nicotiana tabacum включают тип табака Burley, темный тип, тип дымовой сушки и тип Oriental. Неограничивающими примерами разновидностей и сортов являются: BD 64, СС 101, СС 200, СС 27, СС 301, СС 400, СС 500, СС 600, СС 700, СС 800, СС 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 263, DF911, DT 538 LC Galpao tobacco, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, Hybrid 403LC, Hybrid 404LC, Hybrid 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KTY14xL8 LC, Little Crittenden, McNair 373, McNair 944, msKY 14xL8, Narrow Leaf Madole, Narrow Leaf Madole LC, NBH 98, N-126, N-777LC, N-7371LC, NC 100, NC 102, NC 2000, NC 291, NC 297, NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, Neal Smith Madole, OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC' «Periq'e» tobacco, PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234, Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, В 13P, Xanthi Mitchell-Мог), Bel-W3, 79-615, Samsun Holmes NN, Hybrid 49 номер 2 KTRDC, Burley 21, KY 8959, KY 9, MD 609, PG 01, PG 04, PO1, PO2, РО3, RG 11, RG 8, VA 509, AS44, Banket A1, Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Comum, HB04P, Hicks Broadleaf, Kabakulak Elassona, Kutsage E1, LA BU 21, NC 2326, NC 297, PVH 2110, Red Russian, Samsun, Saplak, Simmaba, Talgar 28, Wislica, Yayaldag, Prilep HC-72, Prilep P23, Prilep PB 156/1, Prilep P12-2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana. Разновидности вышеуказанного с низким преобразованием, даже если специально не идентифицированы в данном документе, также рассматриваются.
Варианты осуществления также направлены на композиции и способы получения мутантных растений, не встречающихся в природе растений, гибридных растений и трансгенных растений, которые были модифицированы для модулирования экспрессии или активности полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, как описано в данном документе). Преимущественно, мутантные растения, не встречающиеся в природе растения, гибридные растения или трансгенные растения, которые получают, могут быть подобными или по существу такими же по общему внешнему виду по сравнению с контрольными растениями. Различные фенотипические характеристики, такие как степень зрелости, количество листьев на растении, высоту стебля, угол врастания листьев, размер листа (ширина и длина), расстояние междоузлия и отношение листовая пластина-главная жилка можно оценить путем полевых наблюдений.
Один аспект относится к семенам мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Предпочтительно, семена представляют собой семена табака. Следующий аспект относится к пыльце или семяпочке мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Кроме того, предусмотрено мутантное растение, не встречающееся в природе растение, гибридное растение или трансгенное растение, как описано в данном документе, которое дополнительно содержит нуклеиновую кислоту, предоставляющую мужскую стерильность.
Также предусмотрена тканевая культура возобновляемых клеток мутантного растения, не встречающегося в природе растения, гибридного растения, или трансгенного растения или его части, как описано в данном документе, при этом культура регенерирует растения, способные экспрессировать все морфологические и физиологические родительские характеристики. Регенерируемые клетки включают, помимо прочего, клетки из листьев, пыльцы, зародышей, семядолей, гипокотилей, корней, кончиков корней, пыльников, цветов и их части, семяпочек, побегов, цветоножек, стеблей, сердцевины и семенных коробочек или каллюса или протопластов, полученных из них.
Одним объектом является получение мутантного, трансгенного или не встречающегося в природе растения или его части, которая проявляет модулированные (например, сниженные) уровни TSNA в растительном материале, например, в высушенных листьях. Соответственно, мутантные, трансгенные или не встречающиеся в природе растения или их части, которые проявляют модулированные (например, сниженные) уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же. В определенных вариантах осуществления уровень по меньшей мере NNN, NAB и NAT будет по существу тем же. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же, а уровень NAB будет снижен по сравнению с контрольным растением. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же, а уровень NAT будет снижен по сравнению с контрольным растением. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же, а уровень NAT и NAB будет снижен по сравнению с контрольным растением. Содержание никотина в мутантных, трансгенных или не встречающихся в природе растениях или их частях может быть по существу тем же по сравнению с контрольным или дикого типа растением или может быть ниже, чем в контрольном растении или растении дикого типа. Соответственно, мутантные, трансгенные или не встречающиеся в природе растения или их части имеют по существу тот же внешний вид, что и контрольное растение.
Четыре основных TSNA, те, присутствие которых, как правило, обнаруживается в самых высоких концентрациях, представляют собой N-нитрозоникотин (NNN), 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK), N-нитрозоанабазин (NAB) и N-нитрозоанатабин (NAT). Второстепенные соединения, те, которые, как правило, обнаруживаются на значительно более низких уровнях, чем основные TSNA, включают 4-(метилнитрозамино)-4-(3-пиридил)бутаналь (NNA), 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанол (NNAL), 4-(метилнитрозамино)4-(3-пиридил)-1-бутанол (изо-NNAL) и 4-(метилнитрозамино)-4-(3-пиридил)-1-масляная кислота (изо-NNAC). Сообщалось, что по меньшей мере NNN и NNK являются канцерогенными при применении в отношении животных в лабораторных исследованиях.
Соответственно, в данном документе описаны мутантные, трансгенные или не встречающиеся в природе растения или их части или растительные клетки, которые обладают модулированными (например, сниженными) уровнями по меньшей мере NNK и/или нитратов по сравнению с контрольными клетками или контрольными растениями. В определенных вариантах осуществления уровень NNN будет по существу тем же. Мутантные, трансгенные или не встречающиеся в природе растения или растительные клетки были модифицированы для модулирования (например, снижения) синтеза или активности одного или нескольких полипептидов, описанных в данном документе, путем модулирования экспрессии одной или нескольких соответствующих полинуклеотидных последовательностей, описанных в данном документе. Соответственно, модулированные уровни по меньшей мере NNK и/или нитратов наблюдаются по меньшей мере в зеленых листьях, соответственно, в высушенных листьях. В определенных вариантах осуществления уровень общих TSNA в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, может быть модулирован (например, снижен). В определенных вариантах осуществления уровень никотина в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, может быть модулирован (например, снижен).
Дополнительный аспект относится к мутантному, не встречающемуся в природе или трансгенному растению или клетке, где экспрессия или активность одного или нескольких полипептидов, описанных в данном документе, модулирована (например, снижена) и часть растения (например, зеленые листья, соответственно, высушенные листья или высушенный табак) имеет сниженные уровни нитратов и/или по меньшей мере NNK по меньшей мере на 5% по сравнению с контрольным растением, в котором экспрессия или активность указанного полипептида(-ов) не была модулирована. В определенных вариантах осуществления уровень NNN будет по существу тем же. В определенных вариантах осуществления уровень общих TSNA в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень никотина в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень общих TSNA в растении, например, в зеленых листьях, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%, и уровень никотина в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%.
Еще один следующий аспект относится к высушенному растительному материалу, такому как высушенный лист или высушенный табак, полученному или получаемому из мутантного, не встречающегося в природе или трансгенного растения или клетки, где экспрессия одного или нескольких полинуклеотидов, описанных в данном документе, или активность белка, кодируемого ими, снижена и где уровень нитратов и/или NNK снижен по меньшей мере на 5% по сравнению с контрольным растением. В определенных вариантах осуществления уровень NNN будет по существу тем же.
Еще один следующий аспект относится к мутантному, не встречающемуся в природе или трансгенному высушенному растительному материалу, такому как лист или высушенный табак, который имеет уровни нитратов и/или NNK, сниженные по меньшей мере на 5% по сравнению с контрольным растением. В определенных вариантах осуществления уровень NNN будет по существу тем же. В определенных вариантах осуществления уровень общих TSNA в высушенном растительном материале также может быть снижен, например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень никотина в высушенном растительном материале также может быть снижен, например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень общих TSNA в высушенном растительном материале также может быть снижен, например, по меньшей мере на приблизительно 5% и уровень никотина в высушенном растительном материале также может быть снижен по меньшей мере на приблизительно 5%.
В еще одном дополнительном аспекте предусмотрено мутантное, не встречающееся в природе или трансгенное растение или растительная клетка, где экспрессия одного или нескольких полипептидов, описанных в данном документе, снижена по сравнению с контрольным растением или растением дикого типа и где (i) содержание нитратов составляет приблизительно 7 мг/г или менее, например, приблизительно 6,9 мг/г или менее, приблизительно 6,8 мг/г или менее, приблизительно 6,7 мг/г или менее, приблизительно 6,6 мг/г или менее, приблизительно 6,5 мг/г или менее, приблизительно 6,4 мг/г или менее, приблизительно 6,3 мг/г или менее, приблизительно 6,2 мг/г или менее, приблизительно 6,1 мг/г или менее или приблизительно 6 мг/г или менее; и (ii) содержание NNK составляет приблизительно 110 нг/г или менее, например, приблизительно 109 нг/г или менее, приблизительно 108 нг/г или менее, приблизительно 107 нг/г или менее, приблизительно 106 нг/г или менее, приблизительно 105 нг/г или менее, приблизительно 104 нг/г или менее, приблизительно 103 нг/г или менее, приблизительно 102 нг/г или менее, приблизительно 101 нг/г или менее или приблизительно 100 нг/г или менее. В определенных вариантах осуществления уровень никотина составляет приблизительно 30 мг/г или менее, например, приблизительно 29,9 мг/г или менее, приблизительно 29,8 мг/г или менее, приблизительно 29,7 мг/г или менее, приблизительно 29,6 мг/г или менее, приблизительно 29,5 мг/г или менее, приблизительно 29,4 мг/г или менее, приблизительно 29,3 мг/г или менее, приблизительно 29,2 мг/г или менее, приблизительно 29,1 мг/г или менее или приблизительно 29 мг/г или менее. В определенных вариантах осуществления общее содержание TSNA составляет приблизительно 250 нг/г или менее, например, приблизительно 240 нг/г или менее, приблизительно 230 нг/г или менее, приблизительно 220 нг/г или менее, приблизительно 210 нг/г или менее, приблизительно 200 нг/г или менее, приблизительно 190 нг/г или менее, приблизительно 180 нг/г или менее, приблизительно 170 нг/г или менее, приблизительно 160 нг/г или менее или приблизительно 150 нг/г или менее.
В еще одном дополнительном аспекте предусмотрен мутантный, не встречающийся в природе или трансгенный лист, где экспрессия одного или нескольких полипептидов, описанных в данном документе, снижена по сравнению с контрольным листом или листом дикого типа и где (i) содержание нитратов составляет приблизительно 7 мг/г или менее, например, приблизительно 6,9 мг/г или менее, приблизительно 6,8 мг/г или менее, приблизительно 6,7 мг/г или менее, приблизительно 6,6 мг/г или менее, приблизительно 6,5 мг/г или менее, приблизительно 6,4 мг/г или менее, приблизительно 6,3 мг/г или менее, приблизительно 6,2 мг/г или менее, приблизительно 6,1 мг/г или менее или приблизительно 6 мг/г или менее; и (ii) содержание NNK составляет приблизительно ПО нг/г или менее, например, приблизительно 109 нг/г или менее, приблизительно 108 нг/г или менее, приблизительно 107 нг/г или менее, приблизительно 106 нг/г или менее, приблизительно 105 нг/г или менее, приблизительно 104 нг/г или менее, приблизительно 103 нг/г или менее, приблизительно 102 нг/г или менее, приблизительно 101 нг/г или менее или приблизительно 100 нг/г или менее. В определенных вариантах осуществления уровень никотина составляет приблизительно 30 мг/г или менее, например, приблизительно 29,9 мг/г или менее, приблизительно 29,8 мг/г или менее, приблизительно 29,7 мг/г или менее, приблизительно 29,6 мг/г или менее, приблизительно 29,5 мг/г или менее, приблизительно 29,4 мг/г или менее, приблизительно 29,3 мг/г или менее, приблизительно 29,2 мг/г или менее, приблизительно 29,1 мг/г или менее или приблизительно 29 мг/г или менее. В определенных вариантах осуществления общее содержание TSNA составляет приблизительно 250 нг/г или менее, например, приблизительно 240 нг/г или менее, приблизительно 230 нг/г или менее, приблизительно 220 нг/г или менее, приблизительно 210 нг/г или менее, приблизительно 200 нг/г или менее, приблизительно 190 нг/г или менее, приблизительно 180 нг/г или менее, приблизительно 170 нг/г или менее, приблизительно 160 нг/г или менее или приблизительно 150 нг/г или менее.
В еще одном следующем аспекте предусмотрен мутантный, не встречающийся в природе или трансгенный высушенный растительный материал, например, высушенный лист или высушенный табак, где экспрессия одного или нескольких полипептидов, описанных в данном документе, снижена по сравнению с контрольным растительным материалом или высушенным растительным материалом дикого типа и где: (i) содержание нитратов составляет приблизительно 7 мг/г или менее, например, приблизительно 6,9 мг/г или менее, приблизительно 6,8 мг/г или менее, приблизительно 6,7 мг/г или менее, приблизительно 6,6 мг/г или менее, приблизительно 6,5 мг/г или менее, приблизительно 6,4 мг/г или менее, приблизительно 6,3 мг/г или менее, приблизительно 6,2 мг/г или менее, приблизительно 6,1 мг/г или менее или приблизительно 6 мг/г или менее; и (ii) содержание NNK составляет приблизительно 110 нг/г или менее, например, приблизительно 109 нг/г или менее, приблизительно 108 нг/г или менее, приблизительно 107 нг/г или менее, приблизительно 106 нг/г или менее, приблизительно 105 нг/г или менее, приблизительно 104 нг/г или менее, приблизительно 103 нг/г или менее, приблизительно 102 нг/г или менее, приблизительно 101 нг/г или менее или приблизительно 100 нг/г или менее. В определенных вариантах осуществления уровень никотина составляет приблизительно 30 мг/г или менее, например, приблизительно 29,9 мг/г или менее, приблизительно 29,8 мг/г или менее, приблизительно 29,7 мг/г или менее, приблизительно 29,6 мг/г или менее, приблизительно 29,5 мг/г или менее, приблизительно 29,4 мг/г или менее, приблизительно 29,3 мг/г или менее, приблизительно 29,2 мг/г или менее, приблизительно 29,1 мг/г или менее или приблизительно 29 мг/г или менее. В определенных вариантах осуществления общее содержание TSNA составляет приблизительно 250 нг/г или менее, например, приблизительно 240 нг/г или менее, приблизительно 230 нг/г или менее, приблизительно 220 нг/г или менее, приблизительно 210 нг/г или менее, приблизительно 200 нг/г или менее, приблизительно 190 нг/г или менее, приблизительно 180 нг/г или менее, приблизительно 170 нг/г или менее, приблизительно 160 нг/г или менее или приблизительно 150 нг/г или менее.
Соответственно, внешний вид указанного растения или его части (например, листа) является по существу таким же, как у контрольного растения. Соответственно, растение представляет собой растение табака.
Варианты осуществления также направлены на композиции и способы для получения мутантных, не встречающихся в природе или трансгенных растений, которые были модифицированы для модулирования экспрессии или активности одного или нескольких полинуклеотидов или полипептидов, описанных в данном документе, которые могут в результате дать растения или составные части растения (например, листья, такие как зеленые листья или высушенные листья, или табак) с модулированными уровнями нитратов и/или NNK и/или NNN и/или TSNA и/или никотина по сравнению с контрольным растением.
Преимущественно, мутантные, не встречающиеся в природе или трансгенные растения, которые получены по способам, описанным в данном документе, являются подобными или по существу такими же по внешнему виду, как контрольные растения. В одном варианте осуществления вес листьев мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. В одном варианте осуществления количество листьев мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. В одном варианте осуществления вес листьев и количество листьев мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. В одном варианте осуществления высота стебля мутантных, не встречающихся в природе или трансгенных растений является по существу такой же, как у контрольных' растений через, например, один, два или три или более месяцев после пересадки в поле или через 10, 20, 30 или 36 или более дней после вершкования. Например, высота стебля мутантных, не встречающихся в природе или трансгенных растений составляет не меньше, чем высота стебля контрольных растений. В другом варианте осуществления содержание хлорофилла в мутантных, не встречающихся в природе или трансгенных растениях является по существу таким же, как у контрольных растений. В другом варианте осуществления высота стебля мутантных, не встречающихся в природе или трансгенных растений является по существу такой же, как у контрольных растений, и содержание хлорофилла в мутантных, не встречающихся в природе или трансгенных растениях является по существу таким же, как у контрольных растений. В других вариантах осуществления размер или форма или количество или окраска листьев мутантных, не встречающихся в природе или трансгенных растений является по существу такой же, как у контрольных растений. Соответственно, растение представляет собой растение табака.
В другом аспекте предусмотрен способ модулирования (например, снижения) количества нитратов и/или по меньшей мере NNK по меньшей мере в части растения (например, в листьях, таких как высушенные листья, или в табаке), включающий этапы: (i) модулирования (например, снижения) экспрессии или активности одного или нескольких полипептидов, описанных в данном документе (или любой их комбинации, как описано в данном документе), соответственно, где полипептид(ы) кодируется соответствующей полинуклеотидной последовательностью, описанной в данном документе; (ii) измерения содержания нитратов и/или по меньшей мере NNK по меньшей мере в части (например, в листьях, таких как высушенные листья, или в табаке) мутантного, не встречающегося в природе или трансгенного растения, полученного на этапе (i); и (iii) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором содержание нитратов и/или по меньшей мере NNK было модулировано (например, снижено) по сравнению с контрольным растением. Соответственно, внешний вид указанного мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. Соответственно, растение представляет собой растение табака.
В другом аспекте предусмотрен способ модулирования (например, снижения) количества нитратов и/или по меньшей мере NNK по меньшей мере в части высушенного растительного материала, такого как высушенный лист, включающий этапы: (i) модулирования (например, снижения) экспрессии или активности одного или нескольких полипептидов (или любой их комбинации, как описано в данном документе), соответственно, где полипептид(ы) кодируется соответствующей полинуклеотидной последовательностью, описанной в данном документе; (ii) сбора растительного материала, такого как один или несколько листьев, и сушка в течение периода времени; (iii) измерения содержания нитратов и/или по меньшей мере NNK в по меньшей мере части растительного материала, полученного на этапе (ii); и (iv) идентификации высушенного растительного материала, в котором содержание нитратов и/или по меньшей мере NNK было модулировано (например, снижено) по сравнению с контрольным растением.
Увеличение экспрессии по сравнению с контрольным растением может составить от приблизительно 5% до приблизительно 100%, или увеличение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, такое как 200% или 300% или более, которое включает в себя увеличение транскрипционной активности или экспрессии белка или обеих.
Увеличение активности по сравнению с растением контрольного типа может составить от приблизительно 5% до приблизительно 100%, или увеличение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, такое как 200% или 300% или более.
Снижение экспрессии по сравнению с контрольным растением может составить от приблизительно 5% до приблизительно 100%, или снижение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%, которое включает в себя снижение транскрипционной активности или экспрессии белка или обеих.
Снижение активности по сравнению с растением контрольного типа может составить от приблизительно 5% до приблизительно 100%, или снижение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%.
Полинуклеотиды и рекомбинантные конструкции, описанные в данном документе, можно использовать для модулирования экспрессии ферментов, описанных в данном документе, в видах растений, представляющих интерес, соответственно, в табаке.
Ряд способов на основе полинуклеотидов можно использовать для увеличения экспрессии генов в растениях. В качестве примера, можно получить конструкцию, вектор или вектор экспрессии, совместимый с растением, которое должно быть трансформировано, который содержит представляющий интерес ген вместе с расположенным выше по цепи промотором, способным к избыточной экспрессии гена в растении. Примеры промоторов описаны в данном документе. После трансформации и при росте в соответствующих условиях промотор может управлять экспрессией для того, чтобы модулировать (например, снижать) уровни данного фермента в растении или в конкретной его ткани. В одном иллюстративном варианте осуществления создают вектор, несущий один или несколько полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе) для избыточной экспрессии гена в растении. Вектор несет соответствующий промотор, такой как промотор 35S вируса мозаики цветной капусты CaMV, выше по цепи трансгена, управляющего его конститутивной экспрессией во всех тканях растения. Вектор также несет ген устойчивости к антибиотику для того, чтобы предоставить отбор трансформированных каллюсов и клеточных линий.
Различные варианты осуществления, таким образом, направлены на способы модулирования (например, снижения) уровня экспрессии одного или нескольких полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе), путем включения множества копий полинуклеотида в геном растения, включающие: трансформацию растительной клетки-хозяина вектором экспрессии, который содержит промотор, функционально связанный с одним или несколькими полинуклеотидами, описанными в данном документе. Полипептид, кодируемый рекомбинантным полинуклеотидом, может быть нативным полипептидом, или может быть гетерологичным по отношению к клетке.
Растение табака, несущее мутантный аллель одного или нескольких полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе) можно использовать в программе селекции растений для создания пригодных линий, разновидностей и гибридов. В частности, мутантный аллель интрогрессируют в коммерчески важные разновидности, описанные выше. Таким образом, предусмотрены способы селекции растений, которые включают скрещивание мутантного растения, не встречающегося в природе растения или трансгенного растения, как описано в данном документе, с растением, содержащим другие генетические особенности. Способ может дополнительно включать скрещивание потомства растения с другим растением и, необязательно, повторное скрещивание до тех пор, пока не будет получено потомство с желаемыми генетическими признаками или генетическим фоном. Одной из целей, которой служат такие способы селекции, является введение желаемого генетического признака в другие разновидности, селекционные линии, гибриды или сорта, особенно те, которые имеют коммерческий интерес. Другой целью является облегчение укладки генетических модификаций различных генов в каждых отдельных разновидности, линии, гибриде или сорте растения. Предполагаются внутривидовые, а также межвидовые скрещивания. Растения потомства, которое возникает из таких скрещиваний, также названные линиями селекции, являются примерами не встречающихся в природе растений по настоящему изобретению.
В одном варианте осуществления предусмотрен способ получения не встречающегося в природе растения табака, включающий: (а) скрещивание мутантного или трансгенного растения табака со вторым растением табака с получением семян потомства табака; (b) выращивание семян потомства табака в условиях роста растений с получением не встречающегося в природе растения табака. Способ может дополнительно включать: (с) скрещивание предыдущего поколения не встречающегося в природе растения табака с самим собою или с другим растением табака с получением семян потомства табака; (d) выращивание семян потомства табака с этапа (с) в условиях роста растений с получением дополнительных не встречающихся в природе растений табака; и (е) повторение этапов скрещивания и выращивания (с) и (d) множество раз с созданием дополнительных поколений не встречающихся в природе растений табака. Способ может необязательно включать перед этапом (а) этап получения родительского растения, которое содержит охарактеризованные генетические особенности и которое не идентично мутантному или трансгенному растению, В некоторых вариантах осуществления в зависимости от программы селекции этапы скрещивания и выращивания повторяют от 0 до 2 раз, от 0 до 3 раз, от 0 до 4 раз, 0 до 5 раз, от 0 до 6 раз, от 0 до 7 раз, от 0 до 8 раз, от 0 до 9 раз или от 0 до 10 раз для того, чтобы создать поколения не встречающихся в природе растений табака. Обратное скрещивание является примером такого способа, в котором потомство скрещивают с одним из его родителей или с другим растением, генетически подобным его родителю, для получения потомства растения в следующем поколении, которое имеет генетические особенности, более близкие к одному из родителей. Методики селекции растений, в частности селекции растений табака, хорошо известны и могут быть использованы в способах по настоящему изобретению. В настоящем изобретении дополнительно предусмотрены не встречающиеся в природе растения табака, полученные с помощью этих способов. Определенные варианты осуществления исключают этап выбора растения.
В некоторых вариантах осуществления способов, описанных в данном документе, линии, полученные в результате селекции и скрининга вариантных генов, оценивают в поле с использованием стандартных полевых процедур. Контрольные генотипы, в том числе исходных не подвергнутых мутагенезу родителей, включены и места посадки растений расположены в поле согласно схеме рандомизированных полных блоков или согласно другому соответствующему планированию поля. Для табака используют стандартные агрономические методы, например, табак собирают, взвешивают и отбирают образцы для химического и другого общепринятого тестирования до и во время сушки. Статистический анализ данных выполняют для подтверждения подобия выбранных линий с родительской линией. Цитогенетические анализы выбранных растений необязательно выполняют для подтверждения взаимосвязей набора хромосом и конъюгации хромосом.
ДНК-фингерпринтинг, однонуклеотидный полиморфизм, микросателлитные маркеры или подобные технологии можно использовать в программе селекции с выбором с помощью маркера (MAS) для переноса или разведения мутантных аллелей гена в других растениях табака, как описано в данном документе. Например, селекционер может создать разделяющиеся популяции при гибридизации генотипа, содержащего мутантный аллель, с агрономически желаемым генотипом. Растения из F2 или обратно скрещенных поколений можно подвергнуть скринингу с использованием маркера, полученного из геномной последовательности или ее фрагмента, с использованием одной из методик, перечисленных в данном документе. Растения, идентифицированные как обладающие мутантным аллелем, можно подвергнуть обратному скрещиванию или самоопылению для создания второй популяции, подлежащей скринингу. В зависимости от предполагаемого способа наследования или используемой технологии MAS может быть необходимо самоопылять выбранные растения перед каждым циклом обратного скрещивания для облегчения обнаружения необходимых отдельных растений. Обратное скрещивание или другую процедуру селекции можно повторять до тех пор, пока необходимый фенотип рекуррентного родителя не восстановится.
Согласно настоящему раскрытию в программе селекции успешные скрещивания дают растения F1, которые являются фертильными. Выбранные растения F1 можно скрестить с одним из родителей, и растения первого поколения обратного скрещивания самоопылить с получением популяции, которую снова подвергают скринингу на экспрессию вариантного гена (например, нулевой версии гена). Процесс обратного скрещивания, самоопыления и скрининга повторяют, например, по меньшей мере 4 раза до тех пор, пока при окончательном скрининге не получат растение, которое является фертильным и достаточно подобным рекуррентному родителю. Это растение, при желании, самоопыляют и потомство затем подвергают скринингу снова, чтобы подтвердить, что растение демонстрирует экспрессию вариантного гена. В некоторых вариантах осуществления популяцию растений в поколении F2 подвергают скринингу на наличие экспрессии вариантного гена, например, растение, которое не экспрессирует полипептид из-за отсутствия гена, идентифицируют согласно стандартным способам, например, с помощью метода ПЦР с использованием праймеров, основанных на информации о последовательности нуклеотидов для полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, описанной в данном документе).
Гибридные разновидности табака можно получить путем предотвращения самоопыления женских родительских растений (то есть, семена родителей) первой разновидности, позволяя пыльце с мужских родительских растений второй разновидности оплодотворить женские родительские растения, и позволяя образовать гибридные F1 семена на женских растениях. Самоопыление женских растений можно предотвратить путем кастрации цветков на ранней стадии развития цветка. В качестве альтернативы, образование пыльцы на женских родительских растениях можно предотвратить, используя какую-либо форму мужской стерильности. Например, мужскую стерильность можно получить с помощью цитоплазматической мужской стерильности (CMS) или трансгенной мужской стерильности, где трансген ингибирует микроспорогенез и/или образование пыльцы, или вызывает самонесовместимость. Женские родительские растения, содержащие CMS, особенно пригодны. В вариантах осуществления, в которых женские родительские растения имеют CMS, пыльцу собирают с мужских фертильных растений и наносят вручную на рыльца женских родительских растений с CMS и собирают полученные семена F1.
Разновидности и линии, описанные в данном документе, можно использовать для образования простых гибридов F1 табака. В таких вариантах осуществления растения родительских разновидностей можно выращивать по существу в гомогенно соединенных популяциях для облегчения естественного перекрестного опыления с мужских родительских растений на женские родительские растения. Семена F1, образованные на женских родительских растениях, избирательно собирают с помощью обычных средств. Можно также вырастить две разновидности родительского растения в массе и собрать смесь гибридных F1 семян, образованных на женской особи, и семян, образованных на мужской особи в результате самоопыления. В качестве альтернативы, можно осуществить трехлинейное скрещивание, где простой гибрид F1 используют в качестве женской особи и скрещивают с другой мужской особью. В качестве другой альтернативы, можно создать гибриды двойного скрещивания, где потомство F1 двух разных простых гибридов скрещивают само с собой.
Популяцию мутантных, не встречающихся в природе или трансгенных растений можно подвергнуть скринингу или отбору тех членов популяции, которые имеют желаемый признак или фенотип. Например, популяцию потомства линии с одной трансформацией можно подвергнуть скринингу на те растения, которые имеют желаемый уровень экспрессии или активности полипептида(-ов), кодируемого с ее помощью. Физические и биохимические способы можно использовать для выявления уровней экспрессии или активности. Они включают Саузерн-анализ или ПЦР-амплификацию для обнаружения полинуклеотида; Нозерн-блоттинг, защиту от РНКазы S1, удлинение праймера, или ПЦР-амплификацию в реальном времени для обнаружения РНК-транскриптов; ферментативные анализы для обнаружения ферментативной или рибозимной активности полипептидов и полинуклеотидов; и гель-электрофорез белков, Вестерн-блоттинг, иммунопреципитацию и иммуноферментные анализы для обнаружения полипептидов. Другие методики, такие как гибридизация in situ-, ферментативное окрашивание и иммуноокрашивание и ферментативный анализ также можно использовать для обнаружения присутствия или экспрессии или активности полипептидов или полинуклеотидов.
В данном документе описаны мутантные, не встречающиеся в природе или трансгенные растительные клетки и растения, содержащие один или несколько рекомбинантных полинуклеотидов, одну или несколько полинуклеотидных конструкций, одну или несколько двухцепочечных РНК, один или несколько конъюгатов или один или несколько векторов/векторов экспрессии.
Без ограничения, растения, описанные в данном документе, можно модифицировать для других целей либо до, либо после того, как экспрессия или активность была модулирована в соответствии с настоящим изобретением. Одна или несколько следующих генетических модификаций могут присутствовать в мутантных, не встречающихся в природе или трансгенных растениях. В одном варианте осуществления один или несколько генов, которые участвуют в превращении промежуточных азотистых продуктов метаболизма, модифицируют с получением в результате растений или частей растений (таких как листья или табак), которые в высушенном состоянии производят более низкие уровни по меньшей мере одного табак-специфичного нитрозамина, чем контрольные растения или их части. Неограничивающие примеры генов, которые можно модифицировать, включают гены, кодирующие никотиндеметилазу, такие как CYP82E4, CYP82E5 и CYP82E10, которые участвуют в превращении никотина в норникотин и описаны в WO 2006091194, WO 2008070274, WO 2009064771 и PCT/US2011/021088. В другом варианте осуществления один или несколько генов, которые участвуют в поглощений тяжелых металлов или транспорте тяжелых металлов, модифицируют с получением в результате растений или частей растений (таких как листья), имеющих более низкое содержание тяжелых металлов, чем у контрольных растений или их частей без модификации (модификаций). Неограничивающие примеры включают гены из семейства белков, ассоциированных с множественной лекарственной устойчивостью, семейства посредников катионной диффузии (CDF), семейства Zrt-, Irt-подобных белков (ZIP), семейства катионообменников (САХ), семейства транспортеров меди (СОРТ), семейства АТФаз тяжелых металлов Р-типа (например, НМА, как описано в WO 2009074325), семейства гомологов белков, ассоциированных с естественной устойчивостью макрофагов (NRAMP) и семейства транспортеров АТФ-связывающей кассеты (ABC) (например, MRP, описанных в WO 2012/028309, которые участвуют в транспорте тяжелых металлов, таких как кадмий. Термин тяжелый металл, использованный в данном документе, включает в себя переходные металлы. Примеры других модификаций включают устойчивость к гербицидам, например, глифосат является активным ингредиентом многих гербицидов широкого спектра действия. Устойчивые к глифосату трансгенные растения были разработаны путем переноса гена aroA (глифосат EPSP синтетаза из Salmonella typhimurium и E.coli). Устойчивые к сульфонилмочевине растения были получены путем трансформации мутантного гена ALS (ацетолактатсинтетаза) из Arabidopsis. Белок ОВ фотосистемы II из мутантного Amaranthus hybridus был перенесен в растения с получением атразин-устойчивых трансгенных растений; и бромоксинил-устойчивые трансгенные растения получены путем встраивания гена bxn из бактерии Klebsiella pneumoniae. Другие примеры модификаций приводят к получению растений, которые устойчивы к насекомым. Токсин Bacillus thuringiensis (Bt) может обеспечить эффективный путь задержки появления Bt-устойчивых вредителей, как недавно показано на брокколи, где пирамидальные cry1Ac и cry1C гены Bt контролировали капустную моль, устойчивую к любому одному белку, и существенно задерживали развитие устойчивых насекомых. Другая иллюстративная модификация приводит к получению растений, которые устойчивы к заболеваниям, вызванным патогенами (например, вирусами, бактериями, грибами). Были сконструированы растения, экспрессирующие ген Ха21 (устойчивость к бактериальному некрозу) с растениями, экспрессирующими одновременно ген слияния Bt и ген хитиназы (устойчивость к желтому стеблевому пилильщику и устойчивость к шипоуске злаковой). Другая иллюстративная модификация приводит к измененной репродуктивной способности, такой как мужская стерильность. Другая иллюстративная модификация приводит к получению растений, которые устойчивы к абиотическому стрессу (например, засуха, температура, соленость), и устойчивые трансгенные растения были получены путем переноса ацилглицеролфосфатного фермента из Arabidopsis; гены, кодирующие маннитолдегидрогеназу и сорбитолдегидрогеназу, которые участвуют в синтезе маннитола и сорбитола, улучшают устойчивость к засухе. Другая иллюстративная модификация приводит к получению растений, производящих белки, которые могут иметь благоприятные иммуногенные свойства при использовании у человека. Например, растения, способные продуцировать белки, которые, по существу, не имеют альфа-1,3-связанных остатков фукозы, бета-1,2-связанных остатков ксилозы или обоих в своих N-гликанах, могут быть полезны. Другие иллюстративные модификации могут приводить к получению растений с улучшенным накоплением белков и масел, растений с повышенной эффективностью фотосинтеза, растений с длительным сроком хранения, растений с повышенным содержанием углеводов и растений, устойчивых к грибам; растений, кодирующих фермент, участвующий в биосинтезе алкалоидов. Трансгенные растения, в которых экспрессия S-аденозил-L-метионин (SAM) и/или цистатионин гаммасинтазы (CGS) была модулирована, также рассматриваются.
Один или несколько таких признаков можно интрогрессировать в мутантные, не встречающиеся в природе или трансгенные растения табака из другого сорта табака или можно непосредственно трансформировать в нем. Интрогрессию признака(-ов) в мутантные, не встречающиеся в природе или трансгенные растения табака по настоящему изобретению можно достичь любым способом селекции растений, известным в данной области, например, селекцией по потомству, обратным скрещиванием, двойной гаплоидной селекцией и тому подобным (см. Wernsman Е.А. и Rufty R.С. 1987. Chapter Seventeen. Tobacco. Pages 669-698 в: Cultivar Development. Crop Species. W.H. Fehr (ed.), MacMillan Publishing Co, Inc., New York, N.Y. 761 pp.). Методики на основе молекулярной биологии, описанные выше, в частности, RFLP и микросателлитные маркеры, можно использовать при таком обратном скрещивании для выявления потомства с высокой степенью генетической идентичности с рекуррентным родителем. Это позволяет ускорить производство разновидностей табака, имеющих по меньшей мере 90%, предпочтительно, по меньшей мере 95%, более предпочтительно, по меньшей мере 99% генетической идентичности с рекуррентным родителем, еще более предпочтительно, генетически идентичных с рекуррентным родителем и дополнительно включающих признак(и), интрогрессированный от донорского родителя. Такое определение генетической идентичности можно проводить на основе молекулярных маркеров, известных в данной области.
Последнее поколение обратного скрещивания можно подвергнуть самоопылению с получением потомства чистого разведения для переносимой нуклеиновой кислоты (кислот). Полученные растения обычно имеют практически все морфологические и физиологические характеристики мутантных, не встречающихся в природе или трансгенных растений табака по настоящему изобретению в дополнение к перенесенному признаку(-ам) (например, один или несколько признаков одного гена). Точный протокол обратного скрещивания будет зависеть от изменяемого признака для определения соответствующего протокола испытаний. Хотя способы обратного скрещивания упрощаются, если переносимый признак представляет собой доминантный аллель, рецессивный аллель также можно перенести. В данном случае может быть необходимо ввести тест потомства с определением успешности переноса желаемого признака.
Различные варианты осуществления предусматривают мутантные растения, не встречающиеся в природе растения или трансгенные растения, а также биомассу, в которой уровень экспрессии полинуклеотида (или любой их комбинации, как описано в данном документе) модулируют для модулирования в них содержания нитратов и/или по меньшей мере NNK.
Части таких растений, в частности растений табака, и более конкретно, листовую пластинку и среднюю жилку растений табака, можно включить в, или использовать при изготовлении различных продуктов потребления, включая, помимо прочего, материалы, образующие аэрозоль, устройства, образующие аэрозоль, курительные изделия, изделия для курения, бездымные продукты и табачные изделия. Примеры материалов, образующих аэрозоль, включают, помимо прочего, табачные композиции, табачные изделия, табачный экстракт, резаный табак, резаный наполнитель, высушенный табак, взорванный табак, гомогенизированный табак, восстановленный табак и трубочный табак.
Курительные изделия и изделия для курения являются, как правило, устройствами, образующими аэрозоль. Примеры курительных изделий и изделий для курения включают, помимо прочего, сигареты, сигариллы и сигары. Примеры бездымных продуктов включают в себя жевательный табак и нюхательный табак. В определенных устройствах, образующих аэрозоль, вместо сгорания, табачная композиция или другой материал, образующий аэрозоль, нагревают с помощью одного или нескольких электрических нагревательных элементов с получением аэрозоля. В другом типе нагреваемого устройства, образующего аэрозоль, аэрозоль получают путем перемещения тепла от горючего топливного элемента или источника тепла к физически отделенному материалу, образующему аэрозоль, который может быть расположен внутри, вокруг или ниже по потоку относительно источника тепла. Бездымные табачные изделия и различные табак-содержащие материалы, образующие аэрозоль, могут содержать табак в любом виде, в том числе в виде высушенных частиц, кусков, гранул, порошков или суспензии, нанесенной на, смешанной с, окруженной или иным образом комбинированной с другими ингредиентами в любом формате, таком как хлопья, пленки, таблетки, пена или шарики. Используемый в данном документе термин «дым» используют для описания типа аэрозоля, который получен с помощью курительных изделий, таких как сигареты, или при сжигании материала, образующего аэрозоль.
В одном варианте осуществления предусмотрен высушенный растительный материал из мутантных, трансгенных и не встречающихся в природе растений табака, описанных в данном документе. Способы сушки зеленых табачных листьев известны специалистам в данной области и включают, без ограничения, теневую сушку, огневую сушку, дымовую сушку и вяление. Способ сушки зеленых табачных листьев зависит от типа собранного табака. Например, табак Virginia flue (светлый) как правило высушен дымовой сушкой, Burley и некоторые темные разновидности обычно высушены теневой сушкой, и трубочный табак, жевательный табак и нюхательный табак обычно высушены огневой сушкой.
В другом варианте осуществления описаны табачные изделия, включая табаксодержащие материалы, образующие аэрозоль, содержащие растительный материал, такой как листья, предпочтительно, высушенные листья, из мутантных растений табака, трансгенных растений табака или не встречающихся в природе растений табака, описанных в данном документе. Табачные изделия, описанные в данном документе, могут быть смешанными табачными изделиями, которые могут дополнительно содержать немодифицированный табак.
Количество NNK в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.
Количество NNN в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.
Количество нитратов в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.
Количество никотина в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов. Количество никотина в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть приблизительно таким же по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.
Количество общих TSNA в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.
Мутантные, не встречающиеся в природе или трансгенные растения могут иметь другие виды использования, например, в сельском хозяйстве. Например, мутантные, не встречающиеся в природе или трансгенные растения, описанные в данном документе, можно использовать для изготовления корма для животных и продуктов питания для человека.
В настоящем изобретении также предусмотрены способы получения семян, включающие выращивание мутантного растения, не встречающегося в природе растения или трансгенного растения, описанного в данном документе, и сбор семян культурных растений. Семена растений, описанных в данном документе, можно довести до кондиции и упаковать в упаковочный материал с помощью средств, известных в данной области, с образованием промышленного изделия. Упаковочный материал, такой как бумага или ткань, хорошо известен в данной области. Упаковка семян может иметь этикетку, например, метку или этикетку, прикрепленную к упаковочному материалу, этикетку, напечатанную на упаковке, которая описывает природу семян в ней.
Композиции, способы и наборы для генотипирования растений для идентификации, выбора или селекции могут включать в себя средства обнаружения присутствия полинуклеотида (или любой их комбинации, как описано в данном документе) в образце полинуклеотида. Соответственно, описана композиция, содержащая один или несколько праймеров для специфической амплификации по меньшей мере части одного или нескольких полинуклеотидов и, необязательно, один или несколько зондов и, необязательно, один или несколько реагентов для проведения амплификации или обнаружения.
Соответственно, раскрыты ген-специфичные олигонуклеотидные праймеры или зонды, содержащие приблизительно 10 или более смежных нуклеотидов, соответствующих полинуклеотиду(-ам), описанному в данном документе. Указанные праймеры или зонды могут содержать или состоять из приблизительно 15, 20, 25, 30, 40, 45 или 50 или более смежных нуклеотидов. которые гибридизируются (например, специфически гибридизируются) с полинуклеотидом(-ами), описанным в данном документе. В некоторых вариантах осуществления праймеры или зонды могут содержать или состоять из приблизительно 10-50 смежных нуклеотидов, приблизительно 10-40 смежных нуклеотидов, приблизительно 10-30 смежных нуклеотидов или приблизительно 15-30 смежных нуклеотидов, которые можно использовать в зависимых от последовательности способах идентификации гена (например, Саузерн-гибридизация) или выделения (например, гибридизация in situ бактериальных колоний или бляшек бактериофага) или обнаружения гена (например, в виде одного или нескольких праймеров амплификации при амплификации и обнаружении нуклеиновой кислоты). Один или несколько специфических праймеров или зондов можно спроектировать и использовать для амплификации и обнаружения части или всего полинуклеотида(-ов). В качестве конкретного примера, два праймера можно использовать в протоколе полимеразной цепной реакции для амплификации фрагмента нуклеиновой кислоты, кодирующего нуклеиновую кислоту, такую как ДНК или РНК. Полимеразную цепную реакцию можно также выполнить с использованием одного праймера, который получен из последовательности нуклеиновой кислоты, и второго праймера, который гибридизируется с последовательностью выше по цепи или ниже по цепи последовательности нуклеиновой кислоты, такой как последовательность промотора, 3'-конец прекурсора иРНК или последовательность, полученная из вектора. Примеры термических и изотермических методик, пригодных для амплификации полинуклеотидов in vitro, хорошо известны в данной области. Образец может происходить или его можно получить из растения, растительной клетки или растительного материала или табачного изделия, изготовленного из растения, растительной клетки или растительного материала, как описано в данном документе.
В следующем аспекте предусмотрен способ обнаружения полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, как описано в данном документе) в образце, включающий этапы: (а) получения образца, содержащего, или предположительно содержащего, полинуклеотид; (b) контакта указанного образца с одним или несколькими праймерами или одним либо несколькими зондами для специфического определения по меньшей мере части полинуклеотида(-ов) и (с) обнаружение присутствия продукта амплификации, где присутствие продукта амплификации свидетельствует о присутствии полинуклеотида(-ов) в образце. В следующем аспекте также предусмотрено использование одного или нескольких праймеров или зондов для специфического обнаружения по меньшей мере части полинуклеотида(-ов). Также предусмотрены наборы для обнаружения по меньшей мере части полинуклеотида(-ов), которые содержат один из несколько праймеров или зондов для специфического обнаружения по меньшей мере части полинуклеотида(-ов). Набор может содержать реагенты для амплификации полинуклеотида, например ПЦР, или реагенты для технологии обнаружения гибридизации зонда, такой как Саузерн-блоттинг, Нозерн-блоттинг, гибридизация in situ или микрочип. Набор может содержать реагенты для технологии обнаружения связывания антител, такой как Вестерн-блоттинг, ELISA, SELDI масс-спектрометрия или тест-полоски. Набор может содержать' реагенты для секвенирования ДНК. Набор может содержать реагенты и инструкции для определения содержания нитратов и/или содержания по меньшей мере NNK, и/или содержания NNN, и/или содержания никотина, и/или общего содержания TSNA. Соответственно, набор содержит реагенты и инструкции для определения содержания нитратов и/или содержания по меньшей мере NNK, и/или содержания никотина и/или содержания NNN и/или общего содержания TSNA в растительном материале, высушенном растительном материале или в высушенных листьях.
В некоторых вариантах осуществления набор может содержать инструкции для одного или нескольких описанных способов. Описанные наборы могут быть полезны для определения генетической идентичности, филогенетических исследований, генотипирования, гаплотипирования, анализа родословной или селекции растений, в частности, с количественной оценкой кодоминантных признаков.
В настоящем изобретении также предусмотрен способ генотипирования растения, растительной клетки или растительного материала, включающий полинуклеотид, как описано в данном документе. Генотипирование обеспечивает средства различения гомологов пары хромосом и может быть использовано для различения сегрегантов в популяции растений. Молекулярные способы с маркерами можно использовать для филогенетических исследований, характеризующих генетические связи между разновидностями сельскохозяйственных культур, выявления гибридов или соматических гибридов, локализации хромосомных сегментов, влияющих на моногенные признаки, клонирования на основе генетических карт и изучения количественного наследования. Конкретный способ генотипирования может использовать любое количество аналитических методик с молекулярным маркером, включая полиморфизмы длины фрагмента амплификации (AFLP). AFLP являются продуктом аллельных различий между фрагментами амплификации, вызванных изменчивостью нуклеотидной последовательности. Таким образом, настоящее изобретение дополнительно предусматривает средства отслеживания разделения одного или нескольких генов или нуклеиновых кислот, а также хромосомных последовательностей, генетически связанных с этими генами или нуклеиновыми кислотами, с использованием таких методик, как анализ AFLP.
В одном варианте осуществления также предусмотрен высушенный растительный материал из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе. Например, способы сушки табачных листьев известны специалистам в данной области и включают без ограничения теневую сушку, огневую сушку, дымовую сушку и вяление. Способ сушки зеленых табачных листьев зависит от типа собранного табака. Например, табак Virginia flue (светлый) как правило высушен дымовой сушкой, Burley и некоторые темные разновидности обычно высушены теневой сушкой, и трубочный табак, жевательный табак и нюхательный табак обычно высушены огневой сушкой.
В другом варианте осуществления описаны табачные изделия, включая табачные изделия, содержащие растительный материал, такой как листья, соответственно, высушенный растительный материал, такой как высушенные листья, из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе, или которые получены по способам, описанным в данном документе. Табачные изделия, описанные в данном документе, могут дополнительно содержать немодифицированный табак.
В другом варианте осуществления описаны табачные изделия, содержащие растительный материал, предпочтительно листья, такие как высушенные листья, из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе. Например, растительный материал можно добавить к внутренней или наружной части табачного изделия, так что при сжигании высвобождается желаемый аромат. Табачное изделие по этому варианту осуществления может даже представлять собой немодифицированный табак или модифицированный табак. Табачное изделие по этому варианту осуществления может даже быть получено из мутантного, трансгенного или не встречающегося в природе растения, которое имеет модификации в одном или нескольких генах, отличающихся от генов, раскрытых в данном документе.
Настоящее изобретение дополнительно описано в Примерах ниже, которые предусмотрены для более детального описания настоящего изобретения. Эти примеры, в которых изложен предпочтительный режим, предполагаемый в настоящее время для выполнения настоящего изобретения, предназначены для иллюстрации, а не для ограничения настоящего изобретения.
ПРИМЕРЫ
Пример 1: Идентификация NtCLCe-s последовательностей
Для идентификации NtCLCe-s обнаруживают родственные транскрипты в листьях N. tabacum с помощью анализа ПЦР в реальном времени и наличие потенциально совпадающих EST-контигов (NtCLCe-s: NCBI_43350-v4ctg-in). Данные из выполненного на заказ биочипа экзонов табака от Affymetrix (зонды последовательностей из NtPMIa1g22230e1-st) используют для подтверждения того, что NtCLCe-s одинаково экспрессируется в корнях, зеленых и стареющих листьях N. tabacum. Кроме того, обнаружено, что стресс от холода и сильный кадмиевый стресс не влияет на уровни экспрессии NtCLCe-s, тем самым свидетельствуя, что NtCLCe-s конститутивно экспрессируется в органах корней и листьев табака. Конститутивная экспрессия NtCLCe может коррелировать с сохранением ее основной клеточной роли в пластидах, которые предположительно связаны с метаболическими путями усвоения азота. Согласно программному обеспечению WoLFPSORT, NtCLCe-s с высокой степенью прогнозируется как мембранный белок пластид. Исследования RNAseq подтверждают наличие транскрипта в его предке N. sylvestris.
Пример 2: Идентификация NtCLCe-t последовательностей
Для идентификации NtCLCe-t обнаруживают родственные транскрипты в листьях N. tabacum с помощью анализа ПЦР в реальном времени и наличие соответствующих EST-контигов. Исследования RNAseq подтверждают наличие транскрипта в предке N. tomentosiformis, таким образом предполагая, что экспрессия копии NtCLCe-t возможно утрачена в N. tabacum после введения аллотетрапоидного состояния, возможно из-за разрушения и/или перегруппировки гена.
Пример 3: Экспрессия NtCLCe-s или NtCLCe-t в листьях N. tabacum
Оба гена CLC-Nt2-s и CLC-Nt2-t экспрессируются в листьях N. tabacum, как определено по наличию обоих транскриптов в листьях N. tabacum (исследования с выполненным на заказ биочипом экзонов табака, подтвержденные с помощью ПЦР в реальном времени) и соответствующих EST-контигов (CLC-Nt2-s: MIRA_20760-v4ctg-in; CLC-Nt2-t: NCBI_56794-v4ctg-in). Кроме того, исследования RNAseq подтверждают наличие соответствующих транскриптов в двух предках N. sylvestris и N. tomentosiformis.
При более внимательном рассмотрении транскриптомных данных от биочипа экзонов табака со специфичными зондами для CLC-Nt2-t и CLC-Nt2-s, NtPMIa1g19904e2-st и NtPMIa1g50210e2-st, соответственно, обнаружено, что обе копии дифференцированно экспрессируются в N. tabacum. CLC-Nt2-s слабо экспрессируется в корне Burley (TN90) и CLC-Nt2-t является чувствительной к суточному ритму. Оба гена экспрессируются в корне и листьях табака дымовой сушки и нечувствительны к обработке кадмием.
Пример 4: Сайленсинг экспрессии CLC-Nt2-t в N. tabacum
Фрагмент ДНК (SEQ ID NO: 8), выявленный в кодирующей последовательности CLC-Nt2 и фланкирующем интроне (100% идентичности с CLC-Nt2-s и 97% идентичности с CLC-Nt2-t) в N. tabacum (Hicks broadleaf), клонируют для того, чтобы выключить обе копии CLC-Nt2 в табаке с использованием подхода РНКи. Соответствующий фрагмент ДНК встраивают в вектор Gateway pB7GWIWG2(II) с помощью исходного вектора в точности так, как подробно описано производителем (Invitrogen). Данный вектор содержит промотор для конститутивной экспрессии (промотор 35S вируса мозаики цветной капусты CaMV) трансгена во всех тканях растения и ген кап для устойчивости к антибиотику канамицину. Затем конструкцию встраивают в геном табака Burley Kentucky 14 (KY14) с помощью Agrobacterium tumefasciens с использованием классической процедуры листового диска. Из каллюсов регенерируют отдельные линии. Отбор трансгенных линий выполняют с помощью ПЦР выделенной геномной ДНК из проростков. РНКи-сайленсинг линий ТО отслеживают с помощью ПЦР в реальном времени с использованием специфичных праймеров, фланкирующих вставку, использованную для сайленсинга, и выращивают для получения семян. Семена Т1 собирают, проращивают на агаровых пластинках и отслеживают точно как проростки Т0. Позитивные растения выращивают в горшках и культивируют в теплице. Во время сбора (10 недельные растения) один лист с середины стебля отбирают и подвергают определению нитратов с использованием либо набора для колориметрического анализа нитратов (Cayman, США), или Skalar. Все оставшиеся листья высушивают растение за растением в небольшом экспериментальном амбаре для теневой сушки в течение двух месяцев с использованием стандартных способов, которые известны в данной области. После сушки листья каждого растения собирают и подвергают анализу TSNA.
Пример 5: Сайленсинг экспрессии NtCLCe в N. tabacum
Фрагмент ДНК (SEQ ID NO: 9), выявленный в кодирующей последовательности NtCLCe, клонируют для выключения обеих копий NtCLCe с использованием подхода РНКи. Затем соответствующий фрагмент ДНК встраивают в вектор Gateway pB7GWIWG2(II) с помощью исходного вектора в точности так, как подробно описано производителем (Invitrogen). Данный вектор содержит промотор для конститутивной экспрессии (промотор 35S вируса мозаики цветной капусты CaMV) трансгена во всех тканях растения и ген kan для устойчивости к антибиотику канамицину. Затем конструкцию встраивают в геном табака Burley Kentucky 14 (KY14) с помощью Agrobacterium tumefasciens с использованием классической процедуры листового диска. Из каллюсов регенерируют отдельные линии. Выбор на агаровых пластинках выполняют с помощью ПЦР на выделенной геномной ДНК из проростков. РНКи-сайленсинг линий Т0 затем отслеживают с помощью ПЦР в реальном времени с использованием специфичных праймеров, фланкирующих вставку, использованную для сайленсинга, и выращивают для получения семян. Семена Т1 собирают, проращивают на агаровых пластинках и отслеживают точно как проростки Т0. Позитивные растения выращивают в горшках и культивируют в теплице. Во время сбора (10-недельные растения) один лист с середины стебля отбирают и подвергают определению нитратов с использованием либо набора для колориметрического анализа нитратов (Cayman, США), или Skalar. Оставшиеся листья высушивают растение за растением в небольшом экспериментальном амбаре для теневой сушки в течение двух месяцев с использованием стандартных способов, которые известны в данной области. После сушки листья каждого растения собирают и подвергают анализу TSNA.
Пример 6: Анализ TSNA в растениях CLC-NT2-RNAi и NtCLCe-RNAi
Выполняют выбор растений CLC-NT2-RNAi и NtCLCe-RNAi с использованием ПЦР геномной ДНК для выявления трансгенных вставок с последующей ПЦР в реальном времени кДНК (полученной из выделенной общей РНК). Как показано на Фигуре 1 (анализ полуколичественной ПЦР в реальном времени), гены CLC-Nt2 или NtCLCe, как обнаружено, полностью или частично выключены в зеленых листьях растений CLC-Nt2-RNAi и NtCLCe-RNAi Т1 по сравнению с растениями дикого типа (показано три типичных растения). Интересно, что в обоих растениях с РНКи гены NtCLCe и CLC-Nt2 выключены независимо от использованной конструкции, таким образом, предполагая возможное перекрестное регулирование между этими двумя генами в листьях. В первом эксперименте проростки Т1 выращивают в небольших горшках (3-литровых горшках) после прорастания. Во время сбора (10 недель после высадки рассады) наблюдают снижение нитратов в зеленых листьях (середина стебля) как CLC-Nt2-RNAi, так и NtCLCe-RNAi, однако снижение нитратов является существенно (Р<0,01) более эффективным в растениях NtCLCe-RNAi (~95%) по сравнению с растениями CLC-Nt2 (приблизительно на 5%, см. Фигуру 2А). Снижение никотина также наблюдается в обоих трансгенных растениях при сравнении с растениями wt (~35%). Данное снижение никотина означает, что NtCLCe и CLC-Nt2 воздействуют на перераспределение нитратов в корнях при определенных условиях роста, которые влияют на синтез никотина. Общие TSNA (NNN, NNK, NAT (N9-нитрозоанатабин) и NAB (N9-нитрозоанабазин) определяют в обоих растениях CLC-RNAi после сушки (см. Фигуру 2В). NNK, NNN, NAB и NAT доступны для приобретения и могут быть использованы в качестве эталонных стандартов. Стандартные способы анализа NNK, NNN, NAB и NAT известны в данной области (см., например, Nicotine & Tobacco Research (2006) 2: 309-313). Можно использовать сверхэффективную жидкостную хроматографию - тандемную масс-спектрометрию (UPLC-MS/MS). Способы для измерения никотина также известны в данной области (см., например, International Journal of Cancer (2005); 116: 16-19). Данные указывают, что сильное снижение уровней нитратов предотвращает образование TSNA в высушенных листьях, что может иметь место, поскольку нитраты являются основным источником нитрозирующего средства в листьях, способствуя образованию TSNA. Снижение нитратов, обнаруженное в растениях CLC-Nt2-RNAi, не приводит к такому сильному эффекту относительно TSNA по сравнению с растениями NtCLCe-RNAi.
Для предотвращения любых стрессовых условий для роста корней предыдущий эксперимент повторили с использованием 10-литровых горшков. При таких условиях растения табака дикого типа накапливают приблизительно в пять раз больше никотина по сравнению с предыдущим экспериментом. Растения NtCLCe-RNAi и CLC-Nt2-RNAi демонстрируют сниженную экспрессию генов при точно таком же отборе, как описано ранее. Поскольку большинство трансгенных растений с обеими конструкциями показали сниженную экспрессию NtCLCe и CLC-Nt2 (см. Фигуру 1), растения с РНКи, демонстрирующие сниженную экспрессию обоих CLC, сгруппировали вместе (растения CLC-RNAi) и подвергли анализам на никотин и нитраты (см. Фигуру 3А). Снижение никотина, наблюдаемое в первых экспериментах в растениях CLC-RNAi, не обнаружено в этом эксперименте, подтверждая тем самым, что ограничение развития корней при использовании небольших горшков может вызывать дополнительное снижение никотина как в NtCLCe-RNAi, так и в CLC-Nt2-RNAi растениях по сравнению с растениями дикого типа (сравнить Фигуры 2А и 3А). Однако нитраты были все еще существенно снижены (>40%) в обоих растениях CLC-RNAi по сравнению с растениями дикого типа, подтверждая таким образом, что снижение экспрессии NtCLCe и CLC-Nt2 приводит к уменьшению содержания нитратов в табачных листьях. При таких условиях роста трансгенные растения не показали никаких фенотипических различий по сравнению с растениями wt, как можно увидеть при сравнении общего веса листьев и числа листьев (см. Фигуры 3В и 3С).
Анализ на TSNA в этих растениях показал, что NNN не снижен в листьях теневой сушки по сравнению с растениями дикого типа. Однако снижение NNK на 24 и 10%) наблюдается в растениях NtCLCe-RNAi и CLC-Nt2-RNAi по сравнению с растениями дикого типа (см. Фигуру 4). Снижение NNK является более существенным в растениях NtCLCe-RNAi (Р<0,01), чем в CLC-Nt2-RNAi, подтверждая тем самым данные, полученные в первом эксперименте для общих TSNA (см. Фигуру 2).
Хотя трансгенные растения и растения дикого типа не выросли в полевых условиях и не высушены в классических амбарах для теневой сушки табака, наши данные показали, что ограничение экспрессии NtCLCe (NtCLCe-s) и CLC-Nt2 (s и t копий) способствует эффективному снижению нитратов в табачных листьях. После сушки TSNA (NNK), как обнаружено, снижены в листьях, указывая, что снижение содержания нитратов в зеленых листьях как поставщика нитрозирующих средств во время сушки будет эффективно способствовать снижению образования TSNA в соответствующих высушенных листьях. Это снижение может способствовать по меньшей мере 20% снижению NNK.
Пример 7: Этилметансульфонатный мутагенез CLC-Nt2-s, CLC-Nt2-t, NtCLCe-s или NtCLCe-t в N. tabacum
Семена МО Nicotiana tabacum АА37 обрабатывают этилметансульфонатом (EMS) при различных концентрациях и времени воздействия для того, чтобы создать популяцию растений со случайными точечными мутациями. Кривую гибели оценивают у поколения M1 для каждой обработки вместе с летальностью, фертильностью и степенью химеризма. Растения M1 подвергают самооплодотворению с образованием семейств семян М2, чтобы позволить получение рецессивных аллелей в виде гомозигот и получение летальных аллелей в виде гетерозигот. Геномную ДНК от 8 растений М2 на каждое семейство подвергнутой EMS-мутагенезу популяции извлекают и подвергают скринингу на мутанты, тогда как растительный материал М2 и семена М3 собирают и сохраняют для будущих анализов. Для выявления и характеристики мутантных вариантов образцы геномной ДНК от растений М2 объединяют в группы и подвергают скринингу путем секвенирования фрагментов нацеленного гена. Фрагменты целевого гена амплифицируют с использованием праймеров, показанных в Таблице 2. Производят поиск мутаций в целевых генах путем секвенирования отдельных фрагментов ДНК. Различные мутанты показаны в Таблице 1.
Пример 8: Анализ выращенного в поле гомозиготного мутантного G163R CLCNt2-s растения табака
Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных G163R CLCNt2-s растений табака показан в Фигуре 5. Цельные листья собирают с середины стебля гомозиготных мутантных G163R CLCNt2-s растений табака (треугольник) и внесегрегантных дикого типа (ромб) растений табака, выращенных в поле в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигурах.
Результаты этого эксперимента показывают, что гомозиготное мутантное G163R CLCNt2-s растение табака имеет сниженный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов снижается с приблизительно 11 мг/г в контрольном растении до приблизительно 6 мг/г в мутантном растении. Уровень нитратов продолжает уменьшаться в середине утра. Уровень нитратов снижается с приблизительно 7 мг/г в контрольном растении до приблизительно 4,5 мг/г в мутантном растении. К позднему утру уровень нитратов увеличился в мутантном растении по сравнению с серединой утра и достигает уровня нитратов, присутствующих ранним утром. Для контроля уровень нитратов в контрольном растении продолжает уменьшаться. К позднему утру уровень нитратов увеличивается до приблизительно 6 мг/г в мутантном растении и уменьшается до приблизительно 3 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра. Уровень никотина меняется от приблизительно 13 мг/г до приблизительно 11 мг/г для мутантного растения и от приблизительно 9 мг/г до приблизительно 13 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.
Пример 9: Анализ выращенного в поле гомозиготного мутантного P143L NtCLCe-t растения табака.
Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных P143L NtCLCe-t растений показан на Фигуре 6. Цельные листья собирают с середины стебля выращенных в поле гомозиготных растений P143L NtCLCe-t (квадрат) и внесегрегантных растений дикого типа (ромб), растущих в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигуре.
Результаты этого эксперимента показывают, что гомозиготное мутантное P143L NtCLCe-t растение табака имеет увеличенный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов увеличивается с приблизительно 7 мг/г в контрольном растении до приблизительно 14 мг/г в мутантном растении. Уровень нитратов уменьшается в середине утра в мутантном растении и несколько увеличивается в контрольном растении. Уровень нитратов в мутантном растении снижен до приблизительно 9 мг/г и уровень нитратов в контрольном растении увеличивается до приблизительно 9 мг/г.К позднему утру уровень нитратов продолжил уменьшаться в мутантном растении по сравнению с серединой утра. Для контроля уровень нитратов в контрольном растении уменьшается. К позднему утру уровень нитратов уменьшается до приблизительно 2 мг/г в мутантном растении и уменьшается до приблизительно 4 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра для каждого из мутантного и контрольного растений. Уровень никотина меняется от приблизительно 20 мг/г до приблизительно 24 мг/г для мутантного растения и от приблизительно 15 мг/г до приблизительно 17 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.
Любая публикация, которая процитирована или описана в данном документе, предоставляет соответствующую информацию, раскрытую до даты подачи настоящей заявки. Заявления, сделанные в данном документе, не должны быть истолкованы как допущение того, что авторы настоящего изобретения не имеют право датировать более ранним числом такие раскрытия. Все публикации, упомянутые в вышеприведенном описании, включены в данный документ с помощью ссылки. Различные модификации и вариации настоящего изобретения будут очевидны специалистам в данной области без отступления от объема и сущности настоящего изобретения. Несмотря на то, что настоящее изобретение было описано в связи с конкретными предпочтительными вариантами осуществления, следует понимать, что настоящее изобретение, как заявлено, не должно быть неправомерно ограничено такими конкретными вариантами осуществления. Действительно, различные модификации описанных способов осуществления изобретения, которые очевидны специалистам в клеточной, молекулярной биологии и биологии растений или в смежных областях, предназначены, чтобы быть в пределах объема прилагаемой формулы изобретения.
ПОСЛЕДОВАТЕЛЬНОСТИ
CLC-Nt2-s соответствует полипептидной последовательности, показанной в SEQ ID NO:5, которая кодируется SEQ ID NO:1
CLC-Nt2-t соответствует последовательности, показанной в SEQ ID NO:6, которая кодируется SEQ ID NO:2
NtCLCe-s соответствует последовательности, показанной в SEQ ID NO:7, которая кодируется SEQ ID NO:3
NtCLCe-t соответствует последовательности, показанной в SEQ ID NO:13, которая кодируется SEQ ID NO:4
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> ФИЛИП МОРРИС ПРОДАКТС С.А.
<120> СНИЖЕНИЕ ТАБАК-СПЕЦИФИЧНЫХ НИТРОЗАМИНОВ В РАСТЕНИЯХ
<130> P4064PC00
<140> PCT/EP2013/077532
<141> 2013-12-19
<150> EP 12198966.9
<151> 2012-12-21
<160> 181
<170> PatentIn version 3.3
<210> 1
<211> 4141
<212> DNA
<213> Nicotiana tabacum
<220>
<223> DNA sequence of CLC-Nt2 from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris
<400> 1
atggaggagc caactcgatt agtagaagaa gcaacgatta ataacatgga cggacaacag 60
aatgaagaag aaagagatcc agagagcaat tcactgcatc agcctcttct caagagaaac 120
agaacactat catccagtcc atttgccttg gttggagcta aggtctccca catcgaaagt 180
ttggattatg agtaagaaca actaataatc ttatcataga tcaagtatag cttttcttta 240
cttgtgcatt aaaagggcca acagaaattg gatgtcctaa ttgtgtgtgt ctgttttagg 300
atcaacgaga atgatctctt caagcatgac tggagaagga gatctagagt tcaagtatta 360
cagtatgtgt tcttgaaatg gacactggca tttttggtcg gcctgcttac aggagttaca 420
gccaccctca tcaatcttgc aatcgaaaac atggctggtt acaaacttcg agctgttgtg 480
aactatatcg aggatagaag gtaggtgatg ttttccctat gatcaacaat tcataaatgc 540
ttccagaagt cttactactg attcttcaat acgataccac tagctaatga ctaagaacaa 600
gaccaaagat cacttatttg acttgaatta tgttattgat ttattcataa ttgagattgt 660
aacaatggtt acaggtacct tatgggattt gcatattttg cgggtgctaa ttttgtgctc 720
actttgatag ctgcccttct ctgcgtgtgc tttgcaccta ctgctgcagg gcctggaatt 780
cctgaaatca aagcttatct caacggtgta gatactccca atatgtatgg agcaaccaca 840
ctttttgtca aggtgcgtca cacacccaat tttatcagtg ctggcaattc agatagcagg 900
cagattataa cgccatcagt atagtattga gattctgtcg aaccagatgt ataaatagat 960
agaatagcag caaataacac atttttatct tagtcgtgat ggcacctaat ccgacccgct 1020
agataagcca aatacaatca acacatattt atggaattca atctcatttg ggaagtgatc 1080
tctatctttc agtaatcaga taggaagtgg tttaagaata aaaagagaat tttagaatcg 1140
aatgcactca tccagcgagg aagatccatc agtggtatct aatttactct tgaacttcca 1200
gcagttcaat cctttggtac cgtcactgta acttgttttt ttcaatcttt gtgactaaca 1260
tggaagggag gaaaatcctg actttcagtg attttcctcg cttacagtga aagtcaggat 1320
atagcttcgg tgagactcag cttatatgtc ttaattgaat atgctatttg ttgactaaca 1380
tggatttgcc ctatcatgaa aatgaaggaa gcgccaaaaa tacatatact taaacagggg 1440
cggacccaag tggtgagaag tgggttcaac tgaacccgct tcgtcaaaaa aatactgtgt 1500
atatgtataa attatggcta aagcaaggta aattttgtat agaaataagc ttatgttagt 1560
tatggacttc tcctgggtcc gctactgtac ttaaaagcac atacgaagag atacacaaac 1620
taagggcaaa ggttcataat ttaaggcagt tgtgtccaga agaacaaatt ttgcttgcat 1680
gttgcagtgt gaatttaaca ataaaagaat tatgatcgca aatttccact tgtaattgta 1740
ctataagatt ctaaattttg agagatttga catgtttgct ttccctttga ctgaatcgta 1800
aaagtgaaag tgaagttcat cagaagtaga ttatgatact taccaacccc tttttccctt 1860
aaacaatctt taatctgttc actcacagat cattggaagc attgcagcag tttctgctag 1920
cttagacctt ggaaaagaag ggccattggt tcacattggc gcttgctttg cttccttact 1980
aggtcaaggt ggtccagata attaccggct caggtggcgt tggctccgtt acttcaacaa 2040
cgatcgggac aggcgagatc ttatcacatg tgggtcatca tcaggtgtgt gtgctgcttt 2100
ccgttctcca gtaggtggtg tcctatttgc tttagaggaa gtggcaacat ggtggagaag 2160
tgcactcctc tggagaactt tcttcagcac ggcagttgtg gtggtgatac tgagggcctt 2220
cattgaatac tgcaaatctg gcaactgtgg actttttgga agaggagggc ttatcatgtt 2280
tgatgtgagt ggtgtcagtg ttagctacca tgttgtggac atcatccctg ttgtagtgat 2340
tggaatcata ggcggacttt tgggaagcct ctacaatcat gtcctccaca aaattctgag 2400
gctctacaat ctgatcaacg agtaagcacc tactcttcca cattcccaac tggatcatca 2460
aacattcagt tggttctcta tattttaaag gcaatgcata tccacacaaa aatgagctta 2520
cttggattag aatcatcttg agacattgat ccaactgtct tgcatctttt taagtttaaa 2580
tcctaattcc tatccaaaca tggccttctt atcacattta actgccaaaa aaaaagggaa 2640
aactatagat gcaaaatcct gactttcaat ctttgatcct tttttatctt gcaggaaggg 2700
aaaactacat aaggttcttc tcgctctgag tgtctccctt ttcacctcca tttgcatgta 2760
tggacttcct tttttggcca aatgcaagcc ttgtgatcca tcacttcccg ggtcttgtcc 2820
tggtactgga gggacaggaa acttcaagca gttcaactgc ccagacggct attacaatga 2880
tcttgctact cttctcctta caaccaacga tgatgcagtc cgaaacattt tctccataaa 2940
cactcccggt gaattccaag ttatgtctct tattatctac ttcgttctgt attgcatatt 3000
gggactcatc acttttggga ttgctgtgcc atctggtctc ttccttccaa tcatcctcat 3060
gggttcagct tatggtcgct tgcttgccat tgccatggga tcttatacaa aaattgatcc 3120
agggctgtat gcggttctcg gagcagcttc ccttatggct ggttcaatga gaatgactgt 3180
ttctctttgc gtcatatttc ttgagctaac aaacaatctt ctccttctgc caataacaat 3240
gctggttctt ctaattgcca aaagtgtagg agactgcttc aacctaagta tttatgaaat 3300
aatattggag ctgaaaggtc tacctttcct ggatgccaac ccggagccat ggatgagaaa 3360
tatcactgct ggtgagcttg ctgatgtaaa gccaccagta gttacactct gtggagttga 3420
gaaggtggga cgtatcgtag aggccttgaa gaacaccaca tataacggat tccctgtcgt 3480
cgatgaagga gtagtgccac cggtgggtct gccagttggg gcaactgaat tgcacggtct 3540
tgtcctaaga actcaccttc ttttggttct caagaaaaag tggttccttc atgaaagacg 3600
gaggacagag gagtgggaag tgagagagaa attcacctgg attgatttag ctgagagggg 3660
cggtaagatc gaagatgtgt tagttacaaa ggatgaaatg gagatgtatg tcgatttgca 3720
tcccctgact aacacaaccc cttatactgt ggtagaaagc ttgtcagtgg ctaaggcaat 3780
ggtgcttttc aggcaggtgg ggctccgcca catgctcatt gtacccaaat accaagcagc 3840
aggggtgaga ttataagcaa atttcagtta tttttcttat gcaaatatct ccctcctatc 3900
atagtataaa gatgcacaga aatagtcata tggtaatata agcacttgtt tagaataatt 3960
ataggtggca aagttatttt acattagaag tgataaaagc attacttaca tcacacttgt 4020
gctccttttg taggtatctc ctgtggtggg aatcttgacc aggcaagact tgagagccca 4080
caacattttg agtgtcttcc ctcatctgga gaagtcaaaa agcggtaaaa aggggaactg 4140
a 4141
<210> 2
<211> 3781
<212> DNA
<213> Nicotiana tabacum
<220>
<223> DNA sequence of CLC-Nt2 from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis
<400> 2
atggaggagc caactcgatt agtagaagaa gcaacgatta ataacatgga cagacaacag 60
aatgaagaag aaagagatcc agagagcaat tcactgcatc agcctctcct caagagaaac 120
agaacactat catccagtcc atttgccttg gttggagcta aggtctccca tattgaaagt 180
ttagactatg agtaagaaca actaataatc ttatctttag atcaagtata gcttttcttt 240
ataaatgggc caacagaaat tggatgtcct aattttgtgt atctgcttta ggatcaacga 300
gaatgatctc ttcaagcatg actggagaag aagatccaga gttcaagtat tacagtatgt 360
attcttgaaa tggacactgg catttttggt cgggcttctt acaggagtga cagcctccct 420
tatcaatctt gcaatcgaaa acattgctgg ctacaaactt agagctgttg tgaactatat 480
cgaggataga aggttggtga tgttttccct atgatcagca attcataaag gctactataa 540
ttcttcaata tgattccact agctaatgac taagaacaag atcaaagatc acttatttga 600
cttgaattat gttattgatt tgttcataat tgagattgta acaatggtta caggtacctt 660
gtgggatttg catattttgc gggtgctaat tttgtgctca ctttgatagc tgcccttctc 720
tgcgtgtgtt ttgcgcctac tgctgcaggg cctggaattc ctgaaatcaa agcttatctc 780
aacggtgtag atactcccaa catgtacgga gcaaccacac tttttgtcaa ggtgcgtcac 840
gcacccaatt ttatcagtgc tggcaattca ggtagcaggc agattataac gccatcagta 900
tagtattgag atcctgttga cctagatgta taaatagaaa gaatagcagc aaataacaca 960
tttttagcct acatatttat ggaattcaat ctcatttggg aagtgatatc tatctttcag 1020
taatcagata ggaagttgtt taagaataaa aagagaattt tatcgaatgc actcatccag 1080
caaggaagat ccatcagtgg tatctaatct actcttgaac ttccagtagt tcaatccttt 1140
ggtactgtca ctgtaacttg ttttctcatc caccattaaa atacaatagc ttccatgaga 1200
ctcagcttat atgtctcaat tgaatatgct atttggtgac taacatgaat ttgccctatc 1260
atgaaaataa atggaagtga caaaaataca tatacttaaa agcacatatg tagagacacg 1320
cagactaagg gcaaaggttc acaattttaa ggcagttgtg tccagaagaa caaatgaaga 1380
attatgatca caaatttcca cttgtaattg tactataaaa tttttaattt tgagagattc 1440
tgacatgttt gctttccctt tgattgaatc gtaaaagtga aagtgaagtt catcagaagt 1500
agattatgat acttaccaac tcctttttcc ccctaaacaa tctttaatct cttcacttac 1560
agatcattgg aagcattgca gcagtttctg ctagcttaga ccttggaaaa gaagggccgt 1620
tggttcacat tggcgcttgt tttgcttcct tactaggtca aggtggtcca gataattacc 1680
ggctcaaatg gcgctggctc cgttacttca acaacgatcg ggacaggcga gatctcatca 1740
catgtgggtc atcatcaggt gtgtgtgctg ctttccgttc tccagtaggt ggtgtcctat 1800
ttgctttaga ggaagtggca acatggtgga gaagtgcact cctctggaga actttcttca 1860
gcacggcagt tgtggtggtg atactgaggg ccttcataga atactgcaaa tctggctact 1920
gtggactttt tggaagagga gggcttatca tgtttgatgt gagtggtgtc agtgttagct 1980
accatgttgt ggacatcatc cctgttgttg tgattggaat cataggcgga cttttgggaa 2040
gcctctacaa ttgtgtcctc cacaaagttc tgaggctcta caatctcatc aacgagtaag 2100
caccaactct tccacattcc caactggatc atcaaacatt cagttggttc tctatattta 2160
aaaggcaatg catatccaca caaaaatgag cttacttgga ttagaatcat cttgagacat 2220
tgatccaact gccttgcatc tttttaagtt tgaatcccaa ttcctatcca aacatggtct 2280
ttttatcaca tttaactgcc aaaaaaagtt actctataga tgtaaaatcc tgactttcaa 2340
actttgatcc ttttttatct tgcaggaagg gaaaactaca taaggttctt ctcgctctga 2400
gcgtctccct tttcacctcc atttgcatgt atggacttcc ttttttggcc aaatgcaagc 2460
cttgtgattc atcacttcaa gggtcttgtc ctggcactgg aggtacagga aacttcaagc 2520
agttcaactg ccctgacggc tattacaatg atctcgctac tcttctcctt acaaccaacg 2580
atgatgcagt ccgaaacatt ttctccataa acactcccgg tgaattccat gttacgtctc 2640
ttattatcta cttcgttctg tattgtatct tgggactcat cacttttggg attgctgtgc 2700
catctggtct cttccttcca atcatcctca tgggttcagc ttatggtcgc ttgcttgcca 2760
ttgccatggg atcttataca aaaattgatc cagggctgta tgccgttctg ggagcagctt 2820
cccttatggc tggttcaatg agaatgactg tttctctttg cgtcatattt cttgagctaa 2880
caaacaatct tctccttctg ccaataacaa tgctggttct tctaattgcc aaaagtgtag 2940
gagactgctt taacctaagt atttatgaaa taatattgga actgaaaggt ctacctttcc 3000
tggatgccaa cccggagcca tggatgagaa atatcactgc tggtgagctt gctgatgtaa 3060
agccaccagt agttacactt tgtggagttg agaaggtggg acgtatcgtc gaggtcttga 3120
agaacaccac atataacgga ttccctgtcg tcgatgaagg agtggtgcca ccggtgggtc 3180
tgccagttgg ggcaactgaa ttgcacggtc ttgtcctaag aactcacctt cttttggttc 3240
tcaagaaaaa gtggttcctt aatgaaagac gaaggacaga ggagtgggaa gtgagagaga 3300
aattcacctg gattgattta gctgagaggg gcggtaagat cgaagatgtg gtagttacga 3360
aggatgaaat ggagatgtat gtcgatttgc atcccctgac taacacaacc ccttatactg 3420
tggtagaaag cttgtcagtg gctaaggcaa tggtgctttt caggcaggtg gggctccgcc 3480
acatgctcat tgtacccaaa taccaagcag caggggtgag attataagca aatttcagtt 3540
attattctta tgcaaatatc tccctcctat catagtatta agatgcacag aaatagtcat 3600
atcgtggcaa agttatttta cgttagtaag tgataaaagc attacttaca tcacacttgt 3660
gctccttttg taggtatctc cggtggtggg aatcttgacc aggcaagact tgagagccca 3720
caacattttg agtgtcttcc ctcatctgga gaagtcaaaa agcggtaaaa aggggaactg 3780
a 3781
<210> 3
<211> 44278
<212> DNA
<213> Nicotiana tabacum
<220>
<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; one start codon
<400> 3
atgaatcacg gaagttgttg ggtcgtcatc caaattgctg gccttgggct cgacgaccat 60
ctcttcctcc gggacgttcc tctgacggaa acattgaaaa agaacaagat atgtgcgaca 120
gcagcaaagt cgatagtgat agtggcatcc agataggatc tctgctcgag gaagttatcc 180
cacaaggcaa taataccgct ataatctcgg cttgctttgt tggcctcttc accggtatca 240
gtgtcgtgct tttcaacgct gcggtacgtg cgctataggt ctttcatttc tcttttcatg 300
tactattcct ccttacttac ttggcctcag tcaatcagcc ccctgcctac tttaaattat 360
tgtacatttt atcagaggag tgtcctatac atcaaattca cataacttag taaaatatgc 420
tgatattctg aattttaaac ttaccagctt agaacatcca ggttagttca gaaacagata 480
atctaaattg gtctcattta taagtcattt tgttattcaa gacatacaat ttggctcttg 540
ataaaagatt atgcagcgcc cgatgattac ctaatattta tcagcaaccc atgtaattta 600
acaatattgt caccatataa aagagaactg aagagaatgt tcaatttgtg gtcatataac 660
ggatatctcc cttggttagg ttcatgaaat acgtgatctt tgttgggatg gaattccata 720
tcgagctgcc tcagaggagc ccattggagt acattggcaa cgtgtaatct tagtaccagc 780
ttgtggcggt ttggtagtca gctttttgaa tgccttccga gccactctgg aggtttcaac 840
tgaaggaagt tggacatcat ctgttaaatc tgtattggaa ccagttttga agacaatggc 900
cgcttgtgtc acattaggaa ctgggaattc cttaggacca gaaggcccta gtgttgaaat 960
tggcacatct gttgccaagg gagttggagc tctgcttgat aaaggtggtc gtagaaagct 1020
gtcactcaag gctgctggat cagctgctgg aatcgcttct ggtttgttcc ccatattatt 1080
cttggttctg aaccatacat ggtacatttt ccttataatt acatgtagcc tgttgtatgc 1140
tttcctcttt cccgggaagc ctttttgtaa atacaagtgt gtttgcactc aaaccaataa 1200
actgtaaaaa aggtgaactc cttaagcaag caaaagcatt agaaatgtaa actagacata 1260
tttctcagat tgagagtctg agagattaga acacgagtgt ttccattaga gagagaaaag 1320
agacttctag atatttctat tatctctgta agagtgaatc cgttcctata caaaaaatag 1380
gccttcatta aatacaagct tgggctgggt actactgggc caaagtaaaa aataaaaaga 1440
atcacccact atcaaatggg cctagtctaa caaccccctt caagctggag ggtgacacaa 1500
cccctagctt gcgaatatga aaatgatgag caggcccaag taacactttg gtaagaacat 1560
caaccacttg agaagcactg gagttgtgaa atagactgat caggccattc ccaagcttgc 1620
cacaaacaaa atgacagtcc agcttaatgt gtttagtgcg ttcatggaaa acttggtttt 1680
ttgcaatgtg gacttcctga ttatcacaaa ataaaggaac aggtaaagaa ggagaaactc 1740
caatatcaga caataatttg gtgagccaag acacctctgc aacagcctta ctcatggacc 1800
tatactcagc ttcaattgat gatagtgaga caacaggttg cttctttgat ttccagctca 1860
ccaagctgcc ccccaagaaa aatacaaaaa ccagtgacag acctgcggct gtctgggcaa 1920
gaagcccaat cactgcacaa taaagctgca aagacaagtc tggagagtta ttgcggaaga 1980
ttccaaagtc aaaagtgccc ttgaggtatc ttagcaagtg cagggcagcc tgcatgttag 2040
gaacacaggg agactgcata aactgactca gatgctgaac aacaaaacta aggtcaggcc 2100
ttgtgcgtat caaaaagttt agcttgtgca ttagactcct gtactcttca ggcctgggca 2160
aaggagtgcc aatcttagct tttaacttca cattcaattc aagggggcaa gtgacagaag 2220
agcaattcga ggaatgaaaa tcagccagca aatcatgaat gaactttttc tgatgaagaa 2280
gaaccccaga atcagtgtat aaaacctcaa tgctaaggaa gtaattaaga gagcccatgt 2340
ccttaatctt gaactggtca ctgagaaagg acttcaaagc agccaattca gctagatcac 2400
acctagtcaa tatgatatca ttcacataga caaccaagat gaccaaggaa tccctagaac 2460
ccttggtaaa aatagagaaa tcattcaagg aacgagagaa gccattagag cacaaggctt 2520
gagataattt agcatactat tgtcttgaag ccagtcttaa accataaaga gacttctgga 2580
gtttgcatac taaaggagca gaagaagagt gaggaacagt taggcccggt ggcagcttca 2640
tgaatacctc ctcatcaagg tccccatgta agaagacatt attcacatct agttgaaaga 2700
ggggccagtg ttgtttaaca gctacaacaa taagagtttt gacaatagac atattgacca 2760
caggagaaaa agtttcatta aagtcaatac cctcaacttg agtgacctag ctttatatct 2820
ctcaatactt tcattagccc tatatttaac cttgtatacc cacttacaac tagtaggttt 2880
cttgccagga ggcaattcaa caatgtccca agttctgttg gcatccaagg cctcaaattc 2940
acatctcatg gctgcctgcc attcaggaac agctgcaacc tgagagtaag aataaggctc 3000
aggaacatga agttgactaa gagaaggagc attagaaata gatctggagg gaggaggaga 3060
agaagtggag gtgcagacat aactcttgag atagttggtt ggattgtgtg gcacggaaga 3120
tcttctcaaa gcaggaggag gtacaagaga gttagaataa tgagaaggag aagagatgga 3180
agtgggaaca gagaagattg agaagcagta gaaggagaaa gtgaaggaga tgaaggagag 3240
gaagaagacg gaaaggaaca ttcatcaaaa caagcagaaa agggaaaggg gaagacttga 3300
ggtactacat gagaggattg aaagaaagga aaaatggtgt tcataaaaaa tgacatcttt 3360
tgatacaaaa caggtgttat tctgaagatt aaggcgcttg tagccctttt tggcaaaagg 3420
gtagccaatg aaaacacaag gaagggacct aggatgaaat ttgttttgtg aggggtggtg 3480
acagttgagt aacagaggca cccaaaagct ctaaggtggt gataagtagg gtggaagaat 3540
gaagcaattc atagggactt ttgtgattaa gaagaggaaa aggaaatctg ttaattaaat 3600
atgtggcagt taaaaagcag tcaccccaaa atttaagtgg tagatgagac tgaaacataa 3660
gtgacctagc agtctctagt aaatttctgt gttctctttc tacaatacca ttttattggg 3720
gggtgtgagg acaggaggtt tggtgtacta tccctttttc tgaaaagaaa aggcaaccag 3780
aagaactaga tcccagttcc aaagcattat cactcctaac agtttgaact ttagattgga 3840
attgggtttc aaccatagca atgaaaacct tgagcaaatc aaaggcattg cggcacccat 3900
taaatgtgtc caagtagccc tagagtagtc atctacaatg gttaaaaaat acctagaacc 3960
attataggta ggagtagaat agggtcacca agtatttatg tgtattagct gaaaaggctg 4020
ggtggagtga atagaactat cagggaagga caacctggtc tgcctcgcta aaggacaaac 4080
cggactagtg aatgaccgtt tggaagacag tttgcaatta agaccagaaa tgcatttcat 4140
tttatagaag ggaatatggc caagtttgta atgccaaaca acatcatctt tattcacatt 4200
atgcaaagca gtactagtat ttacaattgg agtatcatca ggtacagaaa taggagcaga 4260
aactgaatta agcaaacaag aaataaggaa attagaaaga ggtaaaggag atgatgttgg 4320
aggcctggca ttctgaaata gtttgtagag tccattgtcc aatctaccaa gaaccactgg 4380
cttcctcact gaagggccct gtagggtaca agtagccttg gtaaattgta caatatcatc 4440
atcatgggaa agtaatttgt acacaaagat gagattatat tgaaaactag gaatatagag 4500
cacattataa agaatcaagt cagggaacaa ggctaaggaa ccaatattag tgaccttaac 4560
cttataccca ttaggaaggg agacaaggta tggtacagga agtgtttgaa cattaaaaaa 4620
acaaatgttt aagggaggtc atgtggtcag atgcccaggg tctattactc aaactacact 4680
atctatcata gtcagcataa atgcaccata agacaaccct tgtgaggtaa taactcacca 4740
gcaaagttgg tagaagcaag atagttggtt gaagaagtag atgatgctga tgaagacagt 4800
tgagattgtt gaagtaacat tagctgagaa tattggttct tggtaagacc aggaactgga 4860
taggactgtt caggagcaga ggtaccttca ggaccagctg acattgcaga accaccagag 4920
gtatccacct cagcatgggc aacagacctt ctgggaggaa gagatctatt tgacttgaaa 4980
tttggaggaa agccattgag cttatagcac ttatcaatgc tatgtccggg tttcttacaa 5040
tagtagacat gtgaagctca aaagatccct tagaggtagt accggacctt tgaggttcaa 5100
aatttatttt aggagaggga ggaggcctgg atacaccaac actgaaagaa gcagaatttg 5160
aggcatattg agttctagca aaaatttgtc tttgcttctc atcagatagc aaaatcccat 5220
atacattacc aatggaaggt aagggcttca tcatgatgat gttgcttctt gtttggacat 5280
aagtatcatt cagtcccata aagaactggt agaccttttg ttccctgtct tcagcagatt 5340
tacccccaca agtacacatt caaactctcc cggcagacaa agatgcaata tcatcccata 5400
gtcgtttaat tttgttgaaa tatgatgcta tgtccatgga cccttgggaa atatgagcca 5460
gttccttctt tagctcaaag atcctagtac ctctcttcta actcagtcca aatattctta 5520
gcaaactcag agtattcaac actcttggat atttccttgt acatagagtt agtcaaccaa 5580
gagaccacaa ggtcattgca acgttaccac tgtctggcta gaggagaacc ttcaggaggt 5640
ctgtgagaag taccattaat gaaatctagc ttgttacgaa tagacaaggc aactaggaca 5700
ttacgtctcc aattgccata acagcttcca tcaaaaggac cggaaactaa ggaagttccc 5760
agcacgtctg atggatggac atataagggg cgacagggat gggtataatc atcttcatgg 5820
aaaattaggc gtaagggagt agaagaagtc gcatcagcac tggtgttatt atcatttgcc 5880
atttttttca acagattgtc aatcaaccaa cacaatacag atacacatat atagattgtg 5940
agaaagcacg agagaaaaat ctatattatt gatattctat ttaattataa tacaatgagc 6000
cctatttata caatacatat catactccta ttctatgtgg gactaggact aattcatatt 6060
atgtacataa ctatctaaca ctccccctca agccggtgca tacaaatcat atgtaccgaa 6120
cttgttacat atgtaactaa tacaaggacc agtaaggaac ttggtgaaaa tatctgcaaa 6180
ctgatcattt gacttcacaa actttgtagc aatatctcat gagagtatct tttctctgac 6240
gaaatgacaa ttaatctcaa tgtgtttagt tctctcatga aacaccggat ttgatgctat 6300
atgaatggca gcttggttat cacacatcag ttccatcttg ctgacctcac caaatttcaa 6360
ctaattaagt aaatgtttga tccaaactag ctcacaagtt gtcacagcca ttgctcgata 6420
ttctgcttct gcactagacc gagcaaccac attttgtttc ttgctcttcc aagacaccta 6480
attacctcct actaaaacac aatatccaga cgtagaacat ctgtcaaaag gtgatcctgc 6540
ctagccagca tttgagtacc caacaatttg ctcatggcct cgatcttcaa acaataatct 6600
gttacctgga gctgatttta tatatcgaag aatgcagaca actgcatccc aatgactatc 6660
acaaggagaa tccaagaact gacttaccac actcactgga aaggaaatat caggtctaat 6720
cactgtgagg taatttaatt taccaaccag ccgcctatat ctagcaggat cgctaagcgg 6780
ctccccctgt cctggtagaa gtttagaatt ccgatccata ggagtgtcaa taggtctaca 6840
acgtgtcatt cctgtctcct caagaatgtc taaggcatac ttcctttgtg agataacaat 6900
acatgtgcta gactaagcga cctcaatacc tagaaaatac tttaatctgc ccagatcctt 6960
agtctgaaag tgctgaaaga gatgttgttt caacttagta ataccatctt gatcattgcc 7020
ggtaataaca atattatcaa cataaaccac cagataaata ctaagatttg aagaagaatg 7080
ccgataaaac acagagtgat cagcttcact acgagtcatg ccgaactctt gaataactgt 7140
gctgaactta ccaaaccagg ctcgaggaga ctgttttaga ccatagaggg accgacgcaa 7200
ccgacataca aggccactag actccccctg agcaacaaaa ccaggtggtt gctccatata 7260
aacttcacct caaggtcacc acgaagaaaa gcattcttaa tgtccaactg atagagaggc 7320
caatggagaa caacaaccat ggatagaaaa aggcggactg atgctatttt agccacagga 7380
gagaaagtat cactgtaatc aagcccaaat atctgagtat accctttggc aacaagacga 7440
gccttaagtc gatcaacctg gccatctgga ccaactttga ctgcatacac ccaacgacaa 7500
ccaacaataa atttacccga aggaagagga acaaactccc aagtaccact cgtatgtaaa 7560
gcagacatct cgtcaatcat agcctgtcac caccctagat gagacagtgc ttcacctgga 7620
tggaaataga ggacaaagat gatacaaatg cacaataggg tgatgacaga cgatggtaac 7680
ttaaaccgac ataatgggga ttagcattta gtgtagaccg ttcacctttc cggagtgcaa 7740
tcaattgact aagaggagac aagtccgcag tattagcagg atcaggtgca ggacgtgaat 7800
cagctgggcc tgatgctggg cgcggacgac gatgataagt taggagtggt agagctgtag 7860
aaggttgaac tggactaggc agtggaactg aagctatatg tggtggaact ggagctatag 7920
gtggtggagc tggagctgta ggtgaagatg aatgggagat agtgactgaa tctccaaaag 7980
atggaactgg tagcacctca gatatatcta agtgattacc tggactggtg aagtatgatt 8040
gggtttcaaa gaaggtaaca tcagcagaca taaggtacca cctgaggtca ggagaatagc 8100
atcgatatcc cttttgtgtt ctcgagtaac ccaaaaatac gcacttaaga gcacgaggag 8160
ctaatttatc ttttcttgga gtaaggttat gaacaaaaca cgtgctccca aaggcacggg 8220
gtggaagaga gaacaaaggt aagtggggaa acaagacaga gaatggaact tgattctgga 8280
tagctgaaga tggcatacga ttaataagat agcaagatgt aagaactgca tccccccaaa 8340
aacgcaacgg aacgtgagat tgtatgagta aggtacgagc agtttcaata agatgtctat 8400
tctttctttc agctacccga ttttgttggg atgtgtatgg acaagatgtt ttatgaataa 8460
tcccatgaga gttcataaac tgttgaaatg ggaaagacaa atactctaag gcattatcac 8520
tacgaaatat gcggatagaa accccaaatt gattttgaat ttcagcgtgg aaggtctgga 8580
aagtagaaaa caactcagat cgatttttta tcaaaaatat ccaagtgcac ctgtaataat 8640
catcaatgaa actgacaaag tagcggaatc ccaaggtaga actgacctga ctaggacccc 8700
aaacatctga atggactaaa gtaaaaggtg actgactctg ctcgattatc aagacggcga 8760
gggaaatggg agcacgtatg cttaccgagc tgacatgact cacactctag agtggacaag 8820
tgagataaac cagataccat tttttgaagt tttgacaaac tgggatgtcc caaccgttta 8880
tgtaatagat ctggtgaatc agtaacagga caagttgttg aagaaagaca agatgtaagt 8940
ccatgtgatt ttgcaagaat aaggtagtaa aatccattta attcacgccc ggtaccaatg 9000
atccgccctg tactgcgttc ctgtataaaa acaaggtcat caagaaataa aacagagcat 9060
ttaagtgatt tggctaagcg actaacggct atgagattaa aaagactaac gagaacataa 9120
agaactgaat ctaaaggtaa ggaaggaagt ggacttactt ggcttattcc agttgccatg 9180
gtttgagact cgttatccat tgtgactgtt gggagtgatt gagaatatga aatagtaatg 9240
aaaagagatt tgttaccaaa aatatgatca gatgcacctg aatcaatgac ccaagactca 9300
gaggttgaag attgggagac acaagtcaca ctactatctg tttgagcaac ggaagctatc 9360
cctgaagatg tttgtttaca tgttttgaac tgaaggaact caatataatc cggtagagaa 9420
accatccaac tcttcgtagt attggattcc attttgctac aaccaatttc tcaaattctt 9480
gattacaact tgtgtggtta accttggaat gccaaatcag aacacccctt tttttttttt 9540
ggaaaacatt gttcactcgc tggaaaataa aaaaggttgc cggaatttga tgaaacttga 9600
atagaccgac tcggaataat gtcctaagaa ggctgtccaa aaggagtttt gtcagaaact 9660
gaccagaagg aggtccacgc accggcgcgt ggacagatct cgccgaaaaa aaaaatcact 9720
ttggttggcg cgtgatggcg cgtgggtggg gtttttccgg tcgggttttg tggggtttgc 9780
tcccccggag atggagaaca ctgtggtggt gttggtttat gcacaacact ggtaaaaagt 9840
ggttttgatg cgaacagcta ctcaggtcac caaaaaattg cacggtgacg actgatttct 9900
tcccggatgt cgttggaatg acgcacaacg ataattatct caccaatgct ctgataccat 9960
gtgagaaagt acgggagaaa aatctatatt attgatattc tatttaatta taatacaatg 10020
agccctattt ataagactag gattaattca tattatgtac ataactatct aacatagatc 10080
aaataggcat gcaattcaca ataatggtga ataaaatgat acgaagttac ccagctcttt 10140
tcgcgatcga aaaggagaaa atagccttca atcacaaacg agaaagaaga atctccggct 10200
tgacagtaga cgacttcgaa accctagctc gagatgaaaa ccacaaaatc cccaaatcac 10260
attaccaacc aaacaatttg agatcacaaa tgttgaatat gtgagaatcc gactaagaaa 10320
tcaacaaaaa atcaatagaa atggttgaag aataccgact tgaaccctaa atgagtcaga 10380
catcacctag aatgaaatac accttcgaaa ttgacgaaaa caggaccggt tgaaagcgga 10440
gaacgtgcca tagaaggatc tacgctctga taccatgtaa acttgacata cttctcagat 10500
tgagagtctg agagattaga aaacgagtgt ttccattaga aagagagaaa agagacttct 10560
agatatttcg attatctgtg taaaaatgaa tccgttccta tacaaaaatt aggccttcat 10620
taaatacaag attcggccgg gtattactgg cccaaagtaa aatataaaaa gaatcaccca 10680
ctatcaaatg ggcctagtct aacaagaaaa ccaacaaata gtcccccccc ccccccccaa 10740
aagataccac tgaaatgaca ccgggtgccc aaaaataaag cagcttactt cttgactttg 10800
agaggaactg caatccttat cggtttgaga ggaactgcaa tcagctataa gtagcttatt 10860
aatttccagt gcctgcattc tgccaagtac tatgatatat ttctgaagct ttgtttcccc 10920
agttcctttt tcagacgttt gctgtcaata aagttgagcc agccaacttg gctcccacaa 10980
gctactaatt ttgtccaagc ttactctatg ggagaagtta aatttcccaa attccttgag 11040
cggaaaatga aaaatggact caaagtgtca tattatgcaa ctatctaaag aaaaatactc 11100
aattgaagtt tagataagaa aagtgaatgt atattgatgt agtctccgtt aggtgagaag 11160
cgtatcactt acccagcaac atatggacct aacattttac tagtgaagtt ttcacattgt 11220
atcaaaagct caacaaacgg aaaggtgact aatcctaaaa tgttatttca catatatggg 11280
cacacggttt gtcaaccttc tcatacgtgc attatttgtt ctctatcttt ctatttcatc 11340
cgatataacc aatcgttatt gtaaattcta taatgcctgt ggttactttt gtctttagtg 11400
acaaatgaca tttaggataa ccatgtagtt attgacttat ttcacttgag gtctcttcca 11460
attatgtagt agtagagtgt tgagatatgg atatgttacc ttctaaaaaa aagagtgtag 11520
agatgcggat agtttgctag ctggcttttg tctcccttca agttgaatta gcaaaagctt 11580
gtctcataag ttggatagct agacaagaaa aactccaaat tactttatgt agagtattct 11640
taagcttgag tcgcgagttg gaaactggaa ttatgtaaaa aaacctggaa ttatttggtt 11700
gagcctgctt tttagttttg tcaatatttc cagtatctaa cccaacatgt ttagagtgat 11760
tcccggagag cctcagtaca aggcatttgc agagtcttta tgagagtcca ggaaggggca 11820
cacattctgt agaggtatag tcttgtcctt attttcaggg ttgaactagt tctttagaag 11880
ttacctaggc ttcctaattt ccaaatttct gccaggtcct tttttggtga agtacttgaa 11940
gtttaataaa tcaaatttta atttctaaca tatcctgaga aatttattca caaattcaac 12000
tggtgacttc tgatgcagaa acataagcaa ctgcttatgg gttcatatgt tcctgcaatt 12060
ttattgttga catggattgg cttcatatgg ttttgttcct gcaattttat cgctgacact 12120
aatcctttca tatggtttta tgtggagtgt taaatagagg ttaagagaca agaagaggct 12180
gaaaaaggtg ggcagttcat ttgttagtag actactctat ttactaagag atatgatgtc 12240
ccatacatta ctcgaattgg ctccgaatcc agattccact tctttgccga gtttccttat 12300
tgtacatagt tcgactcgtc aagggaaatt cacttccttt gactgaataa tgctagtttg 12360
agtagtacct tacattaaat ggaccattta gttctatcta cttgatagaa tagactggtc 12420
atcaactagt tgcaaataca atgacaactt tgccatgttt gcagagtcac ctgatgaaga 12480
agtacctcaa ttagtagaac atttcttgaa tgttctacag tattctctat gcctacatga 12540
ccacatcact tttccttttg cgttgtgaga acttgaactt ggtgagcggg ggttccccag 12600
gaatggcatc ttgatggcag atgaccattc tgtccttgtc ttagctaatg cttcttgcat 12660
tgcctcacta gatttattat acctttaaaa aatgtttgcc attgttctgc cataatagaa 12720
ggatgtaccc agctggtgct tcaaaactaa tgaaatgctt tacaattgtc gagtcctaaa 12780
ggatgatttg tggaatcaga tctcaaacaa ttctttttga ggaagaaaaa taccaaaggt 12840
tttttctgtt tgttggaaga ttaaaaatcc tttaaatggt aaagatttat gaacttaatt 12900
cagcgttttt gtggccattg ctggaaaaga gaaaaaacaa tggcacttct tcgagtttgc 12960
ttatccaaaa aaaagaagaa gagaatgtca cgtaatgcaa tttcatctta ggaaactttg 13020
caggagaaaa gcaagagtga taaaacagaa ctatttgttt tttttaacaa gttgttgtga 13080
cctatttctt gtcattctta tttgctaata agctaatgta ctatagttcc tgtactatgg 13140
tttgttttga cttaatacgg ggatgttcaa tgagcatttt cttgtttttt ctgctttcag 13200
catctgctgc cttacaggaa ttcattttct ggaaatttac ttcttgttct gctaacattt 13260
tcctgttata tcttgtcagt cattttctct ccatggttat actgtttgtg tcactttaaa 13320
ctctccttgt tttctacttt aaaggattta atgctgctgt cgggggctgt ttctttgctg 13380
tggaatctgt gttatggcca tcacctgcag agtcctcctt gtccttaaca aatacgactt 13440
caatggttat tctcagtgct gttatagctt ctgtagtctc agaaattggt cttggctctg 13500
aacctgcatt tgcggtccca ggatatgatt ttcgtacacc tactggtaat tttggacttc 13560
tttctcgagt ttgattctta aatacaattg tacccgtcac ttacagcaac aactacattt 13620
caacagctag ttggggttgg ctacacagat catcactatc catttcaatt catttagtcc 13680
catttctttc gaatattgag tactttggga ttctataata tcaaggttct ttatattttc 13740
tactttgacg tacaaatctc taaatagatt aaagaagact cctagagaca ctggcctaat 13800
gcaaatgtac caccatgaat aaactttaat ctgaaatagc tggtatctta tataaggacc 13860
cttagcttta attgtgttct atattgatct tttgggacaa cttccttcca atattatgtc 13920
ttacttatac agttatactt atccttaagc cttactcttt agagtggtta tccctaattc 13980
aagcttttgt tggcaccata gctagtttgg ttctaagtaa aaagttactc tttagagtgg 14040
taactttttg tcaattttct tagtgaaaat ataacctctg tgacaaatct accaagtata 14100
aatccaattt ggttctatgt catccttgta gtttatccaa gtcaatgctc catcactctt 14160
acaaaggttc atcgtatgac taatcttttt tggagaaagg taacagtttg tattgataat 14220
aagatcagcg ccaggttggt cattagtgct aatagctgta cgtacaactc caaaagagca 14280
aaagacaagc acctgatgta aggtaaatta caagctgcct ataaaatcta tcaggtgtcc 14340
tatctcacta aacatttctt gtttacacca aaaaaataaa acaaggaaag acaatccatc 14400
ttaatcttct gaatggagtt tctttttcct tcaaaacatc tggagttcct tccgttccat 14460
gcaatccacc atatacaagc tgggatgatt ttccatttgt ctttatccat ttcttctacc 14520
aattcccttc caattgatta gaagttccaa tgtggttcta gatatgaccc aattaactcc 14580
caacagataa aagaagatgt gccacggatt tgtagtgatt ctgcaatgta ggaacaagtg 14640
agcattactt tctacttcct gtccacaaag aaaacatctt gagcaaatct ggaaacctct 14700
tctttgtaag ttatcatgtg ttaaacatgc ctttttcacc accaaccaga caaaacatga 14760
tactttggga ggagttttaa ccctccaaat gtgtttccaa ggccacacct cagttgttga 14820
aacattagga tgtagagtcc agtatgctct tttactgaaa atgcaccttt tctattcagc 14880
ttttaaacta ctttatctat ggtctgtgat gtacccttga aaggttcaag agtttggagg 14940
aagatagaaa ctctgtttat ctcccaatca tccaaagatc ttctaaagtt ccagctccat 15000
ccttgtgagc tccagactga cttaccaatg cttggctttg aagacttaga gagaataagt 15060
caggaaaata tctttcaacc ttccttgccc tatccggtga tcttcccaaa aagatgtctg 15120
caacccattg ccaatattga tcttgatatt gctactgaaa gatttctttt ggtggcagga 15180
ttactctcat taacaatgta cttgacaatc tccatacata ctaatgtctc tttaccctct 15240
tgccattaag gttgtaaaga gacttgtcaa attaagaaaa ggtttcctat ggaactgttt 15300
caaggaagga acctcctttc ctttggtcaa gtggagttaa gtcatataat ctaggaagtg 15360
gaggcttggg tatgaaatag ctgcaaatac agaaaaggag catcttattt aaatgatcac 15420
ggaaatgtgc ccaaaacttt aaatatctgc acagcatatg gttgtagcaa aatttgaatc 15480
ttcctgtcaa tggtgctcat gtccagtgaa tacccctgat ggtgaaagtg tcctgaaggg 15540
aagcaggaac ttattggaag aattggcatc taacactcag cttttcggtg ggtcatagcc 15600
cattgaaaat tgagtgccca gatttatata gttttgctct aaactgacga tgcagttgca 15660
caacatacga caaactaagg tgggacatca tcttcttcgg aaggaatttt gaggattaag 15720
agatagagtg gttgattcag ttgcaaatga agcttcaagg gttcaatatc atccaggaga 15780
caccggattc tgatagataa aacaacagaa agatgagcac tactttgtta ggcttgttac 15840
aagttgctat cgtctttctt atctcggtac acaatttaga tttgggaact tagttggaaa 15900
agcagagtgg ttgtttttgt gaatagcatc agacaaagct tctgagctgg tacgacagaa 15960
aactcaacag ggagaataga agactgtggt tcacaatttc tgcatgcatc ttgtaggtta 16020
tttggtgggt aaattattta atgttttgaa gggaaggtag aacatgttca taggcttaga 16080
ttcaaatgtt tgtatttttt tggctctttg gtgagagatg ctgaacgtaa atgacatagg 16140
cagctgacta taatttctca gctccttgct ttttaaattg acaggcactg atatgtacat 16200
gtgaacatcc aacacttttg tggtgccgtt ccgatgaata aagaacatta atcacttact 16260
gatcaggagt aatagtttag gagttctaga atttttgtac ataaaatgaa ccaaaaagaa 16320
gatcggaatg agaacatgtt tctttttttg ttttttcttt ttcgtgaaaa cttcaataac 16380
acttctgata gaatagctag gtccatttga attcctttgg agacccttac acaaccaatg 16440
aatgacaagt atagcatttc taactccctc ccacacgtat aacccagatt ttagggttta 16500
gatgtggatc tgatttgacc ttattgcctt tttttgtttt tgttcttttt gaagtagaga 16560
gtgaggaggc tcaacaatta attcggctca acgggctaat gattggactt acatgctacg 16620
acaatgttag gagagagaga gagagagaga agcccagagc agttacatga gttaagaaag 16680
agaagtccaa agcgatagaa tatgaagaga gaaagcggtt gtgctaacag gctccctgaa 16740
gtttggctct gagcatccaa ctcaaaacct taaggcaatg agtagagtag cccaggacca 16800
tttaaattgc tgttgaaaac cttacacaac caataaggga acaagtgtaa cattctctta 16860
caaccctacc gtcttataag tcagtgctct aatttagcat aaaatcaaag tgaggcgatc 16920
tacaatgaaa tgaagtaaat aactgataaa tacaaagaat gttaattctc caatatagcc 16980
tgaatgttcc cagaacaaaa taaactagtc tcaggattta tcattaacat gatgttcctc 17040
ttattttgag tgattaggaa ggttaatcaa ggtataaatt ctttctaatt tgtatcgtct 17100
agaattattt atctaacaaa ttttcagatt accggttcaa aagaggaata tattttgcat 17160
acaacgttac cataccttac aaaagggaga tgaacatttt tttattttat tattgtcctt 17220
tttttcaatt agggattatg cagtcttcct ccacgtgata ttactcttag aatcacgttt 17280
ttgtcattgc tattacttaa tgtggtaagt acaaatgtgt tttgaactct ttttggtatg 17340
taatattgag ttaatttttg gtttccattt cagagctgcc gctttatctt ctgctgggca 17400
tcttttgtgg cttagtttca gtggcattat caagttgtac atcatttatg ctgcaaatag 17460
tggaaaatat tcaaacgacc agcggcatgc caaaagcagc ttttcctgtc ctgggtggtc 17520
ttctggttgg gctggtagct ttagcatatc ctgaaatcct ttaccagggt tttgagaatg 17580
ttaatatttt gctagaatct cgcccactag tgaaaggcct ctccgctgat ctgttgctcc 17640
agcttgtagc tgtcaaaata gtaacaactt cattatgtcg agcctctgga ttggttggag 17700
gctactatgc accatctcta ttcatcggtg ctgctactgg aactgcatat gggaaaattg 17760
ttagctacat tatctctcat gctgatccaa tctttcatct ttccatcttg gaagttgcat 17820
ccccacaagc atatggcctg gtatgaattt gtcttttgtt agaagtagca ttacatatct 17880
ggataagtga gttttttatt attgaaaagt aataacagga gagcaagaga atatagcacc 17940
caaatctact tctttcctct cttctattct tctgaaattc aaggtccttt aactcctcca 18000
cggcctgtct agttattgat cctgtagact taattcacat aggtttagga cattcaagtt 18060
tatccaaact tcgtgaaaag gtttctaatt tttttacatt acagtatgag tcgtgtctac 18120
ttgagaaaca tatcactcca tgtttctata gagtctgttt tctcctcagt ttattttgat 18180
atatggggtc ctattaagac agttcaacct tggattttca ttatttttgt tgtttcattg 18240
ataattattc aagatgtact tggattttct taacaagaga tagttctcag ttgttttttg 18300
tgttcctaag tttttgtgct gcaatacaaa attagtttga tgtctctatt tgcatttttc 18360
ccaatgataa tgccttagaa tattttcttc tcggtttcag tagcttatga tttctttaga 18420
aactctctat cagaaatctc aactgagata gatgagagga agaataagca tatcattgag 18480
acggctcgta cccttctcat tcagtcccct gtcaagctta gtttcttggg cgatgcagtt 18540
tcacgtcctt tgattagatt aattggatgc ctcatctgct atccaaaatc agattcaact 18600
ttcgatattg tttcctcgct tacctttata ctctctttcc ctcgagtctt tgggagcaca 18660
tgttttgttc aataacatag ctcctggaaa gtgaccagcg caaccgacaa gcaaggcctt 18720
cttaatatag aaggagggca tatgctattc tagccacgag ggagaaagta atattgtaat 18780
caaacccaaa tatctgagta taacctttgg caatggcgat caatttgatt atatggacca 18840
actttgccta catataccca ccgatagatt tacggggagg tagagaaata agctcccaag 18900
taccactaat atgtaaagca gacatctctt tgatcatagc ctgtccttgt ggacataggg 18960
atagaaattg aggactaaga tgacacaaaa gcataatgct gtgatgataa acgatgataa 19020
ctcaaatcaa tatgatgggg atgggaatta agagtggatt gaatatcttt gcggaatgtg 19080
attggtagac taggaggaga caagtccgca ataggtaaaa gatccagtac atggaatgaa 19140
tcttctggac atgatgttgg actgacgtca atgataagtc aagagtggtg gagttgcaga 19200
acatggaact ggagctgtag gtgacataat cgaagttgta gggggtggag ctatagagga 19260
aggtgaagga gagatagtga ctgaatctcc aaaatatgaa accggtaata cctcaaaaaa 19320
tgtctaagag atcatttgga cctatgaagt atggttgcgt tttaaagaag gtaacatcag 19380
cagacataag gtaccgcgga aagtcaggtg aataacattg atatccttgt tgcgtcctcg 19440
agtaacttag aaatacatat ttgagagcac ggggagctaa cttatctttt ctggagtaag 19500
gttataaaaa aacacatgct cccatagaca cgaggtggaa gagagaaagg tgagtgggga 19560
aacaagacag agtatgaaac ttgattcttg atagttgaag atggcataca attaataaga 19620
caataggatg tgagaactgt atccccacgt aaacacaaca gaacatgaga ttgtacgagt 19680
tgggtatgag cagtctcaat gagataccta ttcttccttt cagctatccc attttattga 19740
gatgtgtatg gacaaaatat ttgatgtatg atcctatgag agttcatgaa ctgctgaaat 19800
ggagaagaca aatactctgg ggcattatca ctatgaaatg tgcggttaga aaccccaaat 19860
tgattttgga tttcagagtg aaaggtctga aaaatagaga ccaactcaga ttgatttttc 19920
atgagaaata tccaagtgga cttggaataa tcatcaatga aactgacaaa gtagcagaat 19980
tccaaggtag aactaactcg acaaggacct caaacatctg aatggactaa agtgaaaggt 20040
gactctattc gattatcaag acaccgagga aaatgagagc gagtatgcct tctgagcgga 20100
tatgactgac gctctagagt ggacaagtga gacaaaccag gtaccatttt ctgaagttct 20160
gataaattgg gatgtcctaa ccgtttatgt aataaatctg gtggatcagt aaaaggacaa 20220
gctgtaaggg gacaaaaata ccaaatattt ccagaagatg gcaaactaca acagaagaag 20280
caactacatt aacaggctca ggatatgtga tgaaatgagg acaaagagtt gatcaagaag 20340
gagattctgg aattctacca gaacttatat agtgaaaatg aaccgtggag gcccagtgca 20400
aattttgaag gcatctcctc actaagcata gaagagaaga actagttgga agctccattt 20460
gaagaaatag aggtgcttga agctttgaaa tcatgtgccc ctgataaagc accaggtcca 20520
gacggcttca ccatggcttt ctttcagaaa aattgggata ctcttaaaat ggacatcatg 20580
gccgcactta atcactttca ccagagctgt cacatggtta gggcttgcaa tgccaccttc 20640
atcgccttaa ttccaaagaa aaagggtgct atggagctca gagactacag atctattgac 20700
aaactagtct cgggggaaca aaatgctttc atcaagaaca ggcacatcac tgatgcttcc 20760
ttgattgcca gtgaagtgct ggattggaga atgaaaagtg gaaaaccagg cgtgttgtgc 20820
aaactggaca ttgaaaaggc ttttgatcaa ttaagatggt cttacctcat gagtatcttg 20880
aggcagatgg ctttggggag aaatggataa gatggataaa ctattgcatt tcaactgtca 20940
agaactctgt tttggtgaat agtggcccga ccggtttttt ctcctgccaa aagggcctaa 21000
ggcaggggat ctcctctccc ctttcctatt cattttggcg atggaaggac tcactaaaat 21060
gttggagaag gctaagcaac tacaatggat acaaggcttt caggtgggaa ggaatcctgc 21120
cagctcagtt acagtatccc atctactctt tgcggatgat actcttattt tttgtggtac 21180
tgagagatca caagcacgaa atctcaacct gacgctgatg atcttcgagg cactatcagg 21240
actccacaac aatatgataa agagcatcat ataccctgtg aatgcagtcc ccaacataca 21300
ggagctagca gacatcctat gctgcaaaac agatactttc ccaacatatc ttggacttcc 21360
cttgggagct aaattcaaat caaaagaagt ttggaatgga gtcctagaga agtttgaaaa 21420
gaggcttgcg acttggcgaa tgcaatacct ctccatcggt ggcaagttaa ctttaatcaa 21480
tagtgtactg gacagtcttc ctacatacca catgtctttg ttcccaattc caatctcagt 21540
cctaaagcag atggacaaac tcagaaggaa gttcttacgg gaaggatgca gcaaaacaca 21600
caaatttcca ctagtgaaat gactcaaggt aactcaacca aaattcaaag gaggcttgag 21660
catcagggat ctacaagcac acaacaaagc tatgctctta aaatggctct ggagatatgg 21720
acaggaggaa tctaggctat ggaaggacat catagttgct aaatatggag cacacaatca 21780
ctggtgttcc aagaaaacaa acactcctta tggagttggt ctgtggaaga acatcagcaa 21840
ccactgggat gaattcttcc aaaatgtaac tttcaaagtt gggaatggaa ctcgtattaa 21900
gttttggaag gatagatggc tcggaaatac acctttgaaa gacatgtttc ccggtatgta 21960
tcagattgcc ttgaccaaag actccactgt tgctcaaaat agagacaatg gcacttggtg 22020
cccattttca gaagaaattt gcaggattgg gaggtcaaca gcctactcac aatgttaagc 22080
tccctagaag gtcataatat cgaagatcaa cagcctgaca aacttatttg gggaaattct 22140
gagagaggca agtacacagt caaagaatga tacattcacc tctgtgacca gaatccaata 22200
atagataact agccatggaa acacatctgg agaactgaag tgcctaccaa ggtgacttgc 22260
ttcacatggt tgactctaaa tggggcatgt ctcactcaag acaacttaat caagaggaat 22320
atcatactag ttaatagatg ctacatgtgc caacaacagt cagaaagtgt aaaccaccta 22380
ttcctccact gctcagttgc aaaagacatt tggaacttct tctacactac ctttggtctg 22440
aaatgggtta tgccacaatc aacaaagcaa gcttttgaaa gttggtattt ttggagagtt 22500
gacaaatcca tcaaaaaaat ctggaaaacg gtgccggctg catttttttg gtgtatttgg 22560
aaagaaagga accgaagatg ttttgatgac atattaactc cactctactc cctcaaggct 22620
gcgtgtttag ttaacttatt tagttttgtg gattttatta gctccctgat agtagcatag 22680
gcttttgtaa atggagctaa ttatcctatc tcttttgtac tctttgcatc ttcttgatgc 22740
cttttaatga atctaattta cttcataaaa aataaaagga caagttgttg aaggaggaaa 22800
agatgtgagt ccatgtgatt tagcaaggat aaggtactaa agtccatttg attcacgccc 22860
ggtaccaatg atccatcccg cattgcattc ctgtattaaa acagagtcat caagaaataa 22920
aatagagcaa ataagtgatt ggccaaacga ctagtggata tgagattaaa aggactatcg 22980
ggaacataaa gaactgaatt caaaggtaag gaaggaagtg gactagctta acctattcca 23040
gttgccatgg tttgagaata gttggccatt gtgactgttg gaagtgattg agagtaagaa 23100
atagtagtga aaagagattt gttaccagaa atataatcag atgcaactga atcaataacc 23160
taagagtcgg aaaaagaaac acaagtcatg ttattacctg tttgaacaat agaagttatc 23220
tccgaagagg attatttaca tgttttgtac tgatggaact caatataagc cgataaagaa 23280
accatccgga tattcaaagt attggatcaa cagcttataa gccaaaagca tccgatacga 23340
gtgccattat aatggatcaa gagagatcaa acaacaaatc accaaatatc ataaacaacc 23400
aagaatctcg ctggaatgtg aacaaagatt gaaaaacaac aatgtagctc gccaaaaatg 23460
tgcaaagtga tcgaaaaata ttgaatcgtg agtggagaga aataggagct tcaatcgacc 23520
cacacagtac caaaaaatcc aaaaacggtt gtcggagctc aagaaagttg tcaaaaagta 23580
tattgtatgc ttcgaaagta gccgaaaaag gttggaagtg ggatgtgtca actccgaatt 23640
atgatacgag caccacagaa gatcaatttg tgtcaaaact accgaaaaaa atacttcaca 23700
ccccgacgcg tggagtactc gctcgttgga acccttgctg ccaacgtcgc atgtaggatc 23760
agttttcgaa gaatcttatt ggggtttggt cgccggacga tgtcggatct tgtggtgccg 23820
ttggaattcg cacaaccctg aaggaaaaga aggttacaca aatcagatct gaaagtcacc 23880
gaaaagacac atggcgattg acttttttgt ctcagatgtt tctcaccgtc gctctgatac 23940
cagttgttgg gctcaactcg tttgaagata ctcttaacat agtgtgatat tgtccctttt 24000
ggaatgtgag tcatcttagc tcggtaagca tactcgctct tccaactagc ccgaagatac 24060
ttttaacaga gtgtaatatt atctgctttg agccaagctg gcgcggtttt catcaaaaga 24120
cctcatacta ttaaaagatc catacacctt atatgtaggc ttctaagttg ctcggacacg 24180
ggtgcgagta cccgacacag gtgcaaatct agaggtcaga tcctttaaaa tgtaaattct 24240
aagatttggg gatacgaatc ctagtacgga tacgggtgcg aggatccgat taaaaataat 24300
tcaaaaaaat aagaaaataa aaaagtctct aaattatgtg aaattttgtg gaataactac 24360
gtatagcttg taaagtgtgg atttattttt tattctcaag ttgtagataa gtaaatgatt 24420
gatttcctag ataaggtatg ttattttctt caaatttacc ctagtttggt tcgaatttcg 24480
ggaaattgta tcttgtctcg aatttttcct tctgtcctga ttaaactact caaaatcgtc 24540
tgaccagatc cggtacggat cccataccca catccacact agtgtcgtgt ggacaagggt 24600
gcggcaccta aacttccgtg taggagcaat ttaggtaggc tcctaatctt ttcagctatt 24660
aatgtgggac ttttacgcac ctctatcaaa ttccccaata aactaagttt cacgtggtcc 24720
atcatcgcaa tccacgggtc tcttcctcta gttaagtccc acatggccca ttaccatgat 24780
ccacgggtca attttcgtga ttcatcgtgt gccacccaca tcgttagtat ttatggtaac 24840
taaagtacgc aactagcttt tgcttgtgag cgtgtctcca agctcgtaaa ggtaagaaaa 24900
ccgagccgca tattccatca ctctatcatc accatactcg tcccgcgaaa cttgtaagat 24960
aaaggtggct ggttggtcag ttgaactacc tcagagtgac ttggtatagt atttcctttc 25020
ttgtgaatat ttaactcaat tatggactct ctgtgtgata gtcattgaga gccattttct 25080
atatagccgg tgcacacaaa tcatatgtac caagcttgtt atatatgtaa ctaatacgag 25140
gaccagtgaa ggactcggtg aaaatatctg caatctggtc attcgacata caaggccaat 25200
agactcccca gcaataaaat cagggggttg ctgataaata gaattggccg aaatgttgcc 25260
agaaaaattt gaaaatagtg agactaagcc gaattctaca ctacaaaata ggttttaaaa 25320
cacaaccaga aaacaaaaac ttttttggaa attactgttc acatcgaaaa aataaaagtt 25380
gtcagaattt gatgtaattt atatggatag gctcgtaatc actggacgag taagttgtcc 25440
tgaagaagtt ttgtcaaaag gtggccggaa tggctcacac atgccggaaa acttattgta 25500
gctcgccgga accctagttc tggcggtgcg tagaggcgtg tgactttctg ccagactgat 25560
tgactgtggt ttgtcgcctg acttttccta acaagatggt agtattggtt ttcgcacaac 25620
aattaccgat gaggagataa cgcaaatcaa tcttgagtcg tcaatcggaa agacgcacgg 25680
tggctgactt tctatttaga tgggactgga atttctggag tttaatcgca caagcgtttt 25740
ggatctgatg gtaatactgg tatgcacagt accactgtag cagtgatgaa ccctcaaaat 25800
aagacaaagt tgccagaaaa ttgcacggcg atgagatctt tcttccggat gtcaccggaa 25860
tgacgcacaa cgataatttc tcactgaagc tctgacacca tgtgagaata cacgggagaa 25920
aaatctattt ttattaacaa tgatacaatg agccctatat ataatacata ttctactcta 25980
ctacatatgg gaatagggca tattttactc ctactacata tgagactagg actatttaca 26040
cataactatc taacaagggc tatatctcag atttatgaga atatctaccc aacgacccag 26100
agagacgagc ctaatcattt tgcagtggca cagactataa caacaaaaaa cctactcata 26160
atggttaaac caactgatta agatgcttac aggactatct tgagaaatgt acatattata 26220
tagatgcttg agttgcgtcc caatcctaaa tagaagcttt tattcgtaag caagaaggga 26280
agcagcttta cttgagccaa tagctttcaa ggtgcatgtt gtcacaccaa ggacatccag 26340
aatttgattt tatagtggga atatcgttta aagataaaaa agatagcgtg cagaagattg 26400
catacattag agatgcaaaa tacggaatac ccatactccc agataatgca gtatgccttt 26460
tgcatgacct actggttgaa tggaagcacc tggtgaattt actaggtgtg ttagtgattt 26520
ctgctgcttc cttccccttt ctaaactgca tactatctaa aatgttaggg gggcagaagc 26580
ccagtcaatc tgactaggtg atgttagtgg tttccgcttc ttcctcccac ttctaaatgc 26640
gtactttctc aaatttagga gcatagaaac ttaagcagct gcctacctga ggagttgcat 26700
gggaacataa gagaatagac tttacctgtc atattttcca taccttagtt aattacagtg 26760
ttatcctgat aatgatctgt tttctggatc taggctgaat cgagattcaa tcgcttttgg 26820
ttgaaaggat gctgctacag atccttagtt tacatcattt tggttcttat tctataagta 26880
cttcccctat caactacttc cttctttttt cttaggttat ttgcctcttt aggttgtttg 26940
gaaggaaagg aacagtagat gttttgatgg aatagcaact ccaaaccact tccttaaggc 27000
taatatcctg attggccaag tttctccaaa gtccaaaaca cttttttttt ccttcaaaaa 27060
agtacctttt tttttcaaag ttgaggtgtt tggccaagct tttggaagga aaaaaagtgt 27120
ttttgagtag aagcagatgc tcttgagaag cagaagaagt agcttcttcc cggaagcact 27180
tttgagaaaa ataaatttag aaacactttt taaaagcttg gccaaacact aattgctgct 27240
taaaagtatt ttcagattta ttagacaaac acaaactgct tctcaccaaa aatacttttt 27300
tgaaaagtac ttttcaaaca aagcactttt caaaataagt tttttagaag cttggctaaa 27360
caggctataa atgtctttta tttttacagc tggagtaccc taacacctgt aaattcccct 27420
atacattttt ttcgactttg gtagctcatt aaccctagta taggactctt tgttttggag 27480
ctagcaaact cttttgtttt cctatttttg catcttcttg gtgccattta taatatctct 27540
tcaccaaaaa aaaaaagttc ccaaactatg actaccttga gttggtcaaa gcataaccaa 27600
agcatgggca caccagtgtt tgcgtgaatt ttatggatgt tccttacctt tatccttctg 27660
tgcttatgta gcatctgtct tggtcaatct tttctgaagt ctatattgta tttctgtgtt 27720
gcaacatgag tttactgtta atcttactgt ttgacctcaa ttttgggttc tttttgattt 27780
tggaagacat cgtttaacag gttggcatgg ctgctactct tgctggtgtc tgtcaggtgc 27840
ctctcactgc ggttttgctt ctctttgaac tgacacagga ttatcggata gttctgcccc 27900
tcttgggagc tgtggggttg tcttcttggg ttacatctgg acaaacaagg aaaagtgtag 27960
tgaaggatag agaaaaacta aaagatgcaa gagcccacat gatgcagcga caaggaactt 28020
ctttctccaa catttctagt ttaacttatt cttcaggttc accttcacag aaagagagta 28080
acctctgcaa acttgagagt tccctctgtc tttatgaatc tgatgatgaa gaaaatgatt 28140
tggcaaggac aattctagtt tcacaggcaa tgagaacacg atatgtgaca gttctaatga 28200
gcaccttgct aatggagacc atatccctca tgctagctga gaagcaatct tgtgcaataa 28260
tagttgatga aaataatttt ctcattggtc tgctgacact tggtgatatc cagaattaca 28320
gcaagttgcc aagaacagag ggcaatttcc aggaggtagc ttcttggtac atttcaatat 28380
tcttaactga tgaaaaaata agggaaattg atctagcatg aaatgaagct aattataagt 28440
tttacacagt agaactggta aaacagggtt ggctggatat ttctttgttg aatttttagg 28500
attatatata ttgttttagt tttgtaggtt gttttctgat gtgctttttg actcggcaga 28560
atcttaagat gaaatggaag gttgtatcat caaatgttaa ataagggaat atgtgacttt 28620
caaagttaag cacggagtat tttggagtca atagttactt cctgaatctt ttaggatgga 28680
ggagacagtt tctataggaa taggaaaagg ggacctgatt tcattatttg tgtgtatata 28740
catttgttat ctgaattcgc attactttct aacaaccaac aaaaggaaag tggacattca 28800
atttgagccg gagggagaaa atttaactag aaaatgacct ggccgtgaaa taaaattatt 28860
gatccgtcct ttaactagtt ttcatggatt gcctccttgc ggatgatttt tccaaccggt 28920
agaactactg ttagtcgtcc aaattctgac cccctactat gaataaaaat gtattagtaa 28980
gtttagtggg taatctcctt gagaaataaa ggaacaggag aaatatttta ttgatatatg 29040
ctaagtgttt tacaatagcc ctatttatat acaatgttta cataaaccta aagccttcta 29100
tataaatgtg ggacactata catgaactaa ctctaacact atccctcaag ctagtgcata 29160
taaattatat atatgcttgt tacatatata attaatttct ctactttttg gtatacttct 29220
tgtatacggg agttatctcc cttttgatta atacaattta ccttatcaaa aaaaaattaa 29280
tacgaggacc agtgagggac ttggtgaaaa tatctgcaag ttgatcattt gacttctcaa 29340
actttgtaac aatatctcct gagaatcttc tctctcgtga agtgacagtc aatctcagtg 29400
tgtttggtcc tctcatggaa cactggattt gatgcaatat gaaggacaac ttgattatca 29460
cacacaagtt ccatctgact gattgctcca aattttaatt atttgagcaa ttgtttgatc 29520
caaactagct cacatggtgc aagagtcatg actcgatatt cggcttctgc gctagatcga 29580
gcaactacat tctgtttctt gcttttccga gagacaaatt acctcctatt aaaacacaat 29640
atccagatac gtaacgtcta tcagaaggtg accctgccca attagcatct gtgcgtccaa 29700
caatatgctc atggcatcga tcttcgaata ttagtcattt gtctggagct gattttatat 29760
aacgaacaat gcgaacaact gcatcccaat gactatcgca aggaaattcc ataaactgac 29820
ttacaacact cacaggaaat aaaatatcag gtctagtaat tatgaggtaa ttcaattttc 29880
caaccaggcg cctatatttt gcaggattgc taagaggctc ccccctatcc tggcagaagc 29940
ttagcattcg gattcataag agtatcaata gttctgcagc ccattattca tgtctcctca 30000
agaatgtcta aagcatactt cctttgcgaa ataacaacct gaactagacc gagcgacctc 30060
aatacctaca aagtacttca atctgctaag gtcgttagtc tggaagtgtt gaaagtgatg 30120
ttgtttcaaa ttagtaatac catcctgatc attgcgagta ataacaatat catcaacata 30180
aaccaccaga taaatacaga gattaggagc agaatgccga taaaatacag agtgatcagc 30240
ttcactatta gtcatgccaa attcccgaat aattgtcctg aacttacgaa actaggctcg 30300
acgagattgt tttaaaccat agagacttgc ataagtgaca tacaatacct ctagactccc 30360
cttgagcaac aaaaccaagt ggttgctcca tattaacttt atcctcaaga tcaccatgga 30420
gaaaggcatt ctttatgtcc aactgataaa gaggccaatg atgaacaata gccatggaca 30480
ggaaaaggcg aacagatacg actttagcca cgggagaaaa gtgtcattat tatcaagccc 30540
aaatagctga gtatatcctt ttgcaatcag acgagccttg agccaatcaa cctggccatc 30600
caggtagact ttgactgcat aaacccaacg acaaccaaca gtagacttac ttgaaggaag 30660
agaacaaact cccatgtacc actcactcac atgtaaagca aacatctcgt caatcatagc 30720
ctgtcgccat cctggatgag atagtgcctc acctgtaaac ttaggaatgg aaacagtgga 30780
caaagatgat acaaaatcat aatagggtga tgagatgcgg tgataactta aaccaacata 30840
atggggacta ggattaagtt tggatcatac accctttcga agtgcaatca gtggactagg 30900
aggagccaag tccgcactag acgtggatga caatgataag tcaagagtgg tggcctcgtg 30960
gttggagatg taggatgagc aactgtagac tcctcagaag tcggtatagg taggagtacc 31020
tgtgatgttg atgtggattt aagaggagga acaatagatt cctcacaagt agatacaggt 31080
aagacctcag atatatcaag atgattagat gaagtaaagt aaggttgaga ctcaaaaaat 31140
gtgacatcga ctgacataag atatctacga agatcaggtg agtagcagcg ataccccttt 31200
tgaacccgag aatagccaag aaagacacac ctgagaacac aaggagctat tttatctttt 31260
tcaggagcta agttatgaac aaatgtactc cttaaaacac taggaggaaa gagtataaag 31320
atgacctagg gaacaatact gagtgtggaa actgattcta gatggaagat gaaggcatcc 31380
gattaattaa gtaacaggtt gtaagaactg catcgtccca aaaacgttgt ggaacatagg 31440
actgaatgag aagtgtgcga gcagttttaa tgagatacct attctttctc tctactaccc 31500
tataatgttg aggagtatac agacatagga taatattttg agaagtcata aactattgaa 31560
actaagagaa tacatatttt aaggcattat cactacgaaa agcgaataaa aacaccaagc 31620
ggagttttaa tttcagcata aaaactctag aatattgaaa acaactcaaa acgatctttc 31680
atttggaaaa tccaaataca tcttgagtaa tcattaatga aactaacaaa atccaaatct 31740
taaggttgtg actctactaa gaccccatat atcataatga actaaagaca aaacagactc 31800
tacacgactc ttagcacgac gtgaaaatgt agctcgaata tatttcccaa gttgacacga 31860
atcacaatct aatgtggaca aaccagacac catcttctga agcttggata aactcggatg 31920
tcctaaacgt ttgtgaatta ggtctagagg atctgtagtt ggacatgttg tagagggatt 31980
gagtgagtta agatagtcaa ggtcttgtga ttcacgccat gtgccaatcg tctgtaccgt 32040
actgcggtcc tgcatagtaa aagaatcatc aataaaatat atatcacaat ggaattcacg 32100
agtcaaatga ctaacagatg cgagattaaa ggacaaccgg ggacataaaa aatagaatct 32160
aaagtgacag aggacatgtg attagcttgt ccaactcctt ttgcttttgt ttagacttca 32220
tttgctaaag tatcattggg aagagattgt gaataaacaa ttatttgaca aaagtgacat 32280
attaccactg gggtatcaag ttgcttagtc atactaagaa tgtttgggag agggtggtgg 32340
aagtgagggt aaggaggaca gtgtctctat ccgagaacca gttcggattc atgcatgatc 32400
gttcaactgc ggaagctatc cgtcttatta ggaggctggt ggaacagtac aaggatagga 32460
agaaggattt gcacatgatg tttacctaga gtaagcgtat gacaaggtcc ctaaggaggt 32520
tccttggaga tgtcagaagg ttaaaggtgt tccggtagca tatactaggg tgatgaagga 32580
catgtatgat ggagctaaga ctcgggttag gacaatggaa agagactcta agcattgttt 32640
ggttgttatg gggttacagt aaggatctac gctcaaaccg ttcttatttg ccttggcgat 32700
ggacgcatta acgtaccata ttcagggaga tgtgccatgg tgtatgttat tcgcggatga 32760
tatagttctg attgatgaga cgcgaggcgg tgttaacgag aggttggggg tttggagaca 32820
gacccttgaa tttaaaggtt tcaagttgag caggactaag acagaatact tggaatgtaa 32880
gttcagcgac gtgacggagg aagctgacat ggacgcgagg cttgattcat aagtcatccc 32940
caagagagga agtttcaagt atcttgagtc agttatacag ggagaagatg gggagattga 33000
caaggatgtc acgcaccgta ttaagggcgg ggtggatgaa atggaggtta gcattcggta 33060
tcttttgtca caagaatgtg ccaccaaaac ttaaaggtaa gttctataga gcggtggtta 33120
gaccaaccat gttgtatggg gcagagtgtt ggccagtcaa gaattctcat atctagaaga 33180
tgaaagtagc agaaatgaga atgttgagac ggatatgcgg gcatactacg ttggaagatt 33240
aagaatgaaa atatttgggt gaaggtgggc gtggccccat ggaagttgtg cccaccatta 33300
aagactgcta tctgaaaact aattctttgg gcccaaacat tctggcccaa agtacctcgt 33360
gaataataat attgagctca tgtctgacat gttggaagag gagttactag caaacactta 33420
tacacctatg ttggtaacac aattgaagaa ctacgaaaaa cactcttctg caaaggaaaa 33480
tgagaagaag aagaagaaga agacgaagaa gaaggatgat gcaatgatca ttgaagaaaa 33540
aggagagcag gaggacccat ctaaacttac aaagtctaga ggaagaggag gacccagagt 33600
ttgatgcttc cctctgggta caccaaaaca tcgtcaaact taggcaagga gtttggggta 33660
aacattcagg ggtgtgagaa ggaagctttg gagcttttcg taaaattaca actagaggca 33720
taaaaaaaaa aaaggcaatc caggcatgga ggtgacaacc ttcgaaaaga aagggattca 33780
aagaactgaa agggctggat ttttggagta acttcaagag taatagaaca agaagtaggg 33840
ggttgcatta ttatcaaaga tcaatgaaga ttaacattga agaagtggga aatccaaaaa 33900
gactccaccg agaaggatga tgcaatgatc attgaagaaa aaggagagca tgagaaaaaa 33960
cccgtagaaa ttgacagcac tcacacacaa taagacgaga taataaagta gtgagttggc 34020
caattgaaga agctttacct cttaacttac aaagtctaga ggaagaggag gacccagagt 34080
ttgatgcttc cctctgggta caccaaaaca tcgtcaaact taggcaagga gtttggggta 34140
aactttcagg ggtgtgagaa ggatgttttg gagcttttca taaaattata acaagaggca 34200
tgggaaaaaa aaggaaatcc aggcatgcag gtgacaaaac cttccaaaag aaagggactg 34260
gaagaactga aagggctgga tttttggcgt aacttcaaga gtaataggac aagaagtacg 34320
ggattgcatt attatcaaag atcaatgaag attaacattg tatcatggaa tgtcaggggg 34380
ttaaatcgac atagaaaaag aatgttgatt aggagtttaa ttcataggtg gaaagcagat 34440
gttttctgtt tccaagattc aaaattaaaa ggggacatta gggagtttat aagagaacta 34500
tgggcaaata ggtggtttaa atatgcacag ttggaggcta gtgggcctag agggggtatt 34560
attgtcttat gggatagtaa aattggggag ggggagatca gcagcctgag ctcctattct 34620
gttacttgta aatttatagg taaaactcag gagtatactt ggaatttatc cactgtatac 34680
gctccaaatg atagggagga aaggaaagaa gtatggtggg aattagcagg tgccagggga 34740
atttttatgg accttgggta atttctgggg atttcaatac tgtgaggtac ccaccagaga 34800
aaaagaatta cagcaaaatc actagagcaa taaatgaatt ctcataattt attgaagata 34860
tggaactggt ggatctacaa cttgcaggag gaagttacac ttggaggaca ggagatagac 34920
atgtgataac agctagactg gataggttct tggtttttat ggattggaat gagagcatca 34980
gaaacaccaa gcaatcagtt ctccattgaa ttacctctga ccattcccct gtgatgcttc 35040
aatgtggtaa ccggtaccct gtcaaatcct attacaagtt tgagaattgg tggctggaaa 35100
cagagggctt caaagaaagg attaaagtct ggtggagctc ttttgcttgt gaaggaagac 35160
gtgactttat tctggctttc aaacttaaag catcgaagga aaaaattgaa gaaatggagt 35220
aaatctattc aaggaaactt ggagatgcag aaattgagta ttcttagtca acttgcagaa 35280
ctagaagaga cacatgatca aaggagcctt actgaagaag aaatacacac taaatatgca 35340
gtctatggag tttggggaga ttgcaaaaca tgaggaggtg gcttggagac aaagatctag 35400
ggctctttgg ttgaaagaag ggacaaaaac atcaattttt tcctcaaaat tgcaagtgca 35460
cataggaaat acaataacat agaccaactg ttacttgaag gaaaatttgt ggcgaatcca 35520
acatacataa caaataatat tggtacattt tatcaaaaac tatatataaa gattgctaga 35580
ggacaatctt atgttgcaaa gtcttttcga agcttaggaa atttgggata gtgtcaggca 35640
tgtgaaaggg ataaagcacc tggacctgag aactgggagg tgataaacac ggatatgata 35700
gctgcagttc tttgttcatg gaatgtttga ggaaagcttt aatgttacct ttgtggtatt 35760
gattcctaag aagatggaag ctaaggaata gaaggacttt aggcctatta tgataggcaa 35820
tgtgtacaag atcttgatag aaagacttaa gaaattggtg aacaagttgg tgaagggtca 35880
acggatgact tttattaaag gtagacagat aatggatgtt gttctaattg ccaaatgaat 35940
gtgtagatgc aagaacaaag gcgagaaacc tacaatacta tgcaaactag atattgagaa 36000
ggcatatgac catctaaatt ggaactttct attggaatcg ctgatgagga tgggctttgg 36060
tgtaagatgg gtcagctgga tcaaattctg catcagcaca atgaaattct caattttgat 36120
aaatgtttca ccagtaggtt tcttcccttc tcagagggat ttgagacagg gtgatccact 36180
atctcctttt attattcatt agtgctatgg gaggcttaaa tgatatgtta aagactactc 36240
aagataacaa ctgcatacgg ggttttaagg tgaagtccag ggcagacagt actattgaga 36300
tttttcatct tcgatatgca gatgacgcac ttatgttctg tgaggttgac aatgaacaat 36360
tgaaagtgct gaaggtgatc ttcattctgt ttgaagccac atctgtatta caaattaact 36420
ggaatgaaag ctttatctat ctagttaatg aggtaactaa gatccacttt ttggttggaa 36480
tcctagaagg taaaattggg gaattgccta cagttatttg gggatgccat gggggccaag 36540
agcaatttta aggggatttg gactagggtc gtagagatat gtgaaaaaat tttaacaaac 36600
tggaagagtt agtatttatc cttaagggac aaactaatac taatcaattc tatacttgat 36660
gattttccta cttacatgat gttcctcttc tcaatccatg tgaatgttgt gaagagaata 36720
tataccctta gaaggaactt cctatgggga ggaaactatg acaaggaaag atctatttgg 36780
tcaaatggaa gtctctcaca gtcagcaaga agtaagagtg ttttggaatc aagaattgga 36840
gaattcagaa ccaaagtttg atgatgaagt ggctatggag atttactaca gaagaacatt 36900
gtttgtggaa agaggtgatc atggagaagt atggcataga agataaacgg ataacaaagt 36960
ctgtaaatag atcttatgga gttagtcgat ggaaatccat cagggaccta tagcttcagc 37020
tcttgaataa gtccaaattc tgaataggaa atggattgaa aatatctttt tggaaggata 37080
attggctaac caaggaactt tgaaacaact ctttcttgac atttacattc caaatcaaca 37140
gcataaagca ataatagtag aattatgggc taatcaaggt tggaatctca catacagaag 37200
actatcaaaa gacccggaga ttggcaggtc aacagagttc aaaggcactt tggaacaatt 37260
taaagaggtc tatacttcta tagactattt gacttggcaa gggaagttta ttgttaattc 37320
agcctataag gaattcaact tctcagctaa ctggattggt tgttggccat agaagttgat 37380
ttggaaagtt aaaattcctt atagagttgc ttgtttctct tggcttttgg ctaaagaggc 37440
agttctgacg catgataatc taaccaagag agattaccat ttatgttcaa gatgttattt 37500
atgtgaagag caggcagaga caaccaatcc actttttttt gcattgtaag ttcactgcag 37560
ttatggagga ttttcattag tttaaagggt atcatgtggg ctatgcgtag aagtatacct 37620
gaagttctag catactggaa aaaagaaaga aatctttcca attataaaaa gagatggagg 37680
attatcctag cttgcatctg gtggaccatt tgggaagaaa gaaatcaaag atgcttcaaa 37740
gataaatcag tcatattcag ataattaaaa tgaagtggct agtcttgttt tatttttggt 37800
gttaagtgtt agatagttat gtattatgta taagttgtct agtcccacat tggaacggga 37860
gtaatatgta ctatgtagag tatagctata aataggactt cttgtacttt attgtagaga 37920
atatattaat aatatatttt tcccgtgttg tctcacatgg tatcagagaa accgtgagat 37980
atcagtcgtt gtgaaaaata ccagcggctt cgggaagaaa aaaatcaatc aactgctagg 38040
tatattagtc ttcggcgacc gatccattaa atttctctgg caaagaacca ctcatgggcc 38100
ctcacgcgcc caccgaaaga aatatttccg gcgaggttcc aatttcatgc gcccgcgcgt 38160
gaggcagttt ccggtcaaat tttgacaaag gtcctttttg acagtttgtt caccctgtaa 38220
ttcccagtct atccatcatt ttttttattt cgatcacttc gcaatttctc gggcagctac 38280
agtgattttt ccggcagaag cggtgtttcc tttgcctgct tcagcgagat acagttgatt 38340
atttctatta tttgtttcta gacctctctc caatccaacg atgtctttgg aatttgatgt 38400
atttggttct gaaaacacga gttctagaaa gtcaagcttc atgattactt tagagccatt 38460
aatggggagt tcaaactatt tagcttgggt ttcctctgtt gaattgtggt gtaaaggtca 38520
aggtgttcga gatcacttaa tcaaaaaggc tagtgagggc tgtgaaaagg tcaatttaag 38580
cagtttatga cgtctgtata ccactcagca gaataggata gcaaagaaag aatatgcaca 38640
tcattgagac tgctcgcaca cttctcattg agtctcacgt tctgctacat tttctgagcg 38700
atgcagttct aacggcttgt tatttgatta atcggatgcc tttatcttcc atccagaatc 38760
agattctgca gttagtattg ttttctcagt cacccttata cttttttcgt cctcgtgctt 38820
ttgggagcat gtgtttgttc ataacttagc tcccgaaaaa aataagttag ctcctcgtgc 38880
tctcaagtgt gtcttccttg gatattcccg agtttaaaag tgatattgtt gctactcacc 38940
tgatcgtagg taccttatgt cagttgatgt tgcatttttt gagtctagac cttactttac 39000
ctcttctgac caccttgata tatatatgag gtcttaccta taccgactct tgaggggttt 39060
actatagctc ctcctctaca tactgagcca cagaaatctt actcatacct accattgggg 39120
aatctagtgt tgctcctcct agatccccag ctacaggaac acttttaact tatcgtcgtc 39180
gtccgcgccc agcatcatgt ccagctgatt cacgttctgc acctgctcct actgcggact 39240
agtctcatcc taatctacca attgcacttc ggaaaggtat atagtccaca cttaatccta 39300
atccatatta tgtcggtttg agttatcatc gtgtcatcac ctcattatgc ttttataact 39360
tctttgtcca ctgtttcaat tcataagttt acaggtgaag cactgtcaca tccaggatgg 39420
caacatgcta tgattgacga gatgtctgct ttacatacga gtagtacttg tgaacttgtt 39480
cctcttcctt caggcaaatc tactgttggt tatcgttggg tttatgccgt caaagttggt 39540
ccagatgacc agattgccaa agggtatagt caaatatttg gggcttggtt acagtgatat 39600
tttctctccc gtggctaaaa taccatcagt tcatctcttt atatccatgg ttgttgttcg 39660
tcattggcat ctctatcagt ttgacattaa gaatgttttt cttcacagtg agattgagga 39720
tgaagtttat atgaattaac cacctaattt tgttgcttag ggggagtcta gtggctttgt 39780
atgttggttg cctcagacgc tctatggtct aaagtaatct cctcgagcct tgtttagtaa 39840
gttgagcaca gttattcggg aatttggcca actcgtagtg aagcttatca ctttgtgctt 39900
tattggcatt ttacttcaaa tctctgtatt tatttggtgg tttatgttga cgatattgtt 39960
attaccggca atgaacagga tggtattact gagttgaagc aacatctctt tcagcacttt 40020
tagactaagg atctgagtag attgaagtat tttttaggta ttgtgattgc tcagtctagc 40080
ttaggttttg ttatttcaca ttggaagtag aaaaacttca atcatttttc tttatttgaa 40140
aggaagaaaa aaaaggtaat atctagacct aaatattaat ctgaagacaa gtgaggcttg 40200
ctcagttggt aaaagcacct ccacctacga tcgttaggtc ctgggttcga gtcaccatgg 40260
aggggaagtg tggaaacact atagatcctc ctaatttggg agggggaaaa aaatattaat 40320
ctgaattgac atgaatctca atgacaatga ccaacgattt cctgcaattc ttttcagtat 40380
ggaatgaata aaaaatcaag ctacaagtct ctattaaacg aaatgcacta acagggatca 40440
ctctcaagaa aggaagtggt tttggttgtt gttattccag gttggataaa tcactttctt 40500
tataaatatc ataaaagaca agggctttct tgcttcagca catgtgggaa atgccggggg 40560
gcttggctgg taccaagctc gagcggtctt tctatctttt tggattgcat gcccaaggca 40620
atgctttttg tagattggga tggattgatc ttcgcagaag tatgctttag acattcttga 40680
ggagacagga atgacggatt gtagacccat tgacacacct atggatccaa atgccacact 40740
tctaccagga tagggggagc ctcttagtga tcctgcaaga tataggcggc tggttggcaa 40800
gttgaattac ctcacagtaa ctagacctta tatatccttt cctgtgagtg ttgtaagtca 40860
gtttatggac tctccttgtg atagtcattg ggatgtggtt ttccgaattc ttcgatataa 40920
aatcagctcc aagcaaagaa ctgttgttcg aggatcgagg cccatgagca gatgttgatt 40980
gggcacgatc accttctaat agacattcta tatctggata ttgtatgtta ataggagtta 41040
atttggtgtc ttggaagatc aagacgtaaa atgtagttga tcggtctagt gcggaagcaa 41100
ataatcgagc aattgttatg gtaacacgtg agctagtttg gatcaaacaa ctgctcaaag 41160
aattgaaatt tggagaaatt gatggaacca gtgtgtaata atcaagcagc tcttcatatt 41220
gcgtcaaatc cggtgttcca tgacagaatt aaacacattg agattgactc tcactttgcc 41280
ggagaaaaga tactctcagg agataccgtt acaaagattg tgaagtcgaa tgatcagctt 41340
agagatattt ttaccaagtc ccttgctggt cctcgtatta gttatatttg tagcaaactc 41400
ggtatatatg atttatatgc accaacttaa gggagagtgt gagatagtta tgtacaacaa 41460
aatacccggt ataatcccac aagtggggta tggagggtag tgtatacgta gagcttaccc 41520
ttaccctgtg aaggtagaga agctgtttcc aaataccctc ggctccagta caaatgaaaa 41580
ggagcagtag caacaagcag taacaacaat gatatagtaa aataactgaa gaaagaaata 41640
acatgtagac atataactcc actaacaaac atgcaaggtt aatactattg ccacgagaat 41700
ggcaaaggaa tgttagatag ttatgtatta tatgtatatt aatagtctag tctcacgttg 41760
gaataggagt aatatgtact atgtagagta tagctataac taggacttct tgtaatatat 41820
tgcatagaga tatcaataat atatttttcc tgtgctttct cacgtaaagg aatgtaatgt 41880
acttagaaga tcatgaatct atctttgatg ttttagacac ctcgtgagaa cacaaaggtt 41940
taggaacttt attgtgttct ttgtaattat gggtgactgc caatatgtta ccttttcata 42000
aaaatgatta tttggccatt ggattagttt caacagcctc tctgcccctc cgggtagggg 42060
taaggtctgc gtacatatta ccctctccag accccacttg tgggattata ctgggttgtt 42120
gttgttgttg ttgtggatta gtttcaacaa ttttgatagt tcttttattt gaatcaaact 42180
actcattcac atggattttg tatcgtatca ttgagttaaa aaaattggtt ttgctaattt 42240
atcctcatgt ataacaacta cctatttttc aatatattgg attcaggagc ttgtagtagc 42300
tggagtttgc tcttcaaagg gcaataagtg ccgggtatca tgcacagtga ctccaaatac 42360
agatctcctt tctgctctaa ctcttatgga gaaacatgat ctaagtcagc tacctgttat 42420
actaggggac gtggaggatg aaggcatcca tcctgtgggc attttggaca gagaatgcat 42480
caatgtagct tgcaggtttt tgacattcaa cttttacttc aaagatataa tgctttctgg 42540
aaccattgat gataaaatat gcaagaaact tgtgcagaag tcgcacttta ctatcgatta 42600
ccagataaag ttacttatca agaagtcaaa tatattgaac atatttctct aaaacacttt 42660
gactggactg taagcagaaa cttactaaag taggtcgtaa gaaatggttt gatagggaaa 42720
tcaccatcta cacttaaaag agttgtgtga atttgaattc ttaaagcatg tgaaagttat 42780
aaaaacttgt tattatctaa gcatctgaag cattttggcc atccaaagga tcaaaaatag 42840
gaaataattt catttgtaca atgaactccc tgcacaaatt ctcacactag gtgtattctc 42900
tattcatcac tagcactaca tgtgtcacta cgaatcatat acaataaatc tttgtaacat 42960
aaaagacgac acataatatg gaagtaagcc gagtatacaa gggaagtttc atcattacgg 43020
tgagcttttt ataagataat caagttttac tggaaaaggg caaaaactct cccgtataga 43080
agtataccaa aaagtagaat accttacaaa aatatgattt tctatgaaca acaccctatc 43140
ttctatactt gtagggatct catcggggca ccaaaaagag ataaagggat aagaggcttt 43200
tcctcaaatg tacaaaatcc ttctctattc cttcaaaagc tctcctattt ctctctctgc 43260
acactgtcca cataagttca atggagcaac atccacgccc tgtgtcttct tttccgtctt 43320
ctataggtcc agctgaacat ggcttctttg actgagtgtg gcatcaacgt tgaagaccaa 43380
accatcccag tacttccaac cacaaacgag acactatatg acaatttaga agaagatgat 43440
tcacatcttc tcccgaacat ttacacataa aacaccagct gatacatgta atcttcctct 43500
tcctcaaatt atcagccgtc aggatcaccc gtctcgtagc taactaggtg aagaagcaca 43560
cctttctcga aaacctcagg atccatacag agagatatgg aaaagctgat tcctccatgc 43620
ccagaagctt ctcataataa gacttaacaa agaaacacca ctacttcccc ccccccccaa 43680
aaaaaaaaaa tctccataca tcgactttca tgtgtaattc ttgttcgtga aacgacccaa 43740
tcaacctttg gcacaaatct cccagtcttg cgagttcctc ctaaacttca aatcacaatg 43800
aacttctcca ccttgtagcc tccgtgtccc ttggactggc aactcctttg gcatgaaact 43860
ttgtacatat taggagatgt gatactcaaa gtgttgttcc tgcaccaatt gtacccccaa 43920
aaaacttacc atgctcccat cacctaacat tgaatgatac gttccaaaat cttcgcactc 43980
cttcaagaaa cttttccgta ggccccaccc ataagggagt gtgatttttt ttgctctcca 44040
tcccctctcc aagaatccat tccctaaacc actgcaggac actttaacaa tcactatgtc 44100
actttttcta ctagttctac attgagtgat atcttgatgt cattgaaatg cctctggaaa 44160
atcttcttct catctaaaag aacacttgtt tgccttttga atccccctct aacattttct 44220
atgtttcatt catctttggt ggaacagagc attagcaact agagaacagc tttgctag 44278
<210> 4
<211> 36700
<212> DNA
<213> Nicotiana tabacum
<220>
<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; one start codon
<400> 4
atgaatcacg aaagttgttg ggtcgtcatc caaattgctg gccttgggct cgacgaccat 60
ctcttcctcc gggacgttcc tgtgacggaa acattgaaaa agaacaagat atgtgcgaca 120
gcagcaaaga cgatagtgat agtgatagtg gtatccagat aggatctctg ctcgaggaag 180
ttatcccaca aggcaataat accgctataa tctcggcttg ctttgttggc ctcttcaccg 240
gtatcagtgt cgtgcttttc aacgctgcgg taagtgcgct ataggtcttt catttctctt 300
ttcatctact attctccctt acttacttgg cctcagtcaa tcagccccct gcctacttta 360
aattattgta caatttatca gaggagtatc ctatacatca aattcacata acttagtaaa 420
atatgctgac attctgaatt ttaaccttac cagcttagaa catccaggct agttcagaaa 480
cagataatct aaattggcct catttataag tcattttgtt aatcaagaca tacaatttgg 540
ctcttgataa aagattatgc agcgcccgat gataacctaa tatttatcag caacccatat 600
gtcactttct tttgtttaaa tgctctccca tgtaatttaa caatattgtc accatacaaa 660
agagaactga agtgaatgtt ccatttgtgg tcatataacg gatatctccc ttggttaggt 720
tcatgaaata cgtgatcttt gttgggatgg aattccatat cgagctgcct cagaggagcc 780
cattggagta cattggcaac gtgtaatctt agtaccagct tgtggcggtt tggtagtcag 840
ctttttgaat gccttccgag ccactctgga ggtttcaact gaagaaagtt ggacatcatc 900
tgttaaatct gtgttggggc cagttttgaa gacaatggcc gcttgtgtca cattaggaac 960
tgggaattcc ttaggaccag aaggccctag tgttgaaatt ggtacatctg ttgccaaggg 1020
agttggagct ctgcttgata aaggtggtcg tagaaagctg tcactcaagg ctgctggatc 1080
agctgctgga atcgcttctg gtttgttccc catattattc ttggttctga accatacatg 1140
gtacattttc cttataatta catgtagcct gttgtatgct ttcctctttc ctgggaagcc 1200
tttctgtaaa tgcaaatgtg tttgcactca aaccaataaa ctgtaaaaac agtgaacccc 1260
ttgagcaagc aaaagcacta gaaaaccaac aaatagatcc cccccccaag ataccagtga 1320
aatgacaccg ggtgacccaa aaataaagca gcttacatct tgactttgag aggaactgca 1380
atcagctata agtaggttat taatttccag tgcctgcatt ctgcccaagt actatgatat 1440
atttctgaag ctttgtttcc ccagttcctt tttcagacgt ttgctgtcaa taaagttgag 1500
ccagccaact tggttcccac aagctactaa ttttgtccaa gcttactcta tgggagaagt 1560
taaatttccc aaattccttg agcagaaaat gaaaaatgaa ctcaaagtgt catattaggc 1620
aactatctaa agaaaaatac ttaattgaag tttagataag aaaagtgaat atatattgat 1680
gtagtctccg ttaggtgaga agcgcatcac ttacccagca acatatggac ctaaaattta 1740
ctagtgaact tttcacattg tatcaaaagc tcaacaaaca gaaagatgac tagtcctaaa 1800
atgttatttc acatcaacct tatcatacgt gcattatttg ttctctatat ttctatttca 1860
tccgatataa ccaatcgtca ttgtaaattc tataatgcct gtggttactt ttgtctttag 1920
tgacaaatga catttaggct aaccatgtag ttattgactg atttcgcttg acgtctcttc 1980
caattatgta gtagtagagt gttgagatat ggatatgtta ccttctaaaa aaaaagagtg 2040
ttgagatgcg gatggtttgc tagctggctt ttgtctccct tcaagttgaa ttagcaaaag 2100
caatgtctca taagttggat agctagacaa gaaaaactcc aaattacttt atgtagagta 2160
ttcttaagct tgagtcgcga gttggaaatt ggaattatgt aaaaaaacct ggaattattt 2220
ggttgagcct gctttttatt tttgtcaata tttccagtat ctaacccaac atgtttagag 2280
caattcccag agagcctcaa tacgaggcat ttgcagagtc tttatgagag tccaggaagg 2340
ggcacacact gtagaggtat agtgttgtcc ttattttttt ttttttgata aggtaagatt 2400
ttattaaaag gtaccaagat ggtgcaaaat tacaaacatc caaactaata caacaaagca 2460
actacattcc tcctagctcc tctagaaaat tcatatattg ttccatattt ttcattacat 2520
gtcttttaca ccagaaatac aagtttaata agcatctgtt tttaatcctg gatacatgct 2580
gcctttcccc ttcaaagcaa atcctgtttc tttccaacca tattgtccag aacacacata 2640
gaggaattgt tcttcatact atctgttgac tctttgccac tttttgttgt tgccatgtct 2700
ccaacaaact ttacactggc aggcattgcc cacttgacat catatatatt taggaagagc 2760
taccaacact gctttgccac tttgaaatgg atgattagat ggttgactgt ttctgcctct 2820
tcttcacaca tgtaacaccg gttacataga gcaaaacctc tcttctgcaa gttctcctga 2880
gttagaaaag cttcctttgc tccaatccaa ccaaaacggg ctactttaat aagtgctttt 2940
gacttccata ttgctttcca tggccaattt gactgataaa gcccttgtag tttttgtaac 3000
aagctataac aactgctgac tgtgaaaata ccatcattac ttgctgccca gattaatgag 3060
tctctcctgt tttcctccaa tctaacatta ttcaataact gcatcaattg ggaaaattca 3120
tcaacttccc agtcattgag gcccctcttg aagattagct gccagccggt gcttgaatag 3180
aagtctaaca ctcttccatt tttgttaata gagcagctat atagaccagg aaactttgat 3240
ctaagacttc cattttccaa ccacatatca gaccaaaaca gggtattatt accatttcca 3300
agtttcagtt tcacaaactg actatattta ttccaaagat tactaattgt gctccaaact 3360
cccccttttg aagaagattg aattgaacga ggagcccaca tgtccttcat accatacttg 3420
gcatctatca cctttttcca taatctattc ccatcataat tatatctcca tagccattta 3480
aataaaagac ttttgttatg catctttaga ttcctcactc ctaatccccc tctttctttt 3540
tttttcatca cctcttgcca tttgaccaag tgaaatttct tgttatcatt attaccttcc 3600
cacaaaaatt tattcctcat agtattcaat tttttctcca ctgatgttgg cattttaacg 3660
agagatatta gataagtagg tataccatcc atcacactat tgaccagtgt aagcctacca 3720
ccaagagata aatattgtct tttccatgac accagtttac tgctacatct atccaagacc 3780
ccctgccaca tctttgcatc attctttttt gctccaagtg gtaggcccag ataggtggat 3840
ggtagctgct ccactttaca acccaaaaca tctgccagat catcaataca atgctcggca 3900
ttaatactaa acacattact ctttgccaag ttcactttca atcccgagac agcttcaaaa 3960
gctagtagta ctcctatgag gtgtaagagt tgctcttttt cagcttcaca taatatcaat 4020
gtatcatcag catagagtat gtgtgagaaa tacagttctt ccccctctct ttttctaatt 4080
ttcaatcctc taatccaccc taacttttct gcttttaaaa gcattctgct aaagatttcc 4140
atcaccaaca aaaataaata gggggatatt ggatccccct gtcttaaccc cctctgagaa 4200
ttaaagtatc tatgtggact cccattaatt aaaactgaga agctaattga ggatatgcag 4260
aattttatcc acccaatcca tctttcccca aaattcgtat gtttcatcag atttaacaga 4320
catgaccaat ttacatgatc ataagccttt tccacgtcaa gtttgcaggc caccccttta 4380
atcttcctct tgaatagata ttcaagacac tcattagcta ccatagcagc atcaataaat 4440
tgccttcctc ttacaaaggc attctgatta tctaatatca attttcctat caccatcttt 4500
aatctttcag ctatcgactt tgcaattatt ttatagacac tgcccaacaa gctgataggt 4560
ctaaaatctt tcacttccgc tgcccccttt ttcttaggaa taagagcaat gaaaattgag 4620
tttaggctct tagtcttgtc cttattttca gggttgaact agttctttag aagtttccta 4680
ggcttcctaa tttccaaagt tctgccaggt ccttttctag tgaagtactt gaagtttaat 4740
aaatcaaatt ttaatttcta acatatcccg agaaattcat tcacaaattc aactggtgac 4800
ttctgatgca gaaacataag caactgctta tgggttcata tgttcctgca attttattgt 4860
tgacatggat tggcttcata tggttttgtt cctgcaattt tatcgctgac actaatcctt 4920
tcatatggtt ttatgtgggg tggtaaatag aggttaagag acaagaagag gctggaaaag 4980
gtgggcagtt catttgttag tagactactc tatttactaa gagatatgat gtcccataca 5040
ttactcgaat tggctccaaa tacagattcc acttctttgt cgagtttcct tattgtacag 5100
agttcgactc gtcaagggaa attcacttcc tttgactgaa taatgctagt ttgagtagta 5160
ccttaaatta aatggaccat ttaattctat ctacttgata gaatagactg gtcatcaact 5220
agttgcaaat ataatgacaa ctccgccatg tttgcagagt cacctgatga agaagtacct 5280
caattagtag accatttctt gaatgttcta cagtattctc tatgcctaca tgaccacatc 5340
acttttcctt ttgcgttgtg agaacttgaa cttggtgagc gggggttccc caggaatggc 5400
atcttggtgg cagatgacca ttctgtcctt atcttagcta atgcttcttg gattgcctca 5460
ctagatttat tataccttta ataaatgttt gccattgttc tgccataata gagggatgta 5520
cctagctggt gcttcacatc acatagtcca aaactaatga aatgctttac aattgtcgag 5580
tactaaagga tgatttgtgg aatcagatct caaacaattt attttgagga agaaaaatac 5640
caaaggtttt ttctgtttgt tggaagatta aaaatccttt aaaaggtaaa gatttatgaa 5700
cttaattcag catttttgtg gccattgctg aaaaagagaa aacaatggca cttattcgag 5760
tttgcttatc caaaaaaaaa gaagaagaga atgtcacgta atgcaatttc atcttaggaa 5820
actttgcagg agaaaagcaa gagtgataaa acagaactat ttgttttttt gataagttgt 5880
tgtgacctat ttctttgtca ttcttatttg ctaataagct aatgtaccct gtactatggt 5940
tgttttgact taatccgggg atgttcagtg agcattttct tgttttttct gctgtcagca 6000
tctgctgcct tacaggaatt cattttctgg aaatttactt cttgttctgc taacattttc 6060
ctgttatatc ttgtcagtca ttttctctcc atggttatac tgtttgtgtc actttgaaac 6120
tctccttgtt ttctacttta aaggatttaa tgctgctgtc gggggctgtt tctttgctgt 6180
ggaatctgtg ttatggccat cacctgcaga gtcctccttg tacttgacaa atacgacttc 6240
aatggttatt ctcagtgctg ttatagcttc tgtagtctca gaaattggtc ttggctctga 6300
acctgcattt gcagttccag gatatgattt ccgtacacct actggtaatt ttggacttct 6360
ttctcgagtt tgattcttaa atacaattgt acccgtcact tacagcaaca acaactacat 6420
ttcaacagct agttggggtt ggctacacag atcatcacta tccatttcaa tttctttagt 6480
cccatttctt tcgaatattc agtactttgg gattctctat tatcagaggt tctctttatt 6540
ttctactttg acgtacaaat ctctaaatag attaaagaag actcctagag acactggcct 6600
aatgcaaatg taccaccatg aataaacctt aatctgaaat agctggtatc gtatataaga 6660
acctttagct ttaattgtgt tctatattga tcttttggga caacttccgt ccaataatat 6720
tatgtcttac ttatacagtt atacttatcc ttaaacttta ctctttagag tggttatccg 6780
tagttcaagc ttttgttggc accatagcta gtttggttct tagtaaaaag ttactcttta 6840
gagtggtaac tttttgtcaa ttttcttagt gaaaatataa cctctgtgac aaatctacca 6900
agtataaatc caatatggtt ctgtgtcata cttgtagttt atccaagtct atgctccatc 6960
actcttacaa aggctcatcg tatgactaat tttttttgag aaaggtaaca gtttgtattg 7020
ataataagat cagcgccagg ttagtcatta gtgctaatag ctgtatgtac aactccaaaa 7080
gagcaaaaga caagcacctg gtgtaacgta aattacaagc tgcctataaa atctatcagg 7140
tctcctacct cactaaacat ttcttgttta caccaaaaaa ataaaacaag gaaagacaat 7200
ccatcttaat cttctgaatg gagtttcttt tgccttcaaa catctcgagt tcctttcgtt 7260
ccatgcaatc caccatatac aagctgggat gcttttccat ttgtctttat ccattttttc 7320
taccaattcc cttccaattg actagaagtt ccaatgtggt tctagatatg acccaattaa 7380
ctcccaacat ataaaagaac atgttccacg gatttgtagt gattctgcaa tgtaggaaca 7440
agtgagcatt actttctact tcctgtccac aaagaaaaca tcttgagcaa atctggaaac 7500
ctcttctttg taagttatca tgtgttaaac atgctttttt accactaacc agacaaaaca 7560
tgatactttg ggaggagttt taaccctcca aatgtgtttc caaggccaca cctcagtcat 7620
tgaaacatta tgatttagag tccagtatgc atcttttact gaaaatgcac ctttgctatt 7680
cagcttccaa actattttat ctatggtctt gttagtttac agctatgtat atagtgtagt 7740
cttgtcccac attggaatag gagtagtatg tccttgtata gtatagctat aaataaggac 7800
ctcttgtatt gtattgaaca tccaatatca ataacatatt ttctcccgtg ctttctcaca 7860
tggtatcaga gcaattgtga gagatttatc gctgcgcata aattccagcg actccgggaa 7920
gagaaatcag tcaccggaag tctttttccg acgactcttt caaggttgtt tgcgtttgct 7980
ttataaatcc aacactacca caagagtaat cactgtccgg cgaccaaacc ccagtaaaaa 8040
tctccggcag cagcctcctc acgccaccag aagctcacgc gccggcgcgt acgaccactt 8100
ccgtccattt tttgaaaaac ttccttcaga acagttgggt cgcctggtaa ttcctatcct 8160
acccctactg ttttcatttc attccgacca ctttgagttt tttccggctg ctacagtact 8220
attccggcag ctatagtact attccgacaa ctacagtaag attccggctg ctacagtatt 8280
tcattattct gtttttgtgt ttccttactc tgtttcagtg gattacaatt gattctttct 8340
cttatttggt aataatttgc aacaatgtct atgggatttg atgtttttgg gtctagaaac 8400
atgagttctg gaagctctag tgttattatt acctcagaac cttaaatggg aggttcaaac 8460
tacttagctt gggcttcatc tgtcgagttg tggtgtagag gccaaggtgt tcaagatcat 8520
ctaatcaaac cgtctagcga aggagatgaa aaggcaataa cactttggac aaaaatcgat 8580
gctcagttat gtagcatctt gtggcgatct attgattcca agttgatgcc cttgtttcgt 8640
ccattcctga catgttattt ggtttgggca aaggcacaca ccttatacac taatgacata 8700
tctcgcttct atgatgtgat atcgcggatg acaaactgaa agaagcaaga attagatatg 8760
tctacttact tgggtcaagt acaagcaatc atgggggaat ttgagaagtt gatgccagtt 8820
tctgctagtg ttgaaaaaca acaagagcag cgacaaaaga tgtttctcgc tcttaccctc 8880
gctgaacttc ctaatgatct tgattcagta cgcgaccata ttttagctag tccgactgtc 8940
ccgacagttg atgaattatt ctctcgatta ctccgccttg ctgtagcacc aagtcaccca 9000
gtgatctcat cacagatact tgattcctct gttcttgcat cccagacaat ggatgttcgg 9060
gcatctcaaa ctatggagca tagacgagga ggaggtcgtt ttggaagatc tagacccaag 9120
tgttcttatt gtcacaaact tggacacact cgtgaaatgt gttattcctt acatggtcgt 9180
ccacccaaaa atgcttacat tgctcagacc gagactccag gtaaccaggg attttcttta 9240
tctaaagaag aatataatga actccttcag tatcgaacaa gtaagcagac atctccacaa 9300
gtagcctcag ttgcttagac tgatacttct tttactggta atttttttgc ttgtgtttcc 9360
cagtctagca ctcttggccc atgggtcatg gactcaggcg cttctgatca catctctggt 9420
aatatatcac ttttgttaaa tattgtatat tcatagtctc ttcccattgt tactttagcc 9480
aatggatgtc aaattacggc aaaaggagtt ggacaagcta atcccttgtc ttctatcacc 9540
ctagattctg ttctttatgt ccctggctgt ctttttcgtc ttgcatctgt tagtcgtttg 9600
actcgtgccc tccattgtgg tatatatttt attgacgatt cttttattat gcaggactgc 9660
agtacgggac agacaattgg tggaggacgt gaatcagaag gcctttacta ccttaactca 9720
cccagtcctt ccacaacatg tctggttaca gatcctccag atctaatcca cagacgttta 9780
ggacatccga gtttatccaa acttcagaag atggtgccta gtttatctag tttgtctaca 9840
ttagattgtg agtcgtgtca gcttgggaaa catacccgag cctccttttc gcgtagtgtt 9900
gagagtcttg catagtctgc cttctcctta gttcattctg atatatgggg tcctagtaga 9960
gtaagttcaa ccttgggatt tcgttatttt gttagtttca ttgatgatta ttcaagatgt 10020
acttggcttt tcttaatgaa agaccgttct gagttatttt ctatattcca gagtttctgt 10080
gctgaaatga aaaaccaatt tggtgtttct attcgcattt ttcgcagtga taatgcctta 10140
gaatatttat cttttcaatt tcagcagttt atgacttctc aaggaattat tcatcagaca 10200
tcttgtcctt atacccctca acaaaatggg gttgctgaga gaaagaatag gcaccttatt 10260
gagattgctc gcacacttct aattgaatct cgtgttccgt tgcgtttttg gggcgatgca 10320
gtgctcacaa cttgttattt gattaatcgg atgccttcat ctcccatcaa ggatcagatt 10380
ccacattcag tattgtttcc ccagtcaccc ttatactctc ttccaccccg tatttttgga 10440
agcacgtgtt ttgttcataa cttagcccct gggaaagata agttagctct tcgtgctctc 10500
aagtgtgtct tccttggtta ttctcgtgtt cagaagggat atcgttatta ttctccagat 10560
cttcgtaggt accttatgtc agctgacgtc acattttttg agtctaaacc tttctttact 10620
tttgctgacc accatgatat atctgaggtc ttacctatac cgacctttga ggagtttact 10680
atagctcctc ctccaccttc gaccacagag gtttcatcca taccagccgt tgaggagtct 10740
agtgttgttc ctcgtagttc cccagccaca ggaacaccac tcttgactta tcatcatcgt 10800
tcgcgcccta catcgggccc aactggttct cgtcctgcac ctgacccttc tcctgctgcg 10860
gaccctgctc ctagtacact gattgcactt cggaaaggta tacgaaccat acttaaccct 10920
aatcctcatt atgtcggttt gagttatcat cgtctgtcat ttccccatta tgcttttata 10980
tcttctttga actcggtttc catccctaag tctacaggtg aaacgttgtc tcacccagga 11040
tggcgacagg ctatgagtga cgagatgtct gctttacata caagtggtac ttgggagctt 11100
gttcctcttc cctcaggtaa atctactgtt ggttgtcgtt gggtttatgc agtcaaagtt 11160
ggtcccgatg gccagattga tcgacttaag gcccgtcttg ttgccaaagg atatactcag 11220
atatttgggc tcgattacag tgataccttc tctcccgtgg ctaaagtggc ttcagtccgt 11280
ctttttctat ccatggctgc ggttcgtcat tggcccctct atcagctgaa cactaagaat 11340
gccttttttc acggtgatct tgaggatgag gtttatatag agcaaccacc tggttttgtt 11400
gctcaggagg gggtctcgtg gccttgtatg tcgcttgcgt cggtcacttt atggtctaaa 11460
gcagtctcct agagcctggt ttggtaagtt cagcacggtt atccaggagt ttggcatgac 11520
tcgtagtgaa gctgatcact ctgtgtttta tcggcaccct gttgacattc cgatggatcc 11580
gaattctaaa cttatgccag gacaggggga gccgcttagc gatcctgcaa gctataggcg 11640
gctggttgga aaattaaatt atctcacagt gactagaccc gatatttctt atcctgtaag 11700
tgttgtgagt cgatttatga attctccctg tgatagtcat tgggttgcag ttgtccgcat 11760
tattcggtat ataaaatcgg ctccaggcaa agggttactg tttgaggatc aaggtcatga 11820
gcagatcgtt ggatactcag atgctgattg ggcaggatca ccttctgata gacgttctac 11880
gtctggatgt tgtgttttag taggaggcaa tttggtgtct tggaagagca agaaacagaa 11940
tgtagttgct cggtctagtg cagaagcaga atatcgagca atggctatgg caacatatga 12000
gctagtctcg accaaacaat tgctcaagga gttgaaattt ggtgaaatca atcggatgga 12060
acttgtgtgc gataatcaag ctgcccttca tattgcatca aatccggtgt tccatgagag 12120
aactaaacac attgagattg attgtcactt cgtcagagaa aagatacttt caggagagat 12180
tgctacaaag tttgtgaggt cgaatgatca acttgcagat attttcacca agtctctcac 12240
tggtcctcgt attggttata tatgtaacaa gctcggtaca tatgatttgt atgcaccggc 12300
ttgaggggga gtgttagttt acagctatgt atatagtgta gtcttgtctc acattggaat 12360
aggagtagta tgtccttgta tagtatagct ataaataaga cagtactaac gtcccttttg 12420
ccgggggttc tgcatcttta aatagatgca cgtggttcca tagcagaccg tgttgatcac 12480
agatcgtgct gcatcctctt cccagcggac tcggtgagcc cctcttgtat tgtattgaac 12540
atccaatatc aataacatat tttctctcgt gctttctcac aggtctgtga tgtacccttg 12600
aaaggttcaa gagtttggag gaagatagaa actctgttta tctcccaatc atccaaagat 12660
cttctaaagt tccagttcca tccttgtgag ctccagactg acttaccaat gcttggcttt 12720
gaagacttag agagaataag tcaggaaaaa tctttcaacc ttccttgccc tatccggtga 12780
tcttcccaaa aagatgtctt caacccattg ccaacattga tcctgatatt gctactgaaa 12840
gatttctttt ggtggcagga ttactctcat taacaatgta cttgacaatc tccatacata 12900
cgaatgtctc tttaccctct tgccattaag gttgtaaaga gacttgtcaa attaagaaga 12960
ggtttcctat ggaactgttt caaggaagga acctcctttc ctttggtcaa gtggagttaa 13020
gtcatataat ctaggaagtg gagacttggg tataaaatag ctgcaactac agaaaaggag 13080
catcttattt aaatgatcac gcaaatgtgc ccaaaacttt aaatatctgc ggagcatatg 13140
gttgtagcaa aatttgaatc ttccggtcaa tgttgctcat gtccagtgaa tacccctgat 13200
ggtgaaagtg tcctgaaggg aagcaggaac ttattggagg aattggcatt taacactcag 13260
catttcgtta ggtcatagcc cgctgaaaat tgagtgccca gatttatata gttttgctct 13320
aaactgacga tgcagttgca caacatacga caaactaagg tgggacatct tcttcggaag 13380
gaattttgag gattaagaga tagagtggtt gattcagttg caaatgaagc ttcaagggtt 13440
caatatcatc caggagacac cggattctga tagataaaac aacagaaaga tgaacactac 13500
tttgttaggc ttgttacaag ttgctatcgt ctttcttatc tcggcacaca atttagattt 13560
gggaacttat ttggaaaata gagtggttgt ttttgtgaat agcatcagac aaagcttctg 13620
agctggtacg acagaaaact caacagggag aataaaagac tgtggttcac gatttctgca 13680
tgcatcttgt aggttatttg gtgggtaaaa tatttaatgt tttgaaggga aggtagaaca 13740
tgttcatagg cttagattca aatgtttgta tttttttggc tctttggtga gagatgctga 13800
atgtaaatga cataggcagc tgactataat ttctcagctc cttgcttttt aaattggcag 13860
gcactgatat gtacatgtga acatccaaca cttttgtggt gccgttccga tgaataaagc 13920
acattaatca cttactgatc aggagtaata gtttaggagt tctagaattt ttgtacataa 13980
aatgaaccaa aaagaatatc ggaatgagaa catgtttctt tttttgtttc ttctttttcg 14040
tacaaatttc aataacactt ctgatagaat agctaggtcc atttgaattc ctttggagac 14100
ccttacacaa ccaatgaatg gcaagtatag cattttctaa caccctccca catgtataat 14160
ccagttttta gggtttagat gtggatttga tttgacctta ttgccttttt ttgtttttgt 14220
tctttttgaa gtagagagtg aggaggctca caacgacggg ctacgtagag cgagattaat 14280
tcggctcaac gggctaatga ttggacttac atgctacaac aatgttagga gaaagagaga 14340
gagagagaga gaagcccaga gcagttccac gagttaagaa agagaagtcc aaagcgattg 14400
aatatgaaga gagaaagcgg ttgtgctaac aggctccctc aagtttggct ctgagcatcc 14460
aactcaaaac cttaaggcaa tgagtagagt agcccaggac catttaaact cctgttgaaa 14520
accttacaca accaataagg gaacaagtgt aacattctct tacaacccta ccgtcttata 14580
agtcagggct ctaatttagc ataaaatcaa agtgaggcga tctactatga aatgaagaaa 14640
ataactgata aatataaaga atgttaattc tcccatatag cctgaatgtt cccagaacaa 14700
aataaattag tctcatgatt tatcattaac atgatgttcc tcttattttg agtgattagg 14760
aaggttaatc aaggagtaaa ttctttctaa tttgtatcgt ctagaattat ttgtctaaca 14820
aattttcaga ttaccggtga tcaaaagagg aaaatatttt gcatacaacg ttaccatacc 14880
ttacaaaagg gcgatgaaca tttttttatt ttattattgt cctttttttc aattaggggt 14940
tatgcagtct tcctccacgt gatattactc ttagaatcac gtttttgtca ttgctattac 15000
ttactgtggt aagtacaaat gtgttttgaa ctctttttgg tatgtattat tgagttaatt 15060
tttcgtttcc atttcagagc tgccgcttta tcttctgctg ggcatctttt gtggcttagt 15120
ttcagtggca ttatcaagtt gtacatcatt tatgctgcaa atagtggaaa atattcaaat 15180
gaccagcggc atgccaaaag cagcttttcc tgtcctgggc ggtcttctgg ttgggctggt 15240
agctttagca tatcctgaaa tcctttacca gggttttgag aatgttaata ttctgctaga 15300
atctcgccca ctagtgaaag gcctctccgc tgatctgttg ctccagcttg tagctgtcaa 15360
aatagtaaca acttcattat gccgagcctc tggattggtt ggaggctact atgcgccatc 15420
tctattcatc ggtgctgcta ctggaactgc atatgggaaa attgttagct acattatctc 15480
tcatgctgat ccaatctttc atctttccat cttggaagtt gcatccccac aagcttatgg 15540
cctggtatga atttgtcttt tgttagaagt agcattacat atctggataa gtgagttttt 15600
tattattgaa aagtaataac aggagaacaa gagaatatat cacccaaatc tacttctttc 15660
ctctcttcta ttcttctgaa attcaaggtc ctttaactcc tccacagtct gtctagttat 15720
tgatcctgta gacttaattc acataggttt aggacattcg agtttatcca aacttcatga 15780
aaaggtttct aattttttta cattacatta tgagtcgtgt ctacttgaga aacatatcac 15840
tccatgtttc tatagtctgt tttctcctta gtttattctg atatgtgggg tcctattaag 15900
tcagttcaac cttgtatttt cattattttt gcagtatcat tgataattat tcaagatgta 15960
cttggatttt ctttacaaga gatagttctc agttgttttt tgtgttccta agtttttatg 16020
ctgcaataca aaattggttt gatgtctcta tttgcatttt tcccaatgat aatgccttag 16080
aatattttct tttccgtttc agtagcttat tatttcttta ggaactcttt atcagaaatc 16140
tcaactgaga tagatgagag gaagaataag catatcattg gtctcattca gtcccctgtc 16200
aagcttagtt tcttgagcga tgcggtttca cgtcctttta ttagattaat tggatgcctc 16260
atctgctatc caaaatcagt taactttcga tattgtttcc tcgcttacct ttatactctc 16320
tttccctcga gtctttggga gcacatgttt tgttcaataa catagctcct ggaaagtgac 16380
cagcgcaacc gacaaacaag gccttcttaa tgtagaaggt ggacatatgc tattctagcc 16440
acgggaaaga aagtaatatt gtaatcaaac ccaaatatct gagtataacc tttggcaatg 16500
gcgatcaatt tgattatatg gaccaacttt gcctgcatat acccaccgac aaccaataat 16560
agatttaccg ggaggtagag aaacaagctc ccaaatacca ctaatatgta aagcagatat 16620
atctctgatc atagcttgtc cttgtggaca tagggataga aattaaggac aaagatgaca 16680
caaaagcata atgcggtgat gataaacgat gataactcaa atcaatataa tggggatggg 16740
gattgagagt ggatcgaata tctttgcgga atgcgattgg tagactagga ggagagaagt 16800
ctgtggacat gatgttggac tgagatcaat aataagtcaa gaatggtgga gctacagaac 16860
atggaactgg agctgtaggt gacataatcg gagctgtagg aggtggagct atagaggaag 16920
gtgaaggaga gatagcgact gaatctccaa aagatgaaac cggtaatacc tcaaaaaatg 16980
tctaagagat catttggacc tatgaagtat gattgcgttt ttaaaaaggt aacatcataa 17040
ggtcaggtga ataacattga tatccccgtt gcatcctcga gtaacttaga aatatacatt 17100
tgagagcacg gagagctaac ttatcttttc tggagcaagg ttgtaaacaa aacacgtgct 17160
cccaaagaca cgaggtggaa gagagaaagg tgagtgggga aacaagacag aggatgaaac 17220
ttgactcttg atagttgaag atgacataca attaataaga caataggatg tgagatccaa 17280
tgacagttct catgaactgc tgaaatggag aagacaaata ctctggggcg ttatcactac 17340
gaaatgtgca gttagaaacc ccaaattgat tttggatttc agtgtggaag gtctaaaaaa 17400
tagagaacaa ctcagattga tttttcatca agaatatcca agtggacttg gaataatcat 17460
caatgaaact gacaaagtag cggaattcca aggtagaact aacccgacaa ggaccccaaa 17520
catctgaatg gactaaagtg aaaggtaact ctacccgatt atcaggatgt cgagggaaat 17580
gagagtgagt atgccttctg agcggatatg actcacgctc tagagtggac aagtgagaca 17640
aacgaggtac tattttctaa agttctgata aattgggatg tcctaactgt atatgtaata 17700
aatctggtgg atcagtaaaa ggacaagctg tagggggaaa aaaataccaa atatttccag 17760
aagatggcaa actacaacag aagatgcaac tgcattaaca tgctcaggat aggtgatgaa 17820
atcattgagg acaaagagtt gatcaagaag gagattctgg aattttacca gaacttatat 17880
agtgaaaatg aaccctggag gcgcagtgca aatttcgaag acatctcctc actaagcata 17940
gaagagaaga actggttgga agctccattt gtagaaatag aggtgcttga agctttgaaa 18000
tcatgtgccc cttataaagc accaggtcca gaaggcttca ctatggattt ctttcagaaa 18060
aattgggata ctcttaaaac agacatcatg gctgcactta atcattttca ccagagctgt 18120
cacatggtta gggcttgcaa tgccaccttc attgccctaa ttccaaagaa aaatggtgct 18180
atggagctca gagactacag acctattagc ttgacaggta ttgtatacaa attggtttca 18240
aagattttag cagagaggct caagaaggta attgacaaac tagtctcggg ggaacaaaat 18300
gctttcatca agaacaggca gatcactgat gcttccttga ttgccaatga agtgctggat 18360
tggagaatga aaagtggaga accaggcgtg ttgtgcaaac tggacattaa aaaggctttt 18420
gatcaattaa gctggtctta cctcatgagt atcttgaggc agatgggctt tggggagaaa 18480
tggagaagat ggataaacta ttgcatttca actgtcaagt actctgtttt ggtgaatagg 18540
gacccaatcg gttttttctc cccccaaaag ggcctaaggc agggggatcc cctctccccc 18600
ttcctattca ttctggcgat ggaaggactc actaaaatgt tggagaaggc taagcaactg 18660
caatggatac aaggctttca ggtgggaagg aatcctgcca gctcagttac agtatctcat 18720
ctactctttg cggatgatac tcttattttc tgtggtactg agagatcaca agcacgaaat 18780
ctcaacctga cactgatgat cttcgaggca ctatcaggac tccacatcaa tatgataaag 18840
agcatcatat accctgtgaa tgcagtcccc aacatacaag agctagcaga catcctatgc 18900
cgcaaaacag acactttccc aaccacatat cttggacttc ccttgggagc taaattcaaa 18960
tcaaaagaag tttggaatgg agtcctagag aagtttgaaa agaggcttgc gacttggcaa 19020
atgcaatacc tccccatggg tggcaggtta actttaatca atagtgtact ggacagtctt 19080
cccacatacc acatatcttt gttcccaatt ccaatctcag tcctaaagca gatggacaaa 19140
ctcagaagga agttcttatg ggaaggatgc agcaaaacac acaaatttcc actagtgaaa 19200
tggctgaagg taactcaacc aaaattcaaa ggagtcttgg gaatcaggga tgctatgctc 19260
ttaaaatggc tctggagata tggacaggag gaatctaggc tatggaagga catcatattt 19320
gctaaatatg gagcacacaa ccactggtgt tccaagaaaa caaactctcc ttatggagtt 19380
ggtctgtgga agaacatcag caaccactgg gatgaattct tccaaaatgt aactttcaaa 19440
gttgggaatg taactcgtat aagttttgga aggatagatg gcttggaaat acacctttga 19500
aagacatgtt tcccagtatg tatcagattg ccgtgaccaa agactccact gttgctcata 19560
atagaaacaa tgacacttgg tacccacttt tcagaagaaa tttgcaggat tgggaggtca 19620
acaacctact cacaatgtta agctccctag aatgtcataa cattgaagat caacaacctg 19680
acaaacttat ttgggaaaat tctaagagag gcaagtacac agtcaaagaa tgatacattc 19740
acctctgtga ccagaatcca atatataact ggccatggaa acatatctgg agaactaaag 19800
tgcctaccaa gatgacttgc ttcacatgat tgtctctaaa tggggcctgt ctcactcaag 19860
acaacttaat caagaggaac atcatataag ttaatagatg ctacatgtgc caacaacagt 19920
cagaaagtgt aaagcactta ttccttcact gctcagttgc aaaagaaatt tggaacttct 19980
tctacactac ctttggtcta aaatgggtta tgccacaatc aactaagcaa gcttttgaaa 20040
gttggtattt ttggagagtt gataaatcca ttagaaaaat ctggaaaatg gtgtcggccg 20100
caagtttttg gtgtatttgg aaagaaagga actgaagatg ttttgatggc atatcaactc 20160
cactcaaggc tgcgtgttta gttaacttat tttgctggaa ctatctcacc cctgttaata 20220
gtgctgatac ttctgtggat ttcattagcc ccctgatagt agcataggct tttgtaaatg 20280
gagctaatta tcctttctct tttgtactct ttgcatcttc ttgatgcctt ttaatgaatc 20340
taatttactt catcaaaaag aaaatgacaa gttgttgaag gaggaaaaga tgtgagtcca 20400
tgtgatttag caaggataag gtactaaagt ccatttgatt cacgtccggt accaatgatc 20460
cgtctcgtgc tgcattcctg tattaaaaca gagtcatcaa gaaataaaat agagcaaata 20520
agtgattggc caagcgacta gtggatatga gattaaaagg actatgggga acataaaaaa 20580
ctgaattcaa aggtaaggaa ggaagtggac tagcttaacc tattctagtt gccatggttt 20640
gagaatcgtt ggccattgtg actattggaa gtgattgaga gtaagaaata gtagtgaaag 20700
gagatttgtt acccgaaata taattagatg cacctgaatc aatgacccaa aagtcggaag 20760
aagaggaaac acaagtcacg ctattacctg tttgaacaat agagattagt ttggatcaaa 20820
tagttgtata gagaactgaa atttggagaa atcaatcata tagaacttgt atgtgattat 20880
tgttgccctt tatattgcgt caaatcctaa aacacattga gattaactgc cacttatcac 20940
agaaaagata ttctctagag acattgttac aatttcatga agtcaagtaa ttagcttgaa 21000
catatcttca gcaagtccct cgtcagtcct catattagtt acatttgtaa caatgtcggt 21060
acataagact tataagcacc agtttgagga ggagtggtag agagttgatg tacatagtta 21120
aagtagatat acttacactt agtgttatgt aaagagtgga tataaaaagg gatcagcata 21180
agacaattgt cttcgcgcgt cttaacattt ttttcctgtc tttatttctc tcatggtatc 21240
agataaccta tctctatctt ggtttaccca atggttggcc cccatattgt attagccatg 21300
ctccagttga ctaggcttgg acgggcagag gtgttaaatt atcccatatt ggttgaaaga 21360
atgagctatt gtctccttat atggtcttag acaattctcc aactcatgag atattttgtt 21420
ttggctgagt tagccctaag gtttattttt tgtcatattc tttaacctta tggcaatgct 21480
tgtacacgga aaaaccggag tgcaagactt aaattaggag aaggaaacta ttgaaggtga 21540
ggaacttaaa gggttgtgag aatacacggg agaaaaaaat cttaatacta tctagtggcc 21600
ttgtatatca aatgatcagc ttgcaaatat tttcaccaag tccctcactg gtcctcgtat 21660
tagttacata tgtaacaagt tcggtatata tgatttgtat gcaccggctt gaggttatgc 21720
atattctatt cctcctacta tatatgtgac taggaaatat tttactccta ctgcatatgg 21780
gactaggact atttacacat aactatctaa cattcccctc aagccagtgc acacaagtca 21840
tatgtaccga gcttgttaca tatgtaacta atacgaggac cagtgaggga tttagtaaaa 21900
atatctgcaa gctggtcatt cgacatacaa ggccactaga ctccccccga gcaacaaaac 21960
caggtggttg ctgataaaca gaaactggcc gaaaagttgc cggaaaaatt tgaaaatagt 22020
gagactaagc cgaattctac actacaaaat aggttctaaa acaccaccag aaaacaaaaa 22080
cttttctaga aattactctt cacaccggaa aaaataaaag ttgtcagaat ttgatgtaat 22140
ttatatagat aggttcggaa tcactggagg agtaagttgt cccgaagaag ttttgtcaaa 22200
aagtggccgg aatggctcac atgcgccgga aaacttactg tagctcgcag gaaccctagt 22260
tctggcggtg cgtggaggcg cgtgacttaa gattaagatg cttacaggac tatcttgaga 22320
aatatacata ttatatagac gcttgagttg cttcccaatc ctaaatagaa gcttttattc 22380
gtaggcaaga agggaagcag ctttacttga gccaatagct ttcaaggtgc acgttgtcac 22440
accaaggaca tccagaattt gattttatag ggggtgtgag aaagcacggg agaaaatatg 22500
ttattgatat ttggataata aatacaatac aagaggtccc tatttatagc tatacactac 22560
aaggagatat tactcctctt ccaatgtggg acaagaatac actatacata tctgtaaact 22620
aacactcccc ctcaagtcgg tgcatacaca tcatatgtac cgatcttgtt acacatgtag 22680
ctaatacgag aaccaataag agacttagtg aaaatatctg ctagttgatc attcgacttt 22740
acaaactttg taacaatatc tcctgaaagt attttttctc tgacaaagtg acagtcgatc 22800
tcaatgtgtt tagtcctctc atggaacacc ggatttgaca caatatgaag agtagcttgg 22860
ttatcacaca ttagttccat cttgctgatt tctccgaatt ttaactcctt gagcaactgc 22920
ttgacccaaa ataactcaca cgtcgtcata gccatggccc gatattcggc ttcggcgcta 22980
gatcgagcaa ctacattctg tttcttgctc ttccacgaga ccaaattacc tcctactaga 23040
acacaatatc cagacataga acgtctatca aaaggtgatc ttgcccaatc agcatctgtg 23100
tacccaacaa tctgctcgtg gccttgatcc tcgaatagta atcctttgcc cggagctgac 23160
tttatatacc gaagaatgcg aacaactgca tcccagtgac tatcacaggg agaatccata 23220
aactgactta caacactcac cggaaaagaa atgtcaggtc tagtcactgt gaggtaattc 23280
aatttgccaa ccaacctcct atatctcgta gggtctctaa gaggctcccc ctgtccaggc 23340
agaagcttag cattcagatc cataggagag tcaataggtc tgcaacccat cattccagtc 23400
tcctcaagaa tgtctaagac atacttccgc tgtgaaataa caatacctga gctagactga 23460
gcgacctcaa tacctaaaaa atacttcaat ctgcccagat ccttagtctg gaagtgctga 23520
aagagatgtt gcttcagatt agtaatacca tcctgatcat tgccagtaat aacaatatca 23580
tcaacataaa tcactagata aatacacaga ttaggagcag aatgccgata aaacacagag 23640
tgatcagcct cactacgagt cataccgaac tcctgaataa ttgtgctgaa cttaccaaac 23700
caagctcgag gggactgttt caaaccatat agtgacctgc gcaatctgca cacacaacca 23760
ttaaactccc ctaagcaaca aaaccaggtg gttgctccat ataaacttct tcctcaagat 23820
cactgtggag aaaagcattc ttaatgtcta actgataaag aggccaatga cgtacaacag 23880
ccatggacaa aaagagacga acagatgcta ctttagccac gggagagaac atatcactat 23940
aatcaagccc aaaaatctga gtatatcctt ttgcaacaag acgagcctta aaccgatcaa 24000
cctggccatc cggaccgact ttgactgcat aaacccaacg acaaccaaca gtagacttac 24060
ctgcaggaag aggaacaagc tcccaagtgc aactcgcatg taaagcagac atctcgtcaa 24120
tcatagcatg tcgccatcct ggatgagata gtgcctcacc tgtagactta gggatagaaa 24180
cagtggacaa agaagatata aaagcataat gaggtgacga cagacgatga taacttaaac 24240
cgacatagtg gggattagga ttaagtgtgg atcatacacc tttgcggagt gcaattggtt 24300
gactaagagg agacaagtcc gcagtaggtg cagaatctga tgcggggcgt gaatcacctg 24360
ggcctgatgc tggatatgga cgacgatgat aagtcaagag tggtggagct gccgaaggtt 24420
gaactggatt atgtggagga actggagcta taggtggtgg agctacaact ggagctgtag 24480
gtggtggaac tagagtaact gaatctccaa aagatgaaac tggtagtacc tcagaaatat 24540
ctaagtgatg acctgaacct gtgaagtatg attgggtttc aaagaaggta acatcagcag 24600
acataaggta ctgctggagg ttaggagagt agcatcgata ccccttttgt gttctcgaga 24660
aacctagaaa tacgcactta agagcacgag gagctaactt atccgttcct ggaataaggt 24720
tatgcacaaa acaagtgctt ccaaagatac gaggtggaag agagaacaaa ggtaagtggt 24780
aaaacatgac agagaatgga acttggttct ggatagctga tgatgtcata cgattaataa 24840
gatagcaaga tgtaagaact gtatccccca aaaacgcaac ggagcatgag attgtatgag 24900
tagggtacga gcagtttcaa taaaatgtct attctttctt tcagctaccc cattttgttg 24960
agatgtgtac agacaagatg tttgatgaat aatcccatga gatttcataa actgctgaaa 25020
tggggaagac aaatactctc gggcattatc actacgaaat gtgcgaatag aaaccccaaa 25080
ttgattttga atttcagcgt ggaaggtctg gaaaatagaa aacagctcag atcgattttt 25140
tatcaaaaat atccaagtgc acctggaata atcatcaatg aaactgacaa aatagcagaa 25200
tcccaaggtg gaactgaccc gactaggacc ccaaacatct gaatggacta aagtaaaagg 25260
tgactctgct cgattatcaa gacgcctaag gaaatgggag cgagtatgct taccgagctg 25320
acatgactca cactctagag ctgacaagtg agataaacca gataccattt tctgaagttt 25380
tgacaaactg ggatgtccca accgtttatg taataaatct ggtgaatcag taacaggaca 25440
tattgtagat ggaagacaag atgcgagtcc atgtatttag caaggataag gtaataaagt 25500
ccgtttgatt cacgcccggt accaatgatc cgccccgtac tgcgttcttg tataaaaaca 25560
tggtcatcaa gaaataaaat aacgcattta agtgatttgg ctaagcgact aacaactatg 25620
agattaaaag gactattgcg aacataaagg actgaatcta aaggtaagga agaaagtggg 25680
cttgcttgac ctattgcagt tgccatggtt tgagacccat tggctattgt gacttttgga 25740
aaagattgag aatacgaaat agtagtgaaa agagatttgt taccagaaat atgatctgat 25800
gcacctgaat caatgaccca agactcagag gatgaagatt gggaaaaaca agtcacgcta 25860
ttacctgttt gaacaacaga agctatctca gaagatgtct gcttacatgc tttgtactaa 25920
aggaactcaa tataatctgc taaagaaacc atccgactat tcaaagcatc ggttcccatg 25980
tcgctacaat ttgtagtagt agggttaact tgaaatagtg gaaataagta actccggtga 26040
gaaaactgaa gaaatagctt gaaaacactg tttacaacag taaaaacaga acactgttct 26100
gcgccggaat ctactgtagc tgacggaaaa actcaaagta gtcggaatga aacgaaaaac 26160
agtaggggta ggatcggaat taccaggcga cccaactatt ctgaaggaag tttttcaaaa 26220
aatggccgga agtggtcgta cgtgtcggcg cgtgagctca cgcgcgtgag cttctggtgg 26280
cgcgtggagg cgcgtgagga ggctgctgcc ggagattttc actggggttt ggtcgccgga 26340
cagtgactac tcttgtggta gtgttggatt ttgcacaaca ctgacggaga taaagcagac 26400
gcaaacagcc ttgaaaaagt cgccggaaaa gacttccggt gactgatttc tcttcctgga 26460
atcgctggaa tttatgcaca gcgataaatc tctcacaatt gctctgatac catgtgagaa 26520
agcatgggag aaaatatgtt attgatattt ggataataaa tacaatacaa gaggtcccta 26580
tttatagcta tacactacaa ggagatatta cttctcttcc aatgtgggac aaaaatacac 26640
tatacatatc tgtaaactaa caaggggaat atcgtttaaa gataaaaaag atagcgtgca 26700
gaagattgca tacattagag atgcaaaata cagaataccc atactcccag ataatgcagt 26760
atgccttttg catgacccac tggttgaatg gaagcacctg gtcaatttac taggtgtgtt 26820
agtgattttt gctgcttcct tcccctttct aaactacata ctatctaaaa tgttaggggg 26880
acagaagccc agtcaatctg actaggtgat gttagtggtt tccgcttctt tctcccactt 26940
ctaaatgcgt actttctcaa atttaggagc atagaaactt aagcagctgc ctacctgagg 27000
aggtgcatgg gaacataaga gaatagactt tacctgtcat attttccata ccttagttaa 27060
ttacagtgtt atcctgataa tgatctgttt tctgtatcta ggctgaatcg agattcaatc 27120
gcttttggct gaaaggatgc tgctacagat ccttagttta catcattgtg gttcttattc 27180
tataagtact tcccctatca actacttcct tcttttttct taggttattt gcctcttagg 27240
ttgtttgcaa ggaaaggaac aatagatgtt ttgatggaat agcaactcca aaccacttcc 27300
ttaaggctaa tatactgttt ggccaagctt cttcaaagtc caaagccctt ttttgtcttc 27360
aaaaaagtat ctttttttcc caaagttgag gtgtttggcc aaacttttgg aaggaaaaaa 27420
aagtgctttt gagtaaagca gaagctcttg agaagtagaa aaagtagttt tttcccggaa 27480
gcattttttt gaaaagcact tttgagaaaa ataaacttag aaacactttt taaaagtttg 27540
gccaaacact aattgctgct taaaagtgtt tttcagattt attagccaaa cacaaactgc 27600
ttctcaccaa aagtactttt ttgaaaaata cttttttgaa aagtgatttt caaacaaagc 27660
acttttcaaa ataagtttat tttagaagct tgtcaaccgg ctataaatgt cttttatttt 27720
tacagctaga gtaccctaac acctgtaaat tcccctagac atttttttcg actttgttag 27780
ctcattaacc ctagtatagg actctttgtt ttggagctag caaactcttt tgttttccta 27840
tttttgcatc ttcttggtgc catttataat atctcttact tcaccaaaaa aaataagttc 27900
ccaaaatatg actaccttga gttggccaaa gcataaccaa agcttgggca caccagtgtt 27960
tgcgtgaatt ttatggatgt tccttacctt tatccttctg tgcttatgta gcatctgtct 28020
tggttaatct tttctgaagt ctatagtgta tttctgtgtt gcaacatgag tttactgtca 28080
atcttactgt ttgacctcaa ttttgggttc tttttgattt tgaaagacat cgtttaacag 28140
gttggcatgg ctgctactct tgctggtgtc tgtcaggtgc ctctcactgc tgttttgctt 28200
ctctttgaac tgacacagaa ttatcggata gttctgcccc tcttgggagc tgtggggttg 28260
tcttcttggg ttacatctgg acaaacaagg aaaagtgtag tgaaggatag agaaagacta 28320
aaagatgcaa gagcccacat gatgcagcga caaggaactt ctttctccaa catttctagt 28380
ttaacttatt cttcaggtgt gaaaccttca cagaaagaga gtaacctatg caaacttgag 28440
agttccctct gtctttatga atctgatgat gaagaaaatg atttggcaag gacaattcta 28500
gtttcacagg caatgagaac acgatatgtg acagttctaa tgagcacctt gctaacggag 28560
accatatccc tcatgctagc tgagaagcaa tcttgtgcaa taatagttga tgaaaataat 28620
tttctcattg gtctgctgac acttagtgat atccagaatt acagcaagtt gccaagagca 28680
gagggcaatt tccaggaggt agcttcttgg tacatttcaa tattcttaac tgatgaaaaa 28740
ataagggaaa ttgatctagc atgaaattaa gctaattata agttttacac tgtagaactg 28800
gtaaaacagg gttggctgga tatttctttg ttgaattttt aggattatat gtattgtttt 28860
agttttgtag gttgttttct gatgtgcttt ttgacttggc agaatcttaa gatgaaatgg 28920
aaggtgttta accaaaaaat agaattttca gtcaaagcct atatttagaa gaaaacgggt 28980
tattgataac caagttttac tttacttccc caacaatcta tttggtaaat agcaaaagta 29040
atgcgtatgt gagaaagcac gggagaaaat atattattga tattagatat tcaatataat 29100
acaagaggtc ctacacatca tatagctata gtctacaaac tacatattac tctcattcca 29160
atgtgggact acacataact aacactcccc ctcaagccgg tgcatacata tcatatgtac 29220
cgagcttgtt acacatgtaa ctaatacgag aaccagtaag agacttagtg aaaatatctg 29280
ctagttgatc atttgacttt acaaactttg taaaaatatc tcctgaaagt attttttctc 29340
tgacaaagta acagtcgatc tcaatgtgtt tagtcctctc atggaatagc ggatttgacg 29400
caatatgaag agcagcttgg ttatcacaca ccagttccat cttgctgatt tctccaaact 29460
ttaactcctt gagcaactgc ttgacccaaa ctaactctca cgttgccata gccattgccc 29520
gatattcgac gtcggcgcca gatcgagcaa ctacattctg tttcttgctc ttccacgaga 29580
ccaaattacc tcctactaga acacaatatc caggcgtaga acgtctatca aaaggtgatc 29640
ctgcccaatc agcatttgtg tacccaacaa tttgctcgtg gcctcgatcc tcgagtagta 29700
atcctttgct tggagatgac tttatatacc gaagaatgcg aacaactgca tcccagtgac 29760
tatcacaggg agaatccata aactgactta caacactcac cggaaaagaa atgtcaggtc 29820
tagtcactgt gaggtaattc aatttgccaa ccaacctcct atatctcgta gggtctctaa 29880
gaggctcccc gtgtctaggc agaagcttag cattcggatc cataagagag tcaataggtc 29940
tgtaacccat cattccagtc tcctcaaaaa tgtctaaggc ataattccgc tgtgaaataa 30000
caatacctga gctagactga ggcactgagc aacctcaata cctagaaaat acttcaatct 30060
gcccagatcc ttagtctgga agtgctgaaa gagatgttgc ttcagattag taatatcatc 30120
ctgatcattg ccagtaataa caatatcatc aacataaacc actagataaa tacacagatt 30180
aggagtaaag tgccgataaa acacagagag atcagcctca ctacgagtca tggcgaactc 30240
ctgaataatt atgctgaact taccaaacca agctcgaggg gactgtttca aaccatataa 30300
tgacctgcac aatctacaca cacaaccatt aaactccccc tgagcaacaa aaccaggtgg 30360
ttactccata taaacttctt cctcaagatc accgtggaga aaagcattct taatgtctaa 30420
ctgataaaga ggccaatgac gtacaacagc catggacaaa aagagacgaa caaatgctat 30480
tttagccacg ggagagaaag tatcactata atcaagccca aaaatctgag tatatccttt 30540
tgcaacaaga cgagccttaa gccgatcaac ctggccatcc gggccgactt tgaccgcata 30600
aacctaatga caaccaacat tagacttacc tgcaggaaga ggaacaagct cccaagtgcc 30660
actcgcatgt aaagcagaca tctcgtcaat catagcatgt cgccatcctg gatgagatag 30720
tgcctcacct gtagacttag ggatagaaac agtggacaaa gaagatataa aagcataatg 30780
aggtgatgac acacgatgat gacttaaacc gacatagtgg ggattaggat tacgtgtgga 30840
tcgtacgcct ttgcggagtg caattggttg actaagagga gacaagatcg tagtaggtgc 30900
agaatctgat gcagggcgtg aatcacttgg gcatgatgtt ggatgtggac gacgatgata 30960
agtcaagagt ggtggagctg cagaaggttg aactggatta tgtggaggaa ctggaggtgg 31020
agctacaact ggagctgtag gtggtggaac tggagctata agtggtggag ctacaactgg 31080
agctggagat gtagaggaag atgaatgaga gatagtgact gaatctccaa aaaataaaat 31140
tggtagtacc tcagaaatat ctaagtgatg acatgaacct gtgaagtatg attgagtttc 31200
aaagaaggta acatcagcgg acataaggta ccgctgaagg tcaagagagt agcatcgata 31260
ccccttttgt gttctcgagt aacctagaaa tacgcactta agagcacgag gagctaactt 31320
atctgttcct ggagtaaggt tatggacaaa acaagtgatt ccaaagatac agggtggaag 31380
agagaacaaa ggtaagtggg gaaacatgac aaagaatgga acttggtttt ggataactga 31440
agatggcata cgattaataa gatagcaaga tataagaact gcatcccccc aaaaacgaaa 31500
cggagcatga gattgtatga gtagggtacg agcaatttca ataagatgtc tattttttct 31560
ttcagctacc ccattttgtt gagatgtgta cagacaagat gtttgatgaa taatcccatg 31620
agatttcata aactgctgaa atggggaaga caaatactct cgggcattat cactaggaaa 31680
tgtgcgaata gaaaccccaa attgattttg aatttttagc gtggaaggtc tggaaaaata 31740
gaaaacaact cagatcgatt ttttatcaaa aatatccaag tgcaccttga ataatcatca 31800
attattcaat aaaactgaca aagtagcaga atcccaaggt ggaactgacc cgactaggac 31860
cccaaacatt tgagaatgga ctaaagtaaa aggtgactct gcttgattat caagacgccg 31920
agggaaatgg aagcgagtat gcttatcgaa ctgacatgac tcacactcta gagctgacaa 31980
gtgagataaa ccagatacca ttttatgaag ttttgacaaa ttgggatgtc ccgaccgttt 32040
atgtaataaa tttggtgtat tagtaacagg acaagttgtt gaaggaagac aagatgtgag 32100
tccgtgtgat ttagcaagga taaggtaata aagtccgttt gattcacgtc cggtaccaat 32160
aattcgtccc gtactgcgtt cctgtataaa aacatggtca tcaagaaata aaacaacgca 32220
tttaagtgat ttggctaagc gactaatagt tatgagatta aaaggactat tgggaacata 32280
aatgactgaa tataaaggta aggaaggaag tgagcttgct tgacttattg ttgttgccat 32340
tgtttgagac ctattggcca ttgtgactct tgaaagagat tgaaaatacg aaatagtagt 32400
gaaaagagat ttgttaccag aaatatgatc tgatgcacct gaatcaatga cccaaaactc 32460
agatgatgaa gattgggaga aacaagtcac gctattacct gtttaaacaa cagaagctat 32520
cacagaagat gtctgcttac atgctttgta ccgaaggaac tcaatataat ctgctaaaga 32580
aaccatccga ctattcaaag tatcggttcc catgtcgcta caatttgtag taataggatg 32640
gatagactcg gaaaattgta aagttatcgg aatttgtcgt aaccaggatc gagcaagctg 32700
tcttgaagaa atggtttcaa aaaatgtccg gaaaggtcac ttttacgccg gaaaaatata 32760
aaaatggtcg aaatttgatt tgaattagat gggtaggctc ggaattgtga ggagagcaga 32820
ctgtcctgaa gaagcttaat gaaaaaatgg ccggaaagtg gccggaaccc tcgccgtaaa 32880
agttgttacc ggcgcgtgaa ggcgcgtggc attttttctg ccagataaat tttcaggggt 32940
tggtcgtcgg agggtgatcc cttgtggtgg tgttggtttt tgcacaatac cgacaggcct 33000
taggtcaccc gaaaatttgc acgatgacta agttctttct tcccggttaa cgctggaatg 33060
acgcacatcg atcttttctc actaatgcta tgataccatg tgagaaagca cgggagaaaa 33120
tatattattg atattagata ctcaatataa tacaagaggt catatttata gctatagtct 33180
acaaagtaca tattactctc attcaaatgt gggactacac ataactaaca acgtaaatta 33240
acaaagagaa ataaggaatg taacaacagt caatccctaa aatcaaggta gaaaactttg 33300
ataaagcaga gaattataga atgtatttca gtagtacttg gaacttgtcc ttacaaataa 33360
aattctttat ccttatatag gggcgtacaa tcataacatt tttcgcactt aattcgaatt 33420
cattatgagc attaattgta ttgattgccc gttatcatag ataaccataa ctgacgtatt 33480
tgtaactata aatgccttat aacggctctg attccccttc cttatttact tctggtttgt 33540
gtatctttcc ttctttttag cctttattca ttcagttctc gcctcttctt tgacaactgt 33600
caagcccgat cctctgttct gtactgtctc gtgggtgttt cccccgtacc ttccttatat 33660
tcttaattct gttaattgag agtgtcactt gtcactatgc cattgttcca cgcgtcatgt 33720
ttcatccacg tgtaatatct tttttccacc aatacagata atcccccact ttctgaatat 33780
tctcaactga atattcgggt aagtttttat ggcgggaatt ctttgccgtc gtttttcgag 33840
tatcatcgtg tcatcttcag aaccgatgtg acgtacgtca cgtctattta atgcctatgc 33900
caggtggctt ctatcgattg gctctgcagt tttttagcgc tttttagggt ttttcagcgg 33960
ctgcgtcagt cacgaagtga cggttccatt atgacgcttc ataatgacta actttaatga 34020
tggtcgtgtc ttcttattaa tacttcattc ctttttgatc tcttggagtc ttccttcttc 34080
agtatccacc acattacttc tttgtatttc tgcatcttct ctttgatatt cctttggaca 34140
atcatgtctt cttctacacc agacccccgt aaggttgtga ttgttgacga acttgatctt 34200
tctactgctc ctactagaag taggagaggt ggtagacttc gtagtcttgg ttcactatct 34260
aatcgtggtt cttcttccca gggtagtgct gctaagccat cttcttctag acctagggct 34320
cctttaaccc ctagatcttc ttctaggaat agagatttaa atgatccagt gcgcgaacct 34380
acagttgcag agattgttcc tcaagaattt tcttttgtaa ctgaccgtga aaccataagg 34440
aatcaaattt cttctatagc ctccctcaat accgctaacc tttatccaag tttaatcagt 34500
aatggtcttc tctcccgggt tcgaagagaa tattactgaa accagatttc ccaattttag 34560
tccctggtgc caaccagaga attactccat accatgttgg tttttccttt gtttacacct 34620
acccttttac tttagggttc aaaccaccta ttgaaccagt aatcattgaa ttctgtcgtt 34680
atttcaacgt gtgtcttggc cagattgacc acatagtatg gagggctgtt catgccttcg 34740
ttatttatca gatttggttt ccatgccttt cacttttcag cacttgcttc atctctactc 34800
ccctaaattg tttcgtgaag tagtttttac tctcgtggct agaagtaaga gagtgttggt 34860
tagccttgaa gacgattggg accgtggctg gtacgctcgt tttgttgctg ctcccactag 34920
tgcattagtg ggtgaagaaa atatgccttt cccggagaaa tggaactttg cacgtaagct 34980
ttcttctcct cttttttttt gtcttaaaaa aactccatgt aatcatatac ccacttcttc 35040
agcaactatg gaagtttttt atgcttgggt agaaaagatg ttaactgctg cgcctatgga 35100
gaaaagatcc tggaaatact tttctcaaag atttggttgg aaagtgaaga cgcacggtac 35160
tttttacctt cattgttttt ccttttctct tccttgtttg ttcaatgatt tctcatcctt 35220
cccttttttt ttactagggt ttccgattcg tggtattagt cccgcgtctg ttccatcaac 35280
taggctttcc gtgattcttg ttcaggaaag aattttaagt gcttcttctt caaaaaggaa 35340
aactgacgga gcccgtggct ctgatgacga agaagaaaca gaggagggtt ctttggtgcg 35400
aaggtcacgc gtcaggagac gcgtggtttc tgatgatgaa actactcctt ctcatgaccc 35460
tctatctagt tcaatccctt ttagactcac ggatgagcta gagagtaccc ctttagtgat 35520
ttcttatgat gatgctgttg atccccctcc aagttctgtt gatagattgt ttgctcatgg 35580
cttcgagggt gatgaagttt tgggcctgtt tctgaagaat tgccccttgc ttcccttcca 35640
gtttcagttt tcattaaccc ttccgtgtcc ttacctgatg atactcctgt tgttattctc 35700
gtggctgctt ctactccgtc atctattccc gtgactgctt ctcatgcaga ggccaaacct 35760
tctagcagca gaagggcaat gaaaagagtt gttgttgagg ttcctgaagg tgagaactta 35820
ttaagaaaat ccggtcaagc cgacgtgtag ttgaaaccta tgctcggccc cgtagagaag 35880
aagaagttag aaagccatag ctcactcact ttaatgaatg atatcgttca ttcttccttg 35940
aaagtacaag cttaattata tttcctttct tttctctttc ttattcataa ctcttcctcc 36000
ttttttgcag atcaacttga ttggcacaga gcttatgaaa agagtttctc aggcggaccg 36060
gcaagttata gatttgcgca ccgaggctga taactggaag gaacaattcg aaggtcttca 36120
attggaaaaa gaggttccgg cggaagagaa gaatgctttg gaacaacaga tgagagtgat 36180
tgcctctgaa ttagcagttg aaaaagcttc ctcgagccag gttggaaagg ataagtatat 36240
acttgaatcc tcctttgctg aacaactttc caaggcaact gaagaaataa ggagtttgaa 36300
ggaactcctt aatcaaaaag aggtttatgc gagagaattg gttcaaacac ttactcaagt 36360
tcaggaagat ctccgtgcct ctacttataa gattcagttc ttggaaagtt ctctcgcttc 36420
tttgaagaca gcttacgatg cctctgaagc agaaaaagaa gagctgagag ctgagattta 36480
ccagtgggag aaggattatg agattctcga ggataatcta tcgttggatg taagttgggc 36540
tttcttaaac actcgtctcg agactctagt tgaagccaac catgagggtt ttgaccttaa 36600
tgctgagatt gctaaggcta aagaagcaat tgataaaact cagcaacgtc aaatcttttc 36660
ctcacctgaa gacgaaggtc ccgaaggtga tggagattga 36700
<210> 5
<211> 786
<212> PRT
<213> Nicotiana tabacum
<220>
<223> Protein sequence of CLC-Nt2 from Nicotiana tabacum, translated from SEQ ID NO:1 of PCT/EP2013/077532
<400> 5
Met Glu Glu Pro Thr Arg Leu Val Glu Glu Ala Thr Ile Asn Asn Met
1 5 10 15
Asp Gly Gln Gln Asn Glu Glu Glu Arg Asp Pro Glu Ser Asn Ser Leu
20 25 30
His Gln Pro Leu Leu Lys Arg Asn Arg Thr Leu Ser Ser Ser Pro Phe
35 40 45
Ala Leu Val Gly Ala Lys Val Ser His Ile Glu Ser Leu Asp Tyr Glu
50 55 60
Ile Asn Glu Asn Asp Leu Phe Lys His Asp Trp Arg Arg Arg Ser Arg
65 70 75 80
Val Gln Val Leu Gln Tyr Val Phe Leu Lys Trp Thr Leu Ala Phe Leu
85 90 95
Val Gly Leu Leu Thr Gly Val Thr Ala Thr Leu Ile Asn Leu Ala Ile
100 105 110
Glu Asn Met Ala Gly Tyr Lys Leu Arg Ala Val Val Asn Tyr Ile Glu
115 120 125
Asp Arg Arg Tyr Leu Met Gly Phe Ala Tyr Phe Ala Gly Ala Asn Phe
130 135 140
Val Leu Thr Leu Ile Ala Ala Leu Leu Cys Val Cys Phe Ala Pro Thr
145 150 155 160
Ala Ala Gly Pro Gly Ile Pro Glu Ile Lys Ala Tyr Leu Asn Gly Val
165 170 175
Asp Thr Pro Asn Met Tyr Gly Ala Thr Thr Leu Phe Val Lys Ile Ile
180 185 190
Gly Ser Ile Ala Ala Val Ser Ala Ser Leu Asp Leu Gly Lys Glu Gly
195 200 205
Pro Leu Val His Ile Gly Ala Cys Phe Ala Ser Leu Leu Gly Gln Gly
210 215 220
Gly Pro Asp Asn Tyr Arg Leu Arg Trp Arg Trp Leu Arg Tyr Phe Asn
225 230 235 240
Asn Asp Arg Asp Arg Arg Asp Leu Ile Thr Cys Gly Ser Ser Ser Gly
245 250 255
Val Cys Ala Ala Phe Arg Ser Pro Val Gly Gly Val Leu Phe Ala Leu
260 265 270
Glu Glu Val Ala Thr Trp Trp Arg Ser Ala Leu Leu Trp Arg Thr Phe
275 280 285
Phe Ser Thr Ala Val Val Val Val Ile Leu Arg Ala Phe Ile Glu Tyr
290 295 300
Cys Lys Ser Gly Asn Cys Gly Leu Phe Gly Arg Gly Gly Leu Ile Met
305 310 315 320
Phe Asp Val Ser Gly Val Ser Val Ser Tyr His Val Val Asp Ile Ile
325 330 335
Pro Val Val Val Ile Gly Ile Ile Gly Gly Leu Leu Gly Ser Leu Tyr
340 345 350
Asn His Val Leu His Lys Ile Leu Arg Leu Tyr Asn Leu Ile Asn Glu
355 360 365
Lys Gly Lys Leu His Lys Val Leu Leu Ala Leu Ser Val Ser Leu Phe
370 375 380
Thr Ser Ile Cys Met Tyr Gly Leu Pro Phe Leu Ala Lys Cys Lys Pro
385 390 395 400
Cys Asp Pro Ser Leu Pro Gly Ser Cys Pro Gly Thr Gly Gly Thr Gly
405 410 415
Asn Phe Lys Gln Phe Asn Cys Pro Asp Gly Tyr Tyr Asn Asp Leu Ala
420 425 430
Thr Leu Leu Leu Thr Thr Asn Asp Asp Ala Val Arg Asn Ile Phe Ser
435 440 445
Ile Asn Thr Pro Gly Glu Phe Gln Val Met Ser Leu Ile Ile Tyr Phe
450 455 460
Val Leu Tyr Cys Ile Leu Gly Leu Ile Thr Phe Gly Ile Ala Val Pro
465 470 475 480
Ser Gly Leu Phe Leu Pro Ile Ile Leu Met Gly Ser Ala Tyr Gly Arg
485 490 495
Leu Leu Ala Ile Ala Met Gly Ser Tyr Thr Lys Ile Asp Pro Gly Leu
500 505 510
Tyr Ala Val Leu Gly Ala Ala Ser Leu Met Ala Gly Ser Met Arg Met
515 520 525
Thr Val Ser Leu Cys Val Ile Phe Leu Glu Leu Thr Asn Asn Leu Leu
530 535 540
Leu Leu Pro Ile Thr Met Leu Val Leu Leu Ile Ala Lys Ser Val Gly
545 550 555 560
Asp Cys Phe Asn Leu Ser Ile Tyr Glu Ile Ile Leu Glu Leu Lys Gly
565 570 575
Leu Pro Phe Leu Asp Ala Asn Pro Glu Pro Trp Met Arg Asn Ile Thr
580 585 590
Ala Gly Glu Leu Ala Asp Val Lys Pro Pro Val Val Thr Leu Cys Gly
595 600 605
Val Glu Lys Val Gly Arg Ile Val Glu Ala Leu Lys Asn Thr Thr Tyr
610 615 620
Asn Gly Phe Pro Val Val Asp Glu Gly Val Val Pro Pro Val Gly Leu
625 630 635 640
Pro Val Gly Ala Thr Glu Leu His Gly Leu Val Leu Arg Thr His Leu
645 650 655
Leu Leu Val Leu Lys Lys Lys Trp Phe Leu His Glu Arg Arg Arg Thr
660 665 670
Glu Glu Trp Glu Val Arg Glu Lys Phe Thr Trp Ile Asp Leu Ala Glu
675 680 685
Arg Gly Gly Lys Ile Glu Asp Val Leu Val Thr Lys Asp Glu Met Glu
690 695 700
Met Tyr Val Asp Leu His Pro Leu Thr Asn Thr Thr Pro Tyr Thr Val
705 710 715 720
Val Glu Ser Leu Ser Val Ala Lys Ala Met Val Leu Phe Arg Gln Val
725 730 735
Gly Leu Arg His Met Leu Ile Val Pro Lys Tyr Gln Ala Ala Gly Val
740 745 750
Ser Pro Val Val Gly Ile Leu Thr Arg Gln Asp Leu Arg Ala His Asn
755 760 765
Ile Leu Ser Val Phe Pro His Leu Glu Lys Ser Lys Ser Gly Lys Lys
770 775 780
Gly Asn
785
<210> 6
<211> 786
<212> PRT
<213> Nicotiana tabacum
<220>
<223> Protein sequence of CLC-Nt2 from Nicotiana tabacum, translated from SEQ ID NO: 2 of PCT/EP2013/077532
<400> 6
Met Glu Glu Pro Thr Arg Leu Val Glu Glu Ala Thr Ile Asn Asn Met
1 5 10 15
Asp Arg Gln Gln Asn Glu Glu Glu Arg Asp Pro Glu Ser Asn Ser Leu
20 25 30
His Gln Pro Leu Leu Lys Arg Asn Arg Thr Leu Ser Ser Ser Pro Phe
35 40 45
Ala Leu Val Gly Ala Lys Val Ser His Ile Glu Ser Leu Asp Tyr Glu
50 55 60
Ile Asn Glu Asn Asp Leu Phe Lys His Asp Trp Arg Arg Arg Ser Arg
65 70 75 80
Val Gln Val Leu Gln Tyr Val Phe Leu Lys Trp Thr Leu Ala Phe Leu
85 90 95
Val Gly Leu Leu Thr Gly Val Thr Ala Ser Leu Ile Asn Leu Ala Ile
100 105 110
Glu Asn Ile Ala Gly Tyr Lys Leu Arg Ala Val Val Asn Tyr Ile Glu
115 120 125
Asp Arg Arg Tyr Leu Val Gly Phe Ala Tyr Phe Ala Gly Ala Asn Phe
130 135 140
Val Leu Thr Leu Ile Ala Ala Leu Leu Cys Val Cys Phe Ala Pro Thr
145 150 155 160
Ala Ala Gly Pro Gly Ile Pro Glu Ile Lys Ala Tyr Leu Asn Gly Val
165 170 175
Asp Thr Pro Asn Met Tyr Gly Ala Thr Thr Leu Phe Val Lys Ile Ile
180 185 190
Gly Ser Ile Ala Ala Val Ser Ala Ser Leu Asp Leu Gly Lys Glu Gly
195 200 205
Pro Leu Val His Ile Gly Ala Cys Phe Ala Ser Leu Leu Gly Gln Gly
210 215 220
Gly Pro Asp Asn Tyr Arg Leu Lys Trp Arg Trp Leu Arg Tyr Phe Asn
225 230 235 240
Asn Asp Arg Asp Arg Arg Asp Leu Ile Thr Cys Gly Ser Ser Ser Gly
245 250 255
Val Cys Ala Ala Phe Arg Ser Pro Val Gly Gly Val Leu Phe Ala Leu
260 265 270
Glu Glu Val Ala Thr Trp Trp Arg Ser Ala Leu Leu Trp Arg Thr Phe
275 280 285
Phe Ser Thr Ala Val Val Val Val Ile Leu Arg Ala Phe Ile Glu Tyr
290 295 300
Cys Lys Ser Gly Tyr Cys Gly Leu Phe Gly Arg Gly Gly Leu Ile Met
305 310 315 320
Phe Asp Val Ser Gly Val Ser Val Ser Tyr His Val Val Asp Ile Ile
325 330 335
Pro Val Val Val Ile Gly Ile Ile Gly Gly Leu Leu Gly Ser Leu Tyr
340 345 350
Asn Cys Val Leu His Lys Val Leu Arg Leu Tyr Asn Leu Ile Asn Glu
355 360 365
Lys Gly Lys Leu His Lys Val Leu Leu Ala Leu Ser Val Ser Leu Phe
370 375 380
Thr Ser Ile Cys Met Tyr Gly Leu Pro Phe Leu Ala Lys Cys Lys Pro
385 390 395 400
Cys Asp Ser Ser Leu Gln Gly Ser Cys Pro Gly Thr Gly Gly Thr Gly
405 410 415
Asn Phe Lys Gln Phe Asn Cys Pro Asp Gly Tyr Tyr Asn Asp Leu Ala
420 425 430
Thr Leu Leu Leu Thr Thr Asn Asp Asp Ala Val Arg Asn Ile Phe Ser
435 440 445
Ile Asn Thr Pro Gly Glu Phe His Val Thr Ser Leu Ile Ile Tyr Phe
450 455 460
Val Leu Tyr Cys Ile Leu Gly Leu Ile Thr Phe Gly Ile Ala Val Pro
465 470 475 480
Ser Gly Leu Phe Leu Pro Ile Ile Leu Met Gly Ser Ala Tyr Gly Arg
485 490 495
Leu Leu Ala Ile Ala Met Gly Ser Tyr Thr Lys Ile Asp Pro Gly Leu
500 505 510
Tyr Ala Val Leu Gly Ala Ala Ser Leu Met Ala Gly Ser Met Arg Met
515 520 525
Thr Val Ser Leu Cys Val Ile Phe Leu Glu Leu Thr Asn Asn Leu Leu
530 535 540
Leu Leu Pro Ile Thr Met Leu Val Leu Leu Ile Ala Lys Ser Val Gly
545 550 555 560
Asp Cys Phe Asn Leu Ser Ile Tyr Glu Ile Ile Leu Glu Leu Lys Gly
565 570 575
Leu Pro Phe Leu Asp Ala Asn Pro Glu Pro Trp Met Arg Asn Ile Thr
580 585 590
Ala Gly Glu Leu Ala Asp Val Lys Pro Pro Val Val Thr Leu Cys Gly
595 600 605
Val Glu Lys Val Gly Arg Ile Val Glu Val Leu Lys Asn Thr Thr Tyr
610 615 620
Asn Gly Phe Pro Val Val Asp Glu Gly Val Val Pro Pro Val Gly Leu
625 630 635 640
Pro Val Gly Ala Thr Glu Leu His Gly Leu Val Leu Arg Thr His Leu
645 650 655
Leu Leu Val Leu Lys Lys Lys Trp Phe Leu Asn Glu Arg Arg Arg Thr
660 665 670
Glu Glu Trp Glu Val Arg Glu Lys Phe Thr Trp Ile Asp Leu Ala Glu
675 680 685
Arg Gly Gly Lys Ile Glu Asp Val Val Val Thr Lys Asp Glu Met Glu
690 695 700
Met Tyr Val Asp Leu His Pro Leu Thr Asn Thr Thr Pro Tyr Thr Val
705 710 715 720
Val Glu Ser Leu Ser Val Ala Lys Ala Met Val Leu Phe Arg Gln Val
725 730 735
Gly Leu Arg His Met Leu Ile Val Pro Lys Tyr Gln Ala Ala Gly Val
740 745 750
Ser Pro Val Val Gly Ile Leu Thr Arg Gln Asp Leu Arg Ala His Asn
755 760 765
Ile Leu Ser Val Phe Pro His Leu Glu Lys Ser Lys Ser Gly Lys Lys
770 775 780
Gly Asn
785
<210> 7
<211> 665
<212> PRT
<213> Nicotiana tabacum
<220>
<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; one start codon, translated from SEQ ID NO: 3 of PCT/EP2013/077532
<400> 7
Met Cys Asp Ser Ser Lys Val Asp Ser Asp Ser Gly Ile Gln Ile Gly
1 5 10 15
Ser Leu Leu Glu Glu Val Ile Pro Gln Gly Asn Asn Thr Ala Ile Ile
20 25 30
Ser Ala Cys Phe Val Gly Leu Phe Thr Gly Ile Ser Val Val Leu Phe
35 40 45
Asn Ala Ala Val His Glu Ile Arg Asp Leu Cys Trp Asp Gly Ile Pro
50 55 60
Tyr Arg Ala Ala Ser Glu Glu Pro Ile Gly Val His Trp Gln Arg Val
65 70 75 80
Ile Leu Val Pro Ala Cys Gly Gly Leu Val Val Ser Phe Leu Asn Ala
85 90 95
Phe Arg Ala Thr Leu Glu Val Ser Thr Glu Gly Ser Trp Thr Ser Ser
100 105 110
Val Lys Ser Val Leu Glu Pro Val Leu Lys Thr Met Ala Ala Cys Val
115 120 125
Thr Leu Gly Thr Gly Asn Ser Leu Gly Pro Glu Gly Pro Ser Val Glu
130 135 140
Ile Gly Thr Ser Val Ala Lys Gly Val Gly Ala Leu Leu Asp Lys Gly
145 150 155 160
Gly Arg Arg Lys Leu Ser Leu Lys Ala Ala Gly Ser Ala Ala Gly Ile
165 170 175
Ala Ser Gly Phe Asn Ala Ala Val Gly Gly Cys Phe Phe Ala Val Glu
180 185 190
Ser Val Leu Trp Pro Ser Pro Ala Glu Ser Ser Leu Ser Leu Thr Asn
195 200 205
Thr Thr Ser Met Val Ile Leu Ser Ala Val Ile Ala Ser Val Val Ser
210 215 220
Glu Ile Gly Leu Gly Ser Glu Pro Ala Phe Ala Val Pro Gly Tyr Asp
225 230 235 240
Phe Arg Thr Pro Thr Glu Leu Pro Leu Tyr Leu Leu Leu Gly Ile Phe
245 250 255
Cys Gly Leu Val Ser Val Ala Leu Ser Ser Cys Thr Ser Phe Met Leu
260 265 270
Gln Ile Val Glu Asn Ile Gln Thr Thr Ser Gly Met Pro Lys Ala Ala
275 280 285
Phe Pro Val Leu Gly Gly Leu Leu Val Gly Leu Val Ala Leu Ala Tyr
290 295 300
Pro Glu Ile Leu Tyr Gln Gly Phe Glu Asn Val Asn Ile Leu Leu Glu
305 310 315 320
Ser Arg Pro Leu Val Lys Gly Leu Ser Ala Asp Leu Leu Leu Gln Leu
325 330 335
Val Ala Val Lys Ile Val Thr Thr Ser Leu Cys Arg Ala Ser Gly Leu
340 345 350
Val Gly Gly Tyr Tyr Ala Pro Ser Leu Phe Ile Gly Ala Ala Thr Gly
355 360 365
Thr Ala Tyr Gly Lys Ile Val Ser Tyr Ile Ile Ser His Ala Asp Pro
370 375 380
Ile Phe His Leu Ser Ile Leu Glu Val Ala Ser Pro Gln Ala Tyr Gly
385 390 395 400
Leu Val Gly Met Ala Ala Thr Leu Ala Gly Val Cys Gln Val Pro Leu
405 410 415
Thr Ala Val Leu Leu Leu Phe Glu Leu Thr Gln Asp Tyr Arg Ile Val
420 425 430
Leu Pro Leu Leu Gly Ala Val Gly Leu Ser Ser Trp Val Thr Ser Gly
435 440 445
Gln Thr Arg Lys Ser Val Val Lys Asp Arg Glu Lys Leu Lys Asp Ala
450 455 460
Arg Ala His Met Met Gln Arg Gln Gly Thr Ser Phe Ser Asn Ile Ser
465 470 475 480
Ser Leu Thr Tyr Ser Ser Gly Ser Pro Ser Gln Lys Glu Ser Asn Leu
485 490 495
Cys Lys Leu Glu Ser Ser Leu Cys Leu Tyr Glu Ser Asp Asp Glu Glu
500 505 510
Asn Asp Leu Ala Arg Thr Ile Leu Val Ser Gln Ala Met Arg Thr Arg
515 520 525
Tyr Val Thr Val Leu Met Ser Thr Leu Leu Met Glu Thr Ile Ser Leu
530 535 540
Met Leu Ala Glu Lys Gln Ser Cys Ala Ile Ile Val Asp Glu Asn Asn
545 550 555 560
Phe Leu Ile Gly Leu Leu Thr Leu Gly Asp Ile Gln Asn Tyr Ser Lys
565 570 575
Leu Pro Arg Thr Glu Gly Asn Phe Gln Glu Glu Leu Val Val Ala Gly
580 585 590
Val Cys Ser Ser Lys Gly Asn Lys Cys Arg Val Ser Cys Thr Val Thr
595 600 605
Pro Asn Thr Asp Leu Leu Ser Ala Leu Thr Leu Met Glu Lys His Asp
610 615 620
Leu Ser Gln Leu Pro Val Ile Leu Gly Asp Val Glu Asp Glu Gly Ile
625 630 635 640
His Pro Val Gly Ile Leu Asp Arg Glu Cys Ile Asn Val Ala Cys Arg
645 650 655
Ala Leu Ala Thr Arg Glu Gln Leu Cys
660 665
<210> 8
<211> 408
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: RNAi sequence used to silence CLC-Nt2
<400> 8
gtcatcatca ggtgtgtgtg ctgctttccg ttctccagta ggtggtgtcc tatttgcttt 60
agaggaagtg gcaacatggt ggagaagtgc actcctctgg agaactttct tcagcacggc 120
agttgtggtg gtgatactga gggccttcat tgaatactgc aaatctggca actgtggact 180
ttttggaaga ggagggctta tcatgtttga tgtgagtggt gtcagtgtta gctaccatgt 240
tgtggacatc atccctgttg tagtgattgg aatcataggc ggacttttgg gaagcctcta 300
caatcatgtc ctccacaaaa ttctgaggct ctacaatctg atcaacgaga agggaaaact 360
acataaggtt cttctcgctc tgagtgtctc ccttttcacc tccatttg 408
<210> 9
<211> 282
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: RNAi sequence used to silence CLCe
<400> 9
gaaatccttt accagggttt tgagaatgtt aatattctgc tagaatctcg cccactagtg 60
aaaggcctct ccgctgatct gttgctccag cttgtagctg tcaaaatagt aacaacttca 120
ttatgccgag cctctggatt ggttggaggc tactatgcgc catctctatt catcggtgct 180
gctactggaa ctgcatatgg gaaaattgtt agctacatta tctctcatgc tgatccaatc 240
tttcatcttt ccatcttgga agttgcatcc ccacaagctt at 282
<210> 10
<211> 44432
<212> DNA
<213> Nicotiana tabacum
<220>
<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; two start codons
<400> 10
atgattagcg gccaaaacac tgtgctgcac aatcctccta attcgctctt caattcctta 60
tctcctcgcc atatctgtat atctttctgt aacgacaaag ctttaaaaaa gtcagtcacg 120
cactccgccc ctcggtttgc tcgtctgtta aacaatgaat cacggaagtt gttgggtcgt 180
catccaaatt gctggccttg ggctcgacga ccatctcttc ctccgggacg ttcctctgac 240
ggaaacattg aaaaagaaca agatatgtgc gacagcagca aagtcgatag tgatagtggc 300
atccagatag gatctctgct cgaggaagtt atcccacaag gcaataatac cgctataatc 360
tcggcttgct ttgttggcct cttcaccggt atcagtgtcg tgcttttcaa cgctgcggta 420
cgtgcgctat aggtctttca tttctctttt catgtactat tcctccttac ttacttggcc 480
tcagtcaatc agccccctgc ctactttaaa ttattgtaca ttttatcaga ggagtgtcct 540
atacatcaaa ttcacataac ttagtaaaat atgctgatat tctgaatttt aaacttacca 600
gcttagaaca tccaggttag ttcagaaaca gataatctaa attggtctca tttataagtc 660
attttgttat tcaagacata caatttggct cttgataaaa gattatgcag cgcccgatga 720
ttacctaata tttatcagca acccatgtaa tttaacaata ttgtcaccat ataaaagaga 780
actgaagaga atgttcaatt tgtggtcata taacggatat ctcccttggt taggttcatg 840
aaatacgtga tctttgttgg gatggaattc catatcgagc tgcctcagag gagcccattg 900
gagtacattg gcaacgtgta atcttagtac cagcttgtgg cggtttggta gtcagctttt 960
tgaatgcctt ccgagccact ctggaggttt caactgaagg aagttggaca tcatctgtta 1020
aatctgtatt ggaaccagtt ttgaagacaa tggccgcttg tgtcacatta ggaactggga 1080
attccttagg accagaaggc cctagtgttg aaattggcac atctgttgcc aagggagttg 1140
gagctctgct tgataaaggt ggtcgtagaa agctgtcact caaggctgct ggatcagctg 1200
ctggaatcgc ttctggtttg ttccccatat tattcttggt tctgaaccat acatggtaca 1260
ttttccttat aattacatgt agcctgttgt atgctttcct ctttcccggg aagccttttt 1320
gtaaatacaa gtgtgtttgc actcaaacca ataaactgta aaaaaggtga actccttaag 1380
caagcaaaag cattagaaat gtaaactaga catatttctc agattgagag tctgagagat 1440
tagaacacga gtgtttccat tagagagaga aaagagactt ctagatattt ctattatctc 1500
tgtaagagtg aatccgttcc tatacaaaaa ataggccttc attaaataca agcttgggct 1560
gggtactact gggccaaagt aaaaaataaa aagaatcacc cactatcaaa tgggcctagt 1620
ctaacaaccc ccttcaagct ggagggtgac acaaccccta gcttgcgaat atgaaaatga 1680
tgagcaggcc caagtaacac tttggtaaga acatcaacca cttgagaagc actggagttg 1740
tgaaatagac tgatcaggcc attcccaagc ttgccacaaa caaaatgaca gtccagctta 1800
atgtgtttag tgcgttcatg gaaaacttgg ttttttgcaa tgtggacttc ctgattatca 1860
caaaataaag gaacaggtaa agaaggagaa actccaatat cagacaataa tttggtgagc 1920
caagacacct ctgcaacagc cttactcatg gacctatact cagcttcaat tgatgatagt 1980
gagacaacag gttgcttctt tgatttccag ctcaccaagc tgccccccaa gaaaaataca 2040
aaaaccagtg acagacctgc ggctgtctgg gcaagaagcc caatcactgc acaataaagc 2100
tgcaaagaca agtctggaga gttattgcgg aagattccaa agtcaaaagt gcccttgagg 2160
tatcttagca agtgcagggc agcctgcatg ttaggaacac agggagactg cataaactga 2220
ctcagatgct gaacaacaaa actaaggtca ggccttgtgc gtatcaaaaa gtttagcttg 2280
tgcattagac tcctgtactc ttcaggcctg ggcaaaggag tgccaatctt agcttttaac 2340
ttcacattca attcaagggg gcaagtgaca gaagagcaat tcgaggaatg aaaatcagcc 2400
agcaaatcat gaatgaactt tttctgatga agaagaaccc cagaatcagt gtataaaacc 2460
tcaatgctaa ggaagtaatt aagagagccc atgtccttaa tcttgaactg gtcactgaga 2520
aaggacttca aagcagccaa ttcagctaga tcacacctag tcaatatgat atcattcaca 2580
tagacaacca agatgaccaa ggaatcccta gaacccttgg taaaaataga gaaatcattc 2640
aaggaacgag agaagccatt agagcacaag gcttgagata atttagcata ctattgtctt 2700
gaagccagtc ttaaaccata aagagacttc tggagtttgc atactaaagg agcagaagaa 2760
gagtgaggaa cagttaggcc cggtggcagc ttcatgaata cctcctcatc aaggtcccca 2820
tgtaagaaga cattattcac atctagttga aagaggggcc agtgttgttt aacagctaca 2880
acaataagag ttttgacaat agacatattg accacaggag aaaaagtttc attaaagtca 2940
ataccctcaa cttgagtgac ctagctttat atctctcaat actttcatta gccctatatt 3000
taaccttgta tacccactta caactagtag gtttcttgcc aggaggcaat tcaacaatgt 3060
cccaagttct gttggcatcc aaggcctcaa attcacatct catggctgcc tgccattcag 3120
gaacagctgc aacctgagag taagaataag gctcaggaac atgaagttga ctaagagaag 3180
gagcattaga aatagatctg gagggaggag gagaagaagt ggaggtgcag acataactct 3240
tgagatagtt ggttggattg tgtggcacgg aagatcttct caaagcagga ggaggtacaa 3300
gagagttaga ataatgagaa ggagaagaga tggaagtggg aacagagaag attgagaagc 3360
agtagaagga gaaagtgaag gagatgaagg agaggaagaa gacggaaagg aacattcatc 3420
aaaacaagca gaaaagggaa aggggaagac ttgaggtact acatgagagg attgaaagaa 3480
aggaaaaatg gtgttcataa aaaatgacat cttttgatac aaaacaggtg ttattctgaa 3540
gattaaggcg cttgtagccc tttttggcaa aagggtagcc aatgaaaaca caaggaaggg 3600
acctaggatg aaatttgttt tgtgaggggt ggtgacagtt gagtaacaga ggcacccaaa 3660
agctctaagg tggtgataag tagggtggaa gaatgaagca attcataggg acttttgtga 3720
ttaagaagag gaaaaggaaa tctgttaatt aaatatgtgg cagttaaaaa gcagtcaccc 3780
caaaatttaa gtggtagatg agactgaaac ataagtgacc tagcagtctc tagtaaattt 3840
ctgtgttctc tttctacaat accattttat tggggggtgt gaggacagga ggtttggtgt 3900
actatccctt tttctgaaaa gaaaaggcaa ccagaagaac tagatcccag ttccaaagca 3960
ttatcactcc taacagtttg aactttagat tggaattggg tttcaaccat agcaatgaaa 4020
accttgagca aatcaaaggc attgcggcac ccattaaatg tgtccaagta gccctagagt 4080
agtcatctac aatggttaaa aaatacctag aaccattata ggtaggagta gaatagggtc 4140
accaagtatt tatgtgtatt agctgaaaag gctgggtgga gtgaatagaa ctatcaggga 4200
aggacaacct ggtctgcctc gctaaaggac aaaccggact agtgaatgac cgtttggaag 4260
acagtttgca attaagacca gaaatgcatt tcattttata gaagggaata tggccaagtt 4320
tgtaatgcca aacaacatca tctttattca cattatgcaa agcagtacta gtatttacaa 4380
ttggagtatc atcaggtaca gaaataggag cagaaactga attaagcaaa caagaaataa 4440
ggaaattaga aagaggtaaa ggagatgatg ttggaggcct ggcattctga aatagtttgt 4500
agagtccatt gtccaatcta ccaagaacca ctggcttcct cactgaaggg ccctgtaggg 4560
tacaagtagc cttggtaaat tgtacaatat catcatcatg ggaaagtaat ttgtacacaa 4620
agatgagatt atattgaaaa ctaggaatat agagcacatt ataaagaatc aagtcaggga 4680
acaaggctaa ggaaccaata ttagtgacct taaccttata cccattagga agggagacaa 4740
ggtatggtac aggaagtgtt tgaacattaa aaaaacaaat gtttaaggga ggtcatgtgg 4800
tcagatgccc agggtctatt actcaaacta cactatctat catagtcagc ataaatgcac 4860
cataagacaa cccttgtgag gtaataactc accagcaaag ttggtagaag caagatagtt 4920
ggttgaagaa gtagatgatg ctgatgaaga cagttgagat tgttgaagta acattagctg 4980
agaatattgg ttcttggtaa gaccaggaac tggataggac tgttcaggag cagaggtacc 5040
ttcaggacca gctgacattg cagaaccacc agaggtatcc acctcagcat gggcaacaga 5100
ccttctggga ggaagagatc tatttgactt gaaatttgga ggaaagccat tgagcttata 5160
gcacttatca atgctatgtc cgggtttctt acaatagtag acatgtgaag ctcaaaagat 5220
cccttagagg tagtaccgga cctttgaggt tcaaaattta ttttaggaga gggaggaggc 5280
ctggatacac caacactgaa agaagcagaa tttgaggcat attgagttct agcaaaaatt 5340
tgtctttgct tctcatcaga tagcaaaatc ccatatacat taccaatgga aggtaagggc 5400
ttcatcatga tgatgttgct tcttgtttgg acataagtat cattcagtcc cataaagaac 5460
tggtagacct tttgttccct gtcttcagca gatttacccc cacaagtaca cattcaaact 5520
ctcccggcag acaaagatgc aatatcatcc catagtcgtt taattttgtt gaaatatgat 5580
gctatgtcca tggacccttg ggaaatatga gccagttcct tctttagctc aaagatccta 5640
gtacctctct tctaactcag tccaaatatt cttagcaaac tcagagtatt caacactctt 5700
ggatatttcc ttgtacatag agttagtcaa ccaagagacc acaaggtcat tgcaacgtta 5760
ccactgtctg gctagaggag aaccttcagg aggtctgtga gaagtaccat taatgaaatc 5820
tagcttgtta cgaatagaca aggcaactag gacattacgt ctccaattgc cataacagct 5880
tccatcaaaa ggaccggaaa ctaaggaagt tcccagcacg tctgatggat ggacatataa 5940
ggggcgacag ggatgggtat aatcatcttc atggaaaatt aggcgtaagg gagtagaaga 6000
agtcgcatca gcactggtgt tattatcatt tgccattttt ttcaacagat tgtcaatcaa 6060
ccaacacaat acagatacac atatatagat tgtgagaaag cacgagagaa aaatctatat 6120
tattgatatt ctatttaatt ataatacaat gagccctatt tatacaatac atatcatact 6180
cctattctat gtgggactag gactaattca tattatgtac ataactatct aacactcccc 6240
ctcaagccgg tgcatacaaa tcatatgtac cgaacttgtt acatatgtaa ctaatacaag 6300
gaccagtaag gaacttggtg aaaatatctg caaactgatc atttgacttc acaaactttg 6360
tagcaatatc tcatgagagt atcttttctc tgacgaaatg acaattaatc tcaatgtgtt 6420
tagttctctc atgaaacacc ggatttgatg ctatatgaat ggcagcttgg ttatcacaca 6480
tcagttccat cttgctgacc tcaccaaatt tcaactaatt aagtaaatgt ttgatccaaa 6540
ctagctcaca agttgtcaca gccattgctc gatattctgc ttctgcacta gaccgagcaa 6600
ccacattttg tttcttgctc ttccaagaca cctaattacc tcctactaaa acacaatatc 6660
cagacgtaga acatctgtca aaaggtgatc ctgcctagcc agcatttgag tacccaacaa 6720
tttgctcatg gcctcgatct tcaaacaata atctgttacc tggagctgat tttatatatc 6780
gaagaatgca gacaactgca tcccaatgac tatcacaagg agaatccaag aactgactta 6840
ccacactcac tggaaaggaa atatcaggtc taatcactgt gaggtaattt aatttaccaa 6900
ccagccgcct atatctagca ggatcgctaa gcggctcccc ctgtcctggt agaagtttag 6960
aattccgatc cataggagtg tcaataggtc tacaacgtgt cattcctgtc tcctcaagaa 7020
tgtctaaggc atacttcctt tgtgagataa caatacatgt gctagactaa gcgacctcaa 7080
tacctagaaa atactttaat ctgcccagat ccttagtctg aaagtgctga aagagatgtt 7140
gtttcaactt agtaatacca tcttgatcat tgccggtaat aacaatatta tcaacataaa 7200
ccaccagata aatactaaga tttgaagaag aatgccgata aaacacagag tgatcagctt 7260
cactacgagt catgccgaac tcttgaataa ctgtgctgaa cttaccaaac caggctcgag 7320
gagactgttt tagaccatag agggaccgac gcaaccgaca tacaaggcca ctagactccc 7380
cctgagcaac aaaaccaggt ggttgctcca tataaacttc acctcaaggt caccacgaag 7440
aaaagcattc ttaatgtcca actgatagag aggccaatgg agaacaacaa ccatggatag 7500
aaaaaggcgg actgatgcta ttttagccac aggagagaaa gtatcactgt aatcaagccc 7560
aaatatctga gtataccctt tggcaacaag acgagcctta agtcgatcaa cctggccatc 7620
tggaccaact ttgactgcat acacccaacg acaaccaaca ataaatttac ccgaaggaag 7680
aggaacaaac tcccaagtac cactcgtatg taaagcagac atctcgtcaa tcatagcctg 7740
tcaccaccct agatgagaca gtgcttcacc tggatggaaa tagaggacaa agatgataca 7800
aatgcacaat agggtgatga cagacgatgg taacttaaac cgacataatg gggattagca 7860
tttagtgtag accgttcacc tttccggagt gcaatcaatt gactaagagg agacaagtcc 7920
gcagtattag caggatcagg tgcaggacgt gaatcagctg ggcctgatgc tgggcgcgga 7980
cgacgatgat aagttaggag tggtagagct gtagaaggtt gaactggact aggcagtgga 8040
actgaagcta tatgtggtgg aactggagct ataggtggtg gagctggagc tgtaggtgaa 8100
gatgaatggg agatagtgac tgaatctcca aaagatggaa ctggtagcac ctcagatata 8160
tctaagtgat tacctggact ggtgaagtat gattgggttt caaagaaggt aacatcagca 8220
gacataaggt accacctgag gtcaggagaa tagcatcgat atcccttttg tgttctcgag 8280
taacccaaaa atacgcactt aagagcacga ggagctaatt tatcttttct tggagtaagg 8340
ttatgaacaa aacacgtgct cccaaaggca cggggtggaa gagagaacaa aggtaagtgg 8400
ggaaacaaga cagagaatgg aacttgattc tggatagctg aagatggcat acgattaata 8460
agatagcaag atgtaagaac tgcatccccc caaaaacgca acggaacgtg agattgtatg 8520
agtaaggtac gagcagtttc aataagatgt ctattctttc tttcagctac ccgattttgt 8580
tgggatgtgt atggacaaga tgttttatga ataatcccat gagagttcat aaactgttga 8640
aatgggaaag acaaatactc taaggcatta tcactacgaa atatgcggat agaaacccca 8700
aattgatttt gaatttcagc gtggaaggtc tggaaagtag aaaacaactc agatcgattt 8760
tttatcaaaa atatccaagt gcacctgtaa taatcatcaa tgaaactgac aaagtagcgg 8820
aatcccaagg tagaactgac ctgactagga ccccaaacat ctgaatggac taaagtaaaa 8880
ggtgactgac tctgctcgat tatcaagacg gcgagggaaa tgggagcacg tatgcttacc 8940
gagctgacat gactcacact ctagagtgga caagtgagat aaaccagata ccattttttg 9000
aagttttgac aaactgggat gtcccaaccg tttatgtaat agatctggtg aatcagtaac 9060
aggacaagtt gttgaagaaa gacaagatgt aagtccatgt gattttgcaa gaataaggta 9120
gtaaaatcca tttaattcac gcccggtacc aatgatccgc cctgtactgc gttcctgtat 9180
aaaaacaagg tcatcaagaa ataaaacaga gcatttaagt gatttggcta agcgactaac 9240
ggctatgaga ttaaaaagac taacgagaac ataaagaact gaatctaaag gtaaggaagg 9300
aagtggactt acttggctta ttccagttgc catggtttga gactcgttat ccattgtgac 9360
tgttgggagt gattgagaat atgaaatagt aatgaaaaga gatttgttac caaaaatatg 9420
atcagatgca cctgaatcaa tgacccaaga ctcagaggtt gaagattggg agacacaagt 9480
cacactacta tctgtttgag caacggaagc tatccctgaa gatgtttgtt tacatgtttt 9540
gaactgaagg aactcaatat aatccggtag agaaaccatc caactcttcg tagtattgga 9600
ttccattttg ctacaaccaa tttctcaaat tcttgattac aacttgtgtg gttaaccttg 9660
gaatgccaaa tcagaacacc cctttttttt ttttggaaaa cattgttcac tcgctggaaa 9720
ataaaaaagg ttgccggaat ttgatgaaac ttgaatagac cgactcggaa taatgtccta 9780
agaaggctgt ccaaaaggag ttttgtcaga aactgaccag aaggaggtcc acgcaccggc 9840
gcgtggacag atctcgccga aaaaaaaaat cactttggtt ggcgcgtgat ggcgcgtggg 9900
tggggttttt ccggtcgggt tttgtggggt ttgctccccc ggagatggag aacactgtgg 9960
tggtgttggt ttatgcacaa cactggtaaa aagtggtttt gatgcgaaca gctactcagg 10020
tcaccaaaaa attgcacggt gacgactgat ttcttcccgg atgtcgttgg aatgacgcac 10080
aacgataatt atctcaccaa tgctctgata ccatgtgaga aagtacggga gaaaaatcta 10140
tattattgat attctattta attataatac aatgagccct atttataaga ctaggattaa 10200
ttcatattat gtacataact atctaacata gatcaaatag gcatgcaatt cacaataatg 10260
gtgaataaaa tgatacgaag ttacccagct cttttcgcga tcgaaaagga gaaaatagcc 10320
ttcaatcaca aacgagaaag aagaatctcc ggcttgacag tagacgactt cgaaacccta 10380
gctcgagatg aaaaccacaa aatccccaaa tcacattacc aaccaaacaa tttgagatca 10440
caaatgttga atatgtgaga atccgactaa gaaatcaaca aaaaatcaat agaaatggtt 10500
gaagaatacc gacttgaacc ctaaatgagt cagacatcac ctagaatgaa atacaccttc 10560
gaaattgacg aaaacaggac cggttgaaag cggagaacgt gccatagaag gatctacgct 10620
ctgataccat gtaaacttga catacttctc agattgagag tctgagagat tagaaaacga 10680
gtgtttccat tagaaagaga gaaaagagac ttctagatat ttcgattatc tgtgtaaaaa 10740
tgaatccgtt cctatacaaa aattaggcct tcattaaata caagattcgg ccgggtatta 10800
ctggcccaaa gtaaaatata aaaagaatca cccactatca aatgggccta gtctaacaag 10860
aaaaccaaca aatagtcccc cccccccccc ccaaaagata ccactgaaat gacaccgggt 10920
gcccaaaaat aaagcagctt acttcttgac tttgagagga actgcaatcc ttatcggttt 10980
gagaggaact gcaatcagct ataagtagct tattaatttc cagtgcctgc attctgccaa 11040
gtactatgat atatttctga agctttgttt ccccagttcc tttttcagac gtttgctgtc 11100
aataaagttg agccagccaa cttggctccc acaagctact aattttgtcc aagcttactc 11160
tatgggagaa gttaaatttc ccaaattcct tgagcggaaa atgaaaaatg gactcaaagt 11220
gtcatattat gcaactatct aaagaaaaat actcaattga agtttagata agaaaagtga 11280
atgtatattg atgtagtctc cgttaggtga gaagcgtatc acttacccag caacatatgg 11340
acctaacatt ttactagtga agttttcaca ttgtatcaaa agctcaacaa acggaaaggt 11400
gactaatcct aaaatgttat ttcacatata tgggcacacg gtttgtcaac cttctcatac 11460
gtgcattatt tgttctctat ctttctattt catccgatat aaccaatcgt tattgtaaat 11520
tctataatgc ctgtggttac ttttgtcttt agtgacaaat gacatttagg ataaccatgt 11580
agttattgac ttatttcact tgaggtctct tccaattatg tagtagtaga gtgttgagat 11640
atggatatgt taccttctaa aaaaaagagt gtagagatgc ggatagtttg ctagctggct 11700
tttgtctccc ttcaagttga attagcaaaa gcttgtctca taagttggat agctagacaa 11760
gaaaaactcc aaattacttt atgtagagta ttcttaagct tgagtcgcga gttggaaact 11820
ggaattatgt aaaaaaacct ggaattattt ggttgagcct gctttttagt tttgtcaata 11880
tttccagtat ctaacccaac atgtttagag tgattcccgg agagcctcag tacaaggcat 11940
ttgcagagtc tttatgagag tccaggaagg ggcacacatt ctgtagaggt atagtcttgt 12000
ccttattttc agggttgaac tagttcttta gaagttacct aggcttccta atttccaaat 12060
ttctgccagg tccttttttg gtgaagtact tgaagtttaa taaatcaaat tttaatttct 12120
aacatatcct gagaaattta ttcacaaatt caactggtga cttctgatgc agaaacataa 12180
gcaactgctt atgggttcat atgttcctgc aattttattg ttgacatgga ttggcttcat 12240
atggttttgt tcctgcaatt ttatcgctga cactaatcct ttcatatggt tttatgtgga 12300
gtgttaaata gaggttaaga gacaagaaga ggctgaaaaa ggtgggcagt tcatttgtta 12360
gtagactact ctatttacta agagatatga tgtcccatac attactcgaa ttggctccga 12420
atccagattc cacttctttg ccgagtttcc ttattgtaca tagttcgact cgtcaaggga 12480
aattcacttc ctttgactga ataatgctag tttgagtagt accttacatt aaatggacca 12540
tttagttcta tctacttgat agaatagact ggtcatcaac tagttgcaaa tacaatgaca 12600
actttgccat gtttgcagag tcacctgatg aagaagtacc tcaattagta gaacatttct 12660
tgaatgttct acagtattct ctatgcctac atgaccacat cacttttcct tttgcgttgt 12720
gagaacttga acttggtgag cgggggttcc ccaggaatgg catcttgatg gcagatgacc 12780
attctgtcct tgtcttagct aatgcttctt gcattgcctc actagattta ttataccttt 12840
aaaaaatgtt tgccattgtt ctgccataat agaaggatgt acccagctgg tgcttcaaaa 12900
ctaatgaaat gctttacaat tgtcgagtcc taaaggatga tttgtggaat cagatctcaa 12960
acaattcttt ttgaggaaga aaaataccaa aggttttttc tgtttgttgg aagattaaaa 13020
atcctttaaa tggtaaagat ttatgaactt aattcagcgt ttttgtggcc attgctggaa 13080
aagagaaaaa acaatggcac ttcttcgagt ttgcttatcc aaaaaaaaga agaagagaat 13140
gtcacgtaat gcaatttcat cttaggaaac tttgcaggag aaaagcaaga gtgataaaac 13200
agaactattt gtttttttta acaagttgtt gtgacctatt tcttgtcatt cttatttgct 13260
aataagctaa tgtactatag ttcctgtact atggtttgtt ttgacttaat acggggatgt 13320
tcaatgagca ttttcttgtt ttttctgctt tcagcatctg ctgccttaca ggaattcatt 13380
ttctggaaat ttacttcttg ttctgctaac attttcctgt tatatcttgt cagtcatttt 13440
ctctccatgg ttatactgtt tgtgtcactt taaactctcc ttgttttcta ctttaaagga 13500
tttaatgctg ctgtcggggg ctgtttcttt gctgtggaat ctgtgttatg gccatcacct 13560
gcagagtcct ccttgtcctt aacaaatacg acttcaatgg ttattctcag tgctgttata 13620
gcttctgtag tctcagaaat tggtcttggc tctgaacctg catttgcggt cccaggatat 13680
gattttcgta cacctactgg taattttgga cttctttctc gagtttgatt cttaaataca 13740
attgtacccg tcacttacag caacaactac atttcaacag ctagttgggg ttggctacac 13800
agatcatcac tatccatttc aattcattta gtcccatttc tttcgaatat tgagtacttt 13860
gggattctat aatatcaagg ttctttatat tttctacttt gacgtacaaa tctctaaata 13920
gattaaagaa gactcctaga gacactggcc taatgcaaat gtaccaccat gaataaactt 13980
taatctgaaa tagctggtat cttatataag gacccttagc tttaattgtg ttctatattg 14040
atcttttggg acaacttcct tccaatatta tgtcttactt atacagttat acttatcctt 14100
aagccttact ctttagagtg gttatcccta attcaagctt ttgttggcac catagctagt 14160
ttggttctaa gtaaaaagtt actctttaga gtggtaactt tttgtcaatt ttcttagtga 14220
aaatataacc tctgtgacaa atctaccaag tataaatcca atttggttct atgtcatcct 14280
tgtagtttat ccaagtcaat gctccatcac tcttacaaag gttcatcgta tgactaatct 14340
tttttggaga aaggtaacag tttgtattga taataagatc agcgccaggt tggtcattag 14400
tgctaatagc tgtacgtaca actccaaaag agcaaaagac aagcacctga tgtaaggtaa 14460
attacaagct gcctataaaa tctatcaggt gtcctatctc actaaacatt tcttgtttac 14520
accaaaaaaa taaaacaagg aaagacaatc catcttaatc ttctgaatgg agtttctttt 14580
tccttcaaaa catctggagt tccttccgtt ccatgcaatc caccatatac aagctgggat 14640
gattttccat ttgtctttat ccatttcttc taccaattcc cttccaattg attagaagtt 14700
ccaatgtggt tctagatatg acccaattaa ctcccaacag ataaaagaag atgtgccacg 14760
gatttgtagt gattctgcaa tgtaggaaca agtgagcatt actttctact tcctgtccac 14820
aaagaaaaca tcttgagcaa atctggaaac ctcttctttg taagttatca tgtgttaaac 14880
atgccttttt caccaccaac cagacaaaac atgatacttt gggaggagtt ttaaccctcc 14940
aaatgtgttt ccaaggccac acctcagttg ttgaaacatt aggatgtaga gtccagtatg 15000
ctcttttact gaaaatgcac cttttctatt cagcttttaa actactttat ctatggtctg 15060
tgatgtaccc ttgaaaggtt caagagtttg gaggaagata gaaactctgt ttatctccca 15120
atcatccaaa gatcttctaa agttccagct ccatccttgt gagctccaga ctgacttacc 15180
aatgcttggc tttgaagact tagagagaat aagtcaggaa aatatctttc aaccttcctt 15240
gccctatccg gtgatcttcc caaaaagatg tctgcaaccc attgccaata ttgatcttga 15300
tattgctact gaaagatttc ttttggtggc aggattactc tcattaacaa tgtacttgac 15360
aatctccata catactaatg tctctttacc ctcttgccat taaggttgta aagagacttg 15420
tcaaattaag aaaaggtttc ctatggaact gtttcaagga aggaacctcc tttcctttgg 15480
tcaagtggag ttaagtcata taatctagga agtggaggct tgggtatgaa atagctgcaa 15540
atacagaaaa ggagcatctt atttaaatga tcacggaaat gtgcccaaaa ctttaaatat 15600
ctgcacagca tatggttgta gcaaaatttg aatcttcctg tcaatggtgc tcatgtccag 15660
tgaatacccc tgatggtgaa agtgtcctga agggaagcag gaacttattg gaagaattgg 15720
catctaacac tcagcttttc ggtgggtcat agcccattga aaattgagtg cccagattta 15780
tatagttttg ctctaaactg acgatgcagt tgcacaacat acgacaaact aaggtgggac 15840
atcatcttct tcggaaggaa ttttgaggat taagagatag agtggttgat tcagttgcaa 15900
atgaagcttc aagggttcaa tatcatccag gagacaccgg attctgatag ataaaacaac 15960
agaaagatga gcactacttt gttaggcttg ttacaagttg ctatcgtctt tcttatctcg 16020
gtacacaatt tagatttggg aacttagttg gaaaagcaga gtggttgttt ttgtgaatag 16080
catcagacaa agcttctgag ctggtacgac agaaaactca acagggagaa tagaagactg 16140
tggttcacaa tttctgcatg catcttgtag gttatttggt gggtaaatta tttaatgttt 16200
tgaagggaag gtagaacatg ttcataggct tagattcaaa tgtttgtatt tttttggctc 16260
tttggtgaga gatgctgaac gtaaatgaca taggcagctg actataattt ctcagctcct 16320
tgctttttaa attgacaggc actgatatgt acatgtgaac atccaacact tttgtggtgc 16380
cgttccgatg aataaagaac attaatcact tactgatcag gagtaatagt ttaggagttc 16440
tagaattttt gtacataaaa tgaaccaaaa agaagatcgg aatgagaaca tgtttctttt 16500
tttgtttttt ctttttcgtg aaaacttcaa taacacttct gatagaatag ctaggtccat 16560
ttgaattcct ttggagaccc ttacacaacc aatgaatgac aagtatagca tttctaactc 16620
cctcccacac gtataaccca gattttaggg tttagatgtg gatctgattt gaccttattg 16680
cctttttttg tttttgttct ttttgaagta gagagtgagg aggctcaaca attaattcgg 16740
ctcaacgggc taatgattgg acttacatgc tacgacaatg ttaggagaga gagagagaga 16800
gagaagccca gagcagttac atgagttaag aaagagaagt ccaaagcgat agaatatgaa 16860
gagagaaagc ggttgtgcta acaggctccc tgaagtttgg ctctgagcat ccaactcaaa 16920
accttaaggc aatgagtaga gtagcccagg accatttaaa ttgctgttga aaaccttaca 16980
caaccaataa gggaacaagt gtaacattct cttacaaccc taccgtctta taagtcagtg 17040
ctctaattta gcataaaatc aaagtgaggc gatctacaat gaaatgaagt aaataactga 17100
taaatacaaa gaatgttaat tctccaatat agcctgaatg ttcccagaac aaaataaact 17160
agtctcagga tttatcatta acatgatgtt cctcttattt tgagtgatta ggaaggttaa 17220
tcaaggtata aattctttct aatttgtatc gtctagaatt atttatctaa caaattttca 17280
gattaccggt tcaaaagagg aatatatttt gcatacaacg ttaccatacc ttacaaaagg 17340
gagatgaaca tttttttatt ttattattgt cctttttttc aattagggat tatgcagtct 17400
tcctccacgt gatattactc ttagaatcac gtttttgtca ttgctattac ttaatgtggt 17460
aagtacaaat gtgttttgaa ctctttttgg tatgtaatat tgagttaatt tttggtttcc 17520
atttcagagc tgccgcttta tcttctgctg ggcatctttt gtggcttagt ttcagtggca 17580
ttatcaagtt gtacatcatt tatgctgcaa atagtggaaa atattcaaac gaccagcggc 17640
atgccaaaag cagcttttcc tgtcctgggt ggtcttctgg ttgggctggt agctttagca 17700
tatcctgaaa tcctttacca gggttttgag aatgttaata ttttgctaga atctcgccca 17760
ctagtgaaag gcctctccgc tgatctgttg ctccagcttg tagctgtcaa aatagtaaca 17820
acttcattat gtcgagcctc tggattggtt ggaggctact atgcaccatc tctattcatc 17880
ggtgctgcta ctggaactgc atatgggaaa attgttagct acattatctc tcatgctgat 17940
ccaatctttc atctttccat cttggaagtt gcatccccac aagcatatgg cctggtatga 18000
atttgtcttt tgttagaagt agcattacat atctggataa gtgagttttt tattattgaa 18060
aagtaataac aggagagcaa gagaatatag cacccaaatc tacttctttc ctctcttcta 18120
ttcttctgaa attcaaggtc ctttaactcc tccacggcct gtctagttat tgatcctgta 18180
gacttaattc acataggttt aggacattca agtttatcca aacttcgtga aaaggtttct 18240
aattttttta cattacagta tgagtcgtgt ctacttgaga aacatatcac tccatgtttc 18300
tatagagtct gttttctcct cagtttattt tgatatatgg ggtcctatta agacagttca 18360
accttggatt ttcattattt ttgttgtttc attgataatt attcaagatg tacttggatt 18420
ttcttaacaa gagatagttc tcagttgttt tttgtgttcc taagtttttg tgctgcaata 18480
caaaattagt ttgatgtctc tatttgcatt tttcccaatg ataatgcctt agaatatttt 18540
cttctcggtt tcagtagctt atgatttctt tagaaactct ctatcagaaa tctcaactga 18600
gatagatgag aggaagaata agcatatcat tgagacggct cgtacccttc tcattcagtc 18660
ccctgtcaag cttagtttct tgggcgatgc agtttcacgt cctttgatta gattaattgg 18720
atgcctcatc tgctatccaa aatcagattc aactttcgat attgtttcct cgcttacctt 18780
tatactctct ttccctcgag tctttgggag cacatgtttt gttcaataac atagctcctg 18840
gaaagtgacc agcgcaaccg acaagcaagg ccttcttaat atagaaggag ggcatatgct 18900
attctagcca cgagggagaa agtaatattg taatcaaacc caaatatctg agtataacct 18960
ttggcaatgg cgatcaattt gattatatgg accaactttg cctacatata cccaccgata 19020
gatttacggg gaggtagaga aataagctcc caagtaccac taatatgtaa agcagacatc 19080
tctttgatca tagcctgtcc ttgtggacat agggatagaa attgaggact aagatgacac 19140
aaaagcataa tgctgtgatg ataaacgatg ataactcaaa tcaatatgat ggggatggga 19200
attaagagtg gattgaatat ctttgcggaa tgtgattggt agactaggag gagacaagtc 19260
cgcaataggt aaaagatcca gtacatggaa tgaatcttct ggacatgatg ttggactgac 19320
gtcaatgata agtcaagagt ggtggagttg cagaacatgg aactggagct gtaggtgaca 19380
taatcgaagt tgtagggggt ggagctatag aggaaggtga aggagagata gtgactgaat 19440
ctccaaaata tgaaaccggt aatacctcaa aaaatgtcta agagatcatt tggacctatg 19500
aagtatggtt gcgttttaaa gaaggtaaca tcagcagaca taaggtaccg cggaaagtca 19560
ggtgaataac attgatatcc ttgttgcgtc ctcgagtaac ttagaaatac atatttgaga 19620
gcacggggag ctaacttatc ttttctggag taaggttata aaaaaacaca tgctcccata 19680
gacacgaggt ggaagagaga aaggtgagtg gggaaacaag acagagtatg aaacttgatt 19740
cttgatagtt gaagatggca tacaattaat aagacaatag gatgtgagaa ctgtatcccc 19800
acgtaaacac aacagaacat gagattgtac gagttgggta tgagcagtct caatgagata 19860
cctattcttc ctttcagcta tcccatttta ttgagatgtg tatggacaaa atatttgatg 19920
tatgatccta tgagagttca tgaactgctg aaatggagaa gacaaatact ctggggcatt 19980
atcactatga aatgtgcggt tagaaacccc aaattgattt tggatttcag agtgaaaggt 20040
ctgaaaaata gagaccaact cagattgatt tttcatgaga aatatccaag tggacttgga 20100
ataatcatca atgaaactga caaagtagca gaattccaag gtagaactaa ctcgacaagg 20160
acctcaaaca tctgaatgga ctaaagtgaa aggtgactct attcgattat caagacaccg 20220
aggaaaatga gagcgagtat gccttctgag cggatatgac tgacgctcta gagtggacaa 20280
gtgagacaaa ccaggtacca ttttctgaag ttctgataaa ttgggatgtc ctaaccgttt 20340
atgtaataaa tctggtggat cagtaaaagg acaagctgta aggggacaaa aataccaaat 20400
atttccagaa gatggcaaac tacaacagaa gaagcaacta cattaacagg ctcaggatat 20460
gtgatgaaat gaggacaaag agttgatcaa gaaggagatt ctggaattct accagaactt 20520
atatagtgaa aatgaaccgt ggaggcccag tgcaaatttt gaaggcatct cctcactaag 20580
catagaagag aagaactagt tggaagctcc atttgaagaa atagaggtgc ttgaagcttt 20640
gaaatcatgt gcccctgata aagcaccagg tccagacggc ttcaccatgg ctttctttca 20700
gaaaaattgg gatactctta aaatggacat catggccgca cttaatcact ttcaccagag 20760
ctgtcacatg gttagggctt gcaatgccac cttcatcgcc ttaattccaa agaaaaaggg 20820
tgctatggag ctcagagact acagatctat tgacaaacta gtctcggggg aacaaaatgc 20880
tttcatcaag aacaggcaca tcactgatgc ttccttgatt gccagtgaag tgctggattg 20940
gagaatgaaa agtggaaaac caggcgtgtt gtgcaaactg gacattgaaa aggcttttga 21000
tcaattaaga tggtcttacc tcatgagtat cttgaggcag atggctttgg ggagaaatgg 21060
ataagatgga taaactattg catttcaact gtcaagaact ctgttttggt gaatagtggc 21120
ccgaccggtt ttttctcctg ccaaaagggc ctaaggcagg ggatctcctc tcccctttcc 21180
tattcatttt ggcgatggaa ggactcacta aaatgttgga gaaggctaag caactacaat 21240
ggatacaagg ctttcaggtg ggaaggaatc ctgccagctc agttacagta tcccatctac 21300
tctttgcgga tgatactctt attttttgtg gtactgagag atcacaagca cgaaatctca 21360
acctgacgct gatgatcttc gaggcactat caggactcca caacaatatg ataaagagca 21420
tcatataccc tgtgaatgca gtccccaaca tacaggagct agcagacatc ctatgctgca 21480
aaacagatac tttcccaaca tatcttggac ttcccttggg agctaaattc aaatcaaaag 21540
aagtttggaa tggagtccta gagaagtttg aaaagaggct tgcgacttgg cgaatgcaat 21600
acctctccat cggtggcaag ttaactttaa tcaatagtgt actggacagt cttcctacat 21660
accacatgtc tttgttccca attccaatct cagtcctaaa gcagatggac aaactcagaa 21720
ggaagttctt acgggaagga tgcagcaaaa cacacaaatt tccactagtg aaatgactca 21780
aggtaactca accaaaattc aaaggaggct tgagcatcag ggatctacaa gcacacaaca 21840
aagctatgct cttaaaatgg ctctggagat atggacagga ggaatctagg ctatggaagg 21900
acatcatagt tgctaaatat ggagcacaca atcactggtg ttccaagaaa acaaacactc 21960
cttatggagt tggtctgtgg aagaacatca gcaaccactg ggatgaattc ttccaaaatg 22020
taactttcaa agttgggaat ggaactcgta ttaagttttg gaaggataga tggctcggaa 22080
atacaccttt gaaagacatg tttcccggta tgtatcagat tgccttgacc aaagactcca 22140
ctgttgctca aaatagagac aatggcactt ggtgcccatt ttcagaagaa atttgcagga 22200
ttgggaggtc aacagcctac tcacaatgtt aagctcccta gaaggtcata atatcgaaga 22260
tcaacagcct gacaaactta tttggggaaa ttctgagaga ggcaagtaca cagtcaaaga 22320
atgatacatt cacctctgtg accagaatcc aataatagat aactagccat ggaaacacat 22380
ctggagaact gaagtgccta ccaaggtgac ttgcttcaca tggttgactc taaatggggc 22440
atgtctcact caagacaact taatcaagag gaatatcata ctagttaata gatgctacat 22500
gtgccaacaa cagtcagaaa gtgtaaacca cctattcctc cactgctcag ttgcaaaaga 22560
catttggaac ttcttctaca ctacctttgg tctgaaatgg gttatgccac aatcaacaaa 22620
gcaagctttt gaaagttggt atttttggag agttgacaaa tccatcaaaa aaatctggaa 22680
aacggtgccg gctgcatttt tttggtgtat ttggaaagaa aggaaccgaa gatgttttga 22740
tgacatatta actccactct actccctcaa ggctgcgtgt ttagttaact tatttagttt 22800
tgtggatttt attagctccc tgatagtagc ataggctttt gtaaatggag ctaattatcc 22860
tatctctttt gtactctttg catcttcttg atgcctttta atgaatctaa tttacttcat 22920
aaaaaataaa aggacaagtt gttgaaggag gaaaagatgt gagtccatgt gatttagcaa 22980
ggataaggta ctaaagtcca tttgattcac gcccggtacc aatgatccat cccgcattgc 23040
attcctgtat taaaacagag tcatcaagaa ataaaataga gcaaataagt gattggccaa 23100
acgactagtg gatatgagat taaaaggact atcgggaaca taaagaactg aattcaaagg 23160
taaggaagga agtggactag cttaacctat tccagttgcc atggtttgag aatagttggc 23220
cattgtgact gttggaagtg attgagagta agaaatagta gtgaaaagag atttgttacc 23280
agaaatataa tcagatgcaa ctgaatcaat aacctaagag tcggaaaaag aaacacaagt 23340
catgttatta cctgtttgaa caatagaagt tatctccgaa gaggattatt tacatgtttt 23400
gtactgatgg aactcaatat aagccgataa agaaaccatc cggatattca aagtattgga 23460
tcaacagctt ataagccaaa agcatccgat acgagtgcca ttataatgga tcaagagaga 23520
tcaaacaaca aatcaccaaa tatcataaac aaccaagaat ctcgctggaa tgtgaacaaa 23580
gattgaaaaa caacaatgta gctcgccaaa aatgtgcaaa gtgatcgaaa aatattgaat 23640
cgtgagtgga gagaaatagg agcttcaatc gacccacaca gtaccaaaaa atccaaaaac 23700
ggttgtcgga gctcaagaaa gttgtcaaaa agtatattgt atgcttcgaa agtagccgaa 23760
aaaggttgga agtgggatgt gtcaactccg aattatgata cgagcaccac agaagatcaa 23820
tttgtgtcaa aactaccgaa aaaaatactt cacaccccga cgcgtggagt actcgctcgt 23880
tggaaccctt gctgccaacg tcgcatgtag gatcagtttt cgaagaatct tattggggtt 23940
tggtcgccgg acgatgtcgg atcttgtggt gccgttggaa ttcgcacaac cctgaaggaa 24000
aagaaggtta cacaaatcag atctgaaagt caccgaaaag acacatggcg attgactttt 24060
ttgtctcaga tgtttctcac cgtcgctctg ataccagttg ttgggctcaa ctcgtttgaa 24120
gatactctta acatagtgtg atattgtccc ttttggaatg tgagtcatct tagctcggta 24180
agcatactcg ctcttccaac tagcccgaag atacttttaa cagagtgtaa tattatctgc 24240
tttgagccaa gctggcgcgg ttttcatcaa aagacctcat actattaaaa gatccataca 24300
ccttatatgt aggcttctaa gttgctcgga cacgggtgcg agtacccgac acaggtgcaa 24360
atctagaggt cagatccttt aaaatgtaaa ttctaagatt tggggatacg aatcctagta 24420
cggatacggg tgcgaggatc cgattaaaaa taattcaaaa aaataagaaa ataaaaaagt 24480
ctctaaatta tgtgaaattt tgtggaataa ctacgtatag cttgtaaagt gtggatttat 24540
tttttattct caagttgtag ataagtaaat gattgatttc ctagataagg tatgttattt 24600
tcttcaaatt taccctagtt tggttcgaat ttcgggaaat tgtatcttgt ctcgaatttt 24660
tccttctgtc ctgattaaac tactcaaaat cgtctgacca gatccggtac ggatcccata 24720
cccacatcca cactagtgtc gtgtggacaa gggtgcggca cctaaacttc cgtgtaggag 24780
caatttaggt aggctcctaa tcttttcagc tattaatgtg ggacttttac gcacctctat 24840
caaattcccc aataaactaa gtttcacgtg gtccatcatc gcaatccacg ggtctcttcc 24900
tctagttaag tcccacatgg cccattacca tgatccacgg gtcaattttc gtgattcatc 24960
gtgtgccacc cacatcgtta gtatttatgg taactaaagt acgcaactag cttttgcttg 25020
tgagcgtgtc tccaagctcg taaaggtaag aaaaccgagc cgcatattcc atcactctat 25080
catcaccata ctcgtcccgc gaaacttgta agataaaggt ggctggttgg tcagttgaac 25140
tacctcagag tgacttggta tagtatttcc tttcttgtga atatttaact caattatgga 25200
ctctctgtgt gatagtcatt gagagccatt ttctatatag ccggtgcaca caaatcatat 25260
gtaccaagct tgttatatat gtaactaata cgaggaccag tgaaggactc ggtgaaaata 25320
tctgcaatct ggtcattcga catacaaggc caatagactc cccagcaata aaatcagggg 25380
gttgctgata aatagaattg gccgaaatgt tgccagaaaa atttgaaaat agtgagacta 25440
agccgaattc tacactacaa aataggtttt aaaacacaac cagaaaacaa aaactttttt 25500
ggaaattact gttcacatcg aaaaaataaa agttgtcaga atttgatgta atttatatgg 25560
ataggctcgt aatcactgga cgagtaagtt gtcctgaaga agttttgtca aaaggtggcc 25620
ggaatggctc acacatgccg gaaaacttat tgtagctcgc cggaacccta gttctggcgg 25680
tgcgtagagg cgtgtgactt tctgccagac tgattgactg tggtttgtcg cctgactttt 25740
cctaacaaga tggtagtatt ggttttcgca caacaattac cgatgaggag ataacgcaaa 25800
tcaatcttga gtcgtcaatc ggaaagacgc acggtggctg actttctatt tagatgggac 25860
tggaatttct ggagtttaat cgcacaagcg ttttggatct gatggtaata ctggtatgca 25920
cagtaccact gtagcagtga tgaaccctca aaataagaca aagttgccag aaaattgcac 25980
ggcgatgaga tctttcttcc ggatgtcacc ggaatgacgc acaacgataa tttctcactg 26040
aagctctgac accatgtgag aatacacggg agaaaaatct atttttatta acaatgatac 26100
aatgagccct atatataata catattctac tctactacat atgggaatag ggcatatttt 26160
actcctacta catatgagac taggactatt tacacataac tatctaacaa gggctatatc 26220
tcagatttat gagaatatct acccaacgac ccagagagac gagcctaatc attttgcagt 26280
ggcacagact ataacaacaa aaaacctact cataatggtt aaaccaactg attaagatgc 26340
ttacaggact atcttgagaa atgtacatat tatatagatg cttgagttgc gtcccaatcc 26400
taaatagaag cttttattcg taagcaagaa gggaagcagc tttacttgag ccaatagctt 26460
tcaaggtgca tgttgtcaca ccaaggacat ccagaatttg attttatagt gggaatatcg 26520
tttaaagata aaaaagatag cgtgcagaag attgcataca ttagagatgc aaaatacgga 26580
atacccatac tcccagataa tgcagtatgc cttttgcatg acctactggt tgaatggaag 26640
cacctggtga atttactagg tgtgttagtg atttctgctg cttccttccc ctttctaaac 26700
tgcatactat ctaaaatgtt aggggggcag aagcccagtc aatctgacta ggtgatgtta 26760
gtggtttccg cttcttcctc ccacttctaa atgcgtactt tctcaaattt aggagcatag 26820
aaacttaagc agctgcctac ctgaggagtt gcatgggaac ataagagaat agactttacc 26880
tgtcatattt tccatacctt agttaattac agtgttatcc tgataatgat ctgttttctg 26940
gatctaggct gaatcgagat tcaatcgctt ttggttgaaa ggatgctgct acagatcctt 27000
agtttacatc attttggttc ttattctata agtacttccc ctatcaacta cttccttctt 27060
ttttcttagg ttatttgcct ctttaggttg tttggaagga aaggaacagt agatgttttg 27120
atggaatagc aactccaaac cacttcctta aggctaatat cctgattggc caagtttctc 27180
caaagtccaa aacacttttt ttttccttca aaaaagtacc tttttttttc aaagttgagg 27240
tgtttggcca agcttttgga aggaaaaaaa gtgtttttga gtagaagcag atgctcttga 27300
gaagcagaag aagtagcttc ttcccggaag cacttttgag aaaaataaat ttagaaacac 27360
tttttaaaag cttggccaaa cactaattgc tgcttaaaag tattttcaga tttattagac 27420
aaacacaaac tgcttctcac caaaaatact tttttgaaaa gtacttttca aacaaagcac 27480
ttttcaaaat aagtttttta gaagcttggc taaacaggct ataaatgtct tttattttta 27540
cagctggagt accctaacac ctgtaaattc ccctatacat ttttttcgac tttggtagct 27600
cattaaccct agtataggac tctttgtttt ggagctagca aactcttttg ttttcctatt 27660
tttgcatctt cttggtgcca tttataatat ctcttcacca aaaaaaaaaa gttcccaaac 27720
tatgactacc ttgagttggt caaagcataa ccaaagcatg ggcacaccag tgtttgcgtg 27780
aattttatgg atgttcctta cctttatcct tctgtgctta tgtagcatct gtcttggtca 27840
atcttttctg aagtctatat tgtatttctg tgttgcaaca tgagtttact gttaatctta 27900
ctgtttgacc tcaattttgg gttctttttg attttggaag acatcgttta acaggttggc 27960
atggctgcta ctcttgctgg tgtctgtcag gtgcctctca ctgcggtttt gcttctcttt 28020
gaactgacac aggattatcg gatagttctg cccctcttgg gagctgtggg gttgtcttct 28080
tgggttacat ctggacaaac aaggaaaagt gtagtgaagg atagagaaaa actaaaagat 28140
gcaagagccc acatgatgca gcgacaagga acttctttct ccaacatttc tagtttaact 28200
tattcttcag gttcaccttc acagaaagag agtaacctct gcaaacttga gagttccctc 28260
tgtctttatg aatctgatga tgaagaaaat gatttggcaa ggacaattct agtttcacag 28320
gcaatgagaa cacgatatgt gacagttcta atgagcacct tgctaatgga gaccatatcc 28380
ctcatgctag ctgagaagca atcttgtgca ataatagttg atgaaaataa ttttctcatt 28440
ggtctgctga cacttggtga tatccagaat tacagcaagt tgccaagaac agagggcaat 28500
ttccaggagg tagcttcttg gtacatttca atattcttaa ctgatgaaaa aataagggaa 28560
attgatctag catgaaatga agctaattat aagttttaca cagtagaact ggtaaaacag 28620
ggttggctgg atatttcttt gttgaatttt taggattata tatattgttt tagttttgta 28680
ggttgttttc tgatgtgctt tttgactcgg cagaatctta agatgaaatg gaaggttgta 28740
tcatcaaatg ttaaataagg gaatatgtga ctttcaaagt taagcacgga gtattttgga 28800
gtcaatagtt acttcctgaa tcttttagga tggaggagac agtttctata ggaataggaa 28860
aaggggacct gatttcatta tttgtgtgta tatacatttg ttatctgaat tcgcattact 28920
ttctaacaac caacaaaagg aaagtggaca ttcaatttga gccggaggga gaaaatttaa 28980
ctagaaaatg acctggccgt gaaataaaat tattgatccg tcctttaact agttttcatg 29040
gattgcctcc ttgcggatga tttttccaac cggtagaact actgttagtc gtccaaattc 29100
tgacccccta ctatgaataa aaatgtatta gtaagtttag tgggtaatct ccttgagaaa 29160
taaaggaaca ggagaaatat tttattgata tatgctaagt gttttacaat agccctattt 29220
atatacaatg tttacataaa cctaaagcct tctatataaa tgtgggacac tatacatgaa 29280
ctaactctaa cactatccct caagctagtg catataaatt atatatatgc ttgttacata 29340
tataattaat ttctctactt tttggtatac ttcttgtata cgggagttat ctcccttttg 29400
attaatacaa tttaccttat caaaaaaaaa ttaatacgag gaccagtgag ggacttggtg 29460
aaaatatctg caagttgatc atttgacttc tcaaactttg taacaatatc tcctgagaat 29520
cttctctctc gtgaagtgac agtcaatctc agtgtgtttg gtcctctcat ggaacactgg 29580
atttgatgca atatgaagga caacttgatt atcacacaca agttccatct gactgattgc 29640
tccaaatttt aattatttga gcaattgttt gatccaaact agctcacatg gtgcaagagt 29700
catgactcga tattcggctt ctgcgctaga tcgagcaact acattctgtt tcttgctttt 29760
ccgagagaca aattacctcc tattaaaaca caatatccag atacgtaacg tctatcagaa 29820
ggtgaccctg cccaattagc atctgtgcgt ccaacaatat gctcatggca tcgatcttcg 29880
aatattagtc atttgtctgg agctgatttt atataacgaa caatgcgaac aactgcatcc 29940
caatgactat cgcaaggaaa ttccataaac tgacttacaa cactcacagg aaataaaata 30000
tcaggtctag taattatgag gtaattcaat tttccaacca ggcgcctata ttttgcagga 30060
ttgctaagag gctcccccct atcctggcag aagcttagca ttcggattca taagagtatc 30120
aatagttctg cagcccatta ttcatgtctc ctcaagaatg tctaaagcat acttcctttg 30180
cgaaataaca acctgaacta gaccgagcga cctcaatacc tacaaagtac ttcaatctgc 30240
taaggtcgtt agtctggaag tgttgaaagt gatgttgttt caaattagta ataccatcct 30300
gatcattgcg agtaataaca atatcatcaa cataaaccac cagataaata cagagattag 30360
gagcagaatg ccgataaaat acagagtgat cagcttcact attagtcatg ccaaattccc 30420
gaataattgt cctgaactta cgaaactagg ctcgacgaga ttgttttaaa ccatagagac 30480
ttgcataagt gacatacaat acctctagac tccccttgag caacaaaacc aagtggttgc 30540
tccatattaa ctttatcctc aagatcacca tggagaaagg cattctttat gtccaactga 30600
taaagaggcc aatgatgaac aatagccatg gacaggaaaa ggcgaacaga tacgacttta 30660
gccacgggag aaaagtgtca ttattatcaa gcccaaatag ctgagtatat ccttttgcaa 30720
tcagacgagc cttgagccaa tcaacctggc catccaggta gactttgact gcataaaccc 30780
aacgacaacc aacagtagac ttacttgaag gaagagaaca aactcccatg taccactcac 30840
tcacatgtaa agcaaacatc tcgtcaatca tagcctgtcg ccatcctgga tgagatagtg 30900
cctcacctgt aaacttagga atggaaacag tggacaaaga tgatacaaaa tcataatagg 30960
gtgatgagat gcggtgataa cttaaaccaa cataatgggg actaggatta agtttggatc 31020
atacaccctt tcgaagtgca atcagtggac taggaggagc caagtccgca ctagacgtgg 31080
atgacaatga taagtcaaga gtggtggcct cgtggttgga gatgtaggat gagcaactgt 31140
agactcctca gaagtcggta taggtaggag tacctgtgat gttgatgtgg atttaagagg 31200
aggaacaata gattcctcac aagtagatac aggtaagacc tcagatatat caagatgatt 31260
agatgaagta aagtaaggtt gagactcaaa aaatgtgaca tcgactgaca taagatatct 31320
acgaagatca ggtgagtagc agcgataccc cttttgaacc cgagaatagc caagaaagac 31380
acacctgaga acacaaggag ctattttatc tttttcagga gctaagttat gaacaaatgt 31440
actccttaaa acactaggag gaaagagtat aaagatgacc tagggaacaa tactgagtgt 31500
ggaaactgat tctagatgga agatgaaggc atccgattaa ttaagtaaca ggttgtaaga 31560
actgcatcgt cccaaaaacg ttgtggaaca taggactgaa tgagaagtgt gcgagcagtt 31620
ttaatgagat acctattctt tctctctact accctataat gttgaggagt atacagacat 31680
aggataatat tttgagaagt cataaactat tgaaactaag agaatacata ttttaaggca 31740
ttatcactac gaaaagcgaa taaaaacacc aagcggagtt ttaatttcag cataaaaact 31800
ctagaatatt gaaaacaact caaaacgatc tttcatttgg aaaatccaaa tacatcttga 31860
gtaatcatta atgaaactaa caaaatccaa atcttaaggt tgtgactcta ctaagacccc 31920
atatatcata atgaactaaa gacaaaacag actctacacg actcttagca cgacgtgaaa 31980
atgtagctcg aatatatttc ccaagttgac acgaatcaca atctaatgtg gacaaaccag 32040
acaccatctt ctgaagcttg gataaactcg gatgtcctaa acgtttgtga attaggtcta 32100
gaggatctgt agttggacat gttgtagagg gattgagtga gttaagatag tcaaggtctt 32160
gtgattcacg ccatgtgcca atcgtctgta ccgtactgcg gtcctgcata gtaaaagaat 32220
catcaataaa atatatatca caatggaatt cacgagtcaa atgactaaca gatgcgagat 32280
taaaggacaa ccggggacat aaaaaataga atctaaagtg acagaggaca tgtgattagc 32340
ttgtccaact ccttttgctt ttgtttagac ttcatttgct aaagtatcat tgggaagaga 32400
ttgtgaataa acaattattt gacaaaagtg acatattacc actggggtat caagttgctt 32460
agtcatacta agaatgtttg ggagagggtg gtggaagtga gggtaaggag gacagtgtct 32520
ctatccgaga accagttcgg attcatgcat gatcgttcaa ctgcggaagc tatccgtctt 32580
attaggaggc tggtggaaca gtacaaggat aggaagaagg atttgcacat gatgtttacc 32640
tagagtaagc gtatgacaag gtccctaagg aggttccttg gagatgtcag aaggttaaag 32700
gtgttccggt agcatatact agggtgatga aggacatgta tgatggagct aagactcggg 32760
ttaggacaat ggaaagagac tctaagcatt gtttggttgt tatggggtta cagtaaggat 32820
ctacgctcaa accgttctta tttgccttgg cgatggacgc attaacgtac catattcagg 32880
gagatgtgcc atggtgtatg ttattcgcgg atgatatagt tctgattgat gagacgcgag 32940
gcggtgttaa cgagaggttg ggggtttgga gacagaccct tgaatttaaa ggtttcaagt 33000
tgagcaggac taagacagaa tacttggaat gtaagttcag cgacgtgacg gaggaagctg 33060
acatggacgc gaggcttgat tcataagtca tccccaagag aggaagtttc aagtatcttg 33120
agtcagttat acagggagaa gatggggaga ttgacaagga tgtcacgcac cgtattaagg 33180
gcggggtgga tgaaatggag gttagcattc ggtatctttt gtcacaagaa tgtgccacca 33240
aaacttaaag gtaagttcta tagagcggtg gttagaccaa ccatgttgta tggggcagag 33300
tgttggccag tcaagaattc tcatatctag aagatgaaag tagcagaaat gagaatgttg 33360
agacggatat gcgggcatac tacgttggaa gattaagaat gaaaatattt gggtgaaggt 33420
gggcgtggcc ccatggaagt tgtgcccacc attaaagact gctatctgaa aactaattct 33480
ttgggcccaa acattctggc ccaaagtacc tcgtgaataa taatattgag ctcatgtctg 33540
acatgttgga agaggagtta ctagcaaaca cttatacacc tatgttggta acacaattga 33600
agaactacga aaaacactct tctgcaaagg aaaatgagaa gaagaagaag aagaagacga 33660
agaagaagga tgatgcaatg atcattgaag aaaaaggaga gcaggaggac ccatctaaac 33720
ttacaaagtc tagaggaaga ggaggaccca gagtttgatg cttccctctg ggtacaccaa 33780
aacatcgtca aacttaggca aggagtttgg ggtaaacatt caggggtgtg agaaggaagc 33840
tttggagctt ttcgtaaaat tacaactaga ggcataaaaa aaaaaaaggc aatccaggca 33900
tggaggtgac aaccttcgaa aagaaaggga ttcaaagaac tgaaagggct ggatttttgg 33960
agtaacttca agagtaatag aacaagaagt agggggttgc attattatca aagatcaatg 34020
aagattaaca ttgaagaagt gggaaatcca aaaagactcc accgagaagg atgatgcaat 34080
gatcattgaa gaaaaaggag agcatgagaa aaaacccgta gaaattgaca gcactcacac 34140
acaataagac gagataataa agtagtgagt tggccaattg aagaagcttt acctcttaac 34200
ttacaaagtc tagaggaaga ggaggaccca gagtttgatg cttccctctg ggtacaccaa 34260
aacatcgtca aacttaggca aggagtttgg ggtaaacttt caggggtgtg agaaggatgt 34320
tttggagctt ttcataaaat tataacaaga ggcatgggaa aaaaaaggaa atccaggcat 34380
gcaggtgaca aaaccttcca aaagaaaggg actggaagaa ctgaaagggc tggatttttg 34440
gcgtaacttc aagagtaata ggacaagaag tacgggattg cattattatc aaagatcaat 34500
gaagattaac attgtatcat ggaatgtcag ggggttaaat cgacatagaa aaagaatgtt 34560
gattaggagt ttaattcata ggtggaaagc agatgttttc tgtttccaag attcaaaatt 34620
aaaaggggac attagggagt ttataagaga actatgggca aataggtggt ttaaatatgc 34680
acagttggag gctagtgggc ctagaggggg tattattgtc ttatgggata gtaaaattgg 34740
ggagggggag atcagcagcc tgagctccta ttctgttact tgtaaattta taggtaaaac 34800
tcaggagtat acttggaatt tatccactgt atacgctcca aatgataggg aggaaaggaa 34860
agaagtatgg tgggaattag caggtgccag gggaattttt atggaccttg ggtaatttct 34920
ggggatttca atactgtgag gtacccacca gagaaaaaga attacagcaa aatcactaga 34980
gcaataaatg aattctcata atttattgaa gatatggaac tggtggatct acaacttgca 35040
ggaggaagtt acacttggag gacaggagat agacatgtga taacagctag actggatagg 35100
ttcttggttt ttatggattg gaatgagagc atcagaaaca ccaagcaatc agttctccat 35160
tgaattacct ctgaccattc ccctgtgatg cttcaatgtg gtaaccggta ccctgtcaaa 35220
tcctattaca agtttgagaa ttggtggctg gaaacagagg gcttcaaaga aaggattaaa 35280
gtctggtgga gctcttttgc ttgtgaagga agacgtgact ttattctggc tttcaaactt 35340
aaagcatcga aggaaaaaat tgaagaaatg gagtaaatct attcaaggaa acttggagat 35400
gcagaaattg agtattctta gtcaacttgc agaactagaa gagacacatg atcaaaggag 35460
ccttactgaa gaagaaatac acactaaata tgcagtctat ggagtttggg gagattgcaa 35520
aacatgagga ggtggcttgg agacaaagat ctagggctct ttggttgaaa gaagggacaa 35580
aaacatcaat tttttcctca aaattgcaag tgcacatagg aaatacaata acatagacca 35640
actgttactt gaaggaaaat ttgtggcgaa tccaacatac ataacaaata atattggtac 35700
attttatcaa aaactatata taaagattgc tagaggacaa tcttatgttg caaagtcttt 35760
tcgaagctta ggaaatttgg gatagtgtca ggcatgtgaa agggataaag cacctggacc 35820
tgagaactgg gaggtgataa acacggatat gatagctgca gttctttgtt catggaatgt 35880
ttgaggaaag ctttaatgtt acctttgtgg tattgattcc taagaagatg gaagctaagg 35940
aatagaagga ctttaggcct attatgatag gcaatgtgta caagatcttg atagaaagac 36000
ttaagaaatt ggtgaacaag ttggtgaagg gtcaacggat gacttttatt aaaggtagac 36060
agataatgga tgttgttcta attgccaaat gaatgtgtag atgcaagaac aaaggcgaga 36120
aacctacaat actatgcaaa ctagatattg agaaggcata tgaccatcta aattggaact 36180
ttctattgga atcgctgatg aggatgggct ttggtgtaag atgggtcagc tggatcaaat 36240
tctgcatcag cacaatgaaa ttctcaattt tgataaatgt ttcaccagta ggtttcttcc 36300
cttctcagag ggatttgaga cagggtgatc cactatctcc ttttattatt cattagtgct 36360
atgggaggct taaatgatat gttaaagact actcaagata acaactgcat acggggtttt 36420
aaggtgaagt ccagggcaga cagtactatt gagatttttc atcttcgata tgcagatgac 36480
gcacttatgt tctgtgaggt tgacaatgaa caattgaaag tgctgaaggt gatcttcatt 36540
ctgtttgaag ccacatctgt attacaaatt aactggaatg aaagctttat ctatctagtt 36600
aatgaggtaa ctaagatcca ctttttggtt ggaatcctag aaggtaaaat tggggaattg 36660
cctacagtta tttggggatg ccatgggggc caagagcaat tttaagggga tttggactag 36720
ggtcgtagag atatgtgaaa aaattttaac aaactggaag agttagtatt tatccttaag 36780
ggacaaacta atactaatca attctatact tgatgatttt cctacttaca tgatgttcct 36840
cttctcaatc catgtgaatg ttgtgaagag aatatatacc cttagaagga acttcctatg 36900
gggaggaaac tatgacaagg aaagatctat ttggtcaaat ggaagtctct cacagtcagc 36960
aagaagtaag agtgttttgg aatcaagaat tggagaattc agaaccaaag tttgatgatg 37020
aagtggctat ggagatttac tacagaagaa cattgtttgt ggaaagaggt gatcatggag 37080
aagtatggca tagaagataa acggataaca aagtctgtaa atagatctta tggagttagt 37140
cgatggaaat ccatcaggga cctatagctt cagctcttga ataagtccaa attctgaata 37200
ggaaatggat tgaaaatatc tttttggaag gataattggc taaccaagga actttgaaac 37260
aactctttct tgacatttac attccaaatc aacagcataa agcaataata gtagaattat 37320
gggctaatca aggttggaat ctcacataca gaagactatc aaaagacccg gagattggca 37380
ggtcaacaga gttcaaaggc actttggaac aatttaaaga ggtctatact tctatagact 37440
atttgacttg gcaagggaag tttattgtta attcagccta taaggaattc aacttctcag 37500
ctaactggat tggttgttgg ccatagaagt tgatttggaa agttaaaatt ccttatagag 37560
ttgcttgttt ctcttggctt ttggctaaag aggcagttct gacgcatgat aatctaacca 37620
agagagatta ccatttatgt tcaagatgtt atttatgtga agagcaggca gagacaacca 37680
atccactttt ttttgcattg taagttcact gcagttatgg aggattttca ttagtttaaa 37740
gggtatcatg tgggctatgc gtagaagtat acctgaagtt ctagcatact ggaaaaaaga 37800
aagaaatctt tccaattata aaaagagatg gaggattatc ctagcttgca tctggtggac 37860
catttgggaa gaaagaaatc aaagatgctt caaagataaa tcagtcatat tcagataatt 37920
aaaatgaagt ggctagtctt gttttatttt tggtgttaag tgttagatag ttatgtatta 37980
tgtataagtt gtctagtccc acattggaac gggagtaata tgtactatgt agagtatagc 38040
tataaatagg acttcttgta ctttattgta gagaatatat taataatata tttttcccgt 38100
gttgtctcac atggtatcag agaaaccgtg agatatcagt cgttgtgaaa aataccagcg 38160
gcttcgggaa gaaaaaaatc aatcaactgc taggtatatt agtcttcggc gaccgatcca 38220
ttaaatttct ctggcaaaga accactcatg ggccctcacg cgcccaccga aagaaatatt 38280
tccggcgagg ttccaatttc atgcgcccgc gcgtgaggca gtttccggtc aaattttgac 38340
aaaggtcctt tttgacagtt tgttcaccct gtaattccca gtctatccat catttttttt 38400
atttcgatca cttcgcaatt tctcgggcag ctacagtgat ttttccggca gaagcggtgt 38460
ttcctttgcc tgcttcagcg agatacagtt gattatttct attatttgtt tctagacctc 38520
tctccaatcc aacgatgtct ttggaatttg atgtatttgg ttctgaaaac acgagttcta 38580
gaaagtcaag cttcatgatt actttagagc cattaatggg gagttcaaac tatttagctt 38640
gggtttcctc tgttgaattg tggtgtaaag gtcaaggtgt tcgagatcac ttaatcaaaa 38700
aggctagtga gggctgtgaa aaggtcaatt taagcagttt atgacgtctg tataccactc 38760
agcagaatag gatagcaaag aaagaatatg cacatcattg agactgctcg cacacttctc 38820
attgagtctc acgttctgct acattttctg agcgatgcag ttctaacggc ttgttatttg 38880
attaatcgga tgcctttatc ttccatccag aatcagattc tgcagttagt attgttttct 38940
cagtcaccct tatacttttt tcgtcctcgt gcttttggga gcatgtgttt gttcataact 39000
tagctcccga aaaaaataag ttagctcctc gtgctctcaa gtgtgtcttc cttggatatt 39060
cccgagttta aaagtgatat tgttgctact cacctgatcg taggtacctt atgtcagttg 39120
atgttgcatt ttttgagtct agaccttact ttacctcttc tgaccacctt gatatatata 39180
tgaggtctta cctataccga ctcttgaggg gtttactata gctcctcctc tacatactga 39240
gccacagaaa tcttactcat acctaccatt ggggaatcta gtgttgctcc tcctagatcc 39300
ccagctacag gaacactttt aacttatcgt cgtcgtccgc gcccagcatc atgtccagct 39360
gattcacgtt ctgcacctgc tcctactgcg gactagtctc atcctaatct accaattgca 39420
cttcggaaag gtatatagtc cacacttaat cctaatccat attatgtcgg tttgagttat 39480
catcgtgtca tcacctcatt atgcttttat aacttctttg tccactgttt caattcataa 39540
gtttacaggt gaagcactgt cacatccagg atggcaacat gctatgattg acgagatgtc 39600
tgctttacat acgagtagta cttgtgaact tgttcctctt ccttcaggca aatctactgt 39660
tggttatcgt tgggtttatg ccgtcaaagt tggtccagat gaccagattg ccaaagggta 39720
tagtcaaata tttggggctt ggttacagtg atattttctc tcccgtggct aaaataccat 39780
cagttcatct ctttatatcc atggttgttg ttcgtcattg gcatctctat cagtttgaca 39840
ttaagaatgt ttttcttcac agtgagattg aggatgaagt ttatatgaat taaccaccta 39900
attttgttgc ttagggggag tctagtggct ttgtatgttg gttgcctcag acgctctatg 39960
gtctaaagta atctcctcga gccttgttta gtaagttgag cacagttatt cgggaatttg 40020
gccaactcgt agtgaagctt atcactttgt gctttattgg cattttactt caaatctctg 40080
tatttatttg gtggtttatg ttgacgatat tgttattacc ggcaatgaac aggatggtat 40140
tactgagttg aagcaacatc tctttcagca cttttagact aaggatctga gtagattgaa 40200
gtatttttta ggtattgtga ttgctcagtc tagcttaggt tttgttattt cacattggaa 40260
gtagaaaaac ttcaatcatt tttctttatt tgaaaggaag aaaaaaaagg taatatctag 40320
acctaaatat taatctgaag acaagtgagg cttgctcagt tggtaaaagc acctccacct 40380
acgatcgtta ggtcctgggt tcgagtcacc atggagggga agtgtggaaa cactatagat 40440
cctcctaatt tgggaggggg aaaaaaatat taatctgaat tgacatgaat ctcaatgaca 40500
atgaccaacg atttcctgca attcttttca gtatggaatg aataaaaaat caagctacaa 40560
gtctctatta aacgaaatgc actaacaggg atcactctca agaaaggaag tggttttggt 40620
tgttgttatt ccaggttgga taaatcactt tctttataaa tatcataaaa gacaagggct 40680
ttcttgcttc agcacatgtg ggaaatgccg gggggcttgg ctggtaccaa gctcgagcgg 40740
tctttctatc tttttggatt gcatgcccaa ggcaatgctt tttgtagatt gggatggatt 40800
gatcttcgca gaagtatgct ttagacattc ttgaggagac aggaatgacg gattgtagac 40860
ccattgacac acctatggat ccaaatgcca cacttctacc aggatagggg gagcctctta 40920
gtgatcctgc aagatatagg cggctggttg gcaagttgaa ttacctcaca gtaactagac 40980
cttatatatc ctttcctgtg agtgttgtaa gtcagtttat ggactctcct tgtgatagtc 41040
attgggatgt ggttttccga attcttcgat ataaaatcag ctccaagcaa agaactgttg 41100
ttcgaggatc gaggcccatg agcagatgtt gattgggcac gatcaccttc taatagacat 41160
tctatatctg gatattgtat gttaatagga gttaatttgg tgtcttggaa gatcaagacg 41220
taaaatgtag ttgatcggtc tagtgcggaa gcaaataatc gagcaattgt tatggtaaca 41280
cgtgagctag tttggatcaa acaactgctc aaagaattga aatttggaga aattgatgga 41340
accagtgtgt aataatcaag cagctcttca tattgcgtca aatccggtgt tccatgacag 41400
aattaaacac attgagattg actctcactt tgccggagaa aagatactct caggagatac 41460
cgttacaaag attgtgaagt cgaatgatca gcttagagat atttttacca agtcccttgc 41520
tggtcctcgt attagttata tttgtagcaa actcggtata tatgatttat atgcaccaac 41580
ttaagggaga gtgtgagata gttatgtaca acaaaatacc cggtataatc ccacaagtgg 41640
ggtatggagg gtagtgtata cgtagagctt acccttaccc tgtgaaggta gagaagctgt 41700
ttccaaatac cctcggctcc agtacaaatg aaaaggagca gtagcaacaa gcagtaacaa 41760
caatgatata gtaaaataac tgaagaaaga aataacatgt agacatataa ctccactaac 41820
aaacatgcaa ggttaatact attgccacga gaatggcaaa ggaatgttag atagttatgt 41880
attatatgta tattaatagt ctagtctcac gttggaatag gagtaatatg tactatgtag 41940
agtatagcta taactaggac ttcttgtaat atattgcata gagatatcaa taatatattt 42000
ttcctgtgct ttctcacgta aaggaatgta atgtacttag aagatcatga atctatcttt 42060
gatgttttag acacctcgtg agaacacaaa ggtttaggaa ctttattgtg ttctttgtaa 42120
ttatgggtga ctgccaatat gttacctttt cataaaaatg attatttggc cattggatta 42180
gtttcaacag cctctctgcc cctccgggta ggggtaaggt ctgcgtacat attaccctct 42240
ccagacccca cttgtgggat tatactgggt tgttgttgtt gttgttgtgg attagtttca 42300
acaattttga tagttctttt atttgaatca aactactcat tcacatggat tttgtatcgt 42360
atcattgagt taaaaaaatt ggttttgcta atttatcctc atgtataaca actacctatt 42420
tttcaatata ttggattcag gagcttgtag tagctggagt ttgctcttca aagggcaata 42480
agtgccgggt atcatgcaca gtgactccaa atacagatct cctttctgct ctaactctta 42540
tggagaaaca tgatctaagt cagctacctg ttatactagg ggacgtggag gatgaaggca 42600
tccatcctgt gggcattttg gacagagaat gcatcaatgt agcttgcagg tttttgacat 42660
tcaactttta cttcaaagat ataatgcttt ctggaaccat tgatgataaa atatgcaaga 42720
aacttgtgca gaagtcgcac tttactatcg attaccagat aaagttactt atcaagaagt 42780
caaatatatt gaacatattt ctctaaaaca ctttgactgg actgtaagca gaaacttact 42840
aaagtaggtc gtaagaaatg gtttgatagg gaaatcacca tctacactta aaagagttgt 42900
gtgaatttga attcttaaag catgtgaaag ttataaaaac ttgttattat ctaagcatct 42960
gaagcatttt ggccatccaa aggatcaaaa ataggaaata atttcatttg tacaatgaac 43020
tccctgcaca aattctcaca ctaggtgtat tctctattca tcactagcac tacatgtgtc 43080
actacgaatc atatacaata aatctttgta acataaaaga cgacacataa tatggaagta 43140
agccgagtat acaagggaag tttcatcatt acggtgagct ttttataaga taatcaagtt 43200
ttactggaaa agggcaaaaa ctctcccgta tagaagtata ccaaaaagta gaatacctta 43260
caaaaatatg attttctatg aacaacaccc tatcttctat acttgtaggg atctcatcgg 43320
ggcaccaaaa agagataaag ggataagagg cttttcctca aatgtacaaa atccttctct 43380
attccttcaa aagctctcct atttctctct ctgcacactg tccacataag ttcaatggag 43440
caacatccac gccctgtgtc ttcttttccg tcttctatag gtccagctga acatggcttc 43500
tttgactgag tgtggcatca acgttgaaga ccaaaccatc ccagtacttc caaccacaaa 43560
cgagacacta tatgacaatt tagaagaaga tgattcacat cttctcccga acatttacac 43620
ataaaacacc agctgataca tgtaatcttc ctcttcctca aattatcagc cgtcaggatc 43680
acccgtctcg tagctaacta ggtgaagaag cacacctttc tcgaaaacct caggatccat 43740
acagagagat atggaaaagc tgattcctcc atgcccagaa gcttctcata ataagactta 43800
acaaagaaac accactactt cccccccccc ccaaaaaaaa aaaatctcca tacatcgact 43860
ttcatgtgta attcttgttc gtgaaacgac ccaatcaacc tttggcacaa atctcccagt 43920
cttgcgagtt cctcctaaac ttcaaatcac aatgaacttc tccaccttgt agcctccgtg 43980
tcccttggac tggcaactcc tttggcatga aactttgtac atattaggag atgtgatact 44040
caaagtgttg ttcctgcacc aattgtaccc ccaaaaaact taccatgctc ccatcaccta 44100
acattgaatg atacgttcca aaatcttcgc actccttcaa gaaacttttc cgtaggcccc 44160
acccataagg gagtgtgatt ttttttgctc tccatcccct ctccaagaat ccattcccta 44220
aaccactgca ggacacttta acaatcacta tgtcactttt tctactagtt ctacattgag 44280
tgatatcttg atgtcattga aatgcctctg gaaaatcttc ttctcatcta aaagaacact 44340
tgtttgcctt ttgaatcccc ctctaacatt ttctatgttt cattcatctt tggtggaaca 44400
gagcattagc aactagagaa cagctttgct ag 44432
<210> 11
<211> 36854
<212> DNA
<213> Nicotiana tabacum
<220>
<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; two start codons
<400> 11
atgattagcg gccaaaacac cgtgctgcac catcctccta attcgctctt caattcctta 60
tctcctcgcc atatctgtgt atctttctgt aacgacaaag ctttaaaaaa gtcagtcacg 120
cactccgccc ctcggtttgc tcgtctgtta aacaatgaat cacgaaagtt gttgggtcgt 180
catccaaatt gctggccttg ggctcgacga ccatctcttc ctccgggacg ttcctgtgac 240
ggaaacattg aaaaagaaca agatatgtgc gacagcagca aagacgatag tgatagtgat 300
agtggtatcc agataggatc tctgctcgag gaagttatcc cacaaggcaa taataccgct 360
ataatctcgg cttgctttgt tggcctcttc accggtatca gtgtcgtgct tttcaacgct 420
gcggtaagtg cgctataggt ctttcatttc tcttttcatc tactattctc ccttacttac 480
ttggcctcag tcaatcagcc ccctgcctac tttaaattat tgtacaattt atcagaggag 540
tatcctatac atcaaattca cataacttag taaaatatgc tgacattctg aattttaacc 600
ttaccagctt agaacatcca ggctagttca gaaacagata atctaaattg gcctcattta 660
taagtcattt tgttaatcaa gacatacaat ttggctcttg ataaaagatt atgcagcgcc 720
cgatgataac ctaatattta tcagcaaccc atatgtcact ttcttttgtt taaatgctct 780
cccatgtaat ttaacaatat tgtcaccata caaaagagaa ctgaagtgaa tgttccattt 840
gtggtcatat aacggatatc tcccttggtt aggttcatga aatacgtgat ctttgttggg 900
atggaattcc atatcgagct gcctcagagg agcccattgg agtacattgg caacgtgtaa 960
tcttagtacc agcttgtggc ggtttggtag tcagcttttt gaatgccttc cgagccactc 1020
tggaggtttc aactgaagaa agttggacat catctgttaa atctgtgttg gggccagttt 1080
tgaagacaat ggccgcttgt gtcacattag gaactgggaa ttccttagga ccagaaggcc 1140
ctagtgttga aattggtaca tctgttgcca agggagttgg agctctgctt gataaaggtg 1200
gtcgtagaaa gctgtcactc aaggctgctg gatcagctgc tggaatcgct tctggtttgt 1260
tccccatatt attcttggtt ctgaaccata catggtacat tttccttata attacatgta 1320
gcctgttgta tgctttcctc tttcctggga agcctttctg taaatgcaaa tgtgtttgca 1380
ctcaaaccaa taaactgtaa aaacagtgaa ccccttgagc aagcaaaagc actagaaaac 1440
caacaaatag atcccccccc caagatacca gtgaaatgac accgggtgac ccaaaaataa 1500
agcagcttac atcttgactt tgagaggaac tgcaatcagc tataagtagg ttattaattt 1560
ccagtgcctg cattctgccc aagtactatg atatatttct gaagctttgt ttccccagtt 1620
cctttttcag acgtttgctg tcaataaagt tgagccagcc aacttggttc ccacaagcta 1680
ctaattttgt ccaagcttac tctatgggag aagttaaatt tcccaaattc cttgagcaga 1740
aaatgaaaaa tgaactcaaa gtgtcatatt aggcaactat ctaaagaaaa atacttaatt 1800
gaagtttaga taagaaaagt gaatatatat tgatgtagtc tccgttaggt gagaagcgca 1860
tcacttaccc agcaacatat ggacctaaaa tttactagtg aacttttcac attgtatcaa 1920
aagctcaaca aacagaaaga tgactagtcc taaaatgtta tttcacatca accttatcat 1980
acgtgcatta tttgttctct atatttctat ttcatccgat ataaccaatc gtcattgtaa 2040
attctataat gcctgtggtt acttttgtct ttagtgacaa atgacattta ggctaaccat 2100
gtagttattg actgatttcg cttgacgtct cttccaatta tgtagtagta gagtgttgag 2160
atatggatat gttaccttct aaaaaaaaag agtgttgaga tgcggatggt ttgctagctg 2220
gcttttgtct cccttcaagt tgaattagca aaagcaatgt ctcataagtt ggatagctag 2280
acaagaaaaa ctccaaatta ctttatgtag agtattctta agcttgagtc gcgagttgga 2340
aattggaatt atgtaaaaaa acctggaatt atttggttga gcctgctttt tatttttgtc 2400
aatatttcca gtatctaacc caacatgttt agagcaattc ccagagagcc tcaatacgag 2460
gcatttgcag agtctttatg agagtccagg aaggggcaca cactgtagag gtatagtgtt 2520
gtccttattt tttttttttt gataaggtaa gattttatta aaaggtacca agatggtgca 2580
aaattacaaa catccaaact aatacaacaa agcaactaca ttcctcctag ctcctctaga 2640
aaattcatat attgttccat atttttcatt acatgtcttt tacaccagaa atacaagttt 2700
aataagcatc tgtttttaat cctggataca tgctgccttt ccccttcaaa gcaaatcctg 2760
tttctttcca accatattgt ccagaacaca catagaggaa ttgttcttca tactatctgt 2820
tgactctttg ccactttttg ttgttgccat gtctccaaca aactttacac tggcaggcat 2880
tgcccacttg acatcatata tatttaggaa gagctaccaa cactgctttg ccactttgaa 2940
atggatgatt agatggttga ctgtttctgc ctcttcttca cacatgtaac accggttaca 3000
tagagcaaaa cctctcttct gcaagttctc ctgagttaga aaagcttcct ttgctccaat 3060
ccaaccaaaa cgggctactt taataagtgc ttttgacttc catattgctt tccatggcca 3120
atttgactga taaagccctt gtagtttttg taacaagcta taacaactgc tgactgtgaa 3180
aataccatca ttacttgctg cccagattaa tgagtctctc ctgttttcct ccaatctaac 3240
attattcaat aactgcatca attgggaaaa ttcatcaact tcccagtcat tgaggcccct 3300
cttgaagatt agctgccagc cggtgcttga atagaagtct aacactcttc catttttgtt 3360
aatagagcag ctatatagac caggaaactt tgatctaaga cttccatttt ccaaccacat 3420
atcagaccaa aacagggtat tattaccatt tccaagtttc agtttcacaa actgactata 3480
tttattccaa agattactaa ttgtgctcca aactccccct tttgaagaag attgaattga 3540
acgaggagcc cacatgtcct tcataccata cttggcatct atcacctttt tccataatct 3600
attcccatca taattatatc tccatagcca tttaaataaa agacttttgt tatgcatctt 3660
tagattcctc actcctaatc cccctctttc tttttttttc atcacctctt gccatttgac 3720
caagtgaaat ttcttgttat cattattacc ttcccacaaa aatttattcc tcatagtatt 3780
caattttttc tccactgatg ttggcatttt aacgagagat attagataag taggtatacc 3840
atccatcaca ctattgacca gtgtaagcct accaccaaga gataaatatt gtcttttcca 3900
tgacaccagt ttactgctac atctatccaa gaccccctgc cacatctttg catcattctt 3960
ttttgctcca agtggtaggc ccagataggt ggatggtagc tgctccactt tacaacccaa 4020
aacatctgcc agatcatcaa tacaatgctc ggcattaata ctaaacacat tactctttgc 4080
caagttcact ttcaatcccg agacagcttc aaaagctagt agtactccta tgaggtgtaa 4140
gagttgctct ttttcagctt cacataatat caatgtatca tcagcataga gtatgtgtga 4200
gaaatacagt tcttccccct ctctttttct aattttcaat cctctaatcc accctaactt 4260
ttctgctttt aaaagcattc tgctaaagat ttccatcacc aacaaaaata aataggggga 4320
tattggatcc ccctgtctta accccctctg agaattaaag tatctatgtg gactcccatt 4380
aattaaaact gagaagctaa ttgaggatat gcagaatttt atccacccaa tccatctttc 4440
cccaaaattc gtatgtttca tcagatttaa cagacatgac caatttacat gatcataagc 4500
cttttccacg tcaagtttgc aggccacccc tttaatcttc ctcttgaata gatattcaag 4560
acactcatta gctaccatag cagcatcaat aaattgcctt cctcttacaa aggcattctg 4620
attatctaat atcaattttc ctatcaccat ctttaatctt tcagctatcg actttgcaat 4680
tattttatag acactgccca acaagctgat aggtctaaaa tctttcactt ccgctgcccc 4740
ctttttctta ggaataagag caatgaaaat tgagtttagg ctcttagtct tgtccttatt 4800
ttcagggttg aactagttct ttagaagttt cctaggcttc ctaatttcca aagttctgcc 4860
aggtcctttt ctagtgaagt acttgaagtt taataaatca aattttaatt tctaacatat 4920
cccgagaaat tcattcacaa attcaactgg tgacttctga tgcagaaaca taagcaactg 4980
cttatgggtt catatgttcc tgcaatttta ttgttgacat ggattggctt catatggttt 5040
tgttcctgca attttatcgc tgacactaat cctttcatat ggttttatgt ggggtggtaa 5100
atagaggtta agagacaaga agaggctgga aaaggtgggc agttcatttg ttagtagact 5160
actctattta ctaagagata tgatgtccca tacattactc gaattggctc caaatacaga 5220
ttccacttct ttgtcgagtt tccttattgt acagagttcg actcgtcaag ggaaattcac 5280
ttcctttgac tgaataatgc tagtttgagt agtaccttaa attaaatgga ccatttaatt 5340
ctatctactt gatagaatag actggtcatc aactagttgc aaatataatg acaactccgc 5400
catgtttgca gagtcacctg atgaagaagt acctcaatta gtagaccatt tcttgaatgt 5460
tctacagtat tctctatgcc tacatgacca catcactttt ccttttgcgt tgtgagaact 5520
tgaacttggt gagcgggggt tccccaggaa tggcatcttg gtggcagatg accattctgt 5580
ccttatctta gctaatgctt cttggattgc ctcactagat ttattatacc tttaataaat 5640
gtttgccatt gttctgccat aatagaggga tgtacctagc tggtgcttca catcacatag 5700
tccaaaacta atgaaatgct ttacaattgt cgagtactaa aggatgattt gtggaatcag 5760
atctcaaaca atttattttg aggaagaaaa ataccaaagg ttttttctgt ttgttggaag 5820
attaaaaatc ctttaaaagg taaagattta tgaacttaat tcagcatttt tgtggccatt 5880
gctgaaaaag agaaaacaat ggcacttatt cgagtttgct tatccaaaaa aaaagaagaa 5940
gagaatgtca cgtaatgcaa tttcatctta ggaaactttg caggagaaaa gcaagagtga 6000
taaaacagaa ctatttgttt ttttgataag ttgttgtgac ctatttcttt gtcattctta 6060
tttgctaata agctaatgta ccctgtacta tggttgtttt gacttaatcc ggggatgttc 6120
agtgagcatt ttcttgtttt ttctgctgtc agcatctgct gccttacagg aattcatttt 6180
ctggaaattt acttcttgtt ctgctaacat tttcctgtta tatcttgtca gtcattttct 6240
ctccatggtt atactgtttg tgtcactttg aaactctcct tgttttctac tttaaaggat 6300
ttaatgctgc tgtcgggggc tgtttctttg ctgtggaatc tgtgttatgg ccatcacctg 6360
cagagtcctc cttgtacttg acaaatacga cttcaatggt tattctcagt gctgttatag 6420
cttctgtagt ctcagaaatt ggtcttggct ctgaacctgc atttgcagtt ccaggatatg 6480
atttccgtac acctactggt aattttggac ttctttctcg agtttgattc ttaaatacaa 6540
ttgtacccgt cacttacagc aacaacaact acatttcaac agctagttgg ggttggctac 6600
acagatcatc actatccatt tcaatttctt tagtcccatt tctttcgaat attcagtact 6660
ttgggattct ctattatcag aggttctctt tattttctac tttgacgtac aaatctctaa 6720
atagattaaa gaagactcct agagacactg gcctaatgca aatgtaccac catgaataaa 6780
ccttaatctg aaatagctgg tatcgtatat aagaaccttt agctttaatt gtgttctata 6840
ttgatctttt gggacaactt ccgtccaata atattatgtc ttacttatac agttatactt 6900
atccttaaac tttactcttt agagtggtta tccgtagttc aagcttttgt tggcaccata 6960
gctagtttgg ttcttagtaa aaagttactc tttagagtgg taactttttg tcaattttct 7020
tagtgaaaat ataacctctg tgacaaatct accaagtata aatccaatat ggttctgtgt 7080
catacttgta gtttatccaa gtctatgctc catcactctt acaaaggctc atcgtatgac 7140
taattttttt tgagaaaggt aacagtttgt attgataata agatcagcgc caggttagtc 7200
attagtgcta atagctgtat gtacaactcc aaaagagcaa aagacaagca cctggtgtaa 7260
cgtaaattac aagctgccta taaaatctat caggtctcct acctcactaa acatttcttg 7320
tttacaccaa aaaaataaaa caaggaaaga caatccatct taatcttctg aatggagttt 7380
cttttgcctt caaacatctc gagttccttt cgttccatgc aatccaccat atacaagctg 7440
ggatgctttt ccatttgtct ttatccattt tttctaccaa ttcccttcca attgactaga 7500
agttccaatg tggttctaga tatgacccaa ttaactccca acatataaaa gaacatgttc 7560
cacggatttg tagtgattct gcaatgtagg aacaagtgag cattactttc tacttcctgt 7620
ccacaaagaa aacatcttga gcaaatctgg aaacctcttc tttgtaagtt atcatgtgtt 7680
aaacatgctt ttttaccact aaccagacaa aacatgatac tttgggagga gttttaaccc 7740
tccaaatgtg tttccaaggc cacacctcag tcattgaaac attatgattt agagtccagt 7800
atgcatcttt tactgaaaat gcacctttgc tattcagctt ccaaactatt ttatctatgg 7860
tcttgttagt ttacagctat gtatatagtg tagtcttgtc ccacattgga ataggagtag 7920
tatgtccttg tatagtatag ctataaataa ggacctcttg tattgtattg aacatccaat 7980
atcaataaca tattttctcc cgtgctttct cacatggtat cagagcaatt gtgagagatt 8040
tatcgctgcg cataaattcc agcgactccg ggaagagaaa tcagtcaccg gaagtctttt 8100
tccgacgact ctttcaaggt tgtttgcgtt tgctttataa atccaacact accacaagag 8160
taatcactgt ccggcgacca aaccccagta aaaatctccg gcagcagcct cctcacgcca 8220
ccagaagctc acgcgccggc gcgtacgacc acttccgtcc attttttgaa aaacttcctt 8280
cagaacagtt gggtcgcctg gtaattccta tcctacccct actgttttca tttcattccg 8340
accactttga gttttttccg gctgctacag tactattccg gcagctatag tactattccg 8400
acaactacag taagattccg gctgctacag tatttcatta ttctgttttt gtgtttcctt 8460
actctgtttc agtggattac aattgattct ttctcttatt tggtaataat ttgcaacaat 8520
gtctatggga tttgatgttt ttgggtctag aaacatgagt tctggaagct ctagtgttat 8580
tattacctca gaaccttaaa tgggaggttc aaactactta gcttgggctt catctgtcga 8640
gttgtggtgt agaggccaag gtgttcaaga tcatctaatc aaaccgtcta gcgaaggaga 8700
tgaaaaggca ataacacttt ggacaaaaat cgatgctcag ttatgtagca tcttgtggcg 8760
atctattgat tccaagttga tgcccttgtt tcgtccattc ctgacatgtt atttggtttg 8820
ggcaaaggca cacaccttat acactaatga catatctcgc ttctatgatg tgatatcgcg 8880
gatgacaaac tgaaagaagc aagaattaga tatgtctact tacttgggtc aagtacaagc 8940
aatcatgggg gaatttgaga agttgatgcc agtttctgct agtgttgaaa aacaacaaga 9000
gcagcgacaa aagatgtttc tcgctcttac cctcgctgaa cttcctaatg atcttgattc 9060
agtacgcgac catattttag ctagtccgac tgtcccgaca gttgatgaat tattctctcg 9120
attactccgc cttgctgtag caccaagtca cccagtgatc tcatcacaga tacttgattc 9180
ctctgttctt gcatcccaga caatggatgt tcgggcatct caaactatgg agcatagacg 9240
aggaggaggt cgttttggaa gatctagacc caagtgttct tattgtcaca aacttggaca 9300
cactcgtgaa atgtgttatt ccttacatgg tcgtccaccc aaaaatgctt acattgctca 9360
gaccgagact ccaggtaacc agggattttc tttatctaaa gaagaatata atgaactcct 9420
tcagtatcga acaagtaagc agacatctcc acaagtagcc tcagttgctt agactgatac 9480
ttcttttact ggtaattttt ttgcttgtgt ttcccagtct agcactcttg gcccatgggt 9540
catggactca ggcgcttctg atcacatctc tggtaatata tcacttttgt taaatattgt 9600
atattcatag tctcttccca ttgttacttt agccaatgga tgtcaaatta cggcaaaagg 9660
agttggacaa gctaatccct tgtcttctat caccctagat tctgttcttt atgtccctgg 9720
ctgtcttttt cgtcttgcat ctgttagtcg tttgactcgt gccctccatt gtggtatata 9780
ttttattgac gattctttta ttatgcagga ctgcagtacg ggacagacaa ttggtggagg 9840
acgtgaatca gaaggccttt actaccttaa ctcacccagt ccttccacaa catgtctggt 9900
tacagatcct ccagatctaa tccacagacg tttaggacat ccgagtttat ccaaacttca 9960
gaagatggtg cctagtttat ctagtttgtc tacattagat tgtgagtcgt gtcagcttgg 10020
gaaacatacc cgagcctcct tttcgcgtag tgttgagagt cttgcatagt ctgccttctc 10080
cttagttcat tctgatatat ggggtcctag tagagtaagt tcaaccttgg gatttcgtta 10140
ttttgttagt ttcattgatg attattcaag atgtacttgg cttttcttaa tgaaagaccg 10200
ttctgagtta ttttctatat tccagagttt ctgtgctgaa atgaaaaacc aatttggtgt 10260
ttctattcgc atttttcgca gtgataatgc cttagaatat ttatcttttc aatttcagca 10320
gtttatgact tctcaaggaa ttattcatca gacatcttgt ccttataccc ctcaacaaaa 10380
tggggttgct gagagaaaga ataggcacct tattgagatt gctcgcacac ttctaattga 10440
atctcgtgtt ccgttgcgtt tttggggcga tgcagtgctc acaacttgtt atttgattaa 10500
tcggatgcct tcatctccca tcaaggatca gattccacat tcagtattgt ttccccagtc 10560
acccttatac tctcttccac cccgtatttt tggaagcacg tgttttgttc ataacttagc 10620
ccctgggaaa gataagttag ctcttcgtgc tctcaagtgt gtcttccttg gttattctcg 10680
tgttcagaag ggatatcgtt attattctcc agatcttcgt aggtacctta tgtcagctga 10740
cgtcacattt tttgagtcta aacctttctt tacttttgct gaccaccatg atatatctga 10800
ggtcttacct ataccgacct ttgaggagtt tactatagct cctcctccac cttcgaccac 10860
agaggtttca tccataccag ccgttgagga gtctagtgtt gttcctcgta gttccccagc 10920
cacaggaaca ccactcttga cttatcatca tcgttcgcgc cctacatcgg gcccaactgg 10980
ttctcgtcct gcacctgacc cttctcctgc tgcggaccct gctcctagta cactgattgc 11040
acttcggaaa ggtatacgaa ccatacttaa ccctaatcct cattatgtcg gtttgagtta 11100
tcatcgtctg tcatttcccc attatgcttt tatatcttct ttgaactcgg tttccatccc 11160
taagtctaca ggtgaaacgt tgtctcaccc aggatggcga caggctatga gtgacgagat 11220
gtctgcttta catacaagtg gtacttggga gcttgttcct cttccctcag gtaaatctac 11280
tgttggttgt cgttgggttt atgcagtcaa agttggtccc gatggccaga ttgatcgact 11340
taaggcccgt cttgttgcca aaggatatac tcagatattt gggctcgatt acagtgatac 11400
cttctctccc gtggctaaag tggcttcagt ccgtcttttt ctatccatgg ctgcggttcg 11460
tcattggccc ctctatcagc tgaacactaa gaatgccttt tttcacggtg atcttgagga 11520
tgaggtttat atagagcaac cacctggttt tgttgctcag gagggggtct cgtggccttg 11580
tatgtcgctt gcgtcggtca ctttatggtc taaagcagtc tcctagagcc tggtttggta 11640
agttcagcac ggttatccag gagtttggca tgactcgtag tgaagctgat cactctgtgt 11700
tttatcggca ccctgttgac attccgatgg atccgaattc taaacttatg ccaggacagg 11760
gggagccgct tagcgatcct gcaagctata ggcggctggt tggaaaatta aattatctca 11820
cagtgactag acccgatatt tcttatcctg taagtgttgt gagtcgattt atgaattctc 11880
cctgtgatag tcattgggtt gcagttgtcc gcattattcg gtatataaaa tcggctccag 11940
gcaaagggtt actgtttgag gatcaaggtc atgagcagat cgttggatac tcagatgctg 12000
attgggcagg atcaccttct gatagacgtt ctacgtctgg atgttgtgtt ttagtaggag 12060
gcaatttggt gtcttggaag agcaagaaac agaatgtagt tgctcggtct agtgcagaag 12120
cagaatatcg agcaatggct atggcaacat atgagctagt ctcgaccaaa caattgctca 12180
aggagttgaa atttggtgaa atcaatcgga tggaacttgt gtgcgataat caagctgccc 12240
ttcatattgc atcaaatccg gtgttccatg agagaactaa acacattgag attgattgtc 12300
acttcgtcag agaaaagata ctttcaggag agattgctac aaagtttgtg aggtcgaatg 12360
atcaacttgc agatattttc accaagtctc tcactggtcc tcgtattggt tatatatgta 12420
acaagctcgg tacatatgat ttgtatgcac cggcttgagg gggagtgtta gtttacagct 12480
atgtatatag tgtagtcttg tctcacattg gaataggagt agtatgtcct tgtatagtat 12540
agctataaat aagacagtac taacgtccct tttgccgggg gttctgcatc tttaaataga 12600
tgcacgtggt tccatagcag accgtgttga tcacagatcg tgctgcatcc tcttcccagc 12660
ggactcggtg agcccctctt gtattgtatt gaacatccaa tatcaataac atattttctc 12720
tcgtgctttc tcacaggtct gtgatgtacc cttgaaaggt tcaagagttt ggaggaagat 12780
agaaactctg tttatctccc aatcatccaa agatcttcta aagttccagt tccatccttg 12840
tgagctccag actgacttac caatgcttgg ctttgaagac ttagagagaa taagtcagga 12900
aaaatctttc aaccttcctt gccctatccg gtgatcttcc caaaaagatg tcttcaaccc 12960
attgccaaca ttgatcctga tattgctact gaaagatttc ttttggtggc aggattactc 13020
tcattaacaa tgtacttgac aatctccata catacgaatg tctctttacc ctcttgccat 13080
taaggttgta aagagacttg tcaaattaag aagaggtttc ctatggaact gtttcaagga 13140
aggaacctcc tttcctttgg tcaagtggag ttaagtcata taatctagga agtggagact 13200
tgggtataaa atagctgcaa ctacagaaaa ggagcatctt atttaaatga tcacgcaaat 13260
gtgcccaaaa ctttaaatat ctgcggagca tatggttgta gcaaaatttg aatcttccgg 13320
tcaatgttgc tcatgtccag tgaatacccc tgatggtgaa agtgtcctga agggaagcag 13380
gaacttattg gaggaattgg catttaacac tcagcatttc gttaggtcat agcccgctga 13440
aaattgagtg cccagattta tatagttttg ctctaaactg acgatgcagt tgcacaacat 13500
acgacaaact aaggtgggac atcttcttcg gaaggaattt tgaggattaa gagatagagt 13560
ggttgattca gttgcaaatg aagcttcaag ggttcaatat catccaggag acaccggatt 13620
ctgatagata aaacaacaga aagatgaaca ctactttgtt aggcttgtta caagttgcta 13680
tcgtctttct tatctcggca cacaatttag atttgggaac ttatttggaa aatagagtgg 13740
ttgtttttgt gaatagcatc agacaaagct tctgagctgg tacgacagaa aactcaacag 13800
ggagaataaa agactgtggt tcacgatttc tgcatgcatc ttgtaggtta tttggtgggt 13860
aaaatattta atgttttgaa gggaaggtag aacatgttca taggcttaga ttcaaatgtt 13920
tgtatttttt tggctctttg gtgagagatg ctgaatgtaa atgacatagg cagctgacta 13980
taatttctca gctccttgct ttttaaattg gcaggcactg atatgtacat gtgaacatcc 14040
aacacttttg tggtgccgtt ccgatgaata aagcacatta atcacttact gatcaggagt 14100
aatagtttag gagttctaga atttttgtac ataaaatgaa ccaaaaagaa tatcggaatg 14160
agaacatgtt tctttttttg tttcttcttt ttcgtacaaa tttcaataac acttctgata 14220
gaatagctag gtccatttga attcctttgg agacccttac acaaccaatg aatggcaagt 14280
atagcatttt ctaacaccct cccacatgta taatccagtt tttagggttt agatgtggat 14340
ttgatttgac cttattgcct ttttttgttt ttgttctttt tgaagtagag agtgaggagg 14400
ctcacaacga cgggctacgt agagcgagat taattcggct caacgggcta atgattggac 14460
ttacatgcta caacaatgtt aggagaaaga gagagagaga gagagaagcc cagagcagtt 14520
ccacgagtta agaaagagaa gtccaaagcg attgaatatg aagagagaaa gcggttgtgc 14580
taacaggctc cctcaagttt ggctctgagc atccaactca aaaccttaag gcaatgagta 14640
gagtagccca ggaccattta aactcctgtt gaaaacctta cacaaccaat aagggaacaa 14700
gtgtaacatt ctcttacaac cctaccgtct tataagtcag ggctctaatt tagcataaaa 14760
tcaaagtgag gcgatctact atgaaatgaa gaaaataact gataaatata aagaatgtta 14820
attctcccat atagcctgaa tgttcccaga acaaaataaa ttagtctcat gatttatcat 14880
taacatgatg ttcctcttat tttgagtgat taggaaggtt aatcaaggag taaattcttt 14940
ctaatttgta tcgtctagaa ttatttgtct aacaaatttt cagattaccg gtgatcaaaa 15000
gaggaaaata ttttgcatac aacgttacca taccttacaa aagggcgatg aacatttttt 15060
tattttatta ttgtcctttt tttcaattag gggttatgca gtcttcctcc acgtgatatt 15120
actcttagaa tcacgttttt gtcattgcta ttacttactg tggtaagtac aaatgtgttt 15180
tgaactcttt ttggtatgta ttattgagtt aatttttcgt ttccatttca gagctgccgc 15240
tttatcttct gctgggcatc ttttgtggct tagtttcagt ggcattatca agttgtacat 15300
catttatgct gcaaatagtg gaaaatattc aaatgaccag cggcatgcca aaagcagctt 15360
ttcctgtcct gggcggtctt ctggttgggc tggtagcttt agcatatcct gaaatccttt 15420
accagggttt tgagaatgtt aatattctgc tagaatctcg cccactagtg aaaggcctct 15480
ccgctgatct gttgctccag cttgtagctg tcaaaatagt aacaacttca ttatgccgag 15540
cctctggatt ggttggaggc tactatgcgc catctctatt catcggtgct gctactggaa 15600
ctgcatatgg gaaaattgtt agctacatta tctctcatgc tgatccaatc tttcatcttt 15660
ccatcttgga agttgcatcc ccacaagctt atggcctggt atgaatttgt cttttgttag 15720
aagtagcatt acatatctgg ataagtgagt tttttattat tgaaaagtaa taacaggaga 15780
acaagagaat atatcaccca aatctacttc tttcctctct tctattcttc tgaaattcaa 15840
ggtcctttaa ctcctccaca gtctgtctag ttattgatcc tgtagactta attcacatag 15900
gtttaggaca ttcgagttta tccaaacttc atgaaaaggt ttctaatttt tttacattac 15960
attatgagtc gtgtctactt gagaaacata tcactccatg tttctatagt ctgttttctc 16020
cttagtttat tctgatatgt ggggtcctat taagtcagtt caaccttgta ttttcattat 16080
ttttgcagta tcattgataa ttattcaaga tgtacttgga ttttctttac aagagatagt 16140
tctcagttgt tttttgtgtt cctaagtttt tatgctgcaa tacaaaattg gtttgatgtc 16200
tctatttgca tttttcccaa tgataatgcc ttagaatatt ttcttttccg tttcagtagc 16260
ttattatttc tttaggaact ctttatcaga aatctcaact gagatagatg agaggaagaa 16320
taagcatatc attggtctca ttcagtcccc tgtcaagctt agtttcttga gcgatgcggt 16380
ttcacgtcct tttattagat taattggatg cctcatctgc tatccaaaat cagttaactt 16440
tcgatattgt ttcctcgctt acctttatac tctctttccc tcgagtcttt gggagcacat 16500
gttttgttca ataacatagc tcctggaaag tgaccagcgc aaccgacaaa caaggccttc 16560
ttaatgtaga aggtggacat atgctattct agccacggga aagaaagtaa tattgtaatc 16620
aaacccaaat atctgagtat aacctttggc aatggcgatc aatttgatta tatggaccaa 16680
ctttgcctgc atatacccac cgacaaccaa taatagattt accgggaggt agagaaacaa 16740
gctcccaaat accactaata tgtaaagcag atatatctct gatcatagct tgtccttgtg 16800
gacataggga tagaaattaa ggacaaagat gacacaaaag cataatgcgg tgatgataaa 16860
cgatgataac tcaaatcaat ataatgggga tggggattga gagtggatcg aatatctttg 16920
cggaatgcga ttggtagact aggaggagag aagtctgtgg acatgatgtt ggactgagat 16980
caataataag tcaagaatgg tggagctaca gaacatggaa ctggagctgt aggtgacata 17040
atcggagctg taggaggtgg agctatagag gaaggtgaag gagagatagc gactgaatct 17100
ccaaaagatg aaaccggtaa tacctcaaaa aatgtctaag agatcatttg gacctatgaa 17160
gtatgattgc gtttttaaaa aggtaacatc ataaggtcag gtgaataaca ttgatatccc 17220
cgttgcatcc tcgagtaact tagaaatata catttgagag cacggagagc taacttatct 17280
tttctggagc aaggttgtaa acaaaacacg tgctcccaaa gacacgaggt ggaagagaga 17340
aaggtgagtg gggaaacaag acagaggatg aaacttgact cttgatagtt gaagatgaca 17400
tacaattaat aagacaatag gatgtgagat ccaatgacag ttctcatgaa ctgctgaaat 17460
ggagaagaca aatactctgg ggcgttatca ctacgaaatg tgcagttaga aaccccaaat 17520
tgattttgga tttcagtgtg gaaggtctaa aaaatagaga acaactcaga ttgatttttc 17580
atcaagaata tccaagtgga cttggaataa tcatcaatga aactgacaaa gtagcggaat 17640
tccaaggtag aactaacccg acaaggaccc caaacatctg aatggactaa agtgaaaggt 17700
aactctaccc gattatcagg atgtcgaggg aaatgagagt gagtatgcct tctgagcgga 17760
tatgactcac gctctagagt ggacaagtga gacaaacgag gtactatttt ctaaagttct 17820
gataaattgg gatgtcctaa ctgtatatgt aataaatctg gtggatcagt aaaaggacaa 17880
gctgtagggg gaaaaaaata ccaaatattt ccagaagatg gcaaactaca acagaagatg 17940
caactgcatt aacatgctca ggataggtga tgaaatcatt gaggacaaag agttgatcaa 18000
gaaggagatt ctggaatttt accagaactt atatagtgaa aatgaaccct ggaggcgcag 18060
tgcaaatttc gaagacatct cctcactaag catagaagag aagaactggt tggaagctcc 18120
atttgtagaa atagaggtgc ttgaagcttt gaaatcatgt gccccttata aagcaccagg 18180
tccagaaggc ttcactatgg atttctttca gaaaaattgg gatactctta aaacagacat 18240
catggctgca cttaatcatt ttcaccagag ctgtcacatg gttagggctt gcaatgccac 18300
cttcattgcc ctaattccaa agaaaaatgg tgctatggag ctcagagact acagacctat 18360
tagcttgaca ggtattgtat acaaattggt ttcaaagatt ttagcagaga ggctcaagaa 18420
ggtaattgac aaactagtct cgggggaaca aaatgctttc atcaagaaca ggcagatcac 18480
tgatgcttcc ttgattgcca atgaagtgct ggattggaga atgaaaagtg gagaaccagg 18540
cgtgttgtgc aaactggaca ttaaaaaggc ttttgatcaa ttaagctggt cttacctcat 18600
gagtatcttg aggcagatgg gctttgggga gaaatggaga agatggataa actattgcat 18660
ttcaactgtc aagtactctg ttttggtgaa tagggaccca atcggttttt tctcccccca 18720
aaagggccta aggcaggggg atcccctctc ccccttccta ttcattctgg cgatggaagg 18780
actcactaaa atgttggaga aggctaagca actgcaatgg atacaaggct ttcaggtggg 18840
aaggaatcct gccagctcag ttacagtatc tcatctactc tttgcggatg atactcttat 18900
tttctgtggt actgagagat cacaagcacg aaatctcaac ctgacactga tgatcttcga 18960
ggcactatca ggactccaca tcaatatgat aaagagcatc atataccctg tgaatgcagt 19020
ccccaacata caagagctag cagacatcct atgccgcaaa acagacactt tcccaaccac 19080
atatcttgga cttcccttgg gagctaaatt caaatcaaaa gaagtttgga atggagtcct 19140
agagaagttt gaaaagaggc ttgcgacttg gcaaatgcaa tacctcccca tgggtggcag 19200
gttaacttta atcaatagtg tactggacag tcttcccaca taccacatat ctttgttccc 19260
aattccaatc tcagtcctaa agcagatgga caaactcaga aggaagttct tatgggaagg 19320
atgcagcaaa acacacaaat ttccactagt gaaatggctg aaggtaactc aaccaaaatt 19380
caaaggagtc ttgggaatca gggatgctat gctcttaaaa tggctctgga gatatggaca 19440
ggaggaatct aggctatgga aggacatcat atttgctaaa tatggagcac acaaccactg 19500
gtgttccaag aaaacaaact ctccttatgg agttggtctg tggaagaaca tcagcaacca 19560
ctgggatgaa ttcttccaaa atgtaacttt caaagttggg aatgtaactc gtataagttt 19620
tggaaggata gatggcttgg aaatacacct ttgaaagaca tgtttcccag tatgtatcag 19680
attgccgtga ccaaagactc cactgttgct cataatagaa acaatgacac ttggtaccca 19740
cttttcagaa gaaatttgca ggattgggag gtcaacaacc tactcacaat gttaagctcc 19800
ctagaatgtc ataacattga agatcaacaa cctgacaaac ttatttggga aaattctaag 19860
agaggcaagt acacagtcaa agaatgatac attcacctct gtgaccagaa tccaatatat 19920
aactggccat ggaaacatat ctggagaact aaagtgccta ccaagatgac ttgcttcaca 19980
tgattgtctc taaatggggc ctgtctcact caagacaact taatcaagag gaacatcata 20040
taagttaata gatgctacat gtgccaacaa cagtcagaaa gtgtaaagca cttattcctt 20100
cactgctcag ttgcaaaaga aatttggaac ttcttctaca ctacctttgg tctaaaatgg 20160
gttatgccac aatcaactaa gcaagctttt gaaagttggt atttttggag agttgataaa 20220
tccattagaa aaatctggaa aatggtgtcg gccgcaagtt tttggtgtat ttggaaagaa 20280
aggaactgaa gatgttttga tggcatatca actccactca aggctgcgtg tttagttaac 20340
ttattttgct ggaactatct cacccctgtt aatagtgctg atacttctgt ggatttcatt 20400
agccccctga tagtagcata ggcttttgta aatggagcta attatccttt ctcttttgta 20460
ctctttgcat cttcttgatg ccttttaatg aatctaattt acttcatcaa aaagaaaatg 20520
acaagttgtt gaaggaggaa aagatgtgag tccatgtgat ttagcaagga taaggtacta 20580
aagtccattt gattcacgtc cggtaccaat gatccgtctc gtgctgcatt cctgtattaa 20640
aacagagtca tcaagaaata aaatagagca aataagtgat tggccaagcg actagtggat 20700
atgagattaa aaggactatg gggaacataa aaaactgaat tcaaaggtaa ggaaggaagt 20760
ggactagctt aacctattct agttgccatg gtttgagaat cgttggccat tgtgactatt 20820
ggaagtgatt gagagtaaga aatagtagtg aaaggagatt tgttacccga aatataatta 20880
gatgcacctg aatcaatgac ccaaaagtcg gaagaagagg aaacacaagt cacgctatta 20940
cctgtttgaa caatagagat tagtttggat caaatagttg tatagagaac tgaaatttgg 21000
agaaatcaat catatagaac ttgtatgtga ttattgttgc cctttatatt gcgtcaaatc 21060
ctaaaacaca ttgagattaa ctgccactta tcacagaaaa gatattctct agagacattg 21120
ttacaatttc atgaagtcaa gtaattagct tgaacatatc ttcagcaagt ccctcgtcag 21180
tcctcatatt agttacattt gtaacaatgt cggtacataa gacttataag caccagtttg 21240
aggaggagtg gtagagagtt gatgtacata gttaaagtag atatacttac acttagtgtt 21300
atgtaaagag tggatataaa aagggatcag cataagacaa ttgtcttcgc gcgtcttaac 21360
atttttttcc tgtctttatt tctctcatgg tatcagataa cctatctcta tcttggttta 21420
cccaatggtt ggcccccata ttgtattagc catgctccag ttgactaggc ttggacgggc 21480
agaggtgtta aattatccca tattggttga aagaatgagc tattgtctcc ttatatggtc 21540
ttagacaatt ctccaactca tgagatattt tgttttggct gagttagccc taaggtttat 21600
tttttgtcat attctttaac cttatggcaa tgcttgtaca cggaaaaacc ggagtgcaag 21660
acttaaatta ggagaaggaa actattgaag gtgaggaact taaagggttg tgagaataca 21720
cgggagaaaa aaatcttaat actatctagt ggccttgtat atcaaatgat cagcttgcaa 21780
atattttcac caagtccctc actggtcctc gtattagtta catatgtaac aagttcggta 21840
tatatgattt gtatgcaccg gcttgaggtt atgcatattc tattcctcct actatatatg 21900
tgactaggaa atattttact cctactgcat atgggactag gactatttac acataactat 21960
ctaacattcc cctcaagcca gtgcacacaa gtcatatgta ccgagcttgt tacatatgta 22020
actaatacga ggaccagtga gggatttagt aaaaatatct gcaagctggt cattcgacat 22080
acaaggccac tagactcccc ccgagcaaca aaaccaggtg gttgctgata aacagaaact 22140
ggccgaaaag ttgccggaaa aatttgaaaa tagtgagact aagccgaatt ctacactaca 22200
aaataggttc taaaacacca ccagaaaaca aaaacttttc tagaaattac tcttcacacc 22260
ggaaaaaata aaagttgtca gaatttgatg taatttatat agataggttc ggaatcactg 22320
gaggagtaag ttgtcccgaa gaagttttgt caaaaagtgg ccggaatggc tcacatgcgc 22380
cggaaaactt actgtagctc gcaggaaccc tagttctggc ggtgcgtgga ggcgcgtgac 22440
ttaagattaa gatgcttaca ggactatctt gagaaatata catattatat agacgcttga 22500
gttgcttccc aatcctaaat agaagctttt attcgtaggc aagaagggaa gcagctttac 22560
ttgagccaat agctttcaag gtgcacgttg tcacaccaag gacatccaga atttgatttt 22620
atagggggtg tgagaaagca cgggagaaaa tatgttattg atatttggat aataaataca 22680
atacaagagg tccctattta tagctataca ctacaaggag atattactcc tcttccaatg 22740
tgggacaaga atacactata catatctgta aactaacact ccccctcaag tcggtgcata 22800
cacatcatat gtaccgatct tgttacacat gtagctaata cgagaaccaa taagagactt 22860
agtgaaaata tctgctagtt gatcattcga ctttacaaac tttgtaacaa tatctcctga 22920
aagtattttt tctctgacaa agtgacagtc gatctcaatg tgtttagtcc tctcatggaa 22980
caccggattt gacacaatat gaagagtagc ttggttatca cacattagtt ccatcttgct 23040
gatttctccg aattttaact ccttgagcaa ctgcttgacc caaaataact cacacgtcgt 23100
catagccatg gcccgatatt cggcttcggc gctagatcga gcaactacat tctgtttctt 23160
gctcttccac gagaccaaat tacctcctac tagaacacaa tatccagaca tagaacgtct 23220
atcaaaaggt gatcttgccc aatcagcatc tgtgtaccca acaatctgct cgtggccttg 23280
atcctcgaat agtaatcctt tgcccggagc tgactttata taccgaagaa tgcgaacaac 23340
tgcatcccag tgactatcac agggagaatc cataaactga cttacaacac tcaccggaaa 23400
agaaatgtca ggtctagtca ctgtgaggta attcaatttg ccaaccaacc tcctatatct 23460
cgtagggtct ctaagaggct ccccctgtcc aggcagaagc ttagcattca gatccatagg 23520
agagtcaata ggtctgcaac ccatcattcc agtctcctca agaatgtcta agacatactt 23580
ccgctgtgaa ataacaatac ctgagctaga ctgagcgacc tcaataccta aaaaatactt 23640
caatctgccc agatccttag tctggaagtg ctgaaagaga tgttgcttca gattagtaat 23700
accatcctga tcattgccag taataacaat atcatcaaca taaatcacta gataaataca 23760
cagattagga gcagaatgcc gataaaacac agagtgatca gcctcactac gagtcatacc 23820
gaactcctga ataattgtgc tgaacttacc aaaccaagct cgaggggact gtttcaaacc 23880
atatagtgac ctgcgcaatc tgcacacaca accattaaac tcccctaagc aacaaaacca 23940
ggtggttgct ccatataaac ttcttcctca agatcactgt ggagaaaagc attcttaatg 24000
tctaactgat aaagaggcca atgacgtaca acagccatgg acaaaaagag acgaacagat 24060
gctactttag ccacgggaga gaacatatca ctataatcaa gcccaaaaat ctgagtatat 24120
ccttttgcaa caagacgagc cttaaaccga tcaacctggc catccggacc gactttgact 24180
gcataaaccc aacgacaacc aacagtagac ttacctgcag gaagaggaac aagctcccaa 24240
gtgcaactcg catgtaaagc agacatctcg tcaatcatag catgtcgcca tcctggatga 24300
gatagtgcct cacctgtaga cttagggata gaaacagtgg acaaagaaga tataaaagca 24360
taatgaggtg acgacagacg atgataactt aaaccgacat agtggggatt aggattaagt 24420
gtggatcata cacctttgcg gagtgcaatt ggttgactaa gaggagacaa gtccgcagta 24480
ggtgcagaat ctgatgcggg gcgtgaatca cctgggcctg atgctggata tggacgacga 24540
tgataagtca agagtggtgg agctgccgaa ggttgaactg gattatgtgg aggaactgga 24600
gctataggtg gtggagctac aactggagct gtaggtggtg gaactagagt aactgaatct 24660
ccaaaagatg aaactggtag tacctcagaa atatctaagt gatgacctga acctgtgaag 24720
tatgattggg tttcaaagaa ggtaacatca gcagacataa ggtactgctg gaggttagga 24780
gagtagcatc gatacccctt ttgtgttctc gagaaaccta gaaatacgca cttaagagca 24840
cgaggagcta acttatccgt tcctggaata aggttatgca caaaacaagt gcttccaaag 24900
atacgaggtg gaagagagaa caaaggtaag tggtaaaaca tgacagagaa tggaacttgg 24960
ttctggatag ctgatgatgt catacgatta ataagatagc aagatgtaag aactgtatcc 25020
cccaaaaacg caacggagca tgagattgta tgagtagggt acgagcagtt tcaataaaat 25080
gtctattctt tctttcagct accccatttt gttgagatgt gtacagacaa gatgtttgat 25140
gaataatccc atgagatttc ataaactgct gaaatgggga agacaaatac tctcgggcat 25200
tatcactacg aaatgtgcga atagaaaccc caaattgatt ttgaatttca gcgtggaagg 25260
tctggaaaat agaaaacagc tcagatcgat tttttatcaa aaatatccaa gtgcacctgg 25320
aataatcatc aatgaaactg acaaaatagc agaatcccaa ggtggaactg acccgactag 25380
gaccccaaac atctgaatgg actaaagtaa aaggtgactc tgctcgatta tcaagacgcc 25440
taaggaaatg ggagcgagta tgcttaccga gctgacatga ctcacactct agagctgaca 25500
agtgagataa accagatacc attttctgaa gttttgacaa actgggatgt cccaaccgtt 25560
tatgtaataa atctggtgaa tcagtaacag gacatattgt agatggaaga caagatgcga 25620
gtccatgtat ttagcaagga taaggtaata aagtccgttt gattcacgcc cggtaccaat 25680
gatccgcccc gtactgcgtt cttgtataaa aacatggtca tcaagaaata aaataacgca 25740
tttaagtgat ttggctaagc gactaacaac tatgagatta aaaggactat tgcgaacata 25800
aaggactgaa tctaaaggta aggaagaaag tgggcttgct tgacctattg cagttgccat 25860
ggtttgagac ccattggcta ttgtgacttt tggaaaagat tgagaatacg aaatagtagt 25920
gaaaagagat ttgttaccag aaatatgatc tgatgcacct gaatcaatga cccaagactc 25980
agaggatgaa gattgggaaa aacaagtcac gctattacct gtttgaacaa cagaagctat 26040
ctcagaagat gtctgcttac atgctttgta ctaaaggaac tcaatataat ctgctaaaga 26100
aaccatccga ctattcaaag catcggttcc catgtcgcta caatttgtag tagtagggtt 26160
aacttgaaat agtggaaata agtaactccg gtgagaaaac tgaagaaata gcttgaaaac 26220
actgtttaca acagtaaaaa cagaacactg ttctgcgccg gaatctactg tagctgacgg 26280
aaaaactcaa agtagtcgga atgaaacgaa aaacagtagg ggtaggatcg gaattaccag 26340
gcgacccaac tattctgaag gaagtttttc aaaaaatggc cggaagtggt cgtacgtgtc 26400
ggcgcgtgag ctcacgcgcg tgagcttctg gtggcgcgtg gaggcgcgtg aggaggctgc 26460
tgccggagat tttcactggg gtttggtcgc cggacagtga ctactcttgt ggtagtgttg 26520
gattttgcac aacactgacg gagataaagc agacgcaaac agccttgaaa aagtcgccgg 26580
aaaagacttc cggtgactga tttctcttcc tggaatcgct ggaatttatg cacagcgata 26640
aatctctcac aattgctctg ataccatgtg agaaagcatg ggagaaaata tgttattgat 26700
atttggataa taaatacaat acaagaggtc cctatttata gctatacact acaaggagat 26760
attacttctc ttccaatgtg ggacaaaaat acactataca tatctgtaaa ctaacaaggg 26820
gaatatcgtt taaagataaa aaagatagcg tgcagaagat tgcatacatt agagatgcaa 26880
aatacagaat acccatactc ccagataatg cagtatgcct tttgcatgac ccactggttg 26940
aatggaagca cctggtcaat ttactaggtg tgttagtgat ttttgctgct tccttcccct 27000
ttctaaacta catactatct aaaatgttag ggggacagaa gcccagtcaa tctgactagg 27060
tgatgttagt ggtttccgct tctttctccc acttctaaat gcgtactttc tcaaatttag 27120
gagcatagaa acttaagcag ctgcctacct gaggaggtgc atgggaacat aagagaatag 27180
actttacctg tcatattttc cataccttag ttaattacag tgttatcctg ataatgatct 27240
gttttctgta tctaggctga atcgagattc aatcgctttt ggctgaaagg atgctgctac 27300
agatccttag tttacatcat tgtggttctt attctataag tacttcccct atcaactact 27360
tccttctttt ttcttaggtt atttgcctct taggttgttt gcaaggaaag gaacaataga 27420
tgttttgatg gaatagcaac tccaaaccac ttccttaagg ctaatatact gtttggccaa 27480
gcttcttcaa agtccaaagc ccttttttgt cttcaaaaaa gtatcttttt ttcccaaagt 27540
tgaggtgttt ggccaaactt ttggaaggaa aaaaaagtgc ttttgagtaa agcagaagct 27600
cttgagaagt agaaaaagta gttttttccc ggaagcattt ttttgaaaag cacttttgag 27660
aaaaataaac ttagaaacac tttttaaaag tttggccaaa cactaattgc tgcttaaaag 27720
tgtttttcag atttattagc caaacacaaa ctgcttctca ccaaaagtac ttttttgaaa 27780
aatacttttt tgaaaagtga ttttcaaaca aagcactttt caaaataagt ttattttaga 27840
agcttgtcaa ccggctataa atgtctttta tttttacagc tagagtaccc taacacctgt 27900
aaattcccct agacattttt ttcgactttg ttagctcatt aaccctagta taggactctt 27960
tgttttggag ctagcaaact cttttgtttt cctatttttg catcttcttg gtgccattta 28020
taatatctct tacttcacca aaaaaaataa gttcccaaaa tatgactacc ttgagttggc 28080
caaagcataa ccaaagcttg ggcacaccag tgtttgcgtg aattttatgg atgttcctta 28140
cctttatcct tctgtgctta tgtagcatct gtcttggtta atcttttctg aagtctatag 28200
tgtatttctg tgttgcaaca tgagtttact gtcaatctta ctgtttgacc tcaattttgg 28260
gttctttttg attttgaaag acatcgttta acaggttggc atggctgcta ctcttgctgg 28320
tgtctgtcag gtgcctctca ctgctgtttt gcttctcttt gaactgacac agaattatcg 28380
gatagttctg cccctcttgg gagctgtggg gttgtcttct tgggttacat ctggacaaac 28440
aaggaaaagt gtagtgaagg atagagaaag actaaaagat gcaagagccc acatgatgca 28500
gcgacaagga acttctttct ccaacatttc tagtttaact tattcttcag gtgtgaaacc 28560
ttcacagaaa gagagtaacc tatgcaaact tgagagttcc ctctgtcttt atgaatctga 28620
tgatgaagaa aatgatttgg caaggacaat tctagtttca caggcaatga gaacacgata 28680
tgtgacagtt ctaatgagca ccttgctaac ggagaccata tccctcatgc tagctgagaa 28740
gcaatcttgt gcaataatag ttgatgaaaa taattttctc attggtctgc tgacacttag 28800
tgatatccag aattacagca agttgccaag agcagagggc aatttccagg aggtagcttc 28860
ttggtacatt tcaatattct taactgatga aaaaataagg gaaattgatc tagcatgaaa 28920
ttaagctaat tataagtttt acactgtaga actggtaaaa cagggttggc tggatatttc 28980
tttgttgaat ttttaggatt atatgtattg ttttagtttt gtaggttgtt ttctgatgtg 29040
ctttttgact tggcagaatc ttaagatgaa atggaaggtg tttaaccaaa aaatagaatt 29100
ttcagtcaaa gcctatattt agaagaaaac gggttattga taaccaagtt ttactttact 29160
tccccaacaa tctatttggt aaatagcaaa agtaatgcgt atgtgagaaa gcacgggaga 29220
aaatatatta ttgatattag atattcaata taatacaaga ggtcctacac atcatatagc 29280
tatagtctac aaactacata ttactctcat tccaatgtgg gactacacat aactaacact 29340
ccccctcaag ccggtgcata catatcatat gtaccgagct tgttacacat gtaactaata 29400
cgagaaccag taagagactt agtgaaaata tctgctagtt gatcatttga ctttacaaac 29460
tttgtaaaaa tatctcctga aagtattttt tctctgacaa agtaacagtc gatctcaatg 29520
tgtttagtcc tctcatggaa tagcggattt gacgcaatat gaagagcagc ttggttatca 29580
cacaccagtt ccatcttgct gatttctcca aactttaact ccttgagcaa ctgcttgacc 29640
caaactaact ctcacgttgc catagccatt gcccgatatt cgacgtcggc gccagatcga 29700
gcaactacat tctgtttctt gctcttccac gagaccaaat tacctcctac tagaacacaa 29760
tatccaggcg tagaacgtct atcaaaaggt gatcctgccc aatcagcatt tgtgtaccca 29820
acaatttgct cgtggcctcg atcctcgagt agtaatcctt tgcttggaga tgactttata 29880
taccgaagaa tgcgaacaac tgcatcccag tgactatcac agggagaatc cataaactga 29940
cttacaacac tcaccggaaa agaaatgtca ggtctagtca ctgtgaggta attcaatttg 30000
ccaaccaacc tcctatatct cgtagggtct ctaagaggct ccccgtgtct aggcagaagc 30060
ttagcattcg gatccataag agagtcaata ggtctgtaac ccatcattcc agtctcctca 30120
aaaatgtcta aggcataatt ccgctgtgaa ataacaatac ctgagctaga ctgaggcact 30180
gagcaacctc aatacctaga aaatacttca atctgcccag atccttagtc tggaagtgct 30240
gaaagagatg ttgcttcaga ttagtaatat catcctgatc attgccagta ataacaatat 30300
catcaacata aaccactaga taaatacaca gattaggagt aaagtgccga taaaacacag 30360
agagatcagc ctcactacga gtcatggcga actcctgaat aattatgctg aacttaccaa 30420
accaagctcg aggggactgt ttcaaaccat ataatgacct gcacaatcta cacacacaac 30480
cattaaactc cccctgagca acaaaaccag gtggttactc catataaact tcttcctcaa 30540
gatcaccgtg gagaaaagca ttcttaatgt ctaactgata aagaggccaa tgacgtacaa 30600
cagccatgga caaaaagaga cgaacaaatg ctattttagc cacgggagag aaagtatcac 30660
tataatcaag cccaaaaatc tgagtatatc cttttgcaac aagacgagcc ttaagccgat 30720
caacctggcc atccgggccg actttgaccg cataaaccta atgacaacca acattagact 30780
tacctgcagg aagaggaaca agctcccaag tgccactcgc atgtaaagca gacatctcgt 30840
caatcatagc atgtcgccat cctggatgag atagtgcctc acctgtagac ttagggatag 30900
aaacagtgga caaagaagat ataaaagcat aatgaggtga tgacacacga tgatgactta 30960
aaccgacata gtggggatta ggattacgtg tggatcgtac gcctttgcgg agtgcaattg 31020
gttgactaag aggagacaag atcgtagtag gtgcagaatc tgatgcaggg cgtgaatcac 31080
ttgggcatga tgttggatgt ggacgacgat gataagtcaa gagtggtgga gctgcagaag 31140
gttgaactgg attatgtgga ggaactggag gtggagctac aactggagct gtaggtggtg 31200
gaactggagc tataagtggt ggagctacaa ctggagctgg agatgtagag gaagatgaat 31260
gagagatagt gactgaatct ccaaaaaata aaattggtag tacctcagaa atatctaagt 31320
gatgacatga acctgtgaag tatgattgag tttcaaagaa ggtaacatca gcggacataa 31380
ggtaccgctg aaggtcaaga gagtagcatc gatacccctt ttgtgttctc gagtaaccta 31440
gaaatacgca cttaagagca cgaggagcta acttatctgt tcctggagta aggttatgga 31500
caaaacaagt gattccaaag atacagggtg gaagagagaa caaaggtaag tggggaaaca 31560
tgacaaagaa tggaacttgg ttttggataa ctgaagatgg catacgatta ataagatagc 31620
aagatataag aactgcatcc ccccaaaaac gaaacggagc atgagattgt atgagtaggg 31680
tacgagcaat ttcaataaga tgtctatttt ttctttcagc taccccattt tgttgagatg 31740
tgtacagaca agatgtttga tgaataatcc catgagattt cataaactgc tgaaatgggg 31800
aagacaaata ctctcgggca ttatcactag gaaatgtgcg aatagaaacc ccaaattgat 31860
tttgaatttt tagcgtggaa ggtctggaaa aatagaaaac aactcagatc gattttttat 31920
caaaaatatc caagtgcacc ttgaataatc atcaattatt caataaaact gacaaagtag 31980
cagaatccca aggtggaact gacccgacta ggaccccaaa catttgagaa tggactaaag 32040
taaaaggtga ctctgcttga ttatcaagac gccgagggaa atggaagcga gtatgcttat 32100
cgaactgaca tgactcacac tctagagctg acaagtgaga taaaccagat accattttat 32160
gaagttttga caaattggga tgtcccgacc gtttatgtaa taaatttggt gtattagtaa 32220
caggacaagt tgttgaagga agacaagatg tgagtccgtg tgatttagca aggataaggt 32280
aataaagtcc gtttgattca cgtccggtac caataattcg tcccgtactg cgttcctgta 32340
taaaaacatg gtcatcaaga aataaaacaa cgcatttaag tgatttggct aagcgactaa 32400
tagttatgag attaaaagga ctattgggaa cataaatgac tgaatataaa ggtaaggaag 32460
gaagtgagct tgcttgactt attgttgttg ccattgtttg agacctattg gccattgtga 32520
ctcttgaaag agattgaaaa tacgaaatag tagtgaaaag agatttgtta ccagaaatat 32580
gatctgatgc acctgaatca atgacccaaa actcagatga tgaagattgg gagaaacaag 32640
tcacgctatt acctgtttaa acaacagaag ctatcacaga agatgtctgc ttacatgctt 32700
tgtaccgaag gaactcaata taatctgcta aagaaaccat ccgactattc aaagtatcgg 32760
ttcccatgtc gctacaattt gtagtaatag gatggataga ctcggaaaat tgtaaagtta 32820
tcggaatttg tcgtaaccag gatcgagcaa gctgtcttga agaaatggtt tcaaaaaatg 32880
tccggaaagg tcacttttac gccggaaaaa tataaaaatg gtcgaaattt gatttgaatt 32940
agatgggtag gctcggaatt gtgaggagag cagactgtcc tgaagaagct taatgaaaaa 33000
atggccggaa agtggccgga accctcgccg taaaagttgt taccggcgcg tgaaggcgcg 33060
tggcattttt tctgccagat aaattttcag gggttggtcg tcggagggtg atcccttgtg 33120
gtggtgttgg tttttgcaca ataccgacag gccttaggtc acccgaaaat ttgcacgatg 33180
actaagttct ttcttcccgg ttaacgctgg aatgacgcac atcgatcttt tctcactaat 33240
gctatgatac catgtgagaa agcacgggag aaaatatatt attgatatta gatactcaat 33300
ataatacaag aggtcatatt tatagctata gtctacaaag tacatattac tctcattcaa 33360
atgtgggact acacataact aacaacgtaa attaacaaag agaaataagg aatgtaacaa 33420
cagtcaatcc ctaaaatcaa ggtagaaaac tttgataaag cagagaatta tagaatgtat 33480
ttcagtagta cttggaactt gtccttacaa ataaaattct ttatccttat ataggggcgt 33540
acaatcataa catttttcgc acttaattcg aattcattat gagcattaat tgtattgatt 33600
gcccgttatc atagataacc ataactgacg tatttgtaac tataaatgcc ttataacggc 33660
tctgattccc cttccttatt tacttctggt ttgtgtatct ttccttcttt ttagccttta 33720
ttcattcagt tctcgcctct tctttgacaa ctgtcaagcc cgatcctctg ttctgtactg 33780
tctcgtgggt gtttcccccg taccttcctt atattcttaa ttctgttaat tgagagtgtc 33840
acttgtcact atgccattgt tccacgcgtc atgtttcatc cacgtgtaat atcttttttc 33900
caccaataca gataatcccc cactttctga atattctcaa ctgaatattc gggtaagttt 33960
ttatggcggg aattctttgc cgtcgttttt cgagtatcat cgtgtcatct tcagaaccga 34020
tgtgacgtac gtcacgtcta tttaatgcct atgccaggtg gcttctatcg attggctctg 34080
cagtttttta gcgcttttta gggtttttca gcggctgcgt cagtcacgaa gtgacggttc 34140
cattatgacg cttcataatg actaacttta atgatggtcg tgtcttctta ttaatacttc 34200
attccttttt gatctcttgg agtcttcctt cttcagtatc caccacatta cttctttgta 34260
tttctgcatc ttctctttga tattcctttg gacaatcatg tcttcttcta caccagaccc 34320
ccgtaaggtt gtgattgttg acgaacttga tctttctact gctcctacta gaagtaggag 34380
aggtggtaga cttcgtagtc ttggttcact atctaatcgt ggttcttctt cccagggtag 34440
tgctgctaag ccatcttctt ctagacctag ggctccttta acccctagat cttcttctag 34500
gaatagagat ttaaatgatc cagtgcgcga acctacagtt gcagagattg ttcctcaaga 34560
attttctttt gtaactgacc gtgaaaccat aaggaatcaa atttcttcta tagcctccct 34620
caataccgct aacctttatc caagtttaat cagtaatggt cttctctccc gggttcgaag 34680
agaatattac tgaaaccaga tttcccaatt ttagtccctg gtgccaacca gagaattact 34740
ccataccatg ttggtttttc ctttgtttac acctaccctt ttactttagg gttcaaacca 34800
cctattgaac cagtaatcat tgaattctgt cgttatttca acgtgtgtct tggccagatt 34860
gaccacatag tatggagggc tgttcatgcc ttcgttattt atcagatttg gtttccatgc 34920
ctttcacttt tcagcacttg cttcatctct actcccctaa attgtttcgt gaagtagttt 34980
ttactctcgt ggctagaagt aagagagtgt tggttagcct tgaagacgat tgggaccgtg 35040
gctggtacgc tcgttttgtt gctgctccca ctagtgcatt agtgggtgaa gaaaatatgc 35100
ctttcccgga gaaatggaac tttgcacgta agctttcttc tcctcttttt ttttgtctta 35160
aaaaaactcc atgtaatcat atacccactt cttcagcaac tatggaagtt ttttatgctt 35220
gggtagaaaa gatgttaact gctgcgccta tggagaaaag atcctggaaa tacttttctc 35280
aaagatttgg ttggaaagtg aagacgcacg gtacttttta ccttcattgt ttttcctttt 35340
ctcttccttg tttgttcaat gatttctcat ccttcccttt ttttttacta gggtttccga 35400
ttcgtggtat tagtcccgcg tctgttccat caactaggct ttccgtgatt cttgttcagg 35460
aaagaatttt aagtgcttct tcttcaaaaa ggaaaactga cggagcccgt ggctctgatg 35520
acgaagaaga aacagaggag ggttctttgg tgcgaaggtc acgcgtcagg agacgcgtgg 35580
tttctgatga tgaaactact ccttctcatg accctctatc tagttcaatc ccttttagac 35640
tcacggatga gctagagagt acccctttag tgatttctta tgatgatgct gttgatcccc 35700
ctccaagttc tgttgataga ttgtttgctc atggcttcga gggtgatgaa gttttgggcc 35760
tgtttctgaa gaattgcccc ttgcttccct tccagtttca gttttcatta acccttccgt 35820
gtccttacct gatgatactc ctgttgttat tctcgtggct gcttctactc cgtcatctat 35880
tcccgtgact gcttctcatg cagaggccaa accttctagc agcagaaggg caatgaaaag 35940
agttgttgtt gaggttcctg aaggtgagaa cttattaaga aaatccggtc aagccgacgt 36000
gtagttgaaa cctatgctcg gccccgtaga gaagaagaag ttagaaagcc atagctcact 36060
cactttaatg aatgatatcg ttcattcttc cttgaaagta caagcttaat tatatttcct 36120
ttcttttctc tttcttattc ataactcttc ctcctttttt gcagatcaac ttgattggca 36180
cagagcttat gaaaagagtt tctcaggcgg accggcaagt tatagatttg cgcaccgagg 36240
ctgataactg gaaggaacaa ttcgaaggtc ttcaattgga aaaagaggtt ccggcggaag 36300
agaagaatgc tttggaacaa cagatgagag tgattgcctc tgaattagca gttgaaaaag 36360
cttcctcgag ccaggttgga aaggataagt atatacttga atcctccttt gctgaacaac 36420
tttccaaggc aactgaagaa ataaggagtt tgaaggaact ccttaatcaa aaagaggttt 36480
atgcgagaga attggttcaa acacttactc aagttcagga agatctccgt gcctctactt 36540
ataagattca gttcttggaa agttctctcg cttctttgaa gacagcttac gatgcctctg 36600
aagcagaaaa agaagagctg agagctgaga tttaccagtg ggagaaggat tatgagattc 36660
tcgaggataa tctatcgttg gatgtaagtt gggctttctt aaacactcgt ctcgagactc 36720
tagttgaagc caaccatgag ggttttgacc ttaatgctga gattgctaag gctaaagaag 36780
caattgataa aactcagcaa cgtcaaatct tttcctcacc tgaagacgaa ggtcccgaag 36840
gtgatggaga ttga 36854
<210> 12
<211> 753
<212> PRT
<213> Nicotiana tabacum
<220>
<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; two start codons, translated from SEQ ID NO: 10 of PCT/EP2013/077532
<400> 12
Met Ile Ser Gly Gln Asn Thr Val Leu His Asn Pro Pro Asn Ser Leu
1 5 10 15
Phe Asn Ser Leu Ser Pro Arg His Ile Cys Ile Ser Phe Cys Asn Asp
20 25 30
Lys Ala Leu Lys Lys Ser Val Thr His Ser Ala Pro Arg Phe Ala Arg
35 40 45
Leu Leu Asn Asn Glu Ser Arg Lys Leu Leu Gly Arg His Pro Asn Cys
50 55 60
Trp Pro Trp Ala Arg Arg Pro Ser Leu Pro Pro Gly Arg Ser Ser Asp
65 70 75 80
Gly Asn Ile Glu Lys Glu Gln Asp Met Cys Asp Ser Ser Lys Val Asp
85 90 95
Ser Asp Ser Gly Ile Gln Ile Gly Ser Leu Leu Glu Glu Val Ile Pro
100 105 110
Gln Gly Asn Asn Thr Ala Ile Ile Ser Ala Cys Phe Val Gly Leu Phe
115 120 125
Thr Gly Ile Ser Val Val Leu Phe Asn Ala Ala Val His Glu Ile Arg
130 135 140
Asp Leu Cys Trp Asp Gly Ile Pro Tyr Arg Ala Ala Ser Glu Glu Pro
145 150 155 160
Ile Gly Val His Trp Gln Arg Val Ile Leu Val Pro Ala Cys Gly Gly
165 170 175
Leu Val Val Ser Phe Leu Asn Ala Phe Arg Ala Thr Leu Glu Val Ser
180 185 190
Thr Glu Gly Ser Trp Thr Ser Ser Val Lys Ser Val Leu Glu Pro Val
195 200 205
Leu Lys Thr Met Ala Ala Cys Val Thr Leu Gly Thr Gly Asn Ser Leu
210 215 220
Gly Pro Glu Gly Pro Ser Val Glu Ile Gly Thr Ser Val Ala Lys Gly
225 230 235 240
Val Gly Ala Leu Leu Asp Lys Gly Gly Arg Arg Lys Leu Ser Leu Lys
245 250 255
Ala Ala Gly Ser Ala Ala Gly Ile Ala Ser Gly Phe Asn Ala Ala Val
260 265 270
Gly Gly Cys Phe Phe Ala Val Glu Ser Val Leu Trp Pro Ser Pro Ala
275 280 285
Glu Ser Ser Leu Ser Leu Thr Asn Thr Thr Ser Met Val Ile Leu Ser
290 295 300
Ala Val Ile Ala Ser Val Val Ser Glu Ile Gly Leu Gly Ser Glu Pro
305 310 315 320
Ala Phe Ala Val Pro Gly Tyr Asp Phe Arg Thr Pro Thr Glu Leu Pro
325 330 335
Leu Tyr Leu Leu Leu Gly Ile Phe Cys Gly Leu Val Ser Val Ala Leu
340 345 350
Ser Ser Cys Thr Ser Phe Met Leu Gln Ile Val Glu Asn Ile Gln Thr
355 360 365
Thr Ser Gly Met Pro Lys Ala Ala Phe Pro Val Leu Gly Gly Leu Leu
370 375 380
Val Gly Leu Val Ala Leu Ala Tyr Pro Glu Ile Leu Tyr Gln Gly Phe
385 390 395 400
Glu Asn Val Asn Ile Leu Leu Glu Ser Arg Pro Leu Val Lys Gly Leu
405 410 415
Ser Ala Asp Leu Leu Leu Gln Leu Val Ala Val Lys Ile Val Thr Thr
420 425 430
Ser Leu Cys Arg Ala Ser Gly Leu Val Gly Gly Tyr Tyr Ala Pro Ser
435 440 445
Leu Phe Ile Gly Ala Ala Thr Gly Thr Ala Tyr Gly Lys Ile Val Ser
450 455 460
Tyr Ile Ile Ser His Ala Asp Pro Ile Phe His Leu Ser Ile Leu Glu
465 470 475 480
Val Ala Ser Pro Gln Ala Tyr Gly Leu Val Gly Met Ala Ala Thr Leu
485 490 495
Ala Gly Val Cys Gln Val Pro Leu Thr Ala Val Leu Leu Leu Phe Glu
500 505 510
Leu Thr Gln Asp Tyr Arg Ile Val Leu Pro Leu Leu Gly Ala Val Gly
515 520 525
Leu Ser Ser Trp Val Thr Ser Gly Gln Thr Arg Lys Ser Val Val Lys
530 535 540
Asp Arg Glu Lys Leu Lys Asp Ala Arg Ala His Met Met Gln Arg Gln
545 550 555 560
Gly Thr Ser Phe Ser Asn Ile Ser Ser Leu Thr Tyr Ser Ser Gly Ser
565 570 575
Pro Ser Gln Lys Glu Ser Asn Leu Cys Lys Leu Glu Ser Ser Leu Cys
580 585 590
Leu Tyr Glu Ser Asp Asp Glu Glu Asn Asp Leu Ala Arg Thr Ile Leu
595 600 605
Val Ser Gln Ala Met Arg Thr Arg Tyr Val Thr Val Leu Met Ser Thr
610 615 620
Leu Leu Met Glu Thr Ile Ser Leu Met Leu Ala Glu Lys Gln Ser Cys
625 630 635 640
Ala Ile Ile Val Asp Glu Asn Asn Phe Leu Ile Gly Leu Leu Thr Leu
645 650 655
Gly Asp Ile Gln Asn Tyr Ser Lys Leu Pro Arg Thr Glu Gly Asn Phe
660 665 670
Gln Glu Glu Leu Val Val Ala Gly Val Cys Ser Ser Lys Gly Asn Lys
675 680 685
Cys Arg Val Ser Cys Thr Val Thr Pro Asn Thr Asp Leu Leu Ser Ala
690 695 700
Leu Thr Leu Met Glu Lys His Asp Leu Ser Gln Leu Pro Val Ile Leu
705 710 715 720
Gly Asp Val Glu Asp Glu Gly Ile His Pro Val Gly Ile Leu Asp Arg
725 730 735
Glu Cys Ile Asn Val Ala Cys Arg Ala Leu Ala Thr Arg Glu Gln Leu
740 745 750
Cys
<210> 13
<211> 818
<212> PRT
<213> Nicotiana tabacum
<220>
<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; one start codon, translated from SEQ ID NO: 4 of PCT/EP2013/077532
<400> 13
Met Cys Asp Ser Ser Lys Asp Asp Ser Asp Ser Asp Ser Gly Ile Gln
1 5 10 15
Ile Gly Ser Leu Leu Glu Glu Val Ile Pro Gln Gly Asn Asn Thr Ala
20 25 30
Ile Ile Ser Ala Cys Phe Val Gly Leu Phe Thr Gly Ile Ser Val Val
35 40 45
Leu Phe Asn Ala Ala Val His Glu Ile Arg Asp Leu Cys Trp Asp Gly
50 55 60
Ile Pro Tyr Arg Ala Ala Ser Glu Glu Pro Ile Gly Val His Trp Gln
65 70 75 80
Arg Val Ile Leu Val Pro Ala Cys Gly Gly Leu Val Val Ser Phe Leu
85 90 95
Asn Ala Phe Arg Ala Thr Leu Glu Val Ser Thr Glu Glu Ser Trp Thr
100 105 110
Ser Ser Val Lys Ser Val Leu Gly Pro Val Leu Lys Thr Met Ala Ala
115 120 125
Cys Val Thr Leu Gly Thr Gly Asn Ser Leu Gly Pro Glu Gly Pro Ser
130 135 140
Val Glu Ile Gly Thr Ser Val Ala Lys Gly Val Gly Ala Leu Leu Asp
145 150 155 160
Lys Gly Gly Arg Arg Lys Leu Ser Leu Lys Ala Ala Gly Ser Ala Ala
165 170 175
Gly Ile Ala Ser Gly Phe Asn Ala Ala Val Gly Gly Cys Phe Phe Ala
180 185 190
Val Glu Ser Val Leu Trp Pro Ser Pro Ala Glu Ser Ser Leu Tyr Leu
195 200 205
Thr Asn Thr Thr Ser Met Val Ile Leu Ser Ala Val Ile Ala Ser Val
210 215 220
Val Ser Glu Ile Gly Leu Gly Ser Glu Pro Ala Phe Ala Val Pro Gly
225 230 235 240
Tyr Asp Phe Arg Thr Pro Thr Glu Leu Pro Leu Tyr Leu Leu Leu Gly
245 250 255
Ile Phe Cys Gly Leu Val Ser Val Ala Leu Ser Ser Cys Thr Ser Phe
260 265 270
Met Leu Gln Ile Val Glu Asn Ile Gln Met Thr Ser Gly Met Pro Lys
275 280 285
Ala Ala Phe Pro Val Leu Gly Gly Leu Leu Val Gly Leu Val Ala Leu
290 295 300
Ala Tyr Pro Glu Ile Leu Tyr Gln Gly Phe Glu Asn Val Asn Ile Leu
305 310 315 320
Leu Glu Ser Arg Pro Leu Val Lys Gly Leu Ser Ala Asp Leu Leu Leu
325 330 335
Gln Leu Val Ala Val Lys Ile Val Thr Thr Ser Leu Cys Arg Ala Ser
340 345 350
Gly Leu Val Gly Gly Tyr Tyr Ala Pro Ser Leu Phe Ile Gly Ala Ala
355 360 365
Thr Gly Thr Ala Tyr Gly Lys Ile Val Ser Tyr Ile Ile Ser His Ala
370 375 380
Asp Pro Ile Phe His Leu Ser Ile Leu Glu Val Ala Ser Pro Gln Ala
385 390 395 400
Tyr Gly Leu Val Gly Met Ala Ala Thr Leu Ala Gly Val Cys Gln Val
405 410 415
Pro Leu Thr Ala Val Leu Leu Leu Phe Glu Leu Thr Gln Asn Tyr Arg
420 425 430
Ile Val Leu Pro Leu Leu Gly Ala Val Gly Leu Ser Ser Trp Val Thr
435 440 445
Ser Gly Gln Thr Arg Lys Ser Val Val Lys Asp Arg Glu Arg Leu Lys
450 455 460
Asp Ala Arg Ala His Met Met Gln Arg Gln Gly Thr Ser Phe Ser Asn
465 470 475 480
Ile Ser Ser Leu Thr Tyr Ser Ser Gly Val Lys Pro Ser Gln Lys Glu
485 490 495
Ser Asn Leu Cys Lys Leu Glu Ser Ser Leu Cys Leu Tyr Glu Ser Asp
500 505 510
Asp Glu Glu Asn Asp Leu Ala Arg Thr Ile Leu Val Ser Gln Ala Met
515 520 525
Arg Thr Arg Tyr Val Thr Val Leu Met Ser Thr Leu Leu Thr Glu Thr
530 535 540
Ile Ser Leu Met Leu Ala Glu Lys Gln Ser Cys Ala Ile Ile Val Asp
545 550 555 560
Glu Asn Asn Phe Leu Ile Gly Leu Leu Thr Leu Ser Asp Ile Gln Asn
565 570 575
Tyr Ser Lys Leu Pro Arg Ala Glu Gly Asn Phe Gln Glu Ile Asn Leu
580 585 590
Ile Gly Thr Glu Leu Met Lys Arg Val Ser Gln Ala Asp Arg Gln Val
595 600 605
Ile Asp Leu Arg Thr Glu Ala Asp Asn Trp Lys Glu Gln Phe Glu Gly
610 615 620
Leu Gln Leu Glu Lys Glu Val Pro Ala Glu Glu Lys Asn Ala Leu Glu
625 630 635 640
Gln Gln Met Arg Val Ile Ala Ser Glu Leu Ala Val Glu Lys Ala Ser
645 650 655
Ser Ser Gln Val Gly Lys Asp Lys Tyr Ile Leu Glu Ser Ser Phe Ala
660 665 670
Glu Gln Leu Ser Lys Ala Thr Glu Glu Ile Arg Ser Leu Lys Glu Leu
675 680 685
Leu Asn Gln Lys Glu Val Tyr Ala Arg Glu Leu Val Gln Thr Leu Thr
690 695 700
Gln Val Gln Glu Asp Leu Arg Ala Ser Thr Tyr Lys Ile Gln Phe Leu
705 710 715 720
Glu Ser Ser Leu Ala Ser Leu Lys Thr Ala Tyr Asp Ala Ser Glu Ala
725 730 735
Glu Lys Glu Glu Leu Arg Ala Glu Ile Tyr Gln Trp Glu Lys Asp Tyr
740 745 750
Glu Ile Leu Glu Asp Asn Leu Ser Leu Asp Val Ser Trp Ala Phe Leu
755 760 765
Asn Thr Arg Leu Glu Thr Leu Val Glu Ala Asn His Glu Gly Phe Asp
770 775 780
Leu Asn Ala Glu Ile Ala Lys Ala Lys Glu Ala Ile Asp Lys Thr Gln
785 790 795 800
Gln Arg Gln Ile Phe Ser Ser Pro Glu Asp Glu Gly Pro Glu Gly Asp
805 810 815
Gly Asp
<210> 14
<211> 906
<212> PRT
<213> Nicotiana tabacum
<220>
<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; two start codons, translated from SEQ ID NO: 11 of PCT/EP2013/077532
<400> 14
Met Ile Ser Gly Gln Asn Thr Val Leu His His Pro Pro Asn Ser Leu
1 5 10 15
Phe Asn Ser Leu Ser Pro Arg His Ile Cys Val Ser Phe Cys Asn Asp
20 25 30
Lys Ala Leu Lys Lys Ser Val Thr His Ser Ala Pro Arg Phe Ala Arg
35 40 45
Leu Leu Asn Asn Glu Ser Arg Lys Leu Leu Gly Arg His Pro Asn Cys
50 55 60
Trp Pro Trp Ala Arg Arg Pro Ser Leu Pro Pro Gly Arg Ser Cys Asp
65 70 75 80
Gly Asn Ile Glu Lys Glu Gln Asp Met Cys Asp Ser Ser Lys Asp Asp
85 90 95
Ser Asp Ser Asp Ser Gly Ile Gln Ile Gly Ser Leu Leu Glu Glu Val
100 105 110
Ile Pro Gln Gly Asn Asn Thr Ala Ile Ile Ser Ala Cys Phe Val Gly
115 120 125
Leu Phe Thr Gly Ile Ser Val Val Leu Phe Asn Ala Ala Val His Glu
130 135 140
Ile Arg Asp Leu Cys Trp Asp Gly Ile Pro Tyr Arg Ala Ala Ser Glu
145 150 155 160
Glu Pro Ile Gly Val His Trp Gln Arg Val Ile Leu Val Pro Ala Cys
165 170 175
Gly Gly Leu Val Val Ser Phe Leu Asn Ala Phe Arg Ala Thr Leu Glu
180 185 190
Val Ser Thr Glu Glu Ser Trp Thr Ser Ser Val Lys Ser Val Leu Gly
195 200 205
Pro Val Leu Lys Thr Met Ala Ala Cys Val Thr Leu Gly Thr Gly Asn
210 215 220
Ser Leu Gly Pro Glu Gly Pro Ser Val Glu Ile Gly Thr Ser Val Ala
225 230 235 240
Lys Gly Val Gly Ala Leu Leu Asp Lys Gly Gly Arg Arg Lys Leu Ser
245 250 255
Leu Lys Ala Ala Gly Ser Ala Ala Gly Ile Ala Ser Gly Phe Asn Ala
260 265 270
Ala Val Gly Gly Cys Phe Phe Ala Val Glu Ser Val Leu Trp Pro Ser
275 280 285
Pro Ala Glu Ser Ser Leu Tyr Leu Thr Asn Thr Thr Ser Met Val Ile
290 295 300
Leu Ser Ala Val Ile Ala Ser Val Val Ser Glu Ile Gly Leu Gly Ser
305 310 315 320
Glu Pro Ala Phe Ala Val Pro Gly Tyr Asp Phe Arg Thr Pro Thr Glu
325 330 335
Leu Pro Leu Tyr Leu Leu Leu Gly Ile Phe Cys Gly Leu Val Ser Val
340 345 350
Ala Leu Ser Ser Cys Thr Ser Phe Met Leu Gln Ile Val Glu Asn Ile
355 360 365
Gln Met Thr Ser Gly Met Pro Lys Ala Ala Phe Pro Val Leu Gly Gly
370 375 380
Leu Leu Val Gly Leu Val Ala Leu Ala Tyr Pro Glu Ile Leu Tyr Gln
385 390 395 400
Gly Phe Glu Asn Val Asn Ile Leu Leu Glu Ser Arg Pro Leu Val Lys
405 410 415
Gly Leu Ser Ala Asp Leu Leu Leu Gln Leu Val Ala Val Lys Ile Val
420 425 430
Thr Thr Ser Leu Cys Arg Ala Ser Gly Leu Val Gly Gly Tyr Tyr Ala
435 440 445
Pro Ser Leu Phe Ile Gly Ala Ala Thr Gly Thr Ala Tyr Gly Lys Ile
450 455 460
Val Ser Tyr Ile Ile Ser His Ala Asp Pro Ile Phe His Leu Ser Ile
465 470 475 480
Leu Glu Val Ala Ser Pro Gln Ala Tyr Gly Leu Val Gly Met Ala Ala
485 490 495
Thr Leu Ala Gly Val Cys Gln Val Pro Leu Thr Ala Val Leu Leu Leu
500 505 510
Phe Glu Leu Thr Gln Asn Tyr Arg Ile Val Leu Pro Leu Leu Gly Ala
515 520 525
Val Gly Leu Ser Ser Trp Val Thr Ser Gly Gln Thr Arg Lys Ser Val
530 535 540
Val Lys Asp Arg Glu Arg Leu Lys Asp Ala Arg Ala His Met Met Gln
545 550 555 560
Arg Gln Gly Thr Ser Phe Ser Asn Ile Ser Ser Leu Thr Tyr Ser Ser
565 570 575
Gly Val Lys Pro Ser Gln Lys Glu Ser Asn Leu Cys Lys Leu Glu Ser
580 585 590
Ser Leu Cys Leu Tyr Glu Ser Asp Asp Glu Glu Asn Asp Leu Ala Arg
595 600 605
Thr Ile Leu Val Ser Gln Ala Met Arg Thr Arg Tyr Val Thr Val Leu
610 615 620
Met Ser Thr Leu Leu Thr Glu Thr Ile Ser Leu Met Leu Ala Glu Lys
625 630 635 640
Gln Ser Cys Ala Ile Ile Val Asp Glu Asn Asn Phe Leu Ile Gly Leu
645 650 655
Leu Thr Leu Ser Asp Ile Gln Asn Tyr Ser Lys Leu Pro Arg Ala Glu
660 665 670
Gly Asn Phe Gln Glu Ile Asn Leu Ile Gly Thr Glu Leu Met Lys Arg
675 680 685
Val Ser Gln Ala Asp Arg Gln Val Ile Asp Leu Arg Thr Glu Ala Asp
690 695 700
Asn Trp Lys Glu Gln Phe Glu Gly Leu Gln Leu Glu Lys Glu Val Pro
705 710 715 720
Ala Glu Glu Lys Asn Ala Leu Glu Gln Gln Met Arg Val Ile Ala Ser
725 730 735
Glu Leu Ala Val Glu Lys Ala Ser Ser Ser Gln Val Gly Lys Asp Lys
740 745 750
Tyr Ile Leu Glu Ser Ser Phe Ala Glu Gln Leu Ser Lys Ala Thr Glu
755 760 765
Glu Ile Arg Ser Leu Lys Glu Leu Leu Asn Gln Lys Glu Val Tyr Ala
770 775 780
Arg Glu Leu Val Gln Thr Leu Thr Gln Val Gln Glu Asp Leu Arg Ala
785 790 795 800
Ser Thr Tyr Lys Ile Gln Phe Leu Glu Ser Ser Leu Ala Ser Leu Lys
805 810 815
Thr Ala Tyr Asp Ala Ser Glu Ala Glu Lys Glu Glu Leu Arg Ala Glu
820 825 830
Ile Tyr Gln Trp Glu Lys Asp Tyr Glu Ile Leu Glu Asp Asn Leu Ser
835 840 845
Leu Asp Val Ser Trp Ala Phe Leu Asn Thr Arg Leu Glu Thr Leu Val
850 855 860
Glu Ala Asn His Glu Gly Phe Asp Leu Asn Ala Glu Ile Ala Lys Ala
865 870 875 880
Lys Glu Ala Ile Asp Lys Thr Gln Gln Arg Gln Ile Phe Ser Ser Pro
885 890 895
Glu Asp Glu Gly Pro Glu Gly Asp Gly Asp
900 905
<210> 15
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 15
ctctgctcga g 11
<210> 16
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 16
aagttatccc a 11
<210> 17
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 17
aatacgtgat 10
<210> 18
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 18
tttgttggga 10
<210> 19
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 19
accagaaggc 10
<210> 20
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 20
ctagtgttga 10
<210> 21
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 21
aatcgcttct 10
<210> 22
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 22
tgcgacagca 10
<210> 23
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 23
caaagtcgat a 11
<210> 24
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 24
tataatctcg g 11
<210> 25
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 25
ttgctttgtt 10
<210> 26
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 26
tgaagacaat 10
<210> 27
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 27
gccgcttgtg 10
<210> 28
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 28
gctttgttgg c 11
<210> 29
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 29
tcttcaccgg 10
<210> 30
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 30
agatatgtgc 10
<210> 31
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 31
acagcagcaa 10
<210> 32
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 32
aatctcggct t 11
<210> 33
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 33
ctttgttggc c 11
<210> 34
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 34
caataatacc g 11
<210> 35
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 35
tataatctcg g 11
<210> 36
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 36
gctggaatcg 10
<210> 37
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 37
ttctggtttg t 11
<210> 38
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 38
ctcttcaccg 10
<210> 39
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 39
tatcagtgtc 10
<210> 40
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 40
ccagcttgtg 10
<210> 41
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 41
cggtttggta g 11
<210> 42
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 42
ccaagggagt t 11
<210> 43
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 43
gagctctgct 10
<210> 44
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 44
agctctgctt 10
<210> 45
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 45
ataaaggtgg t 11
<210> 46
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 46
ctcaaggctg 10
<210> 47
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 47
tggatcagct g 11
<210> 48
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 48
tggatcagct g 11
<210> 49
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 49
tggaatcgct t 11
<210> 50
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 50
gacaatggcc g 11
<210> 51
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 51
ttgtgtcaca 10
<210> 52
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 52
gtgtcacatt a 11
<210> 53
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 53
gaactgggaa 10
<210> 54
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 54
ctggtttgtt c 11
<210> 55
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 55
ccatattatt c 11
<210> 56
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 56
accagcttgt g 11
<210> 57
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 57
cggtttggta g 11
<210> 58
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 58
ggtcgtagaa a 11
<210> 59
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 59
ctgtcactca a 11
<210> 60
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 60
gtatccagat a 11
<210> 61
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 61
gatctctgct 10
<210> 62
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 62
ggagcccatt 10
<210> 63
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 63
gagtacattg g 11
<210> 64
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 64
tcaaggctgc t 11
<210> 65
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 65
gatcagctgc 10
<210> 66
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 66
accagaaggc c 11
<210> 67
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 67
tagtgttgaa at 12
<210> 68
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 68
aacaagatat 10
<210> 69
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 69
tgcgacagca g 11
<210> 70
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 70
atgtgcgaca 10
<210> 71
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 71
cagcaaagac ga 12
<210> 72
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 72
cccttggtta g 11
<210> 73
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 73
ttcatgaaat a 11
<210> 74
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 74
cggtttggta 10
<210> 75
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 75
gacaatggcc g 11
<210> 76
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 76
ttgtgtcaca t 11
<210> 77
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 77
aactgggaat t 11
<210> 78
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 78
cttaggacca 10
<210> 79
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 79
gaatcgcttc t 11
<210> 80
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 80
gtttgttccc 10
<210> 81
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 81
cattgccatg g 11
<210> 82
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 82
atcttataca 10
<210> 83
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 83
attgcatatt g 11
<210> 84
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 84
gactcatcac t 11
<210> 85
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 85
ccttcttttg 10
<210> 86
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 86
ttctcaagaa a 11
<210> 87
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 87
cttcaaccta a 11
<210> 88
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 88
tatttatgaa 10
<210> 89
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 89
gagtagtgcc a 11
<210> 90
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 90
cggtgggtct 10
<210> 91
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 91
ctggtgagct t 11
<210> 92
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 92
ctgatgtaaa g 11
<210> 93
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 93
gatttgcatc 10
<210> 94
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 94
cctgactaac 10
<210> 95
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 95
gtaccttatg 10
<210> 96
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 96
gatttgcata 10
<210> 97
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 97
tttgatagct g 11
<210> 98
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 98
ccttctctgc g 11
<210> 99
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 99
agctgagagg g 11
<210> 100
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 100
cggtaagatc 10
<210> 101
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 101
tcaggcaggt g 11
<210> 102
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 102
ggctccgcca 10
<210> 103
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 103
gtaccttatg 10
<210> 104
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 104
gatttgcata 10
<210> 105
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 105
ctactgctgc a 11
<210> 106
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 106
ggcctggaat t 11
<210> 107
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 107
gattgctgtg 10
<210> 108
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 108
catctggtct c 11
<210> 109
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 109
cggagcagct t 11
<210> 110
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 110
ccttatggct 10
<210> 111
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 111
cagggctgta t 11
<210> 112
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 112
cggttctcgg 10
<210> 113
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 113
ggttctcgga g 11
<210> 114
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 114
agcttccctt a 11
<210> 115
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 115
catcactttt g 11
<210> 116
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 116
gtggggctcc 10
<210> 117
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 117
ccacatgctc 10
<210> 118
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 118
tgcggttctc g 11
<210> 119
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 119
agcagcttcc 10
<210> 120
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 120
atgccaaccc g 11
<210> 121
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 121
agccatggat g 11
<210> 122
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 122
aggagtggga a 11
<210> 123
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 123
tgagagagaa a 11
<210> 124
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 124
cagggctgta t 11
<210> 125
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 125
ccgttctggg a 11
<210> 126
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 126
gcgtcatatt t 11
<210> 127
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 127
ttgagctaac a 11
<210> 128
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 128
gccatggatg a 11
<210> 129
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 129
aaatatcact 10
<210> 130
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 130
caaataccaa 10
<210> 131
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 131
cagcaggggt g 11
<210> 132
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 132
cttatggctg 10
<210> 133
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 133
ttcaatgaga a 11
<210> 134
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 134
cacttcaagg gt 12
<210> 135
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 135
ttgtcctggc a 11
<210> 136
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 136
cattgccatg 10
<210> 137
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 137
gatcttatac a 11
<210> 138
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 138
ttctccttct g 11
<210> 139
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 139
caataacaat gc 12
<210> 140
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 140
gctgagaggg 10
<210> 141
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 141
cggtaagatc ga 12
<210> 142
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 142
tttgggattg 10
<210> 143
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 143
tgtgccatct g 11
<210> 144
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 144
ctccgccaca tg 12
<210> 145
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 145
tcattgtacc 10
<210> 146
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 146
gcatcccctg a 11
<210> 147
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 147
taacacaacc c 11
<210> 148
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 148
caataacaat 10
<210> 149
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 149
ctggttcttc 10
<210> 150
<211> 12
<212> DNA
<213> Nicotiana tabacum
<400> 150
gccaacccgg ag 12
<210> 151
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 151
catggatgag a 11
<210> 152
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 152
ccttaatgaa a 11
<210> 153
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 153
acgaaggaca 10
<210> 154
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 154
gtgggaagtg a 11
<210> 155
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 155
agagaaattc 10
<210> 156
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 156
tccctgtcgt c 11
<210> 157
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 157
atgaaggagt g 11
<210> 158
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 158
gaactcacct t 11
<210> 159
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 159
ttttggttct c 11
<210> 160
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 160
caggcaggtg 10
<210> 161
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 161
ggctccgcca c 11
<210> 162
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 162
atggctggtt 10
<210> 163
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 163
aatgagaatg a 11
<210> 164
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 164
tggtgagctt 10
<210> 165
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 165
ctgatgtaaa g 11
<210> 166
<211> 10
<212> DNA
<213> Nicotiana tabacum
<400> 166
aaggacagag 10
<210> 167
<211> 11
<212> DNA
<213> Nicotiana tabacum
<400> 167
agtgggaagt g 11
<210> 168
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 168
tatctcctcg ccatatctgt a 21
<210> 169
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 169
gtgcaaacac acttgtattt ac 22
<210> 170
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 170
accatctctt cctccggga 19
<210> 171
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 171
tataggatac tcctctgata aat 23
<210> 172
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 172
ttgtacaatt tatcagagga gta 23
<210> 173
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 173
ttggtttgag tgcaaacaca 20
<210> 174
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 174
actatatcga ggatagaagg ta 22
<210> 175
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 175
tatctattta tacatctggt tcg 23
<210> 176
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 176
cttgtgatcc atcacttccc 20
<210> 177
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 177
tatgactatt tctgtgcatc ttt 23
<210> 178
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 178
gccttgtgat tcatcacttc aa 22
<210> 179
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 179
tatgactatt tctgtgcatc tta 23
<210> 180
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Forward primer
<400> 180
ggttcttctc gctctgagc 19
<210> 181
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Reverse primer
<400> 181
aacgtaaaat aactttgcca cg 22
<---
название | год | авторы | номер документа |
---|---|---|---|
МОДУЛИРОВАНИЕ СОДЕРЖАНИЯ САХАРОВ И АМИНОКИСЛОТ В РАСТЕНИИ (SULTR3) | 2020 |
|
RU2826107C1 |
МОДУЛИРОВАНИЕ СОДЕРЖАНИЯ РЕДУЦИРУЮЩИХ САХАРОВ В РАСТЕНИИ | 2019 |
|
RU2801948C2 |
МОДУЛИРОВАНИЕ СОДЕРЖАНИЯ АМИНОКИСЛОТ В РАСТЕНИИ | 2019 |
|
RU2799785C2 |
МОДУЛИРОВАНИЕ УРОВНЕЙ НИТРАТОВ В РАСТЕНИЯХ ПОСРЕДСТВОМ МУТАЦИИ НИТРАТРЕДУКТАЗЫ | 2019 |
|
RU2815762C2 |
СНИЖЕНИЕ ПРЕВРАЩЕНИЯ НИКОТИНА В НОРНИКОТИН В РАСТЕНИЯХ | 2015 |
|
RU2733837C2 |
РАСТЕНИЯ СО СНИЖЕННЫМ СОДЕРЖАНИЕМ АСПАРАГИНА | 2016 |
|
RU2742725C2 |
ГЕНЫ ПРОТЕАЗ ТАБАКА | 2015 |
|
RU2756102C2 |
УМЕНЬШЕНИЕ СОДЕРЖАНИЯ ТАБАК-СПЕЦИФИЧНЫХ НИТРОЗАМИНОВ ПОСРЕДСТВОМ ИЗМЕНЕНИЯ ПУТИ АССИМИЛЯЦИИ НИТРАТОВ | 2015 |
|
RU2721799C2 |
РАСТЕНИЯ С СОКРАЩЕННЫМ ПЕРИОДОМ ВРЕМЕНИ ДО НАСТУПЛЕНИЯ ЦВЕТЕНИЯ | 2017 |
|
RU2792235C2 |
СПОСОБЫ ПОЛУЧЕНИЯ ПРОМЫШЛЕННЫХ ПРОДУКТОВ ИЗ РАСТИТЕЛЬНЫХ ЛИПИДОВ | 2015 |
|
RU2743384C2 |
Изобретение относится к области биохимии, в частности к мутантной растительной клетке табака для снижения уровней нитратов в мутантном растении табака, а также к растению табака, его части, растительному материалу табака, а также к табачной композиции, содержащей вышеуказанную клетку. Также раскрыт способ снижения содержания нитратов, по меньшей мере, в части растения табака, включающий введения в геном растения табака одной или несколько мутаций в пределах, по меньшей мере, одного аллеля члена семейства CLC хлоридных каналов, а также способ получения высушенного растительного материала табака, предпочтительно высушенных листьев, со сниженными в нем уровнями 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанона (NNK). Изобретение также относится к полинуклеотидной конструкции для снижения уровней нитратов в растении табака, а также к вектору для снижения уровней нитратов в растении табака, содержащему вышеуказанную конструкцию. Изобретение позволяет эффективно получать растение табака со сниженными уровнями нитратов. 9 н. и 4 з.п. ф-лы, 6 ил., 2 табл., 9 пр.
1. Мутантная растительная клетка табака для снижения уровней нитратов в мутантном растении табака, где мутантная растительная клетка табака содержит одну или несколько мутацию в
(i) полинуклеотиде, содержащем последовательность, кодирующую член семейства CLC хлоридных каналов и имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 1;
(ii) полипептиде, кодируемом полинуклеотидом, представленным в (i); или
(iii) полипептиде члена семейства CLC хлоридных каналов, содержащем последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 5;
и где одна или несколько мутаций согласно (i)-(iii) содержит мутацию замены в положении, соответствующем G163 последовательности SEQ ID NO: 5;
и где экспрессия или активность члена семейства CLC хлоридных каналов снижена по сравнению с растительной клеткой табака дикого типа, в которой экспрессия или активность члена семейства CLC хлоридных каналов не была снижена;
уровни нитратов в мутантном растении табака, содержащем мутантную растительную клетку табака, снижены по сравнению с растением табака дикого типа, содержащим растительную клетку табака дикого типа; и
уровни табак-специфичных нитрозаминов (TSNA) в высушенном мутантном растении табака, содержащем мутантную растительную клетку табака, снижены по сравнению с высушенным растением табака дикого типа, содержащим растительную клетку табака дикого типа.
2. Мутантное растение табака для получения годных к потреблению табачных изделий, содержащее мутантную растительную клетку табака по п. 1.
3. Часть мутантного растения табака по п. 2 для получения годных к потреблению табачных изделий, где указанная часть содержит мутантную растительную клетку табака по п. 1.
4. Способ снижения содержания нитратов по меньшей мере в части растения табака, включающий этапы:
(a) введения в геном растения табака одной или несколько мутаций в пределах по меньшей мере одного аллеля члена семейства CLC хлоридных каналов, включающий:
(i) полинуклеотид, содержащий последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 1;
(ii) полипептид, кодируемый полинуклеотидом, представленным в (i); или
(iii) полипептид, содержащий последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 5;
и где одна или несколько мутаций согласно (i)-(iii) содержит мутацию замены в положении, соответствующем G163 последовательности SEQ ID NO: 5;
(b) получения мутантного растения табака согласно (a), в котором указанная мутация снижает экспрессию или активность члена семейства CLC хлоридных каналов по сравнению с растением табака дикого ипа, в котором экспрессия или активность члена семейства CLC хлоридных каналов не была снижена.
5. Способ по п. 4, где содержание 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанона (NNK) и/или содержание никотина снижают в мутантном растении табака и/или где содержание N-нитрозоникотина (NNN) является по существу таким же, как в растении табака дикого типа, в котором экспрессия или активность полинуклеотида или полипептида не была снижена.
6. Способ по п. 4 или 5, где часть растения табака представляет собой лист, соответственно высушенный лист.
7. Мутантное растение табака по п. 2, где содержание 4-(метилнитрозамино)-1-(3- пиридил)-1-бутанона (NNK) составляет приблизительно 110 нг/г или менее, необязательно, где содержание нитратов составляет приблизительно 7 мг/г или менее.
8. Растительный материал табака для получения годных к потреблению табачных изделий, включающий биомассу, семена, стебель или листья, содержащий мутантную растительную клетку табака по п. 1.
9. Табачная композиция для снижения уровней нитрозаминов (TSNA), поглощаемых потребителями, где табачное изделие содержит мутантную растительную клетку табака по п. 1, по меньшей мере часть мутантного растения табака по п. 2 или растительный материал табака по п. 8.
10. Способ получения высушенного растительного материала табака, предпочтительно высушенных листьев, со сниженными в нем уровнями 4-(метилнитрозамино)-1-(3- пиридил)-1-бутанона (NNK), включающий этапы:
(а) получения по меньшей мере части мутантного растения табака по п. 2 или 7 или растительного материала табака по п. 8;
(b) необязательно сбора с него растительного материала табака и
(c) сушки растительного материала табака в течение периода времени, подходящего для данного типа табака.
11. Полинуклеотидная конструкция для снижения уровней нитратов в растении табака, содержащая последовательность, кодирующую член семейства CLC хлоридных каналов и имеющую последовательность, представленную в SEQ ID NO: 1, и содержащая мутацию замены в положении, соответствующем G163 последовательности SEQ ID NO: 5.
12. Вектор для снижения уровней нитратов в растении табака, содержащий полинуклеотидную конструкцию по п. 11.
13. Вектор экспрессии для снижения уровней нитратов в растении табака, содержащий полинуклеотидную конструкцию по п. 11.
Разборный с внутренней печью кипятильник | 1922 |
|
SU9A1 |
WO2011048009 A1, 28.04.2011 | |||
WO1998056923, 17.12.1998 | |||
US20070034220 A1, 18.08.2004 | |||
СПОСОБ ПОЛУЧЕНИЯ ТРАНСГЕННЫХ РАСТЕНИЙ ТАБАКА С ПОВЫШЕННЫМ СОДЕРЖАНИЕМ ПРОЛИНА | 2006 |
|
RU2324737C1 |
Авторы
Даты
2020-10-29—Публикация
2013-12-19—Подача