КОМПОНЕНТ 1 МЕХАНОЧУВСТВИТЕЛЬНОГО ИОННОГО КАНАЛА ПЬЕЗОТИПА (PIEZO1) И ЕГО ПРИМЕНЕНИЕ Российский патент 2024 года по МПК C12Q1/68 C12Q1/6883 

Описание патента на изобретение RU2812362C2

Ссылка на перечень последовательностей

Данная заявка включает Перечень последовательностей, поданный в электронной форме в виде текстового файла под названием 18923802502SEQ, созданного 5 февраля 2020 г. и имеющего размер 132 килобайта. Перечень последовательностей включен в данный документ посредством ссылки.

Область техники изобретения

В настоящем изобретении предложены способы лечения пациентов, имеющих варикозное расширение вен, способы идентификации субъектов, имеющих повышенный риск развития варикозного расширения вен, и способы диагностики варикозного расширения вен у субъекта-человека, включающие выявление наличия молекул нуклеиновых кислот и полипептидов варианта PIEZO1 с прогнозируемой потерей функции в биологическом образце от пациента или субъекта.

Уровень техники изобретения

Варикозное расширение вен - это распространенное многофакторное заболевание с большей частью неизвестными генетическими причинами, которое часто наблюдается у пациентов с хронической венозной недостаточностью, что вместе классифицируется как хроническая венозная болезнь. Дисфункция венозных клапанов вызывает варикозное расширение вен, венозную гипертензию и тромбоз. Некоторые процессы, такие как изменения гемодинамических сил, активация эндотелия, воспаление, гипоксия и нарушение регуляции матриксных металлопротеиназ и их тканевых ингибиторов, были связаны с развитием варикозного расширения вен. К факторам риска варикозного расширения вен относятся пожилой возраст, женский пол, количество беременностей, ожирение, тромбоз глубоких вен в анамнезе и длительное пребывание в стоячем положении. Варикозное расширение вен также связано с недостаточным оттоком лимфы и хронической венозной недостаточностью. Помимо этого, некоторые полногеномные исследования ассоциаций (GWAS) показали, что наследуемость варикозного расширения вен составляет около 18,5%.

PIEZO1 кодируется 70 т. п. о. геном, расположенным в 16q24.3, и имеющим пять потенциальных изоформ. Белок варианта PIEZO1 имеет длину 2 521 аминокислот и представляет собой трансмембранный белок массой 286 кДа, который содержит 38 трансмембранных доменов и функционирует в виде гомотетрамера. PIEZO1 кодирует эволюционно консервативный эндотелиальный механочувствительный катионный канал, который генерирует токи, характеризующиеся линейной зависимостью тока от напряжения, которые чувствительны к рутению красному и гадолинию. PIEZO1 экспрессируется повсеместно и играет роль в адгезии эпителиальных клеток, поддерживая активацию интегринов путем привлечения R-Ras в эндоплазматический ретикулум, вероятно, в активированном состоянии, и последующей стимуляции передачи сигналов кальпаина. В сосудистой сети PIEZO1 участвует в миграции эндотелиальных клеток и ангиогенезе, путем прорастания. Если говорить точнее, PIEZO1 действует как датчик гемодинамического удара, связанного с током крови, и способствует организации и выравниванию эндотелиальных клеток в направлении потока крови, обеспечивая правильное формирование, ремоделирование и дозревание сосудов. PIEZO1 также необходим для формирования лимфатических клапанов. Другие известные функции включают регуляцию кровяного давления, осмолярность мочи, целостность эритроцитов, определение давления и осморегуляцию собирательных трубочек.

Сущность изобретения

В настоящем изобретении предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия: молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции; молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем отсутствие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект не имеет повышенного риска развития варикозного расширения вен; а наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.

В настоящем изобретении также предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия: молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции; молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.

В настоящем изобретении также предложены способы лечения пациента терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, причем пациент имеет варикозное расширение вен или имеет повышенный риск развития варикозного расширение вен, включающие этапы: определения, имеет ли пациент молекулу нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, путем: получения, запланированного или уже осуществленного, биологического образца от пациента; и проведения, запланированного или уже осуществленного, анализа генотипирования биологического образца, чтобы определить, имеет ли пациент генотип, включающий молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; и, если пациент соответствует стандарту PIEZO1, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует развитие варикозного расширения вен, в стандартной дозе; и, если пациент является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует развитие варикозного расширения вен, в количестве, которое равно или превышает стандартную дозу; при этом наличие генотипа, включающего молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен.

Краткое описание графических материалов

Сопроводительные фигуры, которые включены и составляют часть этого описания изобретения, иллюстрируют несколько аспектов и вместе с описанием служат для пояснения принципов настоящего изобретения.

На Фиг. 1 показано репрезентативное распределение IBD, общей для пар индивидов в UKB 50k WES; оценочная для генотипов WES с отсутствие аллелей, идентичных по происхождению (IBD, от англ. «identical by descent») в сравнении с 1 аллелью IBD среди всех пар, для которых оценивали экзом UKB 50k.

На Фиг. 2 показан спектр частоты использования сайта (SFS) для всех аутосомных вариантов и по функциональному прогнозированию; экзомы UKB 50k были случайным образом отобраны для числа индивидов, указанного по горизонтальной оси; число генов, содержащих по меньшей мере указанное количество ЧАА ПП < 1% в соответствии с подписью, отложено по вертикальной оси; максимальное число аутосомных генов составляет 18272.

На Фиг. 3 показано континентальное происхождение в UK Biobank (Биобанк Объединенного королевства) 500k и 50k; основной компонент 1 и 2 для n=488377 индивидов, для которых доступны данные UK Biobank; три предопределенные области графика представляют африканское (синий цвет), восточно-азиатское (зеленый цвет) и европейское (красный цвет) происхождение.

На Фиг. 4 показаны одноточечные и общие результаты для 65 вариантов пПП в PIEZO1.

На Фиг. 5 показано оценку LD для варианта PIEZO1.

Описание

Различные термины, относящиеся к аспектам данного изобретения, используются по всему тексту данного описания и формулы изобретения. Таким терминам следует придавать их обычное значение в данной области техники, если не указано иное. Другие конкретно определенные термины следует толковать в соответствии с определениями, приведенными в данном документе.

Если четко не указано иное, любой способ или аспект, приведенный в данном документе, никоим образом не следует воспринимать, как требующий проведения его этапов в конкретном порядке. Соответственно, если в формуле изобретения или описании способа конкретно не указано, что стадии должны быть ограничены конкретным порядком, никоим образом не предусматривается, что подразумевается порядок, в любом отношении. Это относится к любой возможной не выраженной основе для интерпретации, включая вопросы логики в отношении организации стадий или производственного потока, простого значения, полученного из грамматической организации или пунктуации, или количества или типа аспектов, описанных в данном раскрытии.

Употребляемые в данном документе формы единственного числа включают ссылки на формы множественного числа, если из контекста явно следует иное.

В контексте данного документа термины «субъект» и «пациент» употребляются взаимозаменяемо. Субъект может включать в себя любое животное, включая млекопитающих. Млекопитающие включают в себя, но не ограничиваются ими, сельскохозяйственных животных (таких как, например, лошадь, корова, свинья), домашних животных (таких как, например, собака, кошка), лабораторных животных (таких как, например, мышь, крыса, кролики) и приматов, отличных от человека. В некоторых вариантах осуществления субъектом является человек.

В контексте данного документа термины «нуклеиновая кислота», «молекула нуклеиновой кислоты», «последовательность нуклеиновой кислоты», «полинуклеотид» или «олигонуклеотид» могут включать полимерную форму нуклеотидов любой длины, Рак включать ДНК и/или РНК, и могут быть одноцепочечными, двухцепочечными или многоцепочечными. Одна цепь нуклеиновой кислоты также относится к ее комплементарной последовательности.

В контексте данного документа термин «содержащая (-ий)» может быть заменен на «состоящая (-ий) из» или «по существу состоящая (-ий) из» в конкретных вариантах осуществления произвольно.

В контексте данного документа выражение «соответствующий» или его грамматические вариации, употребляемые в контексте нумерации конкретной аминокислотной или нуклеотидной последовательности или позиции, относится к нумерации определенной референсной последовательности, когда проводится сравнение конкретной аминокислотной или нуклеотидной последовательности с референсной последовательностью (например, в данном случае с референсной последовательностью, являющейся молекулой нуклеиновой кислоты или полипептидом (дикого типа) PIEZO1). Другими словами, номер остатка (например, аминокислоты или нуклеотида) или позицию остатка (например, аминокислоты или нуклеотида) конкретного полимера обозначают относительно референсной последовательности, а не по действительному номеру позиции остатка в конкретной аминокислотной или нуклеотидной последовательности. Например, конкретная аминокислотная последовательность может быть выровнена относительно референсной последовательности посредством внесения гэпов для оптимизации совпадения остатков между двумя последовательностями. В этих случаях, несмотря на наличие гэпов, нумерацию остатка в конкретной аминокислотной последовательности делают относительно референсной последовательности, с которой она была выровнена.

В соответствии с настоящим изобретением были получены данные, что определенные вариации в PIEZO1 связаны с риском развития варикозного расширения вен. Считается, что варианты гена PIEZO1 или его белка не имеют какой-либо известной связи с варикозным расширением вен у людей. Следовательно, субъектов-людей, имеющих изменения в PIEZO1, которые связаны с варикозным расширением вен, можно лечить так, чтобы ингибировать варикозное расширение вен, уменьшать его симптомы и/или подавлять развитие симптомов. Соответственно, в настоящем изобретении предложены способы использования идентификации таких вариантов у субъекта, чтобы идентифицировать или стратифицировать риск развития варикозного расширения вен у таких субъектов, или чтобы диагностировать субъектов, как имеющих варикозное расширение вен, чтобы субъектов, подверженных риску, или субъектов с активным заболеванием можно было лечить.

В целях настоящего изобретения любого конкретного человека можно классифицировать как имеющего один из трех генотипов PIEZO1: i) стандартный по PIEZO1; ii) гетерозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции; или iii) гомозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции. Человек является стандартным по PIEZO1, когда у этого человека отсутствует копия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. Человек является гетерозиготным в отношении варианта PIEZO1 с прогнозируемой потерей функции, когда у этого человека присутствует одна копия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. Молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции представляет собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Человек, который имеет полипептид PIEZO1 с частичной потерей функции (или прогнозируемой частичной потерей функции), является гипоморфным в отношении PIEZO1. Молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую описанную в данном документе вариантную молекулу нуклеиновой кислоты. Человек является гомозиготным в отношении варианта PIEZO1 с прогнозируемой потерей функции, когда у этого человека присутствуют две копии любой из молекул нуклеиновых кислот варианта PIEZO1 с прогнозируемой потерей функции.

В случае субъектов-людей или пациентов, которые генотипированы или определены как гетерозиготные или гомозиготные в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, такие субъекты-люди или пациенты имеют повышенный риск развития варикозного расширения вен. В случае субъектов-людей или пациентов, которые генотипированы или определены как гетерозиготные или гомозиготные в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, таких субъектов-людей или пациентов можно лечить агентом, эффективным для лечения варикозного расширения вен.

В настоящем изобретении предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК) или полипептида; причем отсутствие молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции или полипептида указывает на то, что субъект не имеет повышенного риска снижения минеральной плотности костной ткани и/или развития остеопороза; а наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.

В настоящем изобретении также предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия: i) молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; ii) молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; iii) молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или iv) полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем отсутствие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект не имеет повышенного риска развития варикозного расширения вен; а наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.

В настоящем изобретении также предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие: выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК), кодирующей человеческий полипептид PIEZO1; причем: i) если у субъекта-человека отсутствует молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (т. е. субъект-человек генотипически категоризован как соответствующий стандарту PIEZO1), субъект-человек не имеет повышенный риск развития варикозного расширения вен; и ii) если у субъекта-человека присутствует молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (т. е. субъект-человек генотипически категоризован как гетерозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции или гомозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции), субъект-человек имеет повышенный риск развития варикозного расширения вен.

В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.

Определение, присутствует ли в биологическом образце субъекта-человека молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления молекула нуклеиновой кислоты может присутствовать в клетке, полученной от субъекта-человека.

В любом из вариантов осуществления, описанных в данном документе, варикозное расширение вен может быть варикозным расширением вен на ранней стадии (например, C0 согласно классификации CEAP (клинической, этиологической, анатомической и патофизиологической)). В некоторых вариантах осуществления варикозное расширение вен может быть варикозным расширением вен на поздней стадии (например, C6 согласно классификации CEAP). В некоторых вариантах осуществления варикозное расширение вен может соответствовать любой стадии заболевания (например, C0-C6 согласно классификации CEAP). В некоторых вариантах осуществления субъект-человек является женщиной.

В некоторых вариантах осуществления, когда субъект-человек идентифицирован как имеющий повышенный риск развития варикозного расширения вен, субъекта-человека дополнительно лечат терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, как описано в данном документе. Например, когда субъект-человек является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции и, следовательно, имеет повышенный риск развития варикозного расширения вен, субъекту-человеку вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен. В некоторых вариантах осуществления, когда субъект-человек является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, пациенту вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен, в дозе, которая равна или превышает стандартную дозу, вводимую пациенту, который является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

В настоящем изобретении предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК) или полипептида; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.

В настоящем изобретении также предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия: i) молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; ii) молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; iii) молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или iv) полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.

В настоящем изобретении также предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК), кодирующей человеческий полипептид PIEZO1; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид (т. е. субъект-человек категоризован как гетерозиготный или гомозиготный в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции) и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.

В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.

Определение наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции в образце, полученном от субъекта, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления молекула нуклеиновой кислоты может присутствовать в клетке, полученной от субъекта-человека.

В любом из вариантов осуществления, описанных в данном документе, варикозное расширение вен может быть варикозным расширением вен на ранней стадии (например, C0 согласно классификации CEAP (клинической, этиологической, анатомической и патофизиологической)). В некоторых вариантах осуществления варикозное расширение вен может быть варикозным расширением вен на поздней стадии (например, C6 согласно классификации CEAP). В некоторых вариантах осуществления варикозное расширение вен может соответствовать любой стадии заболевания (например, C0-C6 согласно классификации CEAP). В некоторых вариантах осуществления субъект-человек является женщиной.

В некоторых вариантах осуществления, когда субъект-человек диагностирован как имеющий варикозное расширение вен, субъекта-человека дополнительно лечат терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, как описано в данном документе. Например, когда субъект-человек определен как гетерозиготный или гомозиготный в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции и имеет один или более симптомов варикозного расширения вен, субъекту-человеку вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен. В некоторых вариантах осуществления, когда субъект-человек является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, пациенту вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен, в дозе, которая равна или превышает стандартную дозу, вводимую пациенту, который является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

В настоящем изобретении также предложены способы лечения пациента терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, причем пациент имеет варикозное расширение вен или имеет повышенный риск развития варикозного расширения вен, включающие этапы: определения, имеет ли пациент молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, путем: получения, запланированного или уже осуществленного, биологического образца от пациента; и проведения, запланированного или уже осуществленного, анализа генотипирования биологического образца, чтобы определить, имеет ли пациент генотип, включающий молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; и, если пациент соответствует стандарту PIEZO1, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в стандартной дозе; и, если пациент является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в количестве, которое равно или превышает стандартную дозу; при этом наличие генотипа, включающего молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен. В некоторых вариантах осуществления пациент является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.

Анализ генотипирования для определения, присутствует ли у пациента молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующая человеческий полипептид PIEZO1, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления молекула нуклеиновой кислоты может присутствовать в клетке, полученной от субъекта-человека.

В некоторых вариантах осуществления, когда субъект-человек является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, пациенту вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен, в дозе, которая равна или превышает стандартную дозу, вводимую пациенту, который является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

В настоящем изобретении также предложены способы лечения пациента терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, причем пациент имеет варикозное расширение вен или имеет повышенный риск развития варикозного расширения вен, включающие этапы: определения, имеет ли пациент вариантный полипептид PIEZO1 с прогнозируемой потерей функции, путем: получения, запланированного или уже осуществленного, биологического образца от пациента; и проведения, запланированного или уже осуществленного, анализа биологического образца, чтобы определить, имеет ли пациент вариантный полипептид PIEZO1 с прогнозируемой потерей функции; и, если пациент не имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в стандартной дозе; и, если пациент имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в количестве, которое равно или превышает стандартную дозу; при этом наличие вариантного полипептида PIEZO1 с прогнозируемой потерей функции указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен. В некоторых вариантах осуществления пациент имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент не имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции.

Анализ для определения, присутствует ли у пациента вариантный полипептид PIEZO1 с прогнозируемой потерей функции, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления полипептид может присутствовать в клетке, полученной от субъекта-человека.

В любом из описанных в данном документе вариантов осуществления вариантный полипептид PIEZO1 с прогнозируемой потерей функции может представлять собой любой полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, вариантный полипептид PIEZO1 с прогнозируемой потерей функции может представлять собой любой из описанных в данном документе вариантных полипептидов PIEZO1.

В любом из вариантов осуществления, описанных в данном документе, варикозное расширение вен может быть варикозным расширением вен на ранней стадии (например, C0 согласно классификации CEAP (клинической, этиологической, анатомической и патофизиологической)). В некоторых вариантах осуществления варикозное расширение вен может быть варикозным расширением вен на поздней стадии (например, C6 согласно классификации CEAP). В некоторых вариантах осуществления варикозное расширение вен может соответствовать любой стадии заболевания (например, C0-C6 согласно классификации CEAP). В некоторых вариантах осуществления субъект-человек является женщиной.

Симптомы варикозного расширения вен включают, но не ограничиваются этим, тяжесть в ногах, появление сосудистой сетки вен (телеангиэктазии) на пораженной ноге, припухлость голеностопного сустава, особенно к вечеру, коричневато-желтый лоснящийся цвет кожи вблизи пораженных вен, покраснение, сухость и зуд участков кожи (так называемый застойный дерматит или венозная экзема), судороги, особенно при резком движении, например, при вставании, незначительные повреждения пораженного участка, кровотечение, превышающее норму или требующее длительного времени для заживления, уменьшение объема кожи над голеностопным суставом (липодерматосклероз), синдром беспокойных ног, побелевшие, неровные пятнами, похожие на рубцы, появляющиеся на голеностопных суставах (белая атрофия кожи), или любую их комбинацию.

Примеры терапевтических средств, которые лечат или ингибируют варикозное расширение вен, включают, но не ограничиваются этим, флавоноиды, такие как диосмин или гесперидин, и противовоспалительные средства, такие как ибупрофен и аспирин.

В некоторых вариантах осуществления доза терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, может быть снижена на около 10%, на около 20%, на около 30%, на около 40%, на около 50%, на около 60%, на около 70%, на около 80% или на около 90% для пациентов или субъектов-людей, которые являются гетерозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции(т. е. ниже стандартной дозы), по сравнению с пациентами или субъектами-людьми, которые являются гомозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (которые могут получать стандартную дозу). В некоторых вариантах осуществления доза терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, может быть снижена на около 10%, на около 20%, на около 30%, на около 40% или на около 50%. Кроме того, дозу терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, для пациентов или субъектов-людей, которые являются гетерозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, можно вводить реже по сравнению с пациентами или субъектами-людьми, которые являются гомозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

Введение терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, можно проводить повторно, например, через одни сутки, двое суток, трое суток, пять суток, одну неделю, две недели, три недели, один месяц, пять недель, шесть недель, семь недель, восемь недель, два месяца или три месяца. Повторное введение можно проводить в той же дозе или в отличной дозе. Введение можно повторять один раз, два раза, три раза, четыре раза, пять раз, шесть раз, семь раз, восемь раз, девять раз, десять раз или большее число раз. Например, в соответствии с определенными схемами введения доз, пациент может получать терапию в течение продолжительного периода времени, такого как, например, 6 месяцев, 1 год или дольше.

Введение терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, можно осуществлять любым подходящим путем, включая, но не ограничиваясь этим, следующие: парентеральный, внутривенный, пероральный, подкожный, внутриартериальный, внутричерепной, интратекальный, внутрибрюшинный, местный, интраназальный или внутримышечный. Фармацевтические композиции для введения предпочтительно являются стерильными и по существу изотоничными, и произведены согласно условиям правил производства и контроля качества лекарственных средств (GMP). Фармацевтические композиции могут быть представлены в единичной лекарственной форме (т. е. дозированной форме для единичного введения). Фармацевтические композиции могут быть составлены с использованием одного или более физиологически и фармацевтически приемлемых носителей, разбавителей, эксципиентов или вспомогательных веществ. Подходящий лекарственный состав зависит от выбранного пути введения. Термин «фармацевтически приемлемый» означает, что носитель, разбавитель, эксципиент или вспомогательное вещество совместимы с другими ингредиентами лекарственного состава и по существу не являются вредными для их реципиента.

В контексте данного документа термины «лечить» и «лечение», а также «предотвращать» и «предотвращение» относятся к обеспечению необходимого биологического ответа, такого как терапевтический и профилактический эффект, соответственно. В некоторых вариантах осуществления терапевтический эффект включает одно или более из снижения/уменьшения варикозного расширения вен, снижения/уменьшения тяжести варикозного расширения вен (например, уменьшения или ингибирования варикозного расширения вен), снижения/уменьшения симптомов и снижения связанных с варикозным расширением вен эффектов, отсрочки появления симптомов и связанных с варикозным расширением вен эффектов, уменьшения тяжести симптомов связанных с варикозным расширением вен эффектов, уменьшения тяжести эпизодов острого заболевания, уменьшения числа симптомов и связанных с варикозным расширением вен эффектов, уменьшения латентного периода симптомов и связанных с варикозным расширением вен эффектов, смягчения симптомов и связанных с варикозным расширением вен эффектов, уменьшения вторичных симптомов, уменьшения вторичных инфекций, предотвращения рецидива до варикозного расширения вен, снижения числа или частоты эпизодов рецидивов, увеличения латентного периода между симптоматическими эпизодами, увеличения времени до постоянного прогрессирования, ускорения выздоровления и/или увеличения эффективности или снижения резистентности к альтернативным терапевтическим средствам после введения агента или композиции, содержащей агент. Профилактический эффект может включать полное или частичное предотвращение/ингибирование или задержку развития/прогрессирования варикозного расширения вен (например, полные или частичные предотвращение/ингибирование или задержку) после применения терапевтического протокола. Лечение варикозного расширения вен включает в себя лечение пациентов, у которых уже диагностирована любая форма варикозного расширения вен на любой клинической стадии или проявлении, задержку начала или развития, или обострения, или ухудшения симптомов или признаков варикозного расширения вен, и/или предотвращение, и/или уменьшение тяжести варикозного расширения вен.

В настоящем изобретении также предложены, в любом из описанных в данном документе способов, обнаружение или определение наличия молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции и/или молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции в биологическом образце от субъекта-человека. Следует понимать, что генные последовательности в пределах популяции и молекулы мРНК, кодируемые такими генами, могут варьировать из-за полиморфизмов, таких как однонуклеотидные полиморфизмы. Предложенные в данном документе последовательности для описанных в данном документе вариантных молекул нуклеиновых кислот PIEZO1 являются исключительно примерами последовательностей. Также возможны другие последовательности вариантных молекул нуклеиновых кислот PIEZO1.

Биологический образец может быть получен из любой клетки, ткани или биологической жидкости субъекта. Образец может содержать любую клинически значимую ткань, например, образец костного мозга, биопсию опухоли, тонкоигольный аспират, или образец жидкости организма, такой как кровь, зубодесневая жидкость, плазма крови, сыворотка крови, лимфа, асцитическая жидкость, кистозная жидкость или моча. В некоторых случаях образец содержит ротовой мазок. Образец, используемый в описанных в данном документе способах, будет варьировать в зависимости от формата анализа, природы способа обнаружения и тканей, клеток или экстрактов, которые используются в качестве образца. Биологический образец может проходить разную обработку в зависимости от применяемого анализа. Например, при обнаружении вариантной молекулы нуклеиновой кислоты PIEZO1 можно применять предварительную обработку с целью выделения или обогащения образца в отношении геномной ДНК. В этих целях можно использовать множество известных способов. При обнаружении уровня любой вариантной мРНК PIEZO1 можно применять разные методики для обогащения биологического образца мРНК. Можно применять различные способы для обнаружения наличия или уровня молекулы мРНК или наличия конкретного локуса вариантной геномной ДНК.

В некоторых вариантах осуществления обнаружение молекулы нуклеиновой кислоты человеческого варианта PIEZO1 с прогнозируемой потерей функции у субъекта-человека включает анализ или генотипирование биологического образца, полученного от субъекта-человека, для определения, содержит ли молекула геномной нуклеиновой кислоты PIEZO1, молекула мРНК PIEZO1 или молекула кДНК PIEZO1, полученная из молекулы мРНК, в биологическом образце одну или более вариаций, которые вызывают потерю функции (частичную или полную), или, как прогнозируется, вызывают потерю функции (частичную или полную).

В некоторых вариантах осуществления способы обнаружения присутствия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как, например, молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК) у субъекта-человека включают: проведение анализа биологического образца, полученного от субъекта-человека, который позволяет определить, содержит ли молекула нуклеиновой кислоты в биологическом образце конкретную нуклеотидную последовательность.

В некоторых вариантах осуществления биологический образец включает клетку или клеточный лизат. Такие способы могут дополнительно включать, например, получение от субъекта биологического образца, содержащего молекулу геномной нуклеиновой кислоты PIEZO1 или молекулу мРНК, и, в случае мРНК, необязательное проведение обратной транскрипции мРНК в кДНК. Такие анализы могут включать, например, определение идентичности этих позиций конкретной молекулы нуклеиновой кислоты PIEZO1. В некоторых вариантах осуществления способ представляет собой способ in vitro.

В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает секвенирование по меньшей мере части нуклеотидной последовательности молекулы геномной нуклеиновой кислоты PIEZO1, молекулы мРНК PIEZO1 или молекулы кДНК PIEZO1, полученной из молекулы мРНК, в биологическом образце, при этом секвенированная часть содержит одну или более вариаций, которые вызывают потерю функции (частичную или полную) или, как прогнозируется, вызывают потерю функции (частичную или полную).

В любом из описанных в данном документе способов этап определения, этап обнаружения или анализ генотипирования включает секвенирование по меньшей мере части нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1 в биологическом образце, при этом секвенированная часть содержит позицию, соответствующую позиции варианта с прогнозируемой потерей функции, причем в случае обнаружения вариантного нуклеотида в позиции варианта с прогнозируемой потерей функции молекула нуклеиновой кислоты PIEZO1 в биологическом образце представляет собой молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает: a) приведение биологического образца в контакт с праймером, гибридизирующимся с частью нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1, которая находится вблизи позиции варианта с прогнозируемой потерей функции; b) удлинение праймера по меньшей мере через позицию варианта с прогнозируемой потерей функции; и c) определение, содержит ли продукт удлинения праймера вариантный нуклеотид в позиции варианта с прогнозируемой потерей функции.

В некоторых вариантах осуществления анализ включает секвенирование всей молекулы нуклеиновой кислоты. В некоторых вариантах осуществления анализируют только молекулу геномной нуклеиновой кислоты PIEZO1. В некоторых вариантах осуществления анализируют только мРНК PIEZO1. В некоторых вариантах осуществления анализируют только кДНК PIEZO1, полученную из мРНК PIEZO1.

В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает: а) амплификацию по меньшей мере части молекулы нуклеиновой кислоты PIEZO1, которая кодирует человеческий полипептид PIEZO1, при этом часть содержит позицию варианта с прогнозируемой потерей функции; b) мечение амплифицированной молекулы нуклеиновой кислоты обнаруживаемой меткой; c) приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей специфический в отношении изменения зонд, причем специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и d) обнаружение обнаруживаемой метки.

В некоторых вариантах осуществления молекула нуклеиновой кислоты представляет собой мРНК, а этап определения дополнительно включает обратную транскрипцию мРНК в кДНК перед этапом амплификации.

В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает: приведение молекулы нуклеиновой кислоты в биологическом образце в контакт со специфическим в отношении изменения зондом, содержащим обнаруживаемую метку, при этом специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и обнаружение обнаруживаемой метки.

Специфические в отношении изменения зонды или специфические в отношении изменения праймеры, описанные в данном документе, содержат последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется или специфически гибридизируется с молекулой нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции или ее комплементарной последовательностью. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 11, по меньшей мере около 12, по меньшей мере около 13, по меньшей мере около 14, по меньшей мере около 15, по меньшей мере около 16, по меньшей мере около 17, по меньшей мере около 18, по меньшей мере около 19, по меньшей мере около 20, по меньшей мере около 21, по меньшей мере около 22, по меньшей мере около 23, по меньшей мере около 24, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45 или по меньшей мере около 50 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры содержат или состоят из по меньшей мере 15 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры содержат или состоят из от по меньшей мере 15 нуклеотидов до по меньшей мере 35 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры гибридизируется с молекулами геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулами мРНК варианта PIEZO1 с прогнозируемой потерей функции и/или молекулами кДНК варианта PIEZO1 с прогнозируемой потерей функции в жестких условиях.

Для обнаружения мутаций, таких как ОНП, в последовательности нуклеиновой кислоты можно применять методики специфической в отношении изменения полимеразной цепной реакции. Можно применять специфические в отношении изменения праймеры, поскольку ДНК-полимераза не будет осуществлять удлинение при наличии несовпадения с матрицей.

В некоторых вариантах осуществления молекула нуклеиновой кислоты в образце представляет собой мРНК, и эту мРНК обратно транскрибируют в кДНК перед этапом амплификации. В некоторых вариантах осуществления молекула нуклеиновой кислоты присутствует в клетке, полученной от субъекта-человека.

В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.

В некоторых вариантах осуществления анализ может включать приведение биологического образца в контакт с праймером или зондом, таким как специфический в отношении изменения праймер или специфический в отношении изменения зонд, которые специфически гибридизируются с вариантной геномной последовательностью PIEZO1, вариантной последовательностью мРНК или вариантной последовательностью кДНК, но не с соответствующей референсной последовательностью PIEZO1 в жестких условиях, и определение, произошла ли гибридизация.

В некоторых вариантах осуществления анализ включает секвенирование РНК (РНК-секвенирование). В некоторых вариантах осуществления анализы также включают проведение обратной транскрипции мРНК в кДНК, например, с помощью полимеразной цепной реакции с обратной транскриптазой (ОТ-ПЦР).

В некоторых вариантах осуществления в способах используют зонды и праймеры достаточной нуклеотидной длины для связывания с целевой нуклеотидной последовательностью и, в частности, для обнаружения и/или идентификации полинуклеотида, содержащего молекулу вариантной геномной нуклеиновой кислоты PIEZO1, молекулу вариантной мРНК или молекулу вариантной кДНК. Условия гибридизации или условия реакции могут определяться проводящим эксперимент человеком для достижения данного результата. Нуклеотидная длина может быть любой длиной, достаточной для использования в выбранном способе обнаружения, включая любой анализ, описанный или приведенный в качестве примера в данном документе. Такие зонды и праймеры могут специфически гибридизоваться с целевой нуклеотидной последовательностью в условиях гибридизации высокой жесткости. Зонды и праймеры могут быть полностью идентичными последовательности смежных нуклеотидов в пределах целевой нуклеотидной последовательности, хотя с помощью традиционных способов можно конструировать зонды, отличающиеся от целевой нуклеотидной последовательности, но которые сохраняют способность специфическим образом выявлять и/или идентифицировать целевую нуклеотидную последовательность. Зонды и праймеры могут быть на около 80%, около 85%, около 90%, около 91%, около 92%, около 93%, около 94%, около 95%, около 96%, около 97%, около 98%, около 99% или на 100% идентичны или комплементарны нуклеотидной последовательности целевой молекулы нуклеиновой кислоты.

Иллюстративные примеры методик секвенирования нуклеиновых кислот включают, но не ограничиваются этим, секвенирование с терминатором синтеза цепи (по Сэнгеру) и секвенирование с терминатором красителя. Другие способы включают в себя способы гибридизации нуклеиновых кислот, отличные от секвенирования, включая применение меченных праймеров или зондов, направленных против очищенной ДНК, амплифицированной ДНК и фиксированных клеточных препаратов (флуоресцентная гибридизация in situ (FISH)). В некоторых способах целевую молекулу нуклеиновой кислоты можно амплифицировать до обнаружения или одновременно с ним. Иллюстративные примеры методик амплификации нуклеиновых кислот включают в себя, но не ограничиваются ими, полимеразную цепную реакцию (ПЦР), лигазную цепную реакцию (ЛЦР), амплификацию с замещением цепей (АЗЦ) и амплификацию на основании нуклеотидной последовательности (АОНП). Другие способы включают в себя, но не ограничиваются ими, лигазную цепную реакцию, амплификацию с замещением цепей и термофильную АЗЦ (тАЗЦ).

В методах гибридизации могут применяться жесткие условия так, чтобы зонд или праймер специфически гибридизировался со своей мишенью. В некоторых вариантах осуществления полинуклеотидный праймер или зонд в жестких условиях будут гибридизоваться со своей целевой последовательностью в выявляемо большей степени, чем с другими, нецелевыми, последовательностями, например, по меньшей мере в 2 раза, по меньшей мере в 3 раза, по меньшей мере в 4 раза или в большее число раз превышая фон, включая превышение фона больше чем в 10 раз. Жесткие условия зависят от последовательности и будут разными в разных обстоятельствах.

Соответствующие условия жесткости, которые стимулируют гибридизацию ДНК, например, 6X хлорид натрия/цитрат натрия (SSC) при около 45°C с последующей промывкой 2X SSC при 50°C, являются известными или же их можно найти в Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. Как правило, жесткие условия для гибридизации и обнаружения будут таковыми, при которых концентрация соли составляет меньше чем около 1,5 M ионов Na+, как правило, это концентрации ионов Na+ (или других солей) от около 0,01 до около 1,0 M при pH от 7,0 до 8,3, а температура составляет по меньшей мере около 30°C для коротких зондов (например, от 10 до 50 нуклеотидов) и по меньшей мере около 60°C для более длинных зондов (например, больше чем 50 нуклеотидов). Жесткие условия также можно обеспечить путем добавления дестабилизирующих агентов, таких как формамид. Необязательно, буферы для промывки могут содержать от 0,1% до 1% ДСН. Длительность гибридизации в общем случает составляет меньше чем около 24 часа, обычно - от около 4 часов до около 12 часов. Длительность времени промывки будет составлять по меньшей мере тот промежуток времени, который необходим для достижения равновесия.

В данном изобретении также предложены молекулярные комплексы, содержащие любую из молекул нуклеиновой кислоты PIEZO1 (молекул геномной нуклеиновой кислоты, молекул мРНК или молекул кДНК) или их комплементарных последовательностей, описанных в данном документе, и любой из специфических в отношении изменения праймеров или специфических в отношении изменения зондов, описанных в данном документе. В некоторых вариантах осуществления молекулы нуклеиновой кислоты PIEZO1 (молекулы геномной нуклеиновой кислоты, молекулы мРНК или молекулы кДНК) или их комплементарные последовательности в молекулярных комплексах являются одноцепочечными. В некоторых вариантах осуществления молекула нуклеиновой кислоты PIEZO1 представляет собой любую из молекул геномных нуклеиновых кислот, описанных в данном документе. В некоторых вариантах осуществления молекула нуклеиновой кислоты PIEZO1 представляет собой любую из молекул мРНК, описанных в данном документе. В некоторых вариантах осуществления молекула нуклеиновой кислоты PIEZO1 представляет собой любую из молекул кДНК, описанных в данном документе. В некоторых вариантах осуществления молекулярный комплекс содержит любую из молекул нуклеиновой кислоты PIEZO1 (молекул геномной нуклеиновой кислоты, молекул мРНК или молекул кДНК) или их комплементарных последовательностей, описанных в данном документе, и любой из специфических в отношении изменения праймеров, описанных в данном документе. В некоторых вариантах осуществления молекулярный комплекс содержит любую из молекул нуклеиновой кислоты PIEZO1 (молекул геномной нуклеиновой кислоты, молекул мРНК или молекул кДНК) или их комплементарных последовательностей, описанных в данном документе, и любой из специфических в отношении изменения зондов, описанных в данном документе. В некоторых вариантах осуществления молекулярный комплекс содержит нечеловеческую полимеразу.

В некоторых вариантах осуществления обнаружение наличия человеческого полипептида PIEZO1 с прогнозируемой потерей функции включает проведение анализа образца, полученного от субъекта-человека, для определения, содержит ли полипептид PIEZO1 у субъекта одну или более вариаций, которые вызывают потерю функции (частичную или полную) или прогнозируемую потерю функции (частичную или полную) полипептида. В некоторых вариантах осуществления анализ включает секвенирование по меньшей мере части полипептида PIEZO1, которая содержит вариантную позицию. В некоторых вариантах осуществления этап обнаружения включает секвенирование всего полипептида. Идентификация вариантной аминокислоты в вариантной позиции полипептида PIEZO1 указывает на то, что полипептид PIEZO1 представляет собой полипептид PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления анализ включает иммуноанализ для обнаружения наличия полипептида, который содержит вариант. Обнаружение вариантной аминокислоты в вариантной позиции полипептида PIEZO1 указывает на то, что полипептид PIEZO1 представляет собой полипептид PIEZO1 с прогнозируемой потерей функции.

Зонды и/или праймеры (включая специфические в отношении изменения зонды и специфические в отношении изменения праймеры), описанные в данном документе, содержат или состоят из от около 15 до около 100, от около 15 до около 35 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды и специфические в отношении изменения праймеры содержат ДНК. В некоторых вариантах осуществления специфические в отношении изменения зонды и специфические в отношении изменения праймеры содержат РНК. В некоторых вариантах осуществления зонды и праймеры, описанные в данном документе (включая специфические в отношении изменения зонды и специфические в отношении изменения праймеры), имеют нуклеотидную последовательность, которая специфически гибридизируется с любой из молекул нуклеиновых кислот, описанных в данном документе, или их комплементарной последовательностью. В некоторых вариантах осуществления зонды и праймеры (включая специфические в отношении изменения зонды и специфические в отношении изменения праймеры) специфически гибридизируются с любой из молекул нуклеиновых кислот, описанных в данном документе, в жестких условиях. В контексте данного описания выражение «специфически гибридизируется» означает, что зонд или праймер (включает специфические в отношении изменения зонды и специфические в отношении изменения праймеры) не гибридизируется с последовательностью нуклеиновой кислоты, кодирующей молекулу референсной геномной нуклеиновой кислоты PIEZO1, молекулу референсной мРНК PIEZO1 и/или молекулу референсной кДНК PIEZO1. В некоторых вариантах осуществления зонды (такие как, например, специфический в отношении изменения зонд) содержат метку. В некоторых вариантах осуществления метка представляет собой флуоресцентную метку, радиоизотопную метку или биотин.

Нуклеотидная последовательность молекулы референсной геномной нуклеиновой кислоты PIEZO1 приведена в SEQ ID NO:1, длина которой составляет 69883 нуклеотидов. Первый нуклеотид, приведенный в SEQ ID NO:1, соответствует нуклеотиду в позиции 88715338 хромосомы 16 (см. hg38_knownGene_ENST00000301015.14).

Существуют многочисленные вариантные молекулы геномной нуклеиновой кислоты PIEZO1, включая, но не ограничиваясь этим (по референсной версии генома человека GRch38): 16:88715629:G:A, 16:88715728:G:T, 16:88715767:G:A, 16:88715802:C:A, 16:88715822:D:4, 16:88715987:I:1, 16:88716359:A:G, 16:88716570:C:T, 16:88716874:G:A, 16:88717213:T:A, 16:88719588:G:A, 16:88719722:C:G, 16:88719870:G:T, 16:88720068:D:2, 16:88720229:C:A, 16:88720248:D:4, 16:88720394:C:T, 16:88720644:D:1, 16:88720698:D:1, 16:88720698:I:1, 16:88721165:C:A, 16:88721268:D:1, 16:88721307:G:A, 16:88721586:G:C, 16:88721652:G:C, 16:88722217:C:T, 16:88722605:I:1, 16:88723005:I:7, 16:88723253:G:A, 16:88723311:C:T, 16:88725081:C:A, 16:88726282:G:A, 16:88726546:C:T, 16:88726619:G:A, 16:88726924:G:A, 16:88727038:C:T, 16:88727072:D:1, 16:88727163:G:A, 16:88731768:D:1, 16:88732334:C:G, 16:88732411:D:1, 16:88732720:D:1, 16:88733326:G:C, 16:88733337:D:4, 16:88733587:C:A, 16:88733965:D:1, 16:88734017:C:A, 16:88734042:I:1, 16:88734679:C:T, 16:88734909:I:1, 16:88736167:D:2, 16:88736324:G:A, 16:88736391:G:T, 16:88736409:C:T, 16:88736671:G:A, 16:88737557:A:C, 16:88737727:C:G, 16:88737815:C:T, 16:88738283:G:C, 16:88738637:G:A, 16:88738735:D:1, 16:88741477:C:T, 16:88742306:D:1, 16:88749399:G:A и 16:88784929:C:T. Так, например, если использовать в качестве основы референсную геномную нуклеотидную последовательность SEQ ID NO:1 (в которой первый нуклеотид обозначен как позиция 88715338), первый из перечисленных вариантов (16:88715629:G:A) будет иметь замену гуанина на аденин (обозначенный как «нуклеотид варианта») в позиции 88715629 (обозначенном как «позиция варианта»). Те варианты, в обозначении которых за числом следует «D», имеют делецию указанного числа нуклеотидов. Те варианты, в обозначении которых за числом следует «I», имеют вставку указанного числа нуклеотидов (любого нуклеотида). Любые из этих молекул геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.

Нуклеотидная последовательность референсной молекулы мРНК PIEZO1 указана в SEQ ID NO:2 (см. референсную последовательность NCBI: NM_001142864.4), длина которой составляет 8089 нуклеотидов. Вариантные нуклеотиды в их соответствующих вариантных позициях для вариантных молекул геномной нуклеиновой кислоты, описанных в данном документе, также имеют соответствующие вариантные нуклеотиды в своих соответствующих вариантных позициях для вариантных молекул мРНК на основании референсной последовательности мРНК PIEZO1 в соответствии с SEQ ID NO:2. Любые из этих молекул мРНК варианта PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.

Нуклеотидная последовательность референсной молекулы кДНК PIEZO1 указана в SEQ ID NO:3 (на основе референсной последовательности NCBI: NM_001142864.4), длина которой составляет 8089 нуклеотидов. Вариантные нуклеотиды в их соответствующих вариантных позициях для вариантных молекул геномной нуклеиновой кислоты, описанных в данном документе, также имеют соответствующие вариантные нуклеотиды в своих соответствующих вариантных позициях для вариантных молекул кДНК на основании референсной последовательности кДНК PIEZO1 в соответствии с SEQ ID NO:3. Любые из этих молекул кДНК варианта PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.

Аминокислотная последовательность референсного полипептида PIEZO1 приведена в SEQ ID NO:4 (см. номер доступа UniProt № Q92508.4 и номер доступа NCBI RefSeq NM_001142864.4), длина которой составляет 2 521 аминокислот. Используя транслированную нуклеотидную последовательность любой из молекул мРНК или кДНК PIEZO1, вариантные полипептиды PIEZO1, имеющие соответствующие транслированные вариантные аминокислоты в вариантных позициях (кодоны). Любые из этих вариантных полипептидов PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.

Нуклеотидные и аминокислотные последовательности, перечисленные в приложенном перечне последовательностей, приведены с помощью стандартных буквенных обозначений для нуклеотидных оснований и трехбуквенного кода для аминокислот. Нуклеотидные последовательности соответствуют стандартной системе, начинаясь с 5’ конца указанной последовательности, продолжаясь вперед (т. е. слева направо в каждой строке) до 3’ конца. Приведена только одна цепь каждой нуклеотидной последовательности, но подразумевается, что комплементарная цепь включена в любую ссылку на приведенную цепь. Аминокислотные последовательности соответствуют стандартной системе, начинаясь с амино-конца последовательности и продолжаясь вперед (т. е. слева направо в каждой строке) до карбокси-конца.

В данном документе выражение «соответствующий» или его грамматические вариации, при употреблении в контексте нумерации конкретных нуклеотида, или нуклеотидной последовательности, или позиции, относится к нумерации определенной референсной последовательности, когда конкретный нуклеотид или нуклеотидную последовательность сравнивают с референсной последовательностью. Другими словами, номер остатка (такого как, например, нуклеотид или аминокислота) или позицию остатка (такого как, например, нуклеотид или аминокислота) конкретного полимера обозначают относительно референсной последовательности, а не по фактическому номеру позиции остатка в конкретном нуклеотиде или нуклеотидной последовательности. Например, конкретная нуклеотидная последовательность может быть выровнена относительно референсной последовательности посредством внесения гэпов для оптимизации совпадения остатков между двумя последовательностями. В этих случаях, несмотря на наличие гэпов, нумерацию остатка в конкретном нуклеотиде или нуклеотидной последовательности проводят относительно референсной последовательности, с которой она была выровнена. Существует ряд компьютерных алгоритмов, которые можно использовать для проведения выравнивания последовательностей для идентификации нуклеотидной или аминокислотной позиции в одной полимерной молекуле, которая соответствует нуклеотидной или аминокислотной позиции в другой полимерной молекуле. Например, используя алгоритм NCBI BLAST (Altschul et al., Nucleic Acids Res., 1997, 25, 3389-3402) или программное обеспечение CLUSTALW (Sievers and Higgins, Methods Mol. Biol., 2014, 1079, 105-116) можно проводить выравнивание последовательностей. При этом последовательности также можно выравнивать вручную.

Все патентные документы, веб-сайты, другие публикации, номера доступа и т. п., цитируемые выше или ниже, в полном объеме и во всех отношениях включены посредством ссылки в той же степени, как если бы для каждого отдельного элемента было специально и отдельно указано его включение посредством ссылки. Если с номером доступа в разное время связаны разные версии последовательности, подразумевается версия, связанная с номером доступа на момент действительной даты подачи данной заявки. Действительная дата подачи означает более раннюю фактическую дату подачи или дату подачи приоритетной заявки, ссылающейся на номер доступа, если это применимо. Аналогично, если разные версии публикации, веб-сайта и т. п. опубликованы в разное время, подразумевается версия, опубликованная ближе всего к действительной дате подачи заявки, если не указано иное. Любой признак, стадия, элемент, вариант осуществления или аспект данного изобретения можно использовать в комбинации в любым другим признаком, стадией, элементом, вариантом осуществления или аспектом, если явно не указано иное. Несмотря на то, что данное изобретение было достаточно подробно описано с помощью иллюстрации и примера в целях ясности и понимания, является очевидным, что определенные изменения и модификации могут быть реализованы в рамках объема прилагаемой формулы изобретения.

Следующие примеры приведены для более подробного описания вариантов реализации. Они предназначены для иллюстрации, но не ограничения заявляемых вариантов осуществления. Следующие примеры приведены для того, чтобы предоставить рядовым специалистам в данной области техники раскрытие и описание создания и оценки соединений, композиций, изделий, устройств и/или способов, описанных в данном документе, и предназначены исключительно для иллюстрации, но не для ограничения объема любых пунктов прилагаемой формулы изобретения. Были предприняты усилия, чтобы обеспечить точность в отношении используемых чисел (например, количества, температуры и т. д.), но должны учитываться некоторые экспериментальные ошибки и отклонения. Если не указано иное, доли представляют собой массовые доли, температура выражена в °C или равна температуре окружающей среды, а давление находится на уровне атмосферного или около него.

Примеры

Пример 1. Материалы и способы

Получение и секвенирование образцов WES

Образцы геномной ДНК, нормализованные приблизительно до 16 нг/мл, переносили в лаборатории из UK Biobank (Биобанк Соединенного Королевства) в 0,5 мл стандартных калибровочных пробирках 2D (Thermo Fisher Scientific) и хранили в автоматизированном биобанке образцов (LiCONiC Instruments) при -80 °C перед приготовлением образцов. Один образец содержал недостаточно ДНК для секвенирования. Захват экзома проводили, используя высокоэффективный полностью автоматизированный подход, разработанный в лаборатории. Вкратце, создавали библиотеки ДНК путем ферментативной фрагментации 100 нг геномной ДНК до среднего размера фрагментов в 200 пар оснований, используя специальный набор для получения библиотек ДНК NEBNext Ultra II FS (New England Biolabs), и во все библиотеки ДНК лигировали обычный Y-образный адаптер (Integrated DNA Technologies). Во время амплификации библиотеки полимеразой KAPA HiFi (KAPA Biosystems) к фрагменту ДНК добавляли уникальные, асимметричные баркоды из 10 пар оснований, чтобы облегчить мультиплексные захват и секвенирование экзома. Одинаковые количества образца объединяли перед захватом экзома в течение ночи, приблизительно 16 часов, с помощью немного модифицированной версии библиотеки зондов IDT’s xGen; добавляли дополнительные зонды для захвата областей генома, хорошо охваченных предыдущим реагентом для захвата (NimbleGen VCRome), но плохо охваченных стандартными зондами xGen. В целевые области вошло всего n=38997831 оснований. Захваченные фрагменты связывали с покрытыми стрептавидином гранулами DYNABEADS® (Thermo Fisher Scientific) и удаляли неспецифические фрагменты ДНК с помощью серии промывок в жестких условиях с использованием набора для гибридизации и промывки xGen в соответствии с рекомендованным производителем протоколом (Integrated DNA Technologies). Проводили ПЦР-амплификацию захваченной ДНК с помощью KAPA HiFi и количественно оценивали методом кПЦР с помощью набора для количественной оценки библиотек KAPA (KAPA Biosystems). Мультиплексированные образцы объединяли, а затем секвенировали, используя считывания со спаренными концами из 75 пар оснований с двумя индексными считываниями из 10 пар оснований на платформе Illumina NOVASEQ® 6000, используя проточные ячейки S2.

Выравнивание последовательностей, идентификация вариантов и присвоение генотипа

После завершения секвенирования исходные данные каждого подхода Illumina NOVASEQ® собирали в локальном буферном хранилище и загружали в платформу DNAnexus для автоматического анализа. После завершения загрузки начинался анализ с преобразованием файлов CBCL в FASTQ-форматированные считывания с присвоением, посредством специальных баркодов, образцам с использованием программного обеспечения для преобразования bcl2fastq (Illumina Inc., San Diego, CA). Затем соответствующие образцам файлы FASTQ, представляющие все считывания, созданные для этого образца, выравнивались с референсным геномом GRCh38 с помощью BWA-mem. Полученный в результате бинарный файл выравнивания (BAM) для каждого образца содержал картированные геномные координаты считывания, информацию по качеству и степени, в которой конкретное считывание отличалось от референса в его картированной локации. Затем оценивали выровненные считывания в файле BAM, чтобы идентифицировать и пометить дублирующие считывания, с помощью инструмента Picard MarkDuplicates (сеть Интернет, «picard.sourceforge.net») с получением файла выравнивания (duplicatesMarked.BAM) со всеми потенциальными дублирующими считываниями, помеченными для исключения в последующем анализе.

Затем для каждого индивидуального образца получали файлы GVCF, включающие определение вариантов, используя инструмент для определения вариантов WeCall (сеть Интернет, «github.com/Genomicsplc/wecall») от Genomics PLC, с идентификацией как ОНВ, так и ИНДЕЛов по сравнению с референсом. Дополнительно каждый файл GVCF содержал информацию по зиготности каждого варианта, числу считываний как референсной, так и альтернативной аллелей, качеству генотипа, представляющему достоверность определения генотипа, и общему качеству определения вариантов в этой позиции.

После завершения поиска вариантов файлы BAM для индивидуальных образцов преобразовывали в полностью не допускающие потерь файлы CRAM, используя samtools. Метрическую статистику получали для каждого образца, чтобы оценить захват, выравнивание, размер вставки и качество определения вариантов, используя Picard (сеть Интернет, «picard.sourceforge.net»), bcftools (сеть Интернет, «samtools.github.io/Bcftools») и FastQC («bioinformatics.babraham.ac.uk/projects/fastqc»).

После завершения секвенирования образцов исключали образцы, демонстрирующие расхождение между генетически определенным и заявленным полом (n=15), высокий уровень гетерозиготности/загрязнения (D-стат. > 0,4) (n=7), низкий охват последовательности (менее 85% целевых оснований достигает охвата 20X) (n=1) или генетически идентифицированные дубликаты образцов (n=14), а также варианты WES, противоречащие чипу генотипирования (n=9). Шесть образцов не прошли контроль качества в нескольких категориях, что привело к исключению 38 индивидов. Оставшиеся 49960 затем использовали для компиляции VCF на уровне проекта (PVCF) для последующего анализа. PVCF создавали, используя инструмент для совместного генотипирования GLnexus. Заботились о том, чтобы перенести все гомозиготные референсные, гетерозиготные, гомозиготные альтернативные и неопределенные генотипы в VCF на уровне проекта. Также создавали дополнительный отфильтрованный PVCF «Goldilocks». В отфильтрованном PVCF Goldilocks образцы, несущие определенные варианты с ОНП в процессе, включающем один образец, или DP < 7 преобразовывали в «неопределенные». После применения фильтра DP исключали сайты, в которых все оставшиеся образцы были определены как гетерозиготные, и все образцы имели AB < 85%реф./15%альт. Образцы, несущие определенные варианты с ИНДЕЛом в процессе, включающем один образец, с DP < 10 преобразовывали в «неопределенные». После применения фильтра DP исключали сайты, в которых все оставшиеся образцы были определены как гетерозиготные, и все образцы имели AB < 80%реф./20%альт. Сайты многоаллельных вариантов в файле PVCF нормализовали путем левого выравнивания и представляли как биаллельные.

Определение фенотипа

Для случаев на основе ICD10 необходимо одно или более из следующего: первичный диагноз или вторичный диагноз в записях по статистике эпизодов, связанных с состоянием здоровья (HES, от англ. «Health Episode Statistics»), стационарных пациентов. Исключение на основе ICD10 предусматривало ≥ 1 первичных или вторичных диагнозов в диапазоне кодов. Контрольных индивидов на основе ICD10 определяли как тех, которые не соответствовали случаям или исключениям. Индивидуальные определения фенотипа включали одно или более из следующего: диагноз ICD-10, самостоятельное сообщение о болезни по результатам устного интервью и диагностированная врачом болезнь по результатам онлайн-наблюдения, информация с сенсорного экрана. Количественные результаты (такие как физикальные измерения, анализ крови, тестирование когнитивных функций и полученные по визуализации фенотипы) загружали из хранилища UK Biobank (UKB) и охватывали один или более визитов. Всего в анализе ассоциаций WES исследовали 1073 бинарных признаков с числом случаев ≥ 50 и числом количественных признаков 669.

Аннотация вариантов с прогнозируемой потерей функции (ПП)

Варианты аннотировали, используя snpEff и генные модели из Ensembl Release 85. Получали исчерпывающий и высококачественный набор транскриптов для кодирующих белок областей, которые включали все кодирующие белок транскрипты с аннотированными стартовым и стоп-кодонами из генных моделей Ensembl. Варианты, аннотированные как стоп_прибавление, старт_потеря, сплайс_донор, сплайс_акцептор, стоп_потеря и сдвиг рамки считали вариантами с ПП.

Недавнее крупномасштабное исследование генетических вариаций у 141456 индивидов позволило получить каталог вариантов с ПП. Прямое сравнение с этими данными является затруднительным вследствие многочисленных факторов, таких как разница в платформах секвенирования экзома, алгоритмах определения вариантов и аннотациях. Кроме того, число индивидов и географическое распределение определения (и, следовательно, генетическое разнообразие) в подгруппе NFE из gnomAD может быть больше, чем для UK Biobank с WES в этой работе. Несмотря на это, сайты экзома gnomAD, помеченные как «PASS», из gnomAD r2.1 были аннотированы с помощью процесса аннотации. Данные из gnomAD переносили в HG38, используя Picard LiftoverVcf. Данные представляли подгруппу индивидов-европейцев не финского происхождения (NFE, от англ «Non-Finnish Europeans») (n=56885 образцов), ограниченную вариантами с ЧМАNFE < 1%, и позволили получить 261309 ПП в любом транскрипте в 17951 гене. С учетом ограничения ПП только теми, которые присутствуют во всех транскриптах, было обнаружено 175162 ПП в 16462 генах. 134745 ПП было обнаружено во всех транскриптах генов у участников UKB с WES европейского происхождения.

Методы анализа ассоциаций нагрузки ПП

Тесты нагрузки ассоциаций проводили для редких ПП среди 49960 индивидов европейского происхождения. Для каждой генной области по определению Ensembl. ПП с ЧМА ≤ 0,01 сжимали так, чтобы любой индивид, который является гетерозиготным в отношении по меньшей мере одной ПП в этой генной области, считался гетерозиготным, и только индивиды, которые несут две копии той же ПП, считались гомозиготными. Редкие варианты не были фазированы и поэтому сложные гетерозиготы в этом анализе не учитывали.

Для каждой генной области оценивали 668 ранжированных обратных нормальных трансформированных (RINT) количественных показателей (включая всех субъектов и стратифицированные по полу модели) с ≥ 5 индивидами с не отсутствующей информацией по фенотипу, используя аддитивную смешанную модель, реализованную в BOLT-LMM v2. Перед нормализацией сначала должным образом трансформировали признаки (log10, квадрат) и корректировали в отношении стандартного набора ковариат, включая возраст, пол, место исследования, первые четыре основных признака происхождения и, в некоторых случаях, ИМТ и/или статус курения. Данные, превышающие пять медианных абсолютных отклонений от медианы, исключали как выбросы перед нормализацией. 1073 дискретных результатов (включая всех субъектов и стратифицированные по полу модели) с ≥ 50 случаями оценивали с корректировкой на ковариат в отношении возраста, пола и четырех основных компонентов происхождения, используя генерализованную смешанную модель, реализованную в SAIGE. В случае каждого количественного и дискретного признака, включенного в анализ, оценивали только генные области, для которых было > 3 носителей ПП с не отсутствующим фенотипом и информацией по ковариатам.

Положительные контроли определяли системно, используя двухэтапный подход. Сначала аннотировали каждый ген в отношении релевантного заболевания, признака, биологических или функциональных данных, используя общедоступные ресурсы, включая OMIM, NCBI MedGen и каталог NHGRI-EBI GWAS. Гены с подтверждающими данными из по меньшей мере одного источника затем отбирали вручную, используя NCBI PubMed, чтобы подтвердить взаимосвязь между признаком и вариантами ПП в представляющем интерес гене. Гены с подтверждением на уровне локуса в отношении представляющего интерес признака или родственные фенотипы в каталоге GWAS, но для которых отсутствовали подтверждающие данные в отношении ассоциации ПП, представлены в данном документе как новые ассоциации ПП.

Методы для одновариантного анализа ассоциаций ПП

Одновариантный анализ ассоциаций проводили, используя те же методы, которые описаны в разделе для анализа ассоциаций нагрузки. Для ассоциаций ген - признак с p < 10-7 рассчитывали статистику одновариантных ассоциаций с представляющим интерес фенотипом для всех ПП, включенных в тест по нагрузке, для которых число минорных аллелей составляло ≥ 5 у 49960 индивидов европейского происхождения с WES. Статистика по ассоциациям для этих вариантов приведена в расширенных данных (ExtData_SingleVariantLOFs_V1.xlsx).

P-значение в методе исключения по одному (LOO, от англ. «Leave-One-Out») для нагрузки - p-значение в тесте на отсутствие/присутствие с исключением тестируемого варианта. Дельта P-значение для нагрузки - это отношение p-значения в анализе с исключением по одному по сравнению с тестом на нагрузку с использованием всех 65 вариантов. Сводные данные по нагрузке с использованием всех 65 вариантов у неродственных индивидов: B=1,44, SE=0,26, p-значение=3,12E-08, cMAF=0,00174, cMAC=152, cMAF_cases=0,0066, cMAC_cases=17, cMAF_controls=0,0016, cMAC_cases=135. Пошаговая логистическая регрессия позволила выделить 11/65 вариантов (AIC 11451). Сводные данные по нагрузке с использованием всех 11 вариантов: B=3,71, SE=0,437, p-значение < 2e-16, cMAF=0,0003, cMAC=22, cMAF_cases=0,005, cMAC_cases=12, cMAF_controls=0,0001, cMAC_controls=10. Когда анализ ограничен вариантами с MAC > 1, пошаговая логистическая регрессия позволяет выделить 5/13 вариантов (AIC 11484). Сводные данные по нагрузке с использованием всех 5 вариантов: B=3,02, SE=0,53, p-значение=8,92e-09.

LD (r2) по 11 вариантам пПП, выделенным с помощью пошаговой регрессии для варианта PIEZO1 и положительному контролю (16:88835545_G_A; выделено зеленым цветом), данные по которому можно найти в литературе для варианта PIEZO1. Ни один из этих 12 вариантов не находится в LD, R2 > 0,01. Когда тест на нагрузку корректируют в отношении известного из литературы варианта rs2911463 (16:88835545_G_A), p-значение теста на нагрузку остается < 2E-16 (AIC 11,444), что указывает на то, что нагрузка не определяет известный вариант.

Пример 2. Демографические и клинические характеристики подвергнутых секвенированию участников

Всего было отобрано 50 000 участников, причем приоритет отдавался индивидам с полными фенотипическими данными: тем, которые имели данные по МРТ-визуализации всего тела из исследования по визуализации UK Biobank, дополнительные измерения на исходном уровне, статистику эпизодов в больницах (HES, от англ. «hospital episode statistics») и/или связанные записи о первичной помощи (которые вскоре будут доступны лицензированным исследователям). Во время получения данных были исключены образцы от 40 участников вследствие непрохождения измерений контроля качества или отзыва согласия участником, что в результате привело к конечной группе из 49 960 участников. В целом секвенированный образец является репрезентативным по 500 000 участникам UKB (таблица 1). Заметная разница в возрасте, поле или происхождении между секвенированным образцом и общей исследуемой популяцией отсутствовала. Подвергнутые секвенированию участники с большей вероятностью имели коды диагноза HES (84,2% среди секвенированных по сравнению с 77,3% в целом) и дополнительные измерения (таблица 1).

Таблица 1: Клинические характеристики участников полноэкзомного секвенирования и всех участников UK Biobank

Основные демографические и клинические характеристики Участники UKB 50k WES Участники UKB 500k Н 49 960 502 543 Женщины, n(%) 27 243 (54) 273 460 (54) Возраст на момент оценки, лет 58 (45-71) 58 (45-71) Индекс массы тела, кг/м2 26 (21-31) 26 (21-31) Число участников с результатами визуализации 12 075b 21 407a Число курящих на данный момент/в прошлом, n (%) 17 515 (35) 216 482 (43) Индекс депривации Таунсенда -2,0 (-6,1, -2,1) -2,13 (-6,2, -1,97) Коды ICD10 для стационарных пациентов (на пациента) 5 5 Пациенты с >= 1 диагнозами ICD10 (%) 84,2 78,0 Установление генетического происхожденияc Африканское (%) 1,49 1,24 Восточно-азиатское (%) 0,54 0,51 Европейское (%) 93,66 94,55 Кардиометаболические фенотипы Ишемическая болезнь сердца, n (%) 3,3340 (6,6) 35 879 (7,1) Сердечная недостаточность, n (%) 300 (0,6) 4 399 (0,8) Диабет 2 типа, n (%) 1 541 (3,0) 17 261 (3,4) Респираторные и иммунологические фенотипы Астма, n (%) 8 250 (16) 68 149 (13) ХОБЛ, n (%) 741 (1,4) 7 438 (1,4) Ревматоидный артрит, n (%) 710 (1,4) 7 337 (1,4) Воспалительное заболевание кишечника, n (%) 543 (1,0) 5 783 (1,1) Нейродегенеративные фенотипы Болезнь Альцгеймера, n (%) 13 (0,05) 320 (0,06) Болезнь Паркинсона, n (%) 65 (0,13) 1 043 (0,2) Рассеянный склероз, n (%) 126 (0,25) 1 352 (0,26) Миастения гравис, n (%) 14 (0,02) 217 (0,04) Онкологические фенотипы Рак молочной железы, n (%) 1 667 (3,3) 16 887 (3,3) Рак яичника, n (%) 162 (0,3) 1 777 (0,3) Рак поджелудочной железы, n (%) 602 (1,2) 4 611 (0,9) Рак предстательной железы, n (%) 848 (1,6) 8 855 (1,7) Меланома, n (%) 598 (1,1) 5 715 (1,1) Дополнительные измерения Доступны результаты проверки остроты слуха, n (%) 40 546 (81,1) 167 011 (33,2) Частота пульса, n (%) 40 548 (34,2) 170 761 (33,9) Измеренная острота зрения, n (%) 39 461 (78,9) 117 092 (23,2) Измеренное ВГД (левый глаз), n (%) 37 940 (75,9) 111 942 (22,2) Ауторефракция, n (%) 36 067 (72,1) 105 989 (21,0) ОКТ сетчатки, n (%) 32 748 (65,5) 67 708 (13,4) ЭКГ в состоянии покоя, n (%) 10 829 (27,1) 13 572 (2,1) Когнитивная функция, n (%) 9 511 (19,0) 96 362 (19,1) Здоровье пищеварительной системы, n (%) 13 553 (28,1) 142 310 (28,3) Измерение физической активности, n (%) 10 684 (21,3) 101 117 (20,1)

a Число образцов с по меньшей мере одним не отсутствующим значением фенотипа, полученным по изображению, из данных, загруженных из UK Biobank в ноябре 2018 года.

b Число образцов с данными секвенирования экзома и по меньшей мере одним не отсутствующим значением фенотипа, полученным по изображению, из данных, загруженных из UK Biobank в ноябре 2018 года.

c Число образцов в 3-х предопределенных областях графика первых двух оценок генетических основных компонентов, где области выбраны так, чтобы представлять африканское, восточно-азиатское и европейское происхождение (см. Фиг. 3).

Участники с WES с по меньшей мере одним кодом диагноза HES не отличались от несеквенированных участников по медианному числу первичных и вторичных кодов ICD10 или широкому распределению фенотипов, отличных от кодов для астмы (ICD10 J45) и астматического статуса (ICD10 J46), как наиболее представленных в секвенированных образцах, и сенильной катаракты (ICD10 H25) и неизвестных и неуточненных причин заболеваемости (ICD10 R69), как наименее представленных. Секвенированная подгруппа включает 194 пар родитель - ребенок, 613 пар родных братьев и сестер, 1 пару монозиготных близнецов и 195 родственных связей второй степени. Распределение родства между парами индивидов в UKB WES включено в Фиг. 1.

Пример 3. Обобщенные данные и характеристики кодирующей вариации из WES

Целью были кодирующие белок области и сайты сплайсинга экзон - интрон 19 467 генов. Число аутосомальных вариантов, наблюдаемое среди всех индивидов по типу/функциональному классу для всех и для частоты ЧМА < 1%. Все варианты прошли критерии КК, индивидуальные и вариантные пропуски < 10%, и p-значение Харди - Вайнберга > 10-15. Медианное число вариантов и межквартильный размах (МКР) для всех вариантов и для ЧМА < 1%. Средняя доля целевых оснований (n=38997831) с достижением по меньшей мере 20x охвата в каждом образце составляла 94,6% (стандартное отклонение 2,1%). После контроля качества наблюдали 10 028 025 однонуклеотидных вариантов и вариантов с инделами, 98,5% с частотой минорной аллели (ЧМА) < 1% (таблица 2). Из всего количества вариантов 3 995 785 находятся в целевых областях. Эти варианты включали 2 431 680 несинонимичных (98,9% с ЧМА < 1%), 1 200 882 синонимичных (97,8% с ЧМА < 1%) и 205 867 вариантов с прогнозируемой потерей функции (пПП), присутствующих в по меньшей мере одном кодирующем транскрипте (потеря кодона инициации, преждевременные стоп-кодоны, сплайсинг и варианты с инделами и сдвигом рамки; 99,7% с ЧМА < 1%) (Фиг. 2). Число 9 403 синонимичных (МКР 125), 8 369 несинонимичных (МКР 132) и 161 пПП вариантов (МКР 14) на индивида (медианные значения) сравнимо с предыдущими исследованиями секвенирования экзома. Если анализ ограничен вариантами пПП, которые присутствуют во всех транскриптах для гена, число вариантов пПП падает в целом до 140 850 и 96 на индивида (снижение около 31,6% и около 40,4%, соответственно), что согласуется с предыдущими исследованиями.

Таблица 2: Обобщенная статистика для вариантов в секвенированных экзомах участников 49 960 UKB

WES в n=49 960 аутосомах Медианное значение на участника (МКР) Число вариантов Число вариантов ЧМА < 1% Число вариантов Число вариантов ЧМА < 1% Всего 10 028 025 9 882 400 49 000 (628) 1 626 (133) Целевые области 3 995 785 3 941 162 18 670 (235) 640 (56) Тип варианта ОНВ 3 823 276 3 770 454 18 404 (233) 613 (54) Инделы 142 603 141 439 266 (16) 21 (25) Многоаллельный 466 433 459 434 2 304 (50) 84 (15) Функциональное прогнозирование Синонимичный 1 200 882 1 175 279 9 403 (125) 222 (26) Миссенс 2 431 680 2 406 367 8 369 (132) 367 (38) пПП (любой транскрипт) 205 867 205 215 161 (14) 20 (7) пПП (все транскрипты) 140 850 140 445 96 (10) 14 (6)

Пример 4. Фенотипические ассоциации с вариацией ПП

Комбинация WES и обширной информации по состоянию здоровья позволяет провести широкое исследование фенотипических последствий человеческой генетической вариации. Вариация ПП может обеспечить возможность понять функцию гена; однако в расчетных наборах данных отсутствует большинство таких вариаций. WES хорошо подходит для идентификации вариантов ПП и для оценки их фенотипических ассоциаций. Тесты ассоциаций генной нагрузки для редких (ЧАА < 1%) вариантов пПП (вариантов пПП, идентифицированных в WES среди всех генов с > 3 носителями варианта пПП) проводили с 1 741 признаком (1 073 дискретных признаков с по меньшей мере 50 случаями, определенными по статистике эпизодов в больницах и самостоятельно сообщенным данным, 668 количественных, антропометрических и кровных признаков) у n=46 979 индивидов преимущественно европейского происхождения. Для каждой ассоциации ген - признак силу ассоциации для теста генной нагрузки пПП также сравнивали с результатами ассоциаций для каждого ОНВ, включенного в тест нагрузки.

Пример 5. Ассоциации ПП и открытие новых генов

В анализе ассоциаций для генной нагрузки пПП была выявлена новая связь между ПП варианта PIEZO1 (совокупная частота аллелей=0,2%) и значительно повышенным риском варикозного расширения вен. Результаты для варианта PIEZO1 для бинарного фенотипа бессимптомного варикозного расширения вен нижних конечностей, расположенного в экзоме UKB 50k и экзоме UKB 150k, представлены в таблице 3.

Таблица 3: Ассоциации генной нагрузки PIEZO1 ПП

Экзом Число импульсов
RR|RA|AA
OR
(95% ДИ)
Нагрузка P Число ОНВ Наименьшее P ОНВ
UKB 50k Ктрл: 43285|142|0
Случаи: 1267|20|0
4,9 (3,1, 7,8) 2,7×10-8 65 2.29E-3
UKB 150k Ктрл: 131514|443|0
Случаи: 3559|36|0
3,0 (2,1, 4,4) 1,8×10-8

Этот результат обусловлен наличием редких вариантов ПП, причем наиболее значимая одновариантная ассоциация ПП PIEZO1, расположенного в экзоме UKB 50k, имеет p-значение 2,29×10-3. Анализ экзома UKB 50k методом исключения по одному показывает, что ни один одиночный вариант не обеспечивает весь сигнал, а пошаговый регрессионный анализ показал, что 11 отдельных вариантов (5 из которых имели MAC > 1) вносили вклад в общий сигнал нагрузки (Фиг. 4).

Этот результат был повторен в 2953 случаях с варикозным расширением вен и 75694 контрольных случаях с ранее подвергнутым секвенированию экзомом (OR=2,7, p=1,86×10-9). Эта область ранее была связана с обычными некодирующими вариантами, с незначительным влиянием на риск развития заболевания, при этом rs2911463 и другие близкорасположенные обычные варианты в хромосоме 16 недавно были связаны с варикозным расширением вен (частота=0,69, ОР=0,996, р-значение=1,0 x10-27 в GWAS 408455 генотипированных участников U.K. Biobank). Вариант rs2911463 не находится в LD ни с одним из выявленных ключевых вариантов (Фиг. 5), и тест на нагрузку остается значимым при корректировке в отношении rs2911463.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Regeneron Pharmaceuticals, Inc.

<120> Компонент 1 механочувствительного ионного канала пьезо-типа

(PIEZO1)и его применение

<130> 189238.02502 (3172)

<150> 62/862847

<151> 2019-06-18

<150> 62/806932

<151> 18.02.2019

<160> 4

<170> PatentIn версии 3.5

<210> 1

<211> 69883

<212> ДНК

<213> homo sapien

<400> 1

gggagccgcc gtccggccca gctcggcccc agtgagccga gcgctgcgct ccgccgaggg 60

gcagggcggt cgcctgagcg agcgcgggcc cgggacgtcg gcaccggcgg ggcggccgaa 120

ggagaaggag gaagaggaga aggcggcgcg cgggtccccg cgggtcagcc atggcgcgcc 180

ggccccgggg cccccgcacc gccccatagc gccgcggcgt ccgctcggtc tgggccgggc 240

cctgggccct ccagccatgg agccgcacgt gctcggcgcg gtcctgtact ggctgctgct 300

gccctgcgcg ctgctggctg gtgagtgggg ggcgggcgcc tgggggcgac gggagggggc 360

tgcgtctcgg ctccccacgg cctggacacc ggacgacgcc ggccggggcg agggctgcgg 420

gcgagcgggc gcggaaattc ccagggacgc gcgacccggg cgcccgcatt cctgaagcat 480

gagcgcgcca ggcggcggcg gggctcctgt cccagggccg ggctggaagg gcggcggcgg 540

ctgggggaga cggcaccgcg tgcccacggg ggcggtcgag cgagcgccgg gcatagcgcg 600

gctggcgtct ccgccggggc gctgcggaga ggaggccgcc gggcgaggcg gtgtttgccc 660

cggtgggaag ggccgcggcg gtggtggggg gagcacgaat ctctttttct ctttcgggtt 720

taaaaaaaaa agcgcaaagt tgcatcagga cttcctgaca atctgggaga aggcgggctt 780

cctgcctgga gctgtttaat ttggagcttc ccgagcccaa cgaacgtccg tgcccagggc 840

ccagccccgc tcaccgctgc acccccctct gccggactga ggcggtccca cactttggaa 900

aaaaatagtg tgggttcctc cctggtcctc ccttgcccta ctgggctcag tttcgcaggg 960

gcgggggccg gcctctgccc tggtctgggg gaggggacac ccccggaggc tgtggcctgg 1020

tgtcagggcg gggcaggggt ccccagtcct ggcatctgtg ttccctgctt gccgggcagt 1080

ggtgcccctt tcgcgaagca cacccgggtg gcttggtgct gcacggcctg gcacccctac 1140

ccttccccga ccctggccta gccgggaccc agggtccgcg ccctccgccc gggggctccc 1200

cacgtgtgat tgatctggga agcagtcgga tggaattaac ccacggacaa gtgggacggt 1260

ttgcattggg agtccgccat ggacacggca ggtggggcct tttgattgta aaagcccttt 1320

cggagccctt gcctcgctcc aggtgggagc tcgcccagcg ctagctttgg ggatctagag 1380

ccgcctgcct gaggctccca gacagactgc gttttgatcg gtcgcacaga aaggtggtga 1440

aacttgggga agattttcta gacaggaatc aatgaaaacc attgaggctg gagaggagag 1500

gttttgagca actctcttca gtgcggtcag ccctgtgtgg actgggcagc ctgggacctg 1560

ctcccagtgc agggtcagat gggccgtaaa cagggcccgg ctgtgttcct tcctgtgcct 1620

tgaaaacaag caggacagcc tggcacagag gcagagtcta gagctgacag gccttagaga 1680

gggaaacagg aaagcttctg aaacgtcccg ttcacactga tcgttccatt tcctcttgtg 1740

tctgagtggg agcgggtgtc ctccctgcag ggaatgcccc ccctctcaga tggcagctgc 1800

tccttgggca gagttggcaa tgtttttctt taaatgacca gatggtaaat attttcatgt 1860

cacaaaatct tcttcttctg gtatttttcc agccattaaa tgtaaaagcc ctcctgagtt 1920

catgggctgt acctaaacag gtgttgagcc cgattctgtg gcacatgtgg tttgctgccc 1980

cctgggcatt ggtcaggggg cctgggttct gccttctcga ttgctatccg cgtgggggat 2040

ctgggggagg gatcactgtt cttcttgctt ttggcctcct tggggaggat ggggaggtag 2100

cccaggggtg ctcacccagg ccccgtgtca gtcttctatg aaacttttaa agaatagtga 2160

tgactgactg tctgtctgta tggtactttc cttaaaccta aaactggtcc caaataaagt 2220

ctcttaattt gaaagatgct gaagcccggg ccatacccca cactgattct gtgtctgggg 2280

atggggcgtg gggcctgggc ctcactcagt gttttctctc agtcacctgg gggagatgga 2340

agtggagccg gccaagaacc ctgcctgcct gcctgctggc cgggactcct gagtcaggct 2400

ctctggccct ggggtgtggg cagctccaga tggacccgcg atgtgcaggt tcagctggcc 2460

tggccggagg tgggacactg gctttgctgt ctttggagtg ccccctccct ctctggcgag 2520

ctttggctgg aagcagttct accgtgtttt ggaaatgaat gaggccttca gaaggcatta 2580

gtcagtgtgt gcctgcgctg gctcagacag tgcctggtga gggtttgagt catcctgggg 2640

tgcccctggc ccccacgccc tccctctcca gtgcaggatc attacccaaa aatctggcag 2700

ggagctgccc cacccacagg gagcaggggc ctccttcagc agtctcacct aatgttgctg 2760

gagccttggg ggatcagggc ccatctcttc tagagagatg tcagggcagg gctgggcgcg 2820

atggctcaca cctgtaatcc cagagcttcg ggaggccaag gtgggaggat tgcttgagcg 2880

tagccattcg agagcagcct gggcaacgta gagatcccca tctctatgaa aaatatttaa 2940

aaattagctg ggcatggtgg tagtgcacct gtagtcccag ctactcagga ggccaaggtg 3000

ggatgattgt ttgagtccag gagttggagg ctacagtgag ccatgattgt atgactgcac 3060

tccagcctgg gtgacagacc ctgtctcaaa aaagaaaaag gaaaaaaaag ggcaggacat 3120

ttgtgattct gataatatgg gaccgcacct ccagttctat cagtgggaaa tctagacagg 3180

gctgcggaaa gccagctggt gcgagaggag ccaccgtgtc actgactgtg ggacacccac 3240

gtgggctgac aatatggctt ctgcttttca gggtgcctcg tggcacagcc taggggcaca 3300

cccacggccg gcaagctggg cgtcacctcc ttcaggctga ttgtcactga gaagtgtcac 3360

catttagcat gagggatgct gcctcctttt tcagaacatt gtcaccatca gggtctcacc 3420

actcctggga ggcggccgag aagctgggga acagcaggca ctcggctcac agttgctcag 3480

cagtgcagac cctctgagct gagcatggca gagtcaccct tcggaggcct gtgcccgggt 3540

ctcaggacct gcacagaacc ctggcctgtc ccatccgagg gtgctgggaa gagcatggcc 3600

gtggcagagt agggtgggag ctgctttcct ctgtggcttg ggggcccctt ctgagcatca 3660

gctccctggt gtgacagagg ggcgcactct gtccccatgc tgggcctgga ggctggatga 3720

gtcagcagga gagcctgggg cctgcctcac agcaccaagg gctgcaggtg tgagtgtgca 3780

catgtgtgcg tgtttgggga aggggccagg gactgcccag gagctgagga tgggtcacag 3840

cgggtgctcg tcccgcagcg ggtcactggt gcccaggaca cagggagctc cagccccagc 3900

tgccagggtc ccacagagag gaagtttcct ctgggggtgg gtgggggcgc acagtctctg 3960

atcctggccc caaggcagct tcctgggcgg tgtctctcct gtgctgactc ggcagtgcat 4020

ttgctttcgg tgctcaaaga tgaaggggaa ccaccgtggg ccttgacggc ctcatctgcc 4080

cgctgcagcc cactcctgag atgggaccac cgcagtcgtc agggtccagt gagagccgca 4140

tcttgcagga agccattcct ggcctctctg gcctcagaaa tccccttttc aattcaacaa 4200

aatgttagtc ttctgtttag ctattttaga aatagacagt taggcttttt tctctttttt 4260

cttaaagaca gaggctcact ctgtcgccca ggctggagtg tagcggcgtg attttggctc 4320

cctacaactt cagcctccag ggctcaagcc atcctcctgc ctcagcctcc tgagtagctg 4380

agattacagg tgtgtagcac catacctaat ttttgtattt tttgtagaga cggggtttca 4440

ccactttggc caggctggcc ttgaactcct gaccttaagc gatctgcccg cctcagcctc 4500

caaaagtgct ggggttacag gcatgagcca ccgcgcccgg ctgacagtta gacttttgct 4560

tctttgttta tataagcttt ttcttctggt tccaaaagca agtttgccct tccttgtggt 4620

agagaatcct agctcacaga gcagtttaga agccagcaca gtatcccaca cacacatctg 4680

gcatggacag acccttcctt gctgggtgtg ggtcctgtgt tcttctgaaa ggcaagctgt 4740

tcccagccaa cccctgcccc tctctgcctt agcctgcctg gaggcctgag tctcctgggt 4800

gactgtgagg tgggaccccc ccttccccta cccccaccca catcctctgt atctgccttc 4860

tgtcctgctc ttgacctttg agctcctctg ctggcttcag ggtgcggctg ttgagcctat 4920

tttttggatt aggactctgg ggtgagggaa gttaattcac acacccaaga tcacactggt 4980

gggaagggac aggcccgggg tgaaggcttc tcctctcctt ggcggttgag tcccacacct 5040

gctggccgag gcacctgaag gggacttggg gtccagggtc actgggagga cgggggcagg 5100

cagaggggtg gccgacctgg tggcggctcg tgggcagcag ccgaccctat cttgctctga 5160

acgtgtgggg ccctcacccc cttctctggg tctgggtttc ctcccctgta agtgacaccg 5220

taaaagcttc acagccgctt ccaagtctca ggtctctcgg gctttggatc tcacacccag 5280

gctgggtggg ggtaggggcg ggacagccgt cccccccgga aggctcagaa ttcctcgcac 5340

aatcgtgggg ccaggagacc cgcaacacag gctttcccag ctgcgctgag tgccgcggtg 5400

gccgggggtc cgtcgggcct ccatggagct gaggggaagg ggccactcac cgcctggtcc 5460

cggagcacac agggcagctc ccaggagcac agaggctcct tgggacctgt ggggctgtcg 5520

gcctccctca tgctgcacac acagcgcgtc cccaggggtg tctgcagccc agcccatccc 5580

actgcagatt cccgaccact cagattcatt catgcatcct ctcacgccgg tcctgtggga 5640

cagagctctg ggcagcagcc agaagtccaa gttctggttc agggccagtg gaggtgggtg 5700

ttggggtggg gctggagctc cctgctctcc ctcccaagct agccaggaaa ggaggttggg 5760

ggccccgcac ggtcattgct gtttattcac aaagcgcgat gctgagcaca ggcggggaaa 5820

gaaaagtgcg atcagtgcca ggaaaatggg gctcccccga cgccgtccaa aatgggatcc 5880

cttgccgggc gcggtggctc acacctgtaa tcccagcact ttgggaagcc gaggcaggtg 5940

gatcacctga ggtcaggagt tcgagaccag cctgaccaac atggcaaaac tccatctcag 6000

ctaaaaatac aaaaattagc tgggcatggt ggcgggcacc tgtattccca gctgggaagg 6060

ctgagacagg agaatcgccg gaacccagga ggtagaggtt gcagtgagcc acagtcgtgc 6120

cactgcactc cagcttgggg gcttggggga cagcaagact ccctctcaaa aaaaaaaaaa 6180

aaaagtgaag tcgtaaatca gattaaattc cctttttaac cctttgaacc tctgtcctcc 6240

cctgttccca gcgggaagcc tctggtgaac gcgccatgca ccccacctgc ccccgctctc 6300

tgggtctctc tcccagctgg aacggccgct tccccaggtg ccttccctgg gccacagcct 6360

tgtgcctcgg cggctgctgg atgcctgggt gtgtgggtgg ctcccagtgt gtgggatggc 6420

acacgagcct ctcgcccttc tgtgtggggt cgcacaccca ccgcaggccg tatttttgct 6480

cacgttcatg tttctccacg gtggacgctg ggttgcaggg acccttcctg tgtgcgggtg 6540

aggatctggg cagctgctgg tgccgggccc atggggacgc tgaccgtccc gggtgccggc 6600

tctgaggtgt gcagtggacg gctgtcctgc cgggcgctgc cagggcccct taggccgacg 6660

tgcgtggcca cccgattccc cgccgttgtc tcaggaacct ttgccgagtg gggtggatca 6720

atttttcggg tgtgttttaa tagcataatt acagggagta tttcaggctc cctctgacgg 6780

gccggcaggg tttggctgcc ggctgtttac caggctccaa tctgcacact atttttctgt 6840

gggtatatat agctggggct gcttctcctt cctcaggttc aggctaaaga gggacagcag 6900

ccgcctcagc caccccctgt ggtttccttt gcctgtggat gggcggctaa aatgggccca 6960

ggaagagtca agaacaaggc cggctctcgg tgccacagct ctacccccaa aagcaggaag 7020

ggggctcggg ccatgcccat ctgtgagcta caccggtccg ggagcggcat caggcagggg 7080

agtcctggac ccccgcagtg ctggggtgtg tttgtccgcc ctccctcccg tgtgtctaga 7140

agcctccagc ctcggggaaa acaatgaaac tcaactgtga cttaaacaga ttcccaggcc 7200

cgcaggagct cccggaggct tgtggctgtg gcgagacctg gagggccatg cgggagggac 7260

agacgcaggt ttgcggaggc cgcctgccca ggaggggcgt caaaggaggg gacagatgtg 7320

ggtttaggga ggccacctgc ccgggaggag cctcgaagga aggcacaggc gtgggtttgg 7380

ggctgcctgc cctggagggg cctcaaggac cccaggtctg gtcttggtct cactcacctc 7440

ctggaccccc caaggcctgc agtttgcaat ctgtcgcctg ggacccccac tgtctgcctt 7500

tacgcagctc agccaccacg cggccctcgc tccctcattt acttgatttc tgtttatggt 7560

taaagtaccg tttaaaacga cacatcatta aagcaacatg aaagggagtt ttgaaaaggg 7620

aagccatcgt ccatcccact gcccctgcct cagcggggat ttacttttcc tttcctgtct 7680

gcgggccagt gacaatgagg accccgcaat gtgtctgcgg gccagtgaca atgaggaccc 7740

cgcaatgtgt ctgcgggcca gtgacagtga ggaccccgca atgtgtctgc gggccagtga 7800

cagtgaggac cctgcaatgt gtctgcgggc cagtgacaat gaggaccctg caatgggcgg 7860

cctgtaaggc tctgccctgg cctccgctgc cttcgctttc tccctccttg gtgggtgcac 7920

gcccttgtgc ttttcctaaa agagcaggtc ctccgggcat ggtggctcac gccggtaatc 7980

ccagcacttt gggaggccga gacgggtgga tcccaaggcc aggagttcaa gaccagcctg 8040

gccaacatgg caaaaccctg tccctactga aaatacaaaa attagctggg tatggtgaca 8100

ggcatctgta atcctagcta ctcgggaggc tgaggcagga gaatcacttg aatccgggag 8160

acggagtttg cagtgagccg agatcacacc attgcactcc agcctgggca acaagagcga 8220

aactccatct caaaaaagaa gaagaagaaa atcctgacac ttcagcctgg tgcaggccct 8280

tccctccttc tagtccctgc caagaagtga gccgggccca gatctcctgc cgggcgggga 8340

atgagcacac acattcccct cttgggacag acagcagcag cagccctgtt gcacacatga 8400

ggacgtacag gctcaggggc cgtgggtggc agagaggcta tcagcgccgg actggcccgc 8460

cccgagccag ggtccagccc cacagtcctg tccccaagcc ctggcccttc tgcggtcact 8520

cccgtctgct gaatccccta ctctgcccct ggtgtgtggc cccccagttc cctcctgtgt 8580

tcattccctg ctaacctccc gtggcttcgc ctccccagat gccctgagca cacagcctct 8640

ccccttcctc ccctcctaga tgtgcacata ggagccgccc aaaggctggg gcagctagtg 8700

gggcccctcc aagggaagct gggccccggg caatgccctg agccaccagg tcctggccct 8760

gcgtctcatc ccttcttttt tttttttgag acagagtctc gctctgtcgc cctggctgga 8820

gtgcagtggc ccagtctggg ctcactgcaa gctctgcctc ccaggttcac gccattctcc 8880

ttcctcagcc tcccgagtag ctgggactac aggcgcccac caccacactc cgctaatttt 8940

ttgtattttt agtagagacg gggtttcacc gtgttaacca ggatggtctc aatctcctga 9000

cctcatgatc cacccgcctc ggcctcccag aatgctggga tgacaggcgt gagccaccgc 9060

gcccggcctc atttggttcc ttctgtgcac cacagtgtgg gatctcgggt cctgggtggc 9120

acgtgtttaa cctgaaagga aactgcccct gcgctcccca gcttgtagcc cgtgggcctg 9180

gctctgaggc cccgactgcc ccacggcctg tgctgcgcat gctggagcca ggctccggct 9240

ctggttggcg cctcccgtgg ctttaatctg cagtgacctg ggtgcttaac gagggccttt 9300

gcctctgcgt gtgcactgcc ttcttctgag gagtctcctc aagtctccca gctgtttaaa 9360

caatggggtc ttttgtcttt tgacctgttg gtgccatcag ccagcctcct gcacatactc 9420

tccctaccct tggctgccac tcctgtcctg cccttcgcca tgtctttttt cttttctttt 9480

tttttttttt ttttgacagc gtcttattct gccacccagg ctgtagtgga gtggcacgat 9540

cttggctcac tgcaccctcc gcctccctgg ttcaaccgat tctcctgcct tagcctccca 9600

agtagctagg actacaggtg cccaccacca cacccggcta atttttgtat tgttagtgga 9660

gatggagttt caccattttg gccaggctgg tctcaaactc ctgaccttag gtgatccgcc 9720

tgccttggcc tcccaaagtg ctgggattac aggcgtgagc cactgcgccg ggcccccgcc 9780

atgtgttttt aagagcaggc atttcattca gatgaagccc ggacactctt gggggttctg 9840

ctcaggggct ctacctgcca ctgaacgtcc tctccctgtg tgggtggcca tggcattcag 9900

cctgtgttgg gccttgttct gcctggctac tggccgctag gtctgccccg gcatcctctg 9960

tgtcctgtgt gggcgcctct gcctcctgct ccagcctgtg ccaggcaatc ctgctcacct 10020

tccaggagcc aggcctctcc ccagggcctg cgtcctgtca gggtcaggga cggcccctct 10080

gccatgctcc ggagtccctg gtcccctcac tccgttacgt cctgggtgtc acgggtacgg 10140

ccgggaactc tgtcgtcttc actgtctggg ccggggcctc cctgggtgtc tgctggatgg 10200

agtgggtgcc tttgggtccc tgcaaagtga gcctgcctcc cagcaccgcc ctgtcgttac 10260

atagccacta tctttgcgcc tgtttttcct tcctttgact ggttcctctg gggttaattc 10320

ccaggcctgg tattaccatc tctgaatgcc tgggtggttt cagcgcccag gaggctgtgc 10380

tgaggtatct tagaccatgt gggcaccgtt cgctcctgcg cagccggctc cggggtgccc 10440

tgtttttgcg gaatcctgca gggaacccca tgtaccctaa gagtgctctc cccagccact 10500

gtggcataag acaagcggtc tctttgccct tgggccccat ccttgtctgg tcggcccttc 10560

ttcatgggtc cagcgcggga ttgccggctt ccttttcagg cttcctggga cccccactca 10620

gacctgcagc tgggccagcg atgcccaccc gtttctcctc cacgtggtat acagaggtgc 10680

ccaggctgct gctggggact ctggagccca ggagtgagtc tccttgaccc tgagctgtcc 10740

tggctatcac agctgggtcc tgttttcccc ttcagcaccc acgggtgtct ttctccagtt 10800

tatattgtta tttttattta tttacttatc gagacagagt ctcgctctgt cgcccaagct 10860

ggtgtgcagt ggcacaatct cgactcatcg caaactccgc ctcccgggtt caagcgattc 10920

tcatgcctca gcctcctgag tagctgggat tacaggcatg tatcaccagg ctggacctct 10980

agtttatatt attacagcct ggtcagggag tcactgggcg tcgccatcct gtgggtggga 11040

agggggccca ggcagaggcc aggaggaggt gacagtcatg cgcttagaag ctcaggccac 11100

gcccacccag ccctgcctgg tgaccggttc ctgctgtgtt gggagctgca tcccagacct 11160

tatcgccggg cacagaactt ccaagccagg ggagagggag gcctggaggg gccccaatct 11220

ctgaaggtca gcagtggcgg ggaggaggct tgcggtgctg aagggactcg ggggacctgc 11280

agggaggtgt tggtggtcag ggatggtggc acctgagggg acttttggca gggccagaag 11340

tgcccagagc aagctccggt ggggccctgc actggagggc tggggtcgag tgaccctctt 11400

cctaagacca cccaggagga cactgggtgc agggtggccg gagccctcac ccccagtagg 11460

cagctgctgt ccactccgcc gacctgcctg tcacccagta ggcagctgct gtccactccc 11520

ccgacctgcc tgtcacccag taggcagctg ctgtccactc ccccgacctg cctgtcaccc 11580

aataggcagc tgctgtccag tcccccgacc tgcctgtcag ccttttccct gtcaggccct 11640

gttcctagga gcctggagac ctcaggggtg gccttgagcc cccagggttt ttttgagggg 11700

aagcgccagc tgctgtcttc acccttcccc tagtgaggcc aggctgtgca gggccacgtg 11760

gaggcagtct gtgctgcgcc catcggtcgc ctggcttcct gccgaccctc ggcccccagc 11820

cacctctggt ctcgggcaag gcccctcccc ctgcccacct cctccctggc ccccacgcca 11880

ggtgggcaga cctcctctgc ggtttttatt cagggggtcc ctcgttggct gcccactctt 11940

ggagggctgt cctgactcag gcctcccctc tactcagatc ccctgagcga gggcctgggc 12000

gtgacgccgg gagttactgg ggggccagag ggggaggctc agcctgaatc aatgagaccc 12060

aggaggaagg aggcacgtgg acctgagggc tggctggagc cgctggtgac agatggagga 12120

gtaattgctg cttccagagc acagcgagct cgagctccct ggagtgccag aagcttctgg 12180

gtggacagac aggccgcctc acattccaga ggctgacaca gtcttccagg cacccctggg 12240

gccagctgga agccatgtgc ctccactcac gtgtcccgtg ggtgtttgga ggggaggctg 12300

gccctgccat ggcccacccc agcctgcggc ctcaggagct tgcacatttg caagggggtg 12360

acatgaagac tgagccaggg ctgcggcggg catccccctc agagaacagg gaggaggggg 12420

cacaggcctt tttttttttt tttttgacag agtctcactc tttggccagg ctggaatgca 12480

gtggcacgat ctcagctcac tgccaccttc gcctcccagg ttcaagcgat tctcctgcct 12540

cagcctcccc agtagctgag attacaggca cccaccatca cgcccggctc atttttgtat 12600

ttttagtaga gacggggttt taccatgttg tccaggatgg tcttgatctg ttgacctcgt 12660

gatctgcttg cctcggcctc ccaaagtgct gggattacag gcgtgagcca ctgtgccctg 12720

ccaggcacgg gcctttttat gagggaggaa gccgtgccct ctgccacctg cctgtgggct 12780

ggggcctgca ggctcccagg gccctcagct ccagcgtggc tgttggttat tggcacctgg 12840

gcctcatgtc cacatggaaa gtatattccg agctggtggc taagccacaa gagcctgctt 12900

acctgtccca acccccggct cacttgctgc catgatacgt ctgggattct gggccctcct 12960

tctgagcttg gacacagact tgggacttca gcgctggaca caggtgctgg atctggggtc 13020

tcaatggcac cagggatggt cattctgaca gccatgccca gagtctcagg agggcctggg 13080

gccgcaggtg gacaggcatc ctgaccagag tctcaggagg gcctggggcc gcgggtggac 13140

aggcatagag tctcaggtgg gcctggggcc gcgggtggac gggcatagag tctcaggagg 13200

gcctggggcc gcgggtggat gggcatagag tctcaggagg gcctggggcc gcgggtggac 13260

gggcatagag tctcaggtgg gcctggggcc gcgggtggac gggcatagag tctcaggagg 13320

gcctggggcc gcgggtggac gggcatagag tctcaggagg gcctggggcc gcgggtggac 13380

gggcatagag tctcaggagg gcctggggcc gcgggtggac gggcatagag tctcaggagg 13440

gcctggggcc gcgggtggac gggcatagag tctcaggagg gcctggggcc gcgggtggac 13500

gggcatctgg acgtcggctc cactagtgtc acctctgcaa ccttgtccca cccagcacct 13560

ccctatggcc ctgctctgac tgtgggctga gggggacccc catggctagc ttgggacctc 13620

cgctggacac tgtcataggg cacttgtcga gtggccctgc tgaggttcag gcttgggcgt 13680

gtgtggcccc tgagcccagc agctgcgtga gccgtgggga gccgagcccc cagtcaagaa 13740

agctgtgtgc tccttaccct gcctgctggg cttggggcct gcagggcaag ggaggcggtg 13800

ggatgggagc cccgcctggc ctggtttctt gttgtcgccg cactcctagc tgtatgtagt 13860

cagatgaggc tcccagtcct ggctctgctg ctgagcacca ttgggccggt ggttgggtga 13920

atctctcagc ctctctgagc ctccagcact tcgtccttaa gagtggaact ggtctggacc 13980

tcccaagggg gggtcactgg gtgcagagtt cctgcaaggc tgggcccggt gccagtagcg 14040

gtcgctctgt ggggcctttc gcacggttga tttttatctc cctgtgagat tagcgcctgc 14100

cctgctctgc ctcacggctc tggctctccg ggactgagac cacctgctaa gtgacagggg 14160

cggaaggacc ttgcaacaca gagcaagacg tgatagggtg gagctgctcc gcccaggccc 14220

cgcctgcaga tgagagggcc cagagcctct taatcccctg cgctcagggc atgtgacggc 14280

agggagtctc tccagtgccg cccaccggat tcctatagtt agagctcctc gcccaagccc 14340

ccagggcacc tcactggcct cccaggtgag gacatgaggc ccagcgactc tggtggtggc 14400

tggtgtcacc tatggcaggg ccgcgcgggg cccagtggag gacgcctggc ccggacctga 14460

ctgctccgtg ggaaccgtgg ggcgtgctca gggtgacttg gtgcggctgg gctgccagcc 14520

ggcctggctg agtcactggc agtgaaggca ccaggtggtg gacgtgctcg gcagctggcg 14580

ggagagtacc cccacccagg accgtgttca ggctgagggg gaagggagcg gcccaggcag 14640

gcaccgccca tggcggggcc cccgcactaa cggccacctc tcccgatgga ctgcagttct 14700

ggagccgccc ctgaggagaa cgccctgctc agtgtcctgg cagactctgg actcttcacc 14760

gtgccatcct cgctacagcc tggccaggca gccgctcccg tccccccacc ccacagacag 14820

gaactgcaga ctcctaaagg tcgagccagc tcccaagtcc atagccagaa agtgatgcag 14880

gcggggcccg gctggggggc aggtgtgacc gggtcatggg ggagcgggct gtgcacaggc 14940

atcaggctga gaggtctcgg ggatacgtcc tgggagccgc ctgccaggcg tcctgtgggg 15000

ctgcctgcag gcctcctctg gctttggcag gttctgtccc gacagaccga ggcttgggaa 15060

gaccggattg tgcactctct gcctggagag agggtgggga ggggctgggg cgtgtgggca 15120

gggagaacac cctgggaggc atcagtcctc ttccctgggg acgggccatg cgtcaacagt 15180

ccctcacttc ctctctcagg ggcagaggcg tgggggtccc gagcctccag gttggagtag 15240

gttaggaggg cctcagagcc ccctgctgcc ccgccatgtg gcattggaag gggtgtgacc 15300

ccctagggga tctgttaacc acactccgcc ccatgccggc ctctctgttc cctctaacct 15360

gcgcaggagc agggccagct ctgagctagc agaggtgaca tgaggctcgt cctggccccg 15420

cccaccctgg cccctccctg tttcccacca cgctccgccc accagagcta catgttgtgt 15480

ttgagcctca gccccagacc tggctcaggt cctcaggagg aagcagtgac agccaggccc 15540

ggggtcctct ccctgctctg ctccctgcgt gctgactgga ggctgcaggt ccccaggctt 15600

ggccctgacc ctcaggaatg gagccggccg atgtgaggtg ggggctccgg tcatgtgcag 15660

tggtaggaga ggaggcggga ccggtcccac agctccattg ctgccgaggc gttccgcagg 15720

tctgtcttca tattggtaag gaaaatgcga ggatggtgta gcctgggcat cccagtcccc 15780

aagtccgaaa tctaaatcca agcggaaaat tccaggcctg acttcatacg ccaggtcaca 15840

gtcagaagcc agaattattg aaagtatgct ctgggcgtgg tggcctcaca cctgtaatcc 15900

cagcactttg ggaggccatg gtgggaggat cacttgaggc caggagtttg agagcagcct 15960

gggtaacata gtgagacccc cgtcattatt tacacaaaat tatgtgactg cctttagggt 16020

atgtgtacga ggtatatatt gaaatgtgag tagaattttg tgttgagtcc catccccaag 16080

atacctcatt atgcgtgtgc aaatattcca aaatccagaa aatcctaaac tggaaatact 16140

tctggcccct ttggatgagg ggcccccact ctgcatagca agtgtgggcg cgggtgctgc 16200

tgtgtcctag cgtacttcag tgtgtggcct ttgcagtgaa tagggctggt gtcctcactg 16260

tacagatgag gaaactgagg cccagcttgc tttgccaagg tgcatccggc cccggccatg 16320

gctattctgg ctccagatcc catggtctgc agccacaata ctgctgtgcc ccggactggg 16380

ccctgcagct cgcggtgtcg ctggcctgcc cattgtgggc accgccccca ccccagactg 16440

gccgaggcct agaagggagc agggcctggc tgaggctgca ggggtgggga cggtcagcca 16500

gcccctcact gccaggaagg gcgcatccat cctggcctct ccccagggag aagggaggag 16560

cggctgagag ggaagcgctc ttgccctgtg gacgagctcc tgccccacgg actagggagc 16620

ccccgcccac aacctgcttg tcagggccac ccgggacccc cgggagttcg gctgctcgct 16680

ctgctgttag gaattggatt agttttccat aaaaacagga tgtggtgggt gagagggcag 16740

tgtgtccgtc tttctcactc ccctttttcc aggaactgag cacgcgcata ggttttagcc 16800

agggccgtcc agtcccctcc ccacccccca cagggaacaa tccactctct gctcttaagt 16860

ggccacttaa tcagcttctc ctcctggccc ggggagcttc ttggagccgg cctgccgtgg 16920

tgggaacagc tatggggaca ccctgccata aggtccagca gctaagctgg gatgtggggg 16980

gaggggctgc gaggcccagg cagtgtgcca ggccgcacaa gaggagccca gctcttgccc 17040

caccagctgg cagccctgga ccgaggttgg gcccgtgagg ttggctgggc cctgggccct 17100

gggcccccct ccccaggaca cgactgtggt ggcacatggc tttgggggct cgtgggtccc 17160

actttgcaga cctctgcttt aaggggtctg gtccacgggg tcccctctgg agggcctggg 17220

ggaaatctca gggacctggg gtctggaccc gggggaggga gcgggagaag catgtgcgtg 17280

agtctcgtgc tgtcagggag cccgggaagt ctgcgagggc ttgggggttg tgtcagggag 17340

tgtgggtttt gcccttcagt ggtggaagct ggcttgagtc ccctcgatcc ctcaaggctg 17400

tagtcctgac tcggggctgt agggcagggc agggtggggt caccctgagg cagaaggctc 17460

agcggagatg ttctggcttg gctctgcccc tccctggctg ggtggcctca ccctgtgacc 17520

tttggggacc ctggttcctc tgagccaggg gacagcagtg actccgcctt cctaggtggc 17580

tgaggatgac atgggctccc cctgcaaatg tgggttctgg ctcagtggcc aagtgtatga 17640

tggtatgtgg ctcttggggt cctgagagag atgggagagg agcaggggtt tgtagggaag 17700

ctggcggctt ccaccccagc cagtcacctg cagtggggga gttccaaagc tgactgaagc 17760

ttcgaccttg tggctggtcc ccttccttcc tgcctcagtc attctggtct ctgggggatc 17820

agggctgggg ggctctgggc tgtgggggcc tgtttttgtg acttaaagct ctcccagcac 17880

agccccctga cctccttcct catgggcagg acctggccca ggggtctcag cacagccaca 17940

ggccagggat gcccttgcag atggccctgg atggaattcc agaactcaga aatgtctcct 18000

tcccgtaagg atgtcccgag actcatgaga ccgtttcctt ctgggaaggg ggaggaatgg 18060

ggagatgagt gaagagcgca ctgcagctca atccgggaag aagctaatca atcaatcagg 18120

gaagccaatc gatcggagaa gctgatggga aagctgtgct tggtagaata ggctcgtgcg 18180

ggcagagcag tcgcggcact cacaggctga ctgtgaggac cttgggtgtt actttgtgct 18240

tctctgcatt ttaaaaactt ttgaaagtgg agaagaggaa agtgaatgtt ctctgagatt 18300

tcatggaaag gggaaactga ggcccactct agccagtttg ggcccagggt tccaacctgg 18360

ggtggccccg gccctcgtgg cctgaggtga tcgtccctgt ggctctgaga gcagctgggg 18420

ccgggtcccc gttctggggc tggtgatcct ggggaagagc caggcagtgc cctgcccacc 18480

tagtggttat gagcccagaa tgttgatttt tttcccttgg ttgcttcatg actttgttga 18540

atttccagag tatgtgtggg ggcccccggc gtcccactcg ccccagccct gtggcagcag 18600

agctggctgt caagctcagt cagctgggcc cagggccccg gaggtaggtg ggtgtgtgcc 18660

tgagcttccc ctttgggccc tgccaggtgc tgggagggac cacacaggcg gcaggaactc 18720

ggggtcccca ggcctcggcc acaccagcct ggtgcttgtt atatattgat atgtctctct 18780

acctgtgaaa tgggtattta ttttaaggag ctgacgcacg cgattgtggg gctgtcacgt 18840

ctgaagttcg cagggcgcgc tggctgtcaa gagccgctgt tgcagtctcg agtccaggct 18900

gtgcgctcag gccgggcttc tctgtggcgg tcctgggaat tcctcctccg ggcccttagg 18960

cgacactccc ctgccttcag ctgattggat gaggccctca tgccgtctgc tgatttaaat 19020

caatctcatt ttaaaaacac ctgcacacca aattgcgatt ggcgtttgac taaactgggc 19080

agcgtggccc agcagcgctg acacatgaat caaccctcac accccacccg caggcgtgac 19140

cacggcaccc acgctgccga ctgagaacac agccgtgcgc tgactcgcat gtgatgtctc 19200

tggtcgcacc tcctccatcc tcagcaccct gttcagaatg gagatagcgg ccgggtgcag 19260

tgctcacacc tgtatcccca gcaccttggg aggcctgggt gggcgggtca cctgaggtca 19320

ggagttcgag accagcctgg ccaacatggt gaaaccccat ctctactgaa aatagaaaaa 19380

ttagccgggt gtggtggcag gtgtctgtag tcccagctac tcgggaggct gaggcaggag 19440

aatcgcttga acccaggagg tagaggttgt agtgcgcgag attgtgccac tgcactccag 19500

cctgggcggg cgacagagtg agactctgtc tcaaaaaaaa aaaaaaaaaa aattagagat 19560

aacgacttgg gctctctaga gaccagggag ccaggctcca ggcgctgctg tccagcccct 19620

tgccagctat acgaggtgct cacctggcca cgtgtccggg cagtgcttct ggggtggcat 19680

ccactgggag ggcaagatgg ttctggtaca ggtgcccaat tctgtcccca tttcacttac 19740

tgggaactca aggcacagag aggggagggc tgagctagga ccagacccca gtctcctgca 19800

gaagtacaca gacatgatgt acgaccatcc tggacacctg ccctgagatt cccctccctc 19860

tcctgccctg tcccagtggc ctggggggaa ggggaagcaa ggttctgaag ggagtgtgac 19920

cagacacctg cccgtgacac cccctctcca ggctgcctcc gagtggctgg tgactcccct 19980

cctgcctgcg agggaggtgg ccaggttgca ttcctctctg agtgccgggg aagtccctag 20040

agagcaggcc agcctgtgac tgggccctgg ggcagtctag acaggccaga ctggacaggc 20100

cagggggctg ggtgccgctg ggtaaatcac agggtgaggg ctctgagtca gcaccccatc 20160

ttctgtcctg ggtccagcac cgctgaggac acagtgggca gccgggtctg ccagggccag 20220

gtagctgtgt tgagaaggca gtgctcctga gaggcggcta ccgggaggtt ttcaatggcc 20280

aggcttctta ggaagccctt gttgcctctc tggggtgagt tgctggggcc atggttggag 20340

tggtcgccag tgtctgcccc tggtgccgag ggcggagtcc tcgttttggg aggtcacggc 20400

atgatgctgg gagtcaaagg caggccgtgg caggggcatt ccttttttct ttcttttttt 20460

tttttttttg agacggagtt tcactcttgt cgcccaggct ggagtgcagt ggtgcgatcc 20520

cagctcactg ggatcccagg ctcccaggtt caagcgattc tcctgcctca gcctcccgag 20580

tagctgggat tacaggtacg tgccaccatg cccggctaat ttttgtattt ttagtagcga 20640

cggggtttcg tcatgttggc caggctggtc tcgaactcct gacctcatga tccacccgcc 20700

ttagcttccc aaagtgttgg cattacaggt gtgagccacc gcgcccggcc tggcagggga 20760

atgtcgacgc gtgatctctg cctggagagc acgttcatgt ttcccagagg acactttaga 20820

acatggcgcc tgggtttgga tgaacctcag cctaagaatc tacctgctca ggatccagcg 20880

acgctggtgg tgtggacttc agctctggag aatgggttat atggaacctg ggcgccggga 20940

gggcattgcc acgtgcttgc tgctggggct tcaagaggac cccatctcct gtggccgaga 21000

ccccgtgtct caaggcacat cccctttcgt accccgcccc accctccgca gcttcatgac 21060

ctctgggttt cccccaggac cttcgcatct gatgttccca gatccttcct gccactgggt 21120

cctgctctgg tgccccccgg ggaagccttc cctgaggacc cagctcagca tctggtgcta 21180

actgtggctc atcgtgcact ttggccccca ggaggctgtg ggctcctgaa acccctctga 21240

accacgggct tccaaccaca cctgaccccc tgcgtgccga ccctgtgtgc aggtgtacag 21300

gtgtgcctgg ggcaggatgg ctgtgacggc ctcacagagc ccggagagct gcctcctagc 21360

ttccaaagcc ttcatttcag gaatcttacc ctctcaatta gtctggaatg ctgggggcgg 21420

ggccagctcc aggtcacaga gcgaccttgt ttacccagac cttaacatcg gcccttccat 21480

gctaatcaat gtaatcattg tggtccatgc ggcctctgga atgtgctgtc cactccctgg 21540

gtcagccaga gagtgtcagg gagcacctac cggctgttac ccagtgctgc cctgacctgg 21600

ttcttcactc tgcacatttg tatcacgcca gaccctggct ggcagctcca ggtgacgagg 21660

catgtcagtg ccttcctgtt ctgttctgtt ttgttttgtt ttttaaatcg ggatgaggcc 21720

ttcctgtgtt gcccaggttg gtcttgaact ctcagggtca agcgaacctt ctgccttggc 21780

ctcataaact gctggattac aggcaggagt caccatacct ggcccactgc tactttctag 21840

atgaagagac agaatcccag agaagaagca ggggtttggc tgctggtctg gagccggttc 21900

tgctcacctc cagcttctgc cttgggccgc cctgttcaca caggagctgc tcacaggctg 21960

agacctcgag cagggccctc ctagaggaac tgggcccccg taagtgccct gagccgccag 22020

gagccggccc tgcgtctcat ccctatctcc ggaggacatt ggctgctagc tcaccagctg 22080

gcccctgggc aggcttgaat catgacctgg aacgccaggt gtctctggct ctacccctgg 22140

acctgcaccc tgtccaagtg ccccagggcc agactgtttt ggttgcaccc tctggacggg 22200

ctacccccat gatggctgct catggaaagc tgtggttctt agggagctgc caattcctag 22260

tcctgcagcc tggagctcct gggtataagg tgggggctcg ggcgtattgg ggactggggg 22320

tctcaggaaa gagcctgtgg gacctgtgaa ctcatagctg ctggccgagg gaccaccttg 22380

tggctgtcct tctcagctag gcctggtcag ggcttgtgtg cagggcggct gaagctgtgg 22440

gaggccacac tgtccacaca gtgccctgta agcccaccgt gcctcagttt ccccgtctga 22500

caagtggcac aacagaagcc acttcctggc acacagctca gggtcagggc cgacacagca 22560

cttgtgggct gccgggagac ccgagaggct gccccttcct tgccttggct gccacgggtg 22620

acctggcaaa cccctctggc cgtggcacca ctgggggtct acccttggca gtcagggttg 22680

gccgcttggc tgggagcccc ttctcctccc cagacacatc ctctccttgg ggctggaggg 22740

ggtcctgccg tccccgggat tgtcgagcag caggaatcca ggagggcagt gcctgcagct 22800

cagatggggg ccagtgggca gggccgatcc aagggtggca ggaaagtgcc catcactgac 22860

ctcaggtggg ggaggccatg gtgtgtgaag gaaggagagc tgagtgggag gtcttacttt 22920

gtcaccgccc ctctgagtgc ctgctgtgtg caaaggccag cgggggccct ttcttcagct 22980

gggctctgcc cagacccctg agctctgggt gggccgggag ggagaccttg ctgctcacag 23040

aggtggctct gcctgaccca gctcccttcc cagggcacag tgggggcata gggtcggctc 23100

cgtcagacat tccgggacct gcgtccttcc tggggccaca ccctctaccc actgtccccc 23160

acctatttac ctgtatctgc gccagagatg gctgcccaga taagccctgg tttcctccct 23220

ttctggagag gctgcggggg ctggcgagga acccacctgc gcagagagtc aggggattgc 23280

tctgtgtgga acgcaggcct cacccatgcc ctggaatctg tccccttctc tgttgctgag 23340

ggatgagtcc cagatccctg accctgcagg ggagcccagc acagaaaaac tctgaggcct 23400

ccacaccctg gcagcgctgc tggtcgtctg tggggaagga caggccctgg gagggagggg 23460

gaggtgcgga gggcagtggg gagggtcagg aggaagtggg ggaagggcca cccaggcccc 23520

gatgtggggg atgtctcacg cgtggggtgg ggcattctca tctctgcttg gtctcctgcc 23580

atgctggggg tcgttcactg cggaccccaa gtaccatgaa gatggggatg ggatgctgag 23640

cagcatcggg gagaacgcaa aggcacctcc cagctcaccc gcccccaccc cgcaagcaca 23700

accattgcca tggtgtgggg accggaaggc ggcggctttg ggaccagact gcttctgcct 23760

cgggccgtgc cgctgggcct ttggtcagca ccatcgtgcc ctgcaagtca ctcttagcct 23820

ggtgccctcc tgggcagggc agtgccacaa gagctcaggc ccagatgtgc aggtgccact 23880

gttccaccca ccagcaggtc acctggggaa ccctcccctc ctgcagcctc tgtgtgctca 23940

tctgtgaaat gggcgtggtg gagtcacccc tggcttgtgg gagaatccca ggggctgatg 24000

cctgcaggac cctgtgggct ttgccccgct ccctgggcag agacagttcc cccagtccca 24060

cccacgtggc tgtgtgcagc aggtgcctgc tgaccctctg ttcctgcaca gtcaccttct 24120

tcacagacgg acccccaccc tgccctgcaa acccctccag gggctgcggg ctgagtgtgt 24180

ccgggagggt gtcctgactc tccacgccag caggtctgag agcagatggc tgtggcaggt 24240

gcggtgggtg cccagcccac agcagccacc aggcctgcag gaccctgccc cgtgtaggtc 24300

agatgagcca taaaactgag tttcctggac actgagctaa ttaaacctgg acaccgagct 24360

aattaaatgg tccagaagct cctcagtgcc ccaggctgct ggccgggctc caagtaggtg 24420

aggaacattc cgtttacctc ctgctgcgtc gaaggcgggt ggctcccctc gggcccctgc 24480

ctgtcccggg ccccctgggt gctgctgcgt caaaggcggg tgtctccgct tgggaccctg 24540

cctgtcctgg gcttcctggg tgctgctgcc tcgaagacgg gtggctcccc tcgggcccct 24600

gcctgtcctg ggctccctgg gtcctgctgc cttaaaggcg ggtcgttccc ctcggatccc 24660

tgcctgtctt gagctccctg ggtgctgcct gccctgtggc cacgtcccac tgttgccttt 24720

ggacaaagct ctcctagggc ctggggttct cccatgagat gacaggggtt ggttcaaagg 24780

tctctgaggt ttttagagct ttgtgaagtg ttctagaatc cattttctct ctcattgctg 24840

gacagagagt atagactggg ctttttcttg agtttctctc aactcttctt tgtccatgag 24900

gcaggaagag gggcttcctc agtcctcagc ttggggtgga ttgggatgga cagagaaccg 24960

tgcaggatcc cagcctgaga cggtccagcg ccccggggga gcggagcccg tggctcagcc 25020

gtctgtagcc acggccgggg tcactgtcac tgagggcacg gaggccccgc cggcgaggtc 25080

cgaggtgggc gtgtggggtg gtgggcgctg gaggcaggac ctctgcttgt ggagggtggg 25140

ccaggcgtgg accaggtgtc acgtccgctg gggcctttga ggggcaggtg gggattggcg 25200

cggagaagga gtgaagcagc tggggttttg ggagcctgtg cggagcaggc ccggatgcca 25260

gggtggctgg tgaaggtggg cctggccggg ctcggcctcc attgggggag ccccccaggt 25320

cccctcccca cacagcttcc ccctctgtct gctgtccaag gctcctgtgc tggcactctg 25380

gggtggtagg ccatgcagcc cgtgtgaacc tccatagacc ttgctgtgaa cgctgcacgg 25440

ggcgtctggg ggcgggctgg cttccccccg tcccctgggc caaccttgcc agccttcttc 25500

ttccataaaa gtgggatccg tctgagccct catggcccct ctgggtctgg gtttgctttt 25560

tgtgctctgc ctggggtcat ggcagggaag gcccagcagg ctcccttgca gagcagggca 25620

gagcagcggc cgccaggagc tgcctgtacc acgtctgctc ttcttcctct cttcctctgc 25680

ccggccccgc ccaccgtcga aagcactagc acgggagtgt ttatcggttt ctcttccaag 25740

ccaaataagg cagagagcgc tcttgcagga gttggagcag gccaggggga gggcagctgg 25800

ggcttggacc aggaccccgg ctccctgtag ctgccctggc ctggcagctg tcatccgcga 25860

actctgatcc tcgcctgccc tcacccggcc cctttcagag cttcccatgc tcagctggta 25920

gcaaaagaag tcaagaccta gcaaggtgcc tgccccggcc aggaggccca ggttctagcc 25980

ctgcagctgc cgctgtgagc tctggggact cagacgactg atgtccttcc cagcttctgt 26040

ttcctttgat gagaggaagg ttggaccaag cgacctgccc tgcttctgtc tgtttcctcc 26100

agtccttttc ctttttgacc agttcacttg ttgataactc cagcaacgca tgaaaacatt 26160

ccccttgtaa aaaagggaaa tgccgtgggt aggggggacc aaggacctct tctgcaggag 26220

cagacgcaac agcttggtgt ggatcttcct cagccttttt gtccatccta gacatgtgga 26280

atttcagttt tacacaaaag gaatggtagg cgtctgactc tctgtggctt gtatcacttg 26340

gcagtgccac agggattggt gcatgtttgc tctctcatgc tatgtgtcag gcactgttgt 26400

ctctgcgaca atcctgtgag gagggagtta tggttcttga tttatagacg aacaaactaa 26460

gacagaggag attgggctca tctgtggtca tctcagcagt tgtgagaggt cagggccaga 26520

gcccagtggt gtcattctgc agggcacata cagacacgac ccacagggtt ctgccgcacc 26580

ccctgccgct tggcctgctc tgcaggtggg tgccgaggct gttcctgcat ctgctgtgtc 26640

ttgtgagtcc gtgggtgcct gtggagtggg ggcagtgggt ttgcatttcc aagcactgcc 26700

tctgtcatag gctcagggag aagcagttac gcatgagctg ctatgagcca cgggtatgac 26760

tggcatcaca gcaggaggag ccctggggat ggctgagtga cgatgggtgg ggacagagct 26820

cacagaagcc agggttgccc ccaggccagg ccactgctgg ggccaaggct gggatgcagc 26880

acgatgttgg tctgtcaggg agtggcagga agcccacagg gtcagctgac acttaaccca 26940

gagtggtggg agccttgaat gccagactga gggccacaca gttggtctcg gtgcacaagg 27000

acttgggctg agagggctgt tgctcctcaa tggccatctc cttgtgggag gagagtccgg 27060

gcagccgctt ccaggaaccc acccatgctt gaaatagtgg gaccacaggg ctgaggaggc 27120

tcctggggat tcctcccagg attcagctgc tctgtcccca accccggagg gcctattcgt 27180

ctagccctat atcctctctg ccagttaggt cagggcagag aagtagaggc acagagggtg 27240

gcggaggggt gtccagccag gcctttctgt ggcaccttct gaggctggct ggagtctgtg 27300

aaatctgtga taactggccc agacccttcc tgcctcctgg ggcatctgct ggagctgagg 27360

ctgctggggg agtctgcctg tgacttgagt ctcttgctgg gccatgctgg gctcagttcg 27420

cctgtctgtg gggtgggatg gtgccaccct taggttgttg ggaggaccca aggagagtga 27480

tgcctccagc catggcagct ggcccagctc cggcccgcag cctggctcct tcagggccag 27540

gaacccccag gtcatggact ccaaccctcg ggctctcctg cttcccaggt gacgaagctt 27600

caacccatgg gctctccttc ctgggtgtgg aagccctgga gaaggtggag atgggatctc 27660

agtccagccc attggctcca cttcctttga gaagctcttt cccccgtctt ggcccccagc 27720

ccttgttcaa gcacctgtcc ctctcctgtc tcctaggccc cgtcagtcct tttggagacc 27780

tgttcccacc cgcccctgct ctcacaggct gccagtgtcc acacactctc aggcactgtc 27840

attggagcct tttaaccaca cgggaaagca ggcaggttag gtaactaccc cccacccccc 27900

cgccagcaac gccccctgca tacccagggc ctgcaccagg tgctgctgcg ctgccagctc 27960

tctcgaggtc cctcctccta acctcaatgc atcgcgtctt ccagcccccg gctccgaggg 28020

ctcagcctcc aggtggtcta acctggagtc taaacctgga ttgccatctg cctgcctcag 28080

cccttccctt ccccagggac cgagggccag tgcggctccc cagccaccca ttttttgttt 28140

gttttgagac ggagtctcgc tctgtcgccc aggctggagt gcagtgtcct gatctcggct 28200

cactgcaagc tccatctcct gggttcacgc cattctcctg cctcagcccc ccaagtagct 28260

gggactacag gtgcccgcca ccacacccgg ctactttttt gtatttttag tagagacagg 28320

gtttcaccat gttggccagg atggtctcga tctcctgacc ttctgatctg cccgcctcgg 28380

cctcccaaag tgctgggatt acaggcatga gccactgcac ctggcttgtt tgtttttatt 28440

tttattgttt tttgagacgg aatcttgctc tattgcccag gctggagtgc agtgacataa 28500

tctcagctca ctgcaacctc cacctcccag gttcaagcga ttctcttgcc tcagcctccc 28560

aagtagctgg gactacaggc acccaccacc acacccagat acattttgta tttttagtag 28620

agatggggtt tcaccatgtt ggccaggctg gtttcgaact cctgaccatg agatggcggg 28680

cttgagccat cttcccgcct cggcctccca aagtgctggg attacaggcg tgagccacgg 28740

tgcccggccc cagccaccag ttttgtacag cactcaggtg ggtgtggttc ctgaggacat 28800

gtcacacgag atccttccgg tccattagcc caccccgccc catcagtggc cagtgcggcc 28860

attgtggggt ccagagtccc gaggcagaac gactgactcc aggttgtgga ggggcctctt 28920

aggatccttc taggcaccca ggttgggcag gtgcctccat gcctaagact gagctcctgg 28980

tggacatcgg gctgggtgtg ggcgtcctgc acaccctccc tgtggcctgg tgcccgtgag 29040

gagtggacag tcaccccgag agcatagacc accctcgagg ctcccagatg gcggccgcag 29100

agccccactt ccctgcctgg tgtgtgatac cttccatggc tgaggacacc tctgactgct 29160

cactcctgtg accctggacc caagtgctgg gccacacctg gactccaggc cccagtcctt 29220

ccttcttctg ctgtcctggc tcctgggtgg cccccgccct ccccgctccg aggctctgcc 29280

ctgtgctggg aacccaggaa ttgccacccc ctggccccgg tttctcatgt caggatctgc 29340

tggccaggtt gactcctgag cgccactgtc tcctcagact tgctggtccc acccggtccc 29400

cacctgtcca ccgcccgagg ctctcctgtg aggccgctct gcagctcttg gcctgggggc 29460

ccccggcctc tcatggtgcc ttctgcactg tcccctttgg agatgggagc tttgagggta 29520

ggcgccaccg ttcggtgaaa aggcggtata agcaaagcaa cccccagata ctgaaggagc 29580

cgggaaataa aaggaggcag acagagcaag tgtgttggta cccgcctatt tactggcagg 29640

aacttacaga cggaaacatg gcctcaggca gcctccaggc aggtagagct ctgaacccaa 29700

acgcccgatc tggggctcgt atcgtgccct gggaggaatg tgcaggtggc tgggaacgtg 29760

gcgggtgggg tggccagatt cctgctgcag caccgggttt gtttaggaag aaacgtacga 29820

ggactagaca ctcttttttt tctttcctgc acgtgaatgc cagggagtag gtgctcctgc 29880

aggaagatga tgcatcaacc agccagtctg gaggcattcc gagacccggg gttaatcagc 29940

agattagcat ttaaataaag ttactctgtc cccacagcca gctaggcccg agccacatgg 30000

cgggggcggc gggggcggct gttcgccgca tcccaggctt gctccatctc ctcgtctgca 30060

atgtggaggt gacagtcgtg gtcctcggct agtgccacag gactgtacgg gacagatcac 30120

ccagccccgt gcctgcactg ggggcggcgg tgacgtgatg gccgcggcgg tgacctgatg 30180

gccgcaggtg tgtccaccct ctggttaggc ctctcctctc cctggggcgc aacaggtgtc 30240

ctcgggtggg aggttcagct gctgggcctg gggccccagc tttcagctcc tgtgcaggcg 30300

tggagcggga cggcacgccg gggcgttcgt tcacacgatg cccccagctc gtctctgcct 30360

gctctgtgat gcagcctcag ctcctgtggg tcccgggtca cccacccgtg tgggccgcag 30420

tctttctgca ccacgtcctg ctctcggcca gcgctggcct gcgggccccg gcagtgtggg 30480

gtcacacaca ggccgcaccg gctgtttcac ggagcccccc tgctcaaaat cctggccttg 30540

ggtctctgtg tggctcctgg agggagcatg tatgaggtgt ccaggttgtg aaagccccat 30600

ccggcagccc tccctgtgac agtccttcag gcctcgtcag gcttggttca gcccgtgtta 30660

gaggaggcca gacagctcct cctcgatcac cacagggaac gagggttggg cagtttctcc 30720

tctcccaccc gggcgtgggt cagctgcaag ggtctcatcc caggaactgg atcctggcag 30780

gggggctcag gcatctgaca tcccctggca ggtcttccta tgtgccagtg ggagtgggtg 30840

gtgtccagcc ctctttgtgg aatgttccgg ttgagtggtg tgtggtcctg gttaccacca 30900

tgtggcattt gtggctttcc tggccagcac ccactgaaag cagaggccag cccagccctt 30960

ggacacccag gggcccagca gctaccgtgg gggcagcctc tcccctcctg actgtgctcc 31020

tctcagctgt aggatgaagg tctgtggatg ggtgatggct gggctctctg cttcccaagg 31080

agctggatgt gggccatagt caggcgtgtg ctggtgaggc gagggggttg ggggttggga 31140

accacagctc tctctgaccc catcccattg cagctgactc aggaaaaggc attaccccca 31200

cggggtcaca ggcccagcct gggcagctcc tgatgggaac atgggagcca cagggcaggg 31260

caggctcctg tccccgctcc ttggattgtc tcaggccccg cctccccttt ggctgaattt 31320

cttccttctc tgcctgagcc tgatctgcga agcttccgac ctgccctgag ttggagccag 31380

tcttcagggc caaaagcaat gccgtctcct ccaggcagcc tgctctgaag tctccccctc 31440

tggctttagc ccacaaagtc acagctgagg ccacatcaac acacttagac caagagcact 31500

gccggctgca tagacagcac aggtagatcc aaggagtgtt tcgaaaagcc gtggccctgc 31560

ggccgggatg cccggacctg ggtcctgacc actcttggga gctcctcccc tctcagagcc 31620

catcccatct gaaaatgggg gcattggagc attggaggag tgctcctcac tcctgccctg 31680

ctagccggct actccgagga ccccaagacc agatgatggg agaagtggtg ggctgggctg 31740

tgaccctgag cccccttctc atcccacccg tgaggctgcc cctgcttggt gtctgtggca 31800

aggctgacag aagatggcgc cagggaccag ccagggccct cctgtctcag cccgtccttg 31860

ggtgagtggg tgtgctctgg gggtggcagg tgtgctccgg gggcgggagg tgtgctgcgg 31920

ggggccgggt acgctctggg ggggcgggtg agctctgggg ggctgggtgc gctctggggg 31980

ggctggtgtg ctctggggat ggacaggtgt gctctggggg gcggggtgtg ctctggggat 32040

ggataggtgt gctctggggg ggcggttgtg ctctgggggg gcaggggtgc tccgggggtg 32100

agtgtgctct ggggggcggt gggtgtgctc tgggggcggt gggtgggctt tgggctaagt 32160

agccctcttc ctctctgagc cttttccttg tctgtgttgt tggtgagtgg ccgccacctg 32220

ggacaagcct tagctgtctg tccaactgtc caccatgtcc ccggacccta gaccaagccc 32280

gctgcctggt ggggcctgct tggtattgaa tgaatgaatg aatggatgaa tggatgaatg 32340

gatgaatgaa tgagtgaaca aactctgggg ggcgtgttgc tgatcacccc agggcaggcc 32400

cgtggtgggt catggtctca ggcaggggac ttgccctgcc gggtgacgtt ggcctgccgg 32460

ggaacccctg ccaaggtgcc tcccatgccc ccatcgtcct ctgcctttga gtccactctg 32520

cccctcaagg ttcccctctg gctcggccag gggcagggcg gtcagggagg cctccagctc 32580

cagcccctcc ctcatctcca tcctcagccc ctgcacccgc ctcatctcca gccccagccc 32640

cttgcagcct caggctcggg cttctgagaa tcctttgcag atttcagggc tggttatttt 32700

tttattctgg caaaatatac atccataaag ctttgtttcc tgagatgatc tcaccctgtc 32760

gcccaggctg gagtgcggca gcgtgatcat ggctcactgc ggcctcagcc tcctgggctc 32820

aagtgatcct cctgctccag cctcctgagt agctgggacc acaggcatgc accatcatcc 32880

ccggctaatt tttgaatttt tttgtagaga tggggtctct gtgttgcctg gtctggtctc 32940

gaactcctgg gctcaagtga tccgcctgcc ttggcctccc aaagtgctgg gattacaggc 33000

ctcagccacc acacccggcc taaagtttgt cacgttagcc gcattgaagg gcacaggtca 33060

gcagcggtaa gcatgttcgc attgttgtgc agccatcact gacacccatc tctagaactt 33120

cttcgttttc ccaaaggaaa ctgcacgcac ggcaccacct ccctggcctc cccacagcct 33180

cagggtctgg tgaccttcat ccccaggacc tacgcttctg actccaggag ccctgcctgg 33240

tgtccacacc acactaaggt gccctgccac gggcttcgaa cccaaccctg gtgcacttgt 33300

tgagcattgg acgttcctgg caggtcagac cgtgagctcc tctgctctga cggatgcatg 33360

gacggctgcc acctggctgg acaggtgcag aggggaggtg ccaccttctc tggggacagg 33420

actggggcag aactcacccg gctgaaaagt gcagctgtgg agaacttcag aacttcagaa 33480

gcctttgctg tgaatgcatt ttcctcctgc ctcttgggcc agatcttagg gatttttttt 33540

ttttttaatg aaaatgtata atcgtcaaaa aactttagat ttaaaagcat ggagccgatg 33600

gctatgcttg gtgcgttaat gggaggaaga ggggatctta acttcaggga gggctcctgg 33660

gggagctggg ggaggctgct gtgtccagca gggcgggcgg tgccccccgg agcccggcac 33720

tccgcgatgt gtgcgctaag ccgaggccgc cttgagcccg tagcagcgcc gagcgcgatt 33780

ctttcgtgtc tgcttccggg agggtggaag ggtgaagctg ttgagagtgg gaagggaggg 33840

gctgtgcttc ttgagtttgc cgtgtgcccc tgaccctttc aggtgcaagc gtcagctcca 33900

cggtgccaat ggggagatgg gtctggaggc cccaccaggc tgtgaaaggc ccggcctcct 33960

gtgctgtccg tggaggtcgg ggtctccctc tgccctgcgc ctcctctaac ttgccctgcg 34020

ttttccgtgc ccctggtcta gggtgaggct cgggtcttgg ggactgaggg gcaggtgggt 34080

gtcaaggtga gagctgggct gggctgggcc tccctccaga agacttcccg gggctccttt 34140

ggcaccaagg atggggcaga tggtggcacg catggcctcc cctgggcaca gagccagact 34200

atggagggat ctcgttggct acatcctggc tggggctttg gggtcatggt gggagcagca 34260

gccaggggtc tcgcttggac acgggtctga gctcactgtg gcctccttcc tcagcctcct 34320

gaccggggtc ctgaggctgg agggtgggtg gagggtggag ggtgggtgga tagtgggctg 34380

gaggatgggc tgctggcgcc ccttaggcag catgaggcgc ctttccagtc ccagtgtcct 34440

ccctggtagc cccggaaagg ctgagtggtc cctcaggtcc cctgcgagga gacgacatca 34500

ggccccaccc ctcatctcct gacaaacctc acattcctag gaggaagcag gcctggctag 34560

cacgtggcag gcacagcctc cctgactcca gaccttatca gatcagtgca agtgccaggg 34620

agaccccggg tgggagctgt gtggttggga ctgatgcagg cactggccgg actctcagga 34680

tgagggtggg aggccaggcc ccgggacctt ctgggacagg caggagggca gacacgggac 34740

atggtgtggg ggctgtggcg agtgcggcca cgcagagcat ttgggctgaa ggcgcgctgt 34800

gtcccactgc cccatacgtg tgcgggggct cccagacacg tgctgggggc aggaatcata 34860

gcattttttt gtttgattgt tttttgagat ggagtctcgc tctgtcgccc aggctggagt 34920

gcagtggctc aatctcggct cactgcaacc tccacctccc gggttcaagc gattctcctg 34980

cctcagcctc ctgagtagct ggaattacag gtgcccgcca ccacacccag ctaatttttg 35040

tatttttttg tcaagacagg gattcaccat attggccagg ctggtcttga actcctgacc 35100

tcaggtgatc ctcctgctgc agcctcccaa actgctggga ttacaggcgt gagccaccac 35160

acccagccaa gaatagcatt ttctttcttt ctctttttga ggcggagtct tgctctgttg 35220

cccaggctgg agtgcagtgg tgccatctca gtgtaacctc cgcctcccgg tttcaagcaa 35280

ttcttctgcc tcagcctccc gagtagctgg gattacaggt gcccgccacc atgcccggct 35340

aatttttgta ttttcggtgg agacagggtt tcaccacgtt ggccaggctg gtcttgaact 35400

cctgacctca agtgatccgc ccgccttggc ctcccaaagt gctgggatga caggtgtgaa 35460

ccactgcacc cagcccaaga atagcatttt taaaggaaaa aaagcaaggt agaaagatgg 35520

gtcaaaaccc cagcgccccg ctgggaggct ggtgcccgtg tcgtggcgtg tgtgagatat 35580

gtacggaagc gcgaggcggc ttccacggct ctggctcagg gcagcactca cagggcacac 35640

ggcctcggcg gtgtgacgag ctgggccgtg ggtgcgctgt cctctggggt ggggctggcc 35700

atcctctgtt ggcgacctag ttaacgccca tctccccgca gcctgcctgc tccgcttcag 35760

cggactctcg ctggtctacc tgctcttcct gctgctgctg ccctggttcc ccggccccac 35820

ccgatgcggc ctccaaggta aggccagggg accctgccca cgctctcagg gtgggagggg 35880

gtgggcattc gtttggggcc aaaattcgta cagctttcct cacctttaac agcccggggt 35940

ggaagatgag gggtcccgaa ataaaatttt tttttttttt tgagacggag tctcgctcag 36000

tcgcccaggc tggagtgcag tggcgcgatc tctgctcact gcaggcttcg cctcccaggt 36060

tcacgccatt ctcctgcctc agcctcccgg gtagctggga ctacaggcgc ccgccaccac 36120

gcctggctta tttttttttg tatttttagt agagacgggg tttcaccgtg atagccagga 36180

tggtctcgat ctcctgacct tgtgatccgc ccgcctcggc ctcccaaagt gctgggatta 36240

cagacgtgag ccaccgcgcc cggctttttt tttttttttt ttttttttga gaccgagtct 36300

cgctctatct cccaggctgg agtgcagtgg cacaatcttg gctcactgca acctccgcat 36360

cccaggttca agtaatcctc gcatcccagc ctcccaagta gctgcaatta caggtgtgag 36420

ccaccacgcc cagccatcaa agtttcttat tttcattgta gaccccaagc taagctcaga 36480

atcttttctg atccgtgttg caggggctgt gaggggcgag gagggtcatg ggggtggagt 36540

ctctgtgtcc cttgggaggc cacagggagt ggatgggccc caactgccca ctctctgcag 36600

gctccaggca cgtttcctgc ctgctgaggc tctggcagcc tgggagttcc agccgcctgg 36660

accgccctcc cgctgcccgc tgtggggttg gacctcagtt gactttgatc cacttgtgcg 36720

gggggggggg ggagctgaga ccccccttgg gaaccacctt ggggtctgag ctgggccagg 36780

actgtgttgc tctcccgtat cctccaaaca gagggcggtg aggccacgtg ccaagcctgc 36840

agcctgggtg acgagggtag cagcaaaccc tccatcctgt gacatgtcac ctacctgccc 36900

tgtgggggcc atgtccattt tgtgcccacg ttttaggaga gcgcgttttg gagcaaacac 36960

tcagagacct gtccccaaag gccatgggcc aaacgtgggt ggggccgggc cctccgctgg 37020

tctttgggtt tggagggtga agagccactg aaaggaagga aggtccccag ggagggcaag 37080

tgtaggcagc aagagacctt ccccagcaga gggcagagag gaggccaagc aggaccaggg 37140

ggcgtgactg tggagacagg ctcttgggtg ccgcccttct gggaggtgct ggacgcatca 37200

ggctggcagc gtcggggcct gtccatggct acgaggtgtc caccgggctg cgtttttcca 37260

ggggactctg gggaggatct gcttcctctt ccagctgctc caggtgccta ccttcctggg 37320

cttggggccc ctccctccat ctccagagcc ggtggggtgg ggtcaggatc acaccctgtc 37380

tctcctgctc cctctcccct gcggtaaccc tgtggcttcg tcccatctgc ctccccggct 37440

aatccaggcc gacttccctg gtttaaggtc agctgttggg cagcccccat ttcctctgct 37500

gcctggactc gcctctgcat gtgagcttct gcgttcacag attctgggga ctggggtgca 37560

ggcatcattg gggtccatcg ttctgccagc tgcaggtgga aggtcgctct ccggcctcgc 37620

gacatctggc tggaagcatc ccagaggctc ctcctagctc gtggtgctgt ggggtgggca 37680

atggtctttt ttatttattt tttttgagat ggagtctcac tctgtcaccc aggctggagt 37740

gcaatggcac gatctgggct cactgcaacc tccgcctcgc gggttcaagc gattctcccg 37800

cctcggcctc ccgagtagct gggattacag gcgcccacca tcatgcctgg ctaatttttg 37860

tgtttttgta gagacagggg ttttaccatg ttggccaggc tggtcttgaa ctcctgacct 37920

caggtgatct gcccacctcg gccgagacta caggcatgag ctaccgtgct tggctttttt 37980

tttttttttc gagtgggggt cttgcttggt tgcccaggct ggagagcagt ggcatgatca 38040

tggctcactg cagcctccac ctcctgggct caagcgatcc tcctgcctta gcctaccaaa 38100

gtgctgagat tacaggtgtg agtcactgtg cccagcgcag gcactgatct tggatcatgg 38160

gtagaattca ggggtgcaga gaggcatttt gggaggggcc cagtgcggcc gagtgctggg 38220

agtcgctggg gcccgaggcc caaacccctc caggatgcat ggctggggtg ggtgggcacc 38280

cccactcccg gtccctatcc tgggcctccc ctttgctctg tggagccggt tctgtctgtt 38340

cccaggcccc tggcgtttcg ccgtttgttc cgtaaatatt tcatgcccag ggcgcaattg 38400

gaaacacttt cctttaatca gcagtggggg aaggcaggcg cccagccagg ccaggggagg 38460

agctggggtg ggaagatttg gagaggaccc gggaggactt ccctgcctga gcctcgtcag 38520

aggcccttca gagacggaga tgctgcccag ttttccggga gggagagagg aaagtgtgag 38580

gcttgcccga gccgagtgcc cggggcttta tgatttgtgc agctgctggg cttggcgtgg 38640

ccctggtgga agctctgacg ccatctgagc cttggtcccc ttgtaggcgt cagcctgatc 38700

cttggggggc tggaggttga gctcagactg aacagggagg agaggggtag gggctggggc 38760

tggggcagag ggaacagacc ctggtgctcc aggcagggct gcaggcagag ccacaggggg 38820

tggctcccag agacctgctt gtcatttagg gactcagaag ccccatcctg ccttaggata 38880

aaacccacct ccaagactga ccctgctgtc tggagagaga tcacccccca cctcttacca 38940

tgccccgtgc agggaggccc tgccaccctc tccagcttca ctggtccccc ggctctgcca 39000

gccttgtgta gtctccatcc tctgtctcaa aaggcccctc tcgtggccct accccgcagc 39060

tcagccctag ctgtcgctgg gtgggcctca tggctcagcc tcaaggcacc ctgggtccct 39120

tggctggtcc catgcacacc ccatggatca ggttccaggg ggctcccatg cacaccccac 39180

ggatcagact cagggcaact ccacactccc cacagaacaa tcaggcccag cccttgtccg 39240

gcaggtgtgg ggatggtggc tatggaccac gcatcaggat gctgccgtgg tggggcccct 39300

cagcctttgc aggccgtgcc ggggtccaag ggctccggct ctgggggagg tccatgctct 39360

gtcaaccatc cggtctgcaa taccctgggg cctccccgcc ccttcctgtt tcctcctgag 39420

agccctgcaa gctggagggg gagccccggc cccttttttt tttttttttt ttgagacgga 39480

gtcttgttct gttgcccagg ctggagtgca gtggcgcgat ctcaactcac tgcaacctcc 39540

gcctcctggg tttaagtgaa agtgattctc ctgcctcagc ctcctgagta gctgagatta 39600

caggtgccca tcaccacgcc tggctaattt ttgtattttc agtagaaaca gggtttcacc 39660

atgttggcca ggctggtctc aaactcctga cctgaggtga tccacccacc tcggcctccc 39720

aaaggtgtga accaccacgc caggccccct gcaccttctt ctgggtgggc aagagccatg 39780

ctgagcccct cccctgccat ggataggggt ggcaagaata gtccattccc catgggctcc 39840

ctccggcagg cagcggatgg gttggggccc acacagtggt tcaggaaagg ctgaagggcg 39900

gttgccggcc agagctgggc gggtccctgg cctgagcctc ctctcactcc ctttcccagg 39960

atggaaaggc cactgtgagc tgggtgtgtc ctgccaggag ggagttggag tcgggggcag 40020

gagacccact gggtctcctg ggctcctgga agaggcagca gtgggtccct gcggaggtgg 40080

cctgatcccc ggctcagcct ggttttccca gctttgcatt tgggggtggg acctgcaggg 40140

ggagagtgac ggggtgggcg gggacagggg ctgcaggtgg aggcacgaga aagccacccg 40200

accccttgag gtcatgctgt ttgcgtcgga gaagagggcc ggtgtcaggg tgccccctcg 40260

gcctctgtgt gcacctcccc gctccccgcc ccgtgcaggt cagcagagcc tcgatccctc 40320

tgcacgttcc ggccccctcc catctccagc agcgtctctt cccggggtgc ccctcggact 40380

ctcagctccc tagtctgatc cagcccaggc agggagcggg cgtgccacgt ggccaggagt 40440

ggcctccagg cccagctgcg gccccttcga ccctgcggag ggatcatggc ccagctgttc 40500

taacatggcc agaccaggac actctggccg gcccgagaac tgaaccggga aggaggcagg 40560

gaaaggggag ggaggaagac aatggggaag cagtgacatc cgagatgtag ccagagacgg 40620

acatcctgga ctgtcgtgca gggcaaggcg ggtgggcggg agccaggtgg cctgagagcc 40680

cctccctgcc caggggtctc tggtcaggca gttccttccc gggctgctgg atcgtgtgtg 40740

cagggaaccc gtcagcctgg ctgcccaagg gcccagatgt cctctcagtg cccgggggtc 40800

cttgacagcc ccagcaggag ccccacgtgc ctgtggggca ggccccgcag gtccctctct 40860

gtaggactca gaataccttc tccaatgcca cgtgctctcc ctgagtgccc agtgccacag 40920

agggccccgc tggcgaggtt acttcaacgt caggctagag ggtgcagcga gcaggactca 40980

cagcccaggt tcccaggcag gtgtggcagg agcccattcc ctgggtcggt gttctcatgt 41040

caccccacgg tgaccctgct gtacagaggc gggggcgcgg ggcccctggc tggtgccctc 41100

ctgctgccag acttgtgctc tgctgaagag gggctggcgc ggcaggtatg agcccggcac 41160

ggaggtcgtg agcagtgaga agcctggcac ctatgggttc ggggcaggga ggccctggaa 41220

ggtcctgtcc tccgggagcc ctgcacagca ccccctggtg gtggctcctg ttcgtgtcgg 41280

ggctgcagcc tcccttcctg gacggttttc cattcctcct tcccactctc cctgctgctc 41340

acccctccca tcctccacag gtcagaggtc atagctgcag ggtcagcagg tcagggcctg 41400

gggcaaccct aggaaggtgt gagtgtgaga agctggtcca aacctgcctc ggctgcctgg 41460

tggtgcggac agggagtcct gggcatccgt gagggctgct tcacggtcag gcttagggat 41520

gtgcagggtg acttggacgt gggtcatgag tctttgctcc agaaagaggg ggctgagtgt 41580

ccaaggccaa tcccgagtct gtcacctaac accatttgtg ctcaaaaaac tgaacagagt 41640

ggacacaggc cctgagtttg cgccccgagg ccgagagagg gcagatgtgg tggtgacatt 41700

caccaccttg gacccagacc cagatgctac ctgtccctga gctccaggaa gttgtgagaa 41760

gggcctgagc tgttctgcac tttctcgtgg ccgggcgtgg ctggtggtgc aggagttgct 41820

gccccagggt gagggcccgg aagctcctgc cagcacgtgc cggggtggaa agggaagctg 41880

tccacagccc tgtcaggact cagaacccgg tgggtcaagg actttggtcc ggacccctgc 41940

tgaagggtga gctgtccaca tgtgcgccga gagcagaggt gaagccaggg ctcctgagtg 42000

cccccagcca cagggtgcgc ccgcccagcc cctgccctgc agccgaaggc ctccctgctg 42060

gggggctgag tccagtgggg ccacaggcag ctgggagcag gacaaggctg ccaggcaacc 42120

agatggtgct gccgcttcct gccaggtgtg ggtgcacaga gagagagagg atgccggtct 42180

ggggcctgac ctggtgcaca gcaggtgcct gaaatgccag ggtggccatg gggactgggt 42240

accatgcata ggccatgcat cgggatgcaa cttctccttg cagcccctca gccccaggga 42300

ggcagctgcc tgccccactt ttctccagag ccatcatggc cctgctccca ccccagccac 42360

ggctgctcag gggcgctccg catgctctgg tctccatcca cctgcagccc ccactggggt 42420

gaggtggagc ttcttgcctc tccttgtgtc tatttcctct gcttccacaa ctgaacggtg 42480

acaggtattt gctggatgag ggagcacacc ccaggtggtt tcctctgagc ctgggaggcc 42540

ttttcctgcc tgtgggcccc aggcccatcc tgctgccacc cccaggagga tgcccggctc 42600

cttgtgacaa gagtgaccct cgggaggcgt ggggagtggg gctggccggc ctgcctgatg 42660

gggtcctgag tccatggcgg gtttgcatct caggcctctg ggctctggcc gggctggggg 42720

ctattgtccg gctgagcggc ctgggctgcg gcccctcccc gtccccggga ccagcctcac 42780

ccactcgctc tgccgcaggt cacacaggcc gcctcctgcg ggcattgctg ggcctcagcc 42840

tgctcttcct ggtggcccat ctcgccctcc agatctgcct gcatattgtg ccccgcctgg 42900

accagctcct gggacccagc tgtgagtcgc tgagggggcg gggtagggat agccatcctg 42960

ggggtcaggg agagggccct gcagtgaccc cgagtctcct gggggggttg actcagcctg 43020

atttatgtct ggcctggatg gtccaggtga aacgctccag ggatgaccag gccacggtgc 43080

tggctgggca gagcctgacc tgggttcccc cgtctttctc tgcaggcagc cgctgggaga 43140

ccctctcgcg acacataggg gtcacaaggt aagaccattc ctcccacccc caaccagcaa 43200

gcctcccttg gggatttcag gccccaggaa gtggggggac ccaggaggga cagaggggga 43260

cctggagact catccacact cccacccaca cctggagacc catccacgct cccacccaca 43320

cctggagacc catccacact ctcacccgca cctggagacc catccacact cccacccgca 43380

cctggagacc catccacact cccacccgca cctgcagacc catccacact ctcacccgca 43440

cctggagacc catccacact cccacccgca cctggagacc catccacact cccacccgca 43500

cctggagacc catccacact cccacccgca cctggagacc catccacact cacacccaca 43560

cctgtcctct tggtctgacc gcggctgctc cctgctctcc gcaggctgga cctgaaggac 43620

atccccaacg ccatccggct ggtggcccct gacctgggca tcttggtggt ctcctctgtc 43680

tgcctcggca tctgcgggcg ccttgcaagg aacacccggc agagcccaca tccacgggag 43740

ctggtgaggg cagctgcgtc acccgtgtgt cagggaggtc attcgagagc tgtggtctca 43800

gccattttga gggttatttt aatcttttta aaacagatgt agacgttttg gttgtaagtt 43860

ggtgttaaag agaggaggaa gttccaaatc ccaccccggg gcccagcctg cagttccatc 43920

cgttcagacc tgtttctact cgggctctgc ctctagtcag aaacctccac gccccgacat 43980

ggcatctgtg cccttaggaa ctcttcacag gggaattatt tggggccacg cggtggtgga 44040

aacctgcagt gctgggcagt gggtctggct ggagagccac tgcagaaggg ctgagaaggg 44100

gcggccccag caggccccat gcacttacag gcaaacaggc tgtcggccca gagccccagc 44160

aggggcctgg accccaggag cgacgggcct gaagcagggc ctctgtcctc ggagtgggag 44220

gcagagtgaa ctttagctgc tacaagactt ggaggtccgg ccccgggaat ctctgagcta 44280

tggccccctc acacggacag ggcatgagct ggggcctgcg acacccaacg ttgactgctc 44340

agaccctctc gtccctgcct gggcccacac ttgccatccc caggctcagc caggatttat 44400

ggccacctgg gtgtcctggc ccacgaactc cctgccccgg gcacccagcc tcctcccacc 44460

tcaccctccc agtgcccact cgtcagatag ctgatgctcg ccacgcacat gggcctcaac 44520

ttctagagga gtcccgagag ggaaaggggt tccccaagcc acacggtagg tcgagtacac 44580

ctgctcagcc tgcagaggcg gcctgccctc ctgcctgtcc tgtcgccacc ccatggggca 44640

aggctggtgc ccgcatttca gaagtgggaa cggggacctg gaggtcaagt ggcttttccg 44700

ggcatttgag ggggtccagc gctcatgagg actgtgctgc tgcctgtcct ccaagagacc 44760

cgcccctccc tcgtcagccc ctccatgctg atgggggcat ggggcatgag cttcctagag 44820

tttggctgct gggaaggggc tgggtggctg gactctggtc atcttcatct tggtgtgatg 44880

ggagcctgag tgtgcagctg cgccctgggc ggccagcgtg gacagacttc agagtgagct 44940

gggggcacca ggcacctgca ggataccgtt ccgaaagatc tagaagcccc atgacccggc 45000

ctggcagggc ccccgggcga ccctcactcc cacatatggg caacacacac acgtgtttgc 45060

aggcatgcga cggagtgtgc cagccagccc gaggggtgct ggccgctaga ggagggtgag 45120

gggcgtctgc agcatggctg cggcacgtgg ggcccaagtc agggccgggc ctgcccctcg 45180

gtggcctcac accccaagtc agggccgggc ctgcccctcg gtggcctcat accccaagtc 45240

agggccgggc ctgcccctcg gtggcctcac acctgttctc tcacagcagc tgcctctgtt 45300

ctttccactc ccagaaatgc tcatttttca cggctctgct cagaagattt cccagggcca 45360

gggccagggc caggctgtgg gtggggtgag cgatggcgcc ctgcgttctg atccagcctc 45420

gcccccagct gctgtgtggt ctctgagagg ggtgggctca gggcctgggc ctctcctgcc 45480

ctgatctccc tgttaccctg gcctcggagc ctcccagcag cccctgcagc cctggaggcc 45540

tgtgaggaca ggactggtct ggttcatctg tcccgtcaag cccccatccc atttgacaga 45600

aggggaatag gctccgagag gctgtgactt gcctcggcct gcagagcacg gagactgtca 45660

gagctggggt ggggcctatc gtccagcccc acagcctgcg gtctcagccc gggcacctgg 45720

cgcctcagcc accaggagag cccccgagtc acagatgggg acactgggcc ggtggcagcc 45780

aggccagagc cagggcatct gacgacagcc gtgttctttc caccacacct ggctttccct 45840

ggtgtttggg aaatggctgt gttctgggaa atctttagtc aggtccaggg aaaacaggcc 45900

cggcaggtct ctctccccag ccccaggccg gcctgtcact tcttctaggc agctggccac 45960

ctctgtcccc ccagaggctt ggggagggca ggagtaccac ccctatcttc caggcagagc 46020

cacccagaag gctggcaggg gtacacagga gaccctggag cctggccatg tccctcaggc 46080

ccccttggtc tctagagacc ccccggggta tagacagggc cccgctgctc cctgggtgcg 46140

tggttcgggg agatgaggtg gtataggaca gtctgtggtc tgtctgtacc tggcaaggtc 46200

atcacgtgcc tgggcttggc aggacagacc ctgggtcttc ggccagggtg ggagctgcta 46260

ccaggaaggc ctgcaggaac tgtgagcttg agtgaggaag taggaaggtg tcaggcagac 46320

ctcagggacg gctggggcct gtgcccgggg aggctgtcct gtggccctca gaggagcagc 46380

tgtggatgtg gccgcctccc acgctcctgg ctgggcaggt gtgggctgga gaggtggcgt 46440

cagtgcgata cacctgacct tgcccctgtc cgtgaccttg gcaggatgat gatgagaggg 46500

atgtggatgc cagcccgacg gcagggctgc aggaagcagc aacgctggcc cctacacgga 46560

ggtcacggct ggccgctcgt ttccgagtca cggcccactg gctgctggtg gcggctgggc 46620

gggtcctggc cgtaacactg cttgcactgg caggtacgca ccgaggcagg gggcactggc 46680

agtcacactg ggaggggtct tgggagttcc ctgatgactg tggagacagc gggacacatg 46740

gcactggcca ggtaccaccc tgtgtgcccc tgccccgcag gcatcgccca cccctcggcc 46800

ctctccagtg tctacctgct gctcttcctg gccctctgca cctggtgggc ctgccacttt 46860

cccatcagca ctcggggctt cagcagactc tgcgtcgcgg tggggtgctt cggcgccggc 46920

catctcatct gcctctactg ctaccagatg cccttggcac aggctctgct cccgcctgcc 46980

ggcatctggg ctaggtaacg gcttgccaca cagccccttt ttcctgccac cctggtcccg 47040

cccacctggc tcgtctagcc cctgtggccc cactgcctct ggggtggtag gctgtgacgg 47100

gtcttctctg gacagggtgc tgggtctcaa ggacttcgtg ggtcccacca actgctccag 47160

cccccacgcg ctggtcctca acaccggcct ggactggcct gtgtatgcca gccccggcgt 47220

cctcctgctg ctgtgctacg ccacggcctc tctgcgcaag ctccgcgcgt accgcccctc 47280

cggccaggtg agcacctgcc acccatggtg ggtgggctga ggccaggcca tggggctggt 47340

ctcaggacct cctgcctctg ggtggggtgt ggagctggtt tgggctcaag acgctggtct 47400

ctgcagagga aggaggcggc aaaggggtat gaggctcggg agctggagct agcagagctg 47460

gaccagtggc cccaggaacg ggagtctgac caggtgagca gccaggcagg tggagacgcc 47520

agcgtggggg gcgcccggcc agcccgtgca tggctcagcg ctgcttgccc acagcacgtg 47580

gtgcccacag cacccgacac cgaggctgat aactgcatcg tgcacgagct gaccggccag 47640

agctccgtcc tgcggcggcc tggtgagtac cgcacactgc aaggtatggc tgggtgcggg 47700

gggcggggcg gaggccggtg ctgccccctg gtggccgcct ggcgctctcg catgctcgcg 47760

ccgcacctct gcctgccgcc ccctcggggg cccaggacat ccacgggtcg gtgtcagtga 47820

cccccgagac ccccagggca gccgagtggc catgtcactg accaaccccc aagaccccca 47880

gggcagctga gtggccgcgt cgttgatccc caagacccca tggggggcct ccaggtcccc 47940

caacccctcc ccagagaatg tggctatgct gtcttgtgct gttagctctg ggagctgctc 48000

caggtggccc agtggcccca ggaggccgct cgtccagggc aggggctggc ctgggaactc 48060

tgtgttggcc acgtcgcctt gggagggcct gggggctctt tctggctact ttctttcttt 48120

accctaaccc ttgattttcc attttgcaat gtgtttctga atgaagcaaa tgaagccacg 48180

gccctggggt gggggtcctg agagtcttca ggtgcgcaga gctggaaagg gggtcagggc 48240

cacctttccc accctttcaa ggaaagtgag gcccagagaa cggcaggtgc tggcagggcc 48300

atccctgacg ctcagggacg gtgtcagccc aattgccgga gccctcgtgt tctgcccata 48360

gcccaccggg ggcctgtctc tcctgctgtg tgcttgccca gggcccagat tttagggcat 48420

agtcagggtg gggaggcctg cagatcaacc tgccgaagct gaccgctgtc cccacctgca 48480

gtgcggccca agcgggctga gcccagggag gcgtctccgc tccacagcct gggccacctc 48540

atcatggacc agagctatgt gtgcgcgctc attgccatga tggtaggcgg ctgtgggggt 48600

tggggtgggc ggccccctct gccgcgcagg tgtggggcat cgcctgggtg gggtgcgctg 48660

ggcagctgtg cagccccctc tgccgcgcag gtgtggggca tcgcctgggt ggggtgcgct 48720

gggcagctgt gcagccccct ctgccgcgca ggtgtggggc atcgcctggg tggggtgcgc 48780

tgggcagctg tgcagccctc tctgccgcgc aggtatggag catcacctac cacagctggc 48840

tgaccttcgt actgctgctc tgggcctgcc tcatctggac ggtgcgcagc cgccaccaac 48900

tggccatgct gtgctcgccc tgcatcctgc tgtatgggat gacgctgtgc tgcctacgct 48960

acgtgtgggc catggacctg cgccctgagc tgcccaccac cctgggcccc gtcagcctgc 49020

gccagctggg gctggagcac acccgctacc cctgtctgga ccttggtgcc atggtgagtg 49080

tgcaccacca catccggggg tgcctgggtg cgcagaccca tcagggttgt cgtcctgttc 49140

aatgtccact tgcccggggg agtggcagcg ccaagaaggc agatgtgtct gtctgtcccc 49200

ttctgcccac ccagagccag cccagagtag cttctcagtg agcgtttgtt gactgaataa 49260

acagacaacc ttgtgttggc acgggcacca cccctgtgcc ctgacactgt gtgagcgtgg 49320

gctctgttgg cacgggcacc acccctgtgc cccgacactg tgtgtgagca tgggctatgc 49380

ccattggcac aggcaccacc cctgcgcccc tgacagtgtg tgtgagcgtg ggctctgccc 49440

attggcacca tgcacagccc tgggtctcag tgacaagctg tgcaggccat gtgttcacag 49500

ggtgcctgcg tgtccatgtg aaacgggtgc cagcatcgtg tctggacacc tgtttgcagg 49560

ccagtgggtc tcatcttgtg aaacttgtga gcctgtgtgc caacatatgc acctgtgagc 49620

ttgtgtgcat atgtgagcac gcatgtgggc aaacatgcac tccagcatgt ggacatgtgt 49680

gcaggtgcgt gcatggatct gtgcccacgt gaactagtga acccgtgtgt gactctgcgt 49740

gtgagcgcaa gtgaacccat gcactcatcc atggatgtga gagtgtgtgc tcgtgtgcct 49800

ctgagtgggt gtgagcgaga gggtgttcgg tgcctgtggg gaggctgcgg tggatgggct 49860

ggtgccagcc gcctgagagc tcttgccccc tgctatagga gggtgctggg tcccccggct 49920

gtgggagggg tgctgggccc cccggctgac tgtgacaccc tgcgcttgtc acagttgctc 49980

tacaccctga ccttctggct cctgctgcgc cagtttgtga aagagaagct gctgaagtgg 50040

gcagagtctc cagctgcgct gacggaggtc accgtggcag acacaggtga gtggtgggcc 50100

agaggcgggg gttgccctcc tgcctgcccg ccctgatgcc atcgcctgcc cctggcttgg 50160

cccacagagc ccacgcggac gcagacgctg ttgcagagcc tgggggagct ggtgaagggc 50220

gtgtacgcca agtactggat ctatgtgtgt gctggcatgt tcatcgtggt cagcttcgcc 50280

ggccgcctcg tggtctacaa gattgtctac atgttcctct tcctgctctg cctcaccctc 50340

ttccaggtgg ctggggggcc gggatggggg ctggggcacg gaccctcccc gcggtcctca 50400

ccacccccac ctcacccggc aggtctacta cagcctgtgg cggaagctgc tcaaggcctt 50460

ctggtggctc gtggtggcct acaccatgct ggtcctcatc gccgtctaca ccttccagtt 50520

ccaggacttc cctgcctact ggcgcaacct cactggcttc accgacgagc agtgagtcca 50580

ggctggggcg gtggggcagg ggcgccgaaa ccccgtgcac ttccccgggg ctgcagcggc 50640

tctgccgggg gccgggccgg tgctgatgct gcccctccac aggctggggg acctgggcct 50700

ggagcagttc agcgtgtccg agctcttctc cagcatcctg gtgcccggct tcttcctcct 50760

ggcctgcatc ctgcagctgc actacttcca caggcccttc atgcagctca ccgacatgga 50820

gcacgtgtcc ctgcctggca cgcgcctccc gcgctgggct cacaggtgcg gccccgccct 50880

ccctgtccgg ccctggagag gtgtagcctc ctgggccagg gagggagcca ggtgggagtt 50940

ggacaggagc cacatcttcc accttcagat cccaaggggc atttgctcat accaagggga 51000

tggcagtagc gtggaggtca cagggacagt gggcatgagt tgcgacacag ctgtgcacct 51060

gaactggcag ctgcagcaga agcggtgccg acagggcttc ttccagcccc aggaaatgag 51120

gggcaggaac ccagttggga gatgacattt tcggaccctc tcccaggcag gatgcagtga 51180

gtgggacccc actgctgcgg gaggagcagc aggagcatca gcagcagcag caggaggagg 51240

aggaggagga ggaggactcc agggacgagg ggctgggcgt ggccactccc caccaggcca 51300

cgcaggtgcc tgaaggtggg ttgggcgggc agagcacagc tgccacccag tctgctgtgc 51360

catgtcccag ctcggggggc gttggcagag tcccctctgg gctccagagc ctcttcctca 51420

caggggaccc gggaatcccc gtttgtgccc cgcactgacc ctcacaccat cacaggggca 51480

gccaagtggg gcctggtggc tgagcggctg ctggagctgg cagccggctt ctcggacgtc 51540

ctctcacgcg tgcaggtgtt cctgcggcgg ctgctggagc ttcacgtttt caagctggtg 51600

gccctgtaca ccgtctgggt ggccctgaag gaggtgagtg tggcaggcaa ctcagcttcc 51660

catctggggt ggggtcgctc tggcctgccc agctggcctc cccaagccca gccccacgtg 51720

cccactgccc tccccaagcc cagccccacg tgcccactgc cctcaggtgt cggtgatgaa 51780

cctgctgctg gtggtgctgt gggccttcgc cctgccctac ccacgcttcc ggcccatggc 51840

ctcctgcctg tccaccgtgt ggacctgcgt catcatcgtg tgtaagatgc tgtaccagct 51900

caaggttgtc aacccccagg agtattccag caactgcacc gaggtaccgg cccccgaggg 51960

ctgggacggg aggaagctcc aggcaactct gtattcgcag cccgaccctc ctggggcagc 52020

tgcctcagtg cagtggggcc agcaatggag atggaggact ctcccctggg ggcgccaagg 52080

gggcttcctg gaggcagcat ccttcgacct caactgtgga ccaggggcgc actccctgca 52140

cacaagggtg tccagtaggg gcggagtccc agggtctccg gcagtgagga cgggagggcc 52200

ccacccctgg acagggagag acagtcaggc atctctgcct gggaccttct cgcacatccc 52260

tccttctccc tggacctctc ttcactcccc cagcccctgc ccgtggtctc cctgtttctc 52320

aaacacctgg tccccttccc cgtgaaggtg gctccaaggc tggcagcccc cgtgtccctg 52380

gctggggagc agtggacctg ccccagagct gtggctgtgg tgggctccgg gcagggccag 52440

ggggcactgt ggcctgggag ggggcactga tgcctggcct cttgccagcc cttccccaac 52500

agcaccaact tgctgcccac ggagatcagc cagtccctgc tgtaccgggg gcccgtggac 52560

cctgccaact ggtttggggt gcggaaaggg ttccccaacc tgggctacat ccaggtgagt 52620

tgaagggctg gtgggcggct gggcgggcga gtacccggct gccccctgac ccttgccctc 52680

cgcagaacca cctgcaagtg ctgctgctgc tggtattcga ggccatcgtg taccggcgcc 52740

aggagcacta ccgccggcag caccagctgg ccccgctgcc tgcccaggcc gtgtttgcca 52800

gcggcacccg ccagcagctg gaccaggatc tgctcggctg cctcaagtac ttcatcaact 52860

tcttcttcta caaattcggg ctggaggtga ggcaaggaca ttgcctcccc ctggggcagg 52920

gcttggcctt cgggagggag ggacggctgc accgtgcagg caccgcaagc ctggccccac 52980

ctgggtttgc ctgggccaca gagggtgggg gactcagggc caggcacggc ttccctggac 53040

tcctgtggtg tgtcggtgct gacaacaggc agggggccaa gttagatctg ctctactgta 53100

cagcccacct cctggagcct cagtttcccc tgcacgatgg caactgccag ccactcctgc 53160

cctcttgaca gcgccgctgg ccctgtcctt gcttgatgcc cgcagcctcc aggcagggct 53220

gctgcaagcc tgaggcctgc tgggtgggac aagaaagtcc ctccccccag actcagtgca 53280

tccccacacc ccgccctctc ccctccccag atctgcttcc tgatggccgt gaacgtgatc 53340

gggcagcgca tgaactttct ggtgaccctg cacggttgct ggctggtggc catcctcacc 53400

cgcaggcacc gccaggccat tgcccgcctc tggcccaact actgcctctt cctggcgctg 53460

ttcctgctgt accagtacct gctgtgcctg gggatgcccc cggccctgtg cattggtgag 53520

gggcacgtgg cttgggtggg agtgggcttt gtggctttgt ggatgcccgt gggggtgttt 53580

cccgcctgcc ccagactcct gtccaccctc ctagacttag ccttggcctc ctccagtccc 53640

tcctctctgc tccacatcct acccaggcgc catcacctgc atcctgtctc tcgggggcgg 53700

cctggccccc tccaggctct gctgttctct tttccttttt tgcccagtat tctatcttga 53760

aatatttcaa accttcagga aagttgtgag tcacacaagg agcactgcgt cctctccggg 53820

ccccgtgcgg gtcggccgtg atgcctcaca cccaagtgct gcctcgagca tgcgtctcct 53880

gggtgagggt gtctgagccc acagccccac acccgtggtc ccgtctcctg gcagtgccat 53940

cgtcaaacgt gtcctctgca ttcaaacagc cccggcctca gcacccttct ttgtggccat 54000

ttggttttca gacgggatct ggtctgatgt ttgctctagt ctcttgtctt gggtctaagc 54060

cgcccccgcc tctcctgtct cttgggaagt tccggaggga ggccggtagc gttgctgacg 54120

ccgtgagact ggatttgcgt ggctgtcctg gtgctgcagg tctgctcaag gcacacagca 54180

ccctgcggtc tgagatgggg agtcacattt gtgcacgtgg ccggctcagg ggcgtcccac 54240

ctgccccaca gtggcaccca gcctgttggc actggtgggc tgtgtggggt cagccttgtg 54300

gttttacgaa acagactttc tctctgctgt ctctgtgtgt ctgtcagctg ggattcccat 54360

caaggacagc tgccatttgt tactggctgc tttccaagaa ttctgtcatc cgcagaccct 54420

gggcctcccc tctgctgagt gggtcctggc ccctccggcc acacactgtt acatcatctc 54480

cccgtatttg gctgggcatg gtggttcacg cctgtgatgc cagcactttg ggaggctgag 54540

gcaggagcat cccttgaggc caggagtttg aaaccactct ggtcaacata gcaagaaccc 54600

tttttttttt tttttttttt tttgagatgg agtcttgctc tgtcacccag gctggagtac 54660

actggcacaa tctcggctca ctgcagcctc cgcctcccgg gttcaagcaa ttctcctgtc 54720

tcagcctccc tcgtggctag gattacaggc aagcaccacc aggcccggct aatttttgta 54780

tttttagtag agacggggtt tcaccatctt ggccaggctg gtcttgaact cctgacctca 54840

ggtgatccac ccgcctccca aattacaggc ctccctcctg ggattacagg cgtgagctgc 54900

cacgcccggc cccgtcttgt tttctgctcc caggcgctgc tgcctcatct tctgctaccc 54960

aggcccagcc ttgtgctcac agccattgct ccagggagcc caatcgagtt ctaggagcgt 55020

gaggtttaga gcccggggtc tgggcgctgg gtgtgcctgt tgctacaggg ctgcctcagc 55080

ctctgggccc tccagctctt ccttgttgaa acatctgctt tcgagcatca ccgaggccag 55140

ctccccgtct cctgtccacc tcttccttgt tgaaatacct gctatcaagc gtcacctagg 55200

ccagctcccc ttcttctgcc tccttccacg cggctgcgcc atgcagtcgc catcctgtga 55260

gatcagcatg tcctgggttc cccaacatcg agggtaactt tgtttttgta tcgtgaggtt 55320

ccctctgtgg cagatggggc tgtgggttca gcatgtcctg ggttccccag catcgagggt 55380

cactttgttt ttgggtcgcg aggttccctc tgtggcagat ggggctgtgg gttcagcatg 55440

tcctgggttc cccagcatcg agggtcactt tgtttttgtg tcgcgaggtt ccctctgtgg 55500

cagatggggc tgtgggttca gcatgtcctg ggttccccag catcgagggt cactttgttt 55560

ttgggtcgcg aggttccctc tgtggcagat gggggctgtg ggttcagaat gtcctgggtt 55620

ccccagcatc gagggtcact ttgtttttgg gtcacgaggt tccctctgtg gcagatgggg 55680

ctgtgggttc agcatgtcct gggttcccca gcatcgaggg tcactttgtt tttgtgtcgc 55740

gaggttccct ctgtggcaga tggggctgtg agatcagcat gtcctgggtt ccccaacatc 55800

gagggtcact ttgtttttgg gtcgcgaggt tccctctgtg gcagatgggg ctgtgggttc 55860

agcatgtcct gggttcccca gcatcgaggg tcactttgtt tttgggtcgc gaggttccct 55920

ctgtggcaga tggggctgtg ggttcagcat gtcctgggtt ccccagcatc gagggtcact 55980

ttgtttttgg gtcgcgaggt tccctctgtg gcagatgggg ctgtgggttc agaatgtcct 56040

gggttcccca gcatcgaggg tcactttgtt tttgggtcgc gaggttccct ctgtggcaga 56100

tggggctgtg ggttcagcat gtcctgggtt ccccagcatc gagggtcact ttgtttttgg 56160

gtcacgaggt tccctctgtg gcagatgggg ctgtgggttc agcatgtcct gggttcccca 56220

acatcgaggg tcactttgtt tttgggtcgc gaggttccct ctgtggcaga tggggctgtg 56280

agttcagcat gtcctgggtt ccccagcatg gagggtcact ttgtttttgt gtcgcaaggt 56340

tccctctgtg gcagatgggg ctgtgagttc agcatgtcct gggttcccca gcatggaggg 56400

tcactttgtt tttgtgtcgc gaggttccct ctgtggcaga tggggctgtg agttcagcat 56460

gtcctgggtt ccccagcatg gagggtcact ttgtttttgt gtcgcgaggt tccctctgtg 56520

gcagatgggg ctgtgagttc agaatgtcct gggttcccca gcatcgaggg tcactttgtt 56580

tttgtgtcgc gaggttccct ctgtggcaga tggggctgtg agatcagcat gtcctgggtt 56640

ccccaacatc gagggtcact ttgtttttgg gtcgcgaggt tccctctgtg gcagatgggg 56700

ctgtgggttc agcatgtcct gggttcccca gcatcgaggg tcactttgct tttgggtcgc 56760

gaggttccct ctgtggcaga tggggctgtg agttcagcat gtcctgggtt ccccagcatg 56820

gagggtcact ttgtttttgt gtcgcgaggt tccctctgtg gcagatgggg ctgtgggttt 56880

cgcagatgcg tggagtcaca tccatgccct cagtccttag ggaccgaccc tccctgcctc 56940

acacgcctcc caggaagtgt ggccgggggc cggcagtgcc acggctccct ccccagcagg 57000

ccccggccgc tcccatcccc agcacgtggt cctatcagaa cgccacgtca gcaggactcc 57060

cagcaggtgg cctttaggtc tggcttcttt cacttggcag agcacactga ggtctgtcta 57120

ggctgtcgca tggatcccgg tcccacgtgc tgagcagcgc gttcccagct gtggttgctg 57180

caggttgaac ttttcctggc tgcaggcgtc cgtgcagctt ctggccgttg ttttcagagc 57240

tgtcctatca cacgcactgt cctatcatgg aatatgacgc cgtgtgggcc acaactcagg 57300

cccagcagcc cccacccccg tgctctctgg cctcctgctc agttcctttg cccccagggg 57360

cttggtgcag agttgaagga atctgtgtgt gtgaacacac aggacactag agctgtcagt 57420

tctcgagaca ccaggtgtgc gcgaggtgat tcccatggac cctgagggct ggtgatagac 57480

tcgggtcaac gggtggggac cgggtgtctc aggccccagg caggcccggc ccttcctgac 57540

atgacacccc ttcccccaga ttatccctgg cgctggagcc gggccgtccc catgaactcc 57600

gcactcatca agtggctgta cctgcctgat ttcttccggg cccccaactc caccaacctc 57660

atcagtgagt gccccccacc acccccgcct ctgcagagga ccctcagagt acattcacgc 57720

ccccaaatct gctcacaagt gtgcacacag gcgtgcacgg gcggaggtgt ggtcaggcac 57780

atggcggcct gcaggccctg acctcgcacg cacgcacgca gacctcagcc tgtgtgcacg 57840

gcagcccttg tgcagatgcc ctcacaccgg ggctccccca gggacacccg gccactcacc 57900

caggcagacg tgtgtccgct cccagcggct gcacgccgac aggcctgggg tgggaggtgg 57960

gatttatgcg ccgtgcccac ctcgtgtggg tccccgtgtg gcacagcggc ggctcctgtg 58020

tcctgcaggc gactttctcc tgctgctgtg cgcctcccag cagtggcagg tgttctcagc 58080

tgagcgcaca gaggagtggc agcgcatggc tggcgtcaac accgaccgcc tggagccgct 58140

gcggggggag cccaaccccg tgcccaactt tatccactgc aggtgggttc cacgtcaccc 58200

tccacgggga accttctggg aggggtggcc ggggcgcccg ccctgacgct ccggcctggc 58260

aggtcctacc ttgacatgct gaaggtggcc gtcttccgat acctgttctg gctggtgctg 58320

gtggtggtgt ttgtcacggg ggccacccgc atcagcatct tcgggctggg ctacctgctg 58380

gcctgcttct acctgctgct cttcggcacg gccctgctgc agagggacac acgggcccgc 58440

ctcgtgctgt gggactgcct cattctgtac aacgtcaccg tcatcatctc caagaacatg 58500

ctgtcggtga gcctccggcc cccccgcacc caccgccctg gggccccgct ggccccgctg 58560

accctgctct cccccagctc ctggcctgcg tcttcgtgga gcagatgcag accggcttct 58620

gctgggtcat ccagctcttc agccttgtat gcaccgtcaa gggctactat gaccgtgagt 58680

ggccaggacg gtggcggggg agggcgtggg gaagccccct gctcctgggc cctgggcctg 58740

acccttgccg gtgcctgcct tgcagccaag gagatgatgg acagagacca ggactgcctg 58800

ctgcctgtgg aggaggctgg catcatctgg gacagcgtct gcttcttctt cctgctgctg 58860

cagcgccgcg tcttccttag ccattactac ctgcacgtca gggccgacct ccaggccacc 58920

gccctgctag cctccaggca agcttgggcc cagacacagc ccagagctcc cgtcttgggg 58980

ctgggagggg gcaatgggag gttcctcact gtctcaggcc ccggcccgtg gagggcaggc 59040

tctgccactc tgtgacatgg gcgtgtcatc tagagggaga atgaaggccg gcagatcccc 59100

ggcaccatca cactctgccc cagtgctggg tctgtcagag accacaggct gcagtgctga 59160

cggtggctgg tgtctcaccc ccagccaact ttcccactaa gggctaagtt tctccaccag 59220

cgggagggcc actgtgtggt gtcacgactg ccccagggag gggttctggc ttggggccag 59280

ctttgccttc ttccctgcag ctgtggtggg gtgggtgcca ccagacgccc ctgcatctgt 59340

acggcagaag ggcctgtcct cgccgcagac agcacggagg gtgggggcag cagatgcctc 59400

ccccgtgggt gcctcttgtc cagcgtgggc agagaggagc aggctgagct gtcccgggct 59460

gagcggggag cggcggctgc ccatgttgct ggggtcgagt gcctggtgct cacaccccat 59520

ccccgcctcc ctacaggggc ttcgccctct acaacgctgc caacctcaag agcattgact 59580

ttcaccgcag gatagaggag aagtccctgg cccagctgaa aagacagtag gtgcctctgg 59640

ggcggggact ccccggctcc tccccccaat gctcagcata ccccaccttt ccccaccaca 59700

ggatggagcg tatccgtgcc aagcaggaga agcacaggca gggccgggtg gaccgcagtc 59760

gcccccagga caccctgggc cccaaggacc ccggcctgga gccaggtgag tgcagctgga 59820

gtcgggcacc cagggccccg tgtccagcat gtctgtgcct gctggcgtgt gctgcgtctg 59880

tgcccatgtg acgtcccaca gggctcccag cccgcctgtc ctgtccgcat gatcaccctc 59940

tgtctggcag gccccatggc cgccctgtga ctgtccgtcc acgcacatgg gctctgagcc 60000

ccatggcccc acacggcccc cgtcactgtg ggtgtccgtg tctgtctcca cctatcctgt 60060

ctccaagacg ggagcactca cagccccgac ccctcctggt ggcttgactg ctgcctcatg 60120

ctcaccctgc ccctccacag ggcccgacag tccagggggc tcctccccgc cacggaggca 60180

gtggtggcgg ccctggctgg accacgccac aggtaccccc aattaggccg cctgtggcca 60240

ccctctcagg ccctctgtgc ccccatctgt cctctgcctg gcctgctatc ttcccctccc 60300

ttcccccgac tcccaggccc tgagcgtcag gacgtgctca ggcctcctgg gtcggggggt 60360

gcctcactgg ctgcagaccc ctgggctgac tatgtcctct cctggctatg ccccagccct 60420

tccaacagtg ggagtctcgg agcttgcccc gatgacacat ggtggtcgag cagcgatctc 60480

acctgggacc cagcagcact gcgttattct gtttttgttt ctttttgaga tggagtctcg 60540

ctctgtcact gcaggctgga gtgcagtggc atgatctcag ctcactgcaa tctctacctc 60600

ccgggttcaa gtgatcctcc tgcctcagcc tcccaagtaa ctgagactac aagcatgtgc 60660

cccactccag gccttttttt tttttttttg gagacggtgt cttgccctgt cgcccaggct 60720

acagtgcaat ggcgtgattg cggctcacta caacccccac ctcccaggtt caaaggattc 60780

tcctgcctca gcctcccaag tagctgggat tacaggtgcc cgccaccacg cccagctaat 60840

tttcgtattt ttagtagaga tggggtttca ccatattggc caggctggtc tcgaacctct 60900

gacttcaggt gatccgcccg cctcagcctc ccacagtgct gggattacag gcgtcagcca 60960

ccgtgcccgg cctgttctgt ttttctaact ctcacacagc ctcctgggtt ttccccggtc 61020

ctctgcagtc ggcccactct gcaccccagc ccgcgctggc tctgctcctc agctgccctg 61080

cccacctctg tcttgtccca ccgcgctggc ctgtgtcttg tgcctgcact gctcccggct 61140

actccgcatg ggaagggtgg ctctcgggcc ttggcccatg caggcggagg gggtctggct 61200

gggagtctcc ctgcatggaa ggctggctct cagtgctgcc tgcccacagt catccactcc 61260

ggggactact tcctgtttga gtccgacagt gaggaagagg aggaggctgt tcctgaagac 61320

ccgaggccgt cggcacagag tgccttccag gtgaggtggg agagccccgt cggccccact 61380

ccaaccacag agcttgtggt cctggaccag ggcagcatag agggtgtcag atgcccccag 61440

ggcctgggag ccgagctcct ccacctccag ttagcccacc ccgccccatc caggcctccc 61500

aagtcccatg ggaaaccagg ctacagggac atgggtcatg tgtagcctgc tgccccacgg 61560

tcttggctct gaccacccag gttctggtgg ctgcccgtgg cctgacctgt gagaccggcc 61620

caacaccttt gtgctggccg cctggctgtc ctgggtccat ctttgggccc ctggctcttg 61680

gtgttagacc agcccaccca actcctgaat gggtgggagt cttcccccac agcccctcag 61740

ggtccccatc cgggaggggc tcagggacac ggaggtccct gggagacaca gagcagggat 61800

ctggatctgg cgcccggctt gcccaacccc agcttcccgc ctgggtctga tggctcggga 61860

ggccgggtcc taacccgggg gctggccgac agctggcgta ccaggcatgg gtgaccaacg 61920

cccaggcggt gctgaggcgg cggcagcagg agcaggagca ggcaaggcag gaacaggcag 61980

gacagctacc cacaggtgag ctggggggcg tggggactct gaggggaagc cgcgggactg 62040

ccagtcactc accagcatcc tgtgcccagg aggtggtccc agccaggagg tggagccagc 62100

agagggcccc gaggaggcag cggcaggtac gtgggcccgg ggctggggag tgggaggtct 62160

ctcttggccc cacaggctgc ccctccagcg ccccctcccg ccctcccgca ggccggagcc 62220

atgtggtgca gagggtgctg agcacggcgc agttcctgtg gatgctgggg caggcgctag 62280

tggatgagct gacacgctgg ctgcaggagt tcacccggca ccacggcacc atgagcgacg 62340

tgctgcgggc agagcgctac ctcctcacac aggagctcct gcaggtgagc ctgcccgtgc 62400

accacgctcg tccctgctct gcctgactac gcccctgcct gcttaacagc ctagtcccgc 62460

gcccactgca cgaaaccccg tgtggggaca agagctggac gcagccctga gccccctgct 62520

gtgccctgca gggcggcgaa gtgcacaggg gcgtgctgga tcagctgtac acaagccagg 62580

ccgaggccac gctgccaggc cccaccgagg cccccaatgc cccaagcacc gtgtccaggt 62640

aggtgcgggg gtgacccgag ccccagctgc tgcccctggt gtgtgggcat cgcctagcca 62700

tccccgaccc tcgccattcc cttgtacccc aaaggaccgt gggcactttc caccctgacc 62760

ctccctgtag cctggggtca ggccatagag caggattctc tgtgactcgg cttccctccc 62820

cagtgggctg ggcgcggagg agccactcag cagcatgaca gacgacatgg gcagccccct 62880

gagcaccggc taccacacgc gcagtggcag tgaggaggca gtcaccgacc ccggggagcg 62940

tgaggctggt gcctctctgt accagggact gatgcggacg gccagcgagc tgctcctgga 63000

caggtggggg cgggacgcgc acaacaccag cctcaccatg gccctcgggg agcagccgaa 63060

caggggcagg agactgactg tgaccggcaa cagatcgggc cgtcatgcct tcgggcagtc 63120

ccagactccc ccaaacacgc gggtctccct gtaggcgcct gcgcatccca gagctggagg 63180

aggcagagct gtttgcggag gggcagggcc gggcgctgcg gctgctgcgg gccgtgtacc 63240

agtgtgtggc cgcccactcg gagctgctct gctacttcat catcatcctc aaccacatgg 63300

tcacggcctc cgccggctcg ctggtgctgc ccgtgctcgt cttcctgtgg gccatgctgt 63360

cgatcccgag gcccagcaag cgcttctgga tgacggccat cgtcttcacc gaggtgggcc 63420

gaggccgcgg gggagggggc gcccggccca ccgcgccgtg accctccccg cgtgctgagc 63480

cccctccccc acagatcgcg gtggtcgtca agtacctgtt ccagtttggg ttcttcccct 63540

ggaacagcca cgtggtgctg cggcgctacg agaacaagcc ctacttcccg ccccgcatcc 63600

tgggcctgga gaagactgac ggctacatca agtacgacct ggtgcagctc atggcccttt 63660

tcttccaccg ctcccagctg ctggtgagtg tgagccttgg ctggcaatgc ggggctgggc 63720

aggccctctg ggcacctgtg ctctccacca gggaggcaag gccccctcac cacaccctcc 63780

cgcccctcag tgctatggcc tctgggacca tgaggaggac tcaccatcca aggagcatga 63840

caagagcggc gaggaggagc agggagccga ggaggggcca ggggtgcctg cggccaccac 63900

cgaagaccac attcaggtgg aagccagggt cggacccacg gacgggaccc cagaacccca 63960

agtggagctc aggccccgtg atacgaggcg catcagtcta cgttttagaa gaaggaagaa 64020

ggagggccca gcacggaaag gagcggcagc catcggtata agcgccctgc ctcacaacct 64080

cctgcctacc cagttttctg agtggggcta ctgcagggag ggtctttctc agatgagacg 64140

gccaagccca gtgcgaggcc cacctggatc ccaggaaggt gccacttctg agccacagct 64200

cccggctctg cctacagagc cgtccctgac tgctgccccc ggggatgctc cccacgtgta 64260

gggtgactgt tggcctgggc tggcccctca cagttgcccc agacagagga cacagcccca 64320

gctgtctcct tgccagtgac actgggagct ttcctgtgct ccgtctgctt gtctgtcaaa 64380

cagggagaat gccagcctct tagggtggtc aggagccatg agccaggccc agtccccagg 64440

gggcccaggc agaagtcagc ttttccctac agaagctgag gacagggagg aagaagaggg 64500

ggaggaagag aaagaggccc ccacggggag agagaagagg ccaagccgct ctggaggaag 64560

agtaagggcg gccgggcggc ggctgcaggg cttctgcctg tccctgtgag tgatggcggc 64620

cgggggcagc tggggagtgg gggtggggag gcgggtactg ggcccaggct gagcgccccc 64680

ttccgcaggg cccagggcac atatcggccg ctacggcgct tcttccacga catcctgcac 64740

accaagtacc gcgcagccac cgacgtctat gccctcatgt tcctggctga tgttgtcgac 64800

ttcatcatca tcatttttgg cttctgggcc tttggggtga gccaggcccg ggacccaaac 64860

ccagtgtacg cagagctcag cagccaccca catcccctgg gcttggctcc ccctgacctg 64920

tgctctcctg gccacagaag cactcggcgg ccacagacat cacgtcctcc ctatcagacg 64980

accaggtacc cgaggctttc ctggtcatgc tgctgatcca gttcagtacc atggtggttg 65040

accgcgccct ctacctgcgc aagaccgtgc tgggcaagct ggccttccag gtggcgctgg 65100

tgctggccat ccacctatgg atgttcttca tcctgcccgc cgtcactgag aggtgggccc 65160

acgcgtgggg gcgctcggtc tccaggggcg gggcagtgca ggctgggggc cctgcggggc 65220

tgtttctgat ggggtccttg acctggccat cccgccccag gatgttcaac cagaatgtgg 65280

tggcccagct ctggtacttc gtgaagtgca tctacttcgc cctgtccgcc taccagatcc 65340

gctgcggcta ccccacccgc atcctcggca acttcctcac caagaagtac aatcatctca 65400

acctcttcct cttccagggg tgagtgcagg tccgccgggg tgggggtcac ggcccgggca 65460

tgagggagcc cacctgacgg gaaccctggc tgtgggcagg ttccggctgg tgccgttcct 65520

ggtggagctg cgggcagtga tggactgggt gtggacggac accacgctgt ccctgtccag 65580

ctggatgtgt gtggaggaca tctatgccaa catcttcatc atcaaatgca gccgagagac 65640

agagaaggtg cctgggccca gggcgggggc cgggacaagg gccagggata tgccctctcc 65700

ctaagacaga ggcactgctg ccacgagaac ccgtggtgct ggaggccctc ccagggctcg 65760

gagcccatgg ggacatgagg cgagcccacc cactagctga tcacgaggcc agtgatcttg 65820

gcagctgcga gtgagtgctg ggcgcagaag tgggcagcgg agttggtcct gttccaggca 65880

ggctggcagc agagcagggc ctggtgcagg gaggaccgga cagccactgt ttgctgcatt 65940

cttgtttaat ggcctttctc agagagaatt cgtgcgtcag accactcccc cacgtaaaaa 66000

gtacaactca ggggtttcta gtggattcac agttgagcat ctgccttctc accacttcaa 66060

aaagaaaccc cgggccgggc acagcggctc acccctatca tcccagcact gtaagagacc 66120

caggagggag gtactgctca aggccaggag ttcaagatct gcacggccac aagcgagacc 66180

ctgcctcagc aaatgtaaaa ataaaacaat tagctggcaa tggcagctca tgcctatggt 66240

cccagcactt tgggaggcca aaggaggagg atcagttgag gccaggagtt ttaagaccag 66300

cctgggcaac atagtgagtg agactctctc tacaaaaaaa taaacgttag ctgggtgtga 66360

tggtgcacac ttgtgctccc agctactctg gaggctgagg tgggaggatg gcttgaggcc 66420

aggagtacag ggctgcatta agcctgatca caccactgca ctccagcttg ggcaacagag 66480

tgagaccctg tctctaaaaa agtaaaaaga agaaacccag tgcccattgg ctgtcactcg 66540

gtttcccctc ccctggcccc tagtaacccc ttgtctaggt cctggttcta tgagatttgc 66600

ctacagtgga tatttcatga aaacaggctc agacagcgtt tgtccttttg taatcagctt 66660

tccttgctca gcatggtgtc tctgaggtcc acccacgtgg cagtatggcc ttcctgttta 66720

tgggcaaatg atattctgtg gcatggatgg accacaacat gctcatctgt tgatgggctg 66780

ttgcccgtga tgctgccagg cacgccggtg tacacgtctg tgtgcccgtg cccctggtcc 66840

tgtggctgca cgccagggcc ggaagtgctg gtggtggttt ccatcatgag gagctgctgg 66900

ttttccatag cagctccacc atctaaggtt cccaccacca acacgaggtt gcggtttctc 66960

cacatcctca acaacctgtt actatgtctt ttttgttctg gccatgctgc tgaacgggtg 67020

gcttgctgtg ggctcttctc agttccctgt tgaccgacgc tgagcgtctt ttcatgtgct 67080

tggccatttg tgtatcttct ctggggaaat gtctattcaa atcctttctc catagtttag 67140

ttgggctttt gagataggat ctcaggctga agtgcagtgg catgaccttc actcactgta 67200

gcctctgcct cccaggttca agcgattctc ccacctcagc ctcccgagta gctgggacta 67260

caggtgtgca ccaccaggcc tggctagtct tttgtatttt tggccaggtt cgtctcaaac 67320

tcctgacctc aaagtgctgg gatgacaagt gtgagccgcc acacccagca gttgggttgt 67380

tttttattag agttttttct gtttttctgc agatacattg gctagaaatg actgaattgg 67440

aagaattctc tgtattctct ggttgctaga accttatcaa ttaaaatttg cagaaaattt 67500

ctccaattct atggactgtc tcttaaattt tcttggtgtc tttggaagca caaagtattt 67560

attttggtaa tatctggttt actttgtttc cttcgccaaa tccaggttca tgaagatttg 67620

cccgttttct tctaaaagtt ctatagtttt agctctgaag tttcgctctt tgatccactt 67680

tgaggtaaat tttggcacat ggtatgaggc aggagttgcg tttcattctc ctgcctgggg 67740

cggtgcctgc accgtgttga aaaaggttgt ccgttcccac tgaacggtca cagctccctt 67800

gtctaagatc aacgacccct gaacatgagg gttccaactg gactcttagt tctactccac 67860

tggcctgtgt ctgcccacca ttactaccgc tgtgccatac tgaggtcagg ctggggcttt 67920

tctgggctgc tgggtgagct ggagaatgcg gttgtgtgac ccgcaggaag ggcagagctg 67980

agcgtatgac ctgtgtcgtt cccctccaga aatacccgca gcccaaaggg cagaagaaga 68040

agaagatcgt caagtacggc atgggtggcc tcatcatcct cttcctcatc gccatcatct 68100

ggttcccact gctcttcatg tcgctggtgc gctccgtggt tggggttgtc aaccagccca 68160

tcgatgtcac cgtcaccctg aagctgggcg gctatgaggt gagcatgtgt gggtccgcct 68220

gtccattccc atcccctggg ggttctggcc aaggtggtgc accaccccca gccgctcctc 68280

cacgctcatc ttcgtggccc cgtgtccccg tgcctgcccc agccgctgtt caccatgagc 68340

gcccagcagc cgtccatcat ccccttcacg gcccaggcct atgaggagct gtcccggcag 68400

tttgaccccc agccggtaag tggcctctgc cctgtgaaag ctggtgtggg gaggcggctg 68460

cagtcactga gggtgtcact tgtacccagc tggccatgca gttcatcagc cagtacagcc 68520

ctgaggacat cgtcacggcg cagattgagg gcagctccgg ggcgctgtgg cgcatcagtc 68580

cccccagccg tgcccagatg aagcgggagc tctacaacgg cacggccgac atcaccctgc 68640

gcttcacctg gaacttccag aggttcgtcc tggacttggg gcagtgcctg ggtgggtgga 68700

cccactacag tgggtcacgc tgtgttccca cccccaggga cctggcgaag ggaggcactg 68760

tggagtatgc caacgagaag cacatgctgg ccctggcccc caacagcact gcacggcggc 68820

agctggccag cctgctcgag ggcacctcgg accagtctgt gtgagtgaag ggcccgggtg 68880

gtgggcagga gggctgtgcc aggttggctg ggccaggcct gacctgccag cacctccctg 68940

cagggtcatc cctaatctct tccccaagta catccgtgcc cccaacgggc ccgaagccaa 69000

ccctgtgaag cagctgcagc ccagtgagta tgggcgtggg ggttggggga ggctagagag 69060

gggtgacctg cggcctcaac gatcttctcc ctccatccca gatgaggagg ccgactacct 69120

cggcgtgcgt atccagctgc ggagggagca gggtgcgggg gccaccggct tcctcgaatg 69180

gtgggtcatc gagctgcagg agtgccggac cgactgcaac ctgctgccca tggtcatttt 69240

cagtgacaag gtcagcccac cgagcctcgg cttcctggct ggctacgggt gagtgagtgg 69300

ctgggggggc accccgcagc tcggggggct ccgggcggcc ccaggactca ccagcttccc 69360

ccgcagcatc atggggctgt acgtgtccat cgtgctggtc atcggcaagt tcgtgcgcgg 69420

attcttcagc gagatctcgc actccattat gttcgaggag ctgccgtgcg tggaccgcat 69480

cctcaagctc tgccaggaca tcttcctggt gcgggagact cgggagctgg agctggagga 69540

ggagttgtac gccaagctca tcttcctcta ccgctcaccg gagaccatga tcaagtggac 69600

tcgtgagaag gagtaggagc tgctgctggc gcccgagagg gaaggagccg gcctgctggg 69660

cagcgtggcc acaaggggcg gcactcctca ggccggggga gccactgccc cgtccaaggc 69720

cgccagctgt gatgcatcct cccggcctgc ctgagccctg atgctgctgt cagagaagga 69780

cactgcgtcc ccacggcctg cgtggcgctg ccgtccccca cgtgtactgt agagtttttt 69840

ttttaattaa aaaatgtttt atttatacaa atggacaatc aga 69883

<210> 2

<211> 8089

<212> ДНК

<213> homo sapien

<400> 2

gggagccgcc guccggccca gcucggcccc agugagccga gcgcugcgcu ccgccgaggg 60

gcagggcggu cgccugagcg agcgcgggcc cgggacgucg gcaccggcgg ggcggccgaa 120

ggagaaggag gaagaggaga aggcggcgcg cggguccccg cgggucagcc auggcgcgcc 180

ggccccgggg cccccgcacc gccccauagc gccgcggcgu ccgcucgguc ugggccgggc 240

ccugggcccu ccagccaugg agccgcacgu gcucggcgcg guccuguacu ggcugcugcu 300

gcccugcgcg cugcuggcug ccugccugcu ccgcuucagc ggacucucgc uggucuaccu 360

gcucuuccug cugcugcugc ccugguuccc cggccccacc cgaugcggcc uccaagguca 420

cacaggccgc cuccugcggg cauugcuggg ccucagccug cucuuccugg uggcccaucu 480

cgcccuccag aucugccugc auauugugcc ccgccuggac cagcuccugg gacccagcug 540

cagccgcugg gagacccucu cgcgacacau aggggucaca aggcuggacc ugaaggacau 600

ccccaacgcc auccggcugg uggccccuga ccugggcauc uugguggucu ccucugucug 660

ccucggcauc ugcgggcgcc uugcaaggaa cacccggcag agcccacauc cacgggagcu 720

ggaugaugau gagagggaug uggaugccag cccgacggca gggcugcagg aagcagcaac 780

gcuggccccu acacggaggu cacggcuggc cgcucguuuc cgagucacgg cccacuggcu 840

gcugguggcg gcugggcggg uccuggccgu aacacugcuu gcacuggcag gcaucgccca 900

ccccucggcc cucuccagug ucuaccugcu gcucuuccug gcccucugca ccuggugggc 960

cugccacuuu cccaucagca cucggggcuu cagcagacuc ugcgucgcgg uggggugcuu 1020

cggcgccggc caucucaucu gccucuacug cuaccagaug cccuuggcac aggcucugcu 1080

cccgccugcc ggcaucuggg cuagggugcu gggucucaag gacuucgugg gucccaccaa 1140

cugcuccagc ccccacgcgc ugguccucaa caccggccug gacuggccug uguaugccag 1200

ccccggcguc cuccugcugc ugugcuacgc cacggccucu cugcgcaagc uccgcgcgua 1260

ccgccccucc ggccagagga aggaggcggc aaagggguau gaggcucggg agcuggagcu 1320

agcagagcug gaccaguggc cccaggaacg ggagucugac cagcacgugg ugcccacagc 1380

acccgacacc gaggcugaua acugcaucgu gcacgagcug accggccaga gcuccguccu 1440

gcggcggccu gugcggccca agcgggcuga gcccagggag gcgucuccgc uccacagccu 1500

gggccaccuc aucauggacc agagcuaugu gugcgcgcuc auugccauga ugguauggag 1560

caucaccuac cacagcuggc ugaccuucgu acugcugcuc ugggccugcc ucaucuggac 1620

ggugcgcagc cgccaccaac uggccaugcu gugcucgccc ugcauccugc uguaugggau 1680

gacgcugugc ugccuacgcu acgugugggc cauggaccug cgcccugagc ugcccaccac 1740

ccugggcccc gucagccugc gccagcuggg gcuggagcac acccgcuacc ccugucugga 1800

ccuuggugcc auguugcucu acacccugac cuucuggcuc cugcugcgcc aguuugugaa 1860

agagaagcug cugaaguggg cagagucucc agcugcgcug acggagguca ccguggcaga 1920

cacagagccc acgcggacgc agacgcuguu gcagagccug ggggagcugg ugaagggcgu 1980

guacgccaag uacuggaucu augugugugc uggcauguuc aucgugguca gcuucgccgg 2040

ccgccucgug gucuacaaga uugucuacau guuccucuuc cugcucugcc ucacccucuu 2100

ccaggucuac uacagccugu ggcggaagcu gcucaaggcc uucugguggc ucgugguggc 2160

cuacaccaug cugguccuca ucgccgucua caccuuccag uuccaggacu ucccugccua 2220

cuggcgcaac cucacuggcu ucaccgacga gcagcugggg gaccugggcc uggagcaguu 2280

cagcgugucc gagcucuucu ccagcauccu ggugcccggc uucuuccucc uggccugcau 2340

ccugcagcug cacuacuucc acaggcccuu caugcagcuc accgacaugg agcacguguc 2400

ccugccuggc acgcgccucc cgcgcugggc ucacaggcag gaugcaguga gugggacccc 2460

acugcugcgg gaggagcagc aggagcauca gcagcagcag caggaggagg aggaggagga 2520

ggaggacucc agggacgagg ggcugggcgu ggccacuccc caccaggcca cgcaggugcc 2580

ugaaggggca gccaaguggg gccugguggc ugagcggcug cuggagcugg cagccggcuu 2640

cucggacguc cucucacgcg ugcagguguu ccugcggcgg cugcuggagc uucacguuuu 2700

caagcuggug gcccuguaca ccgucugggu ggcccugaag gaggugucgg ugaugaaccu 2760

gcugcuggug gugcuguggg ccuucgcccu gcccuaccca cgcuuccggc ccauggccuc 2820

cugccugucc accgugugga ccugcgucau caucgugugu aagaugcugu accagcucaa 2880

gguugucaac ccccaggagu auuccagcaa cugcaccgag cccuucccca acagcaccaa 2940

cuugcugccc acggagauca gccagucccu gcuguaccgg gggcccgugg acccugccaa 3000

cugguuuggg gugcggaaag gguuccccaa ccugggcuac auccagaacc accugcaagu 3060

gcugcugcug cugguauucg aggccaucgu guaccggcgc caggagcacu accgccggca 3120

gcaccagcug gccccgcugc cugcccaggc cguguuugcc agcggcaccc gccagcagcu 3180

ggaccaggau cugcucggcu gccucaagua cuucaucaac uucuucuucu acaaauucgg 3240

gcuggagauc ugcuuccuga uggccgugaa cgugaucggg cagcgcauga acuuucuggu 3300

gacccugcac gguugcuggc ugguggccau ccucacccgc aggcaccgcc aggccauugc 3360

ccgccucugg cccaacuacu gccucuuccu ggcgcuguuc cugcuguacc aguaccugcu 3420

gugccugggg augcccccgg cccugugcau ugauuauccc uggcgcugga gccgggccgu 3480

ccccaugaac uccgcacuca ucaaguggcu guaccugccu gauuucuucc gggcccccaa 3540

cuccaccaac cucaucagcg acuuucuccu gcugcugugc gccucccagc aguggcaggu 3600

guucucagcu gagcgcacag aggaguggca gcgcauggcu ggcgucaaca ccgaccgccu 3660

ggagccgcug cggggggagc ccaaccccgu gcccaacuuu auccacugca gguccuaccu 3720

ugacaugcug aagguggccg ucuuccgaua ccuguucugg cuggugcugg uggugguguu 3780

ugucacgggg gccacccgca ucagcaucuu cgggcugggc uaccugcugg ccugcuucua 3840

ccugcugcuc uucggcacgg cccugcugca gagggacaca cgggcccgcc ucgugcugug 3900

ggacugccuc auucuguaca acgucaccgu caucaucucc aagaacaugc ugucgcuccu 3960

ggccugcguc uucguggagc agaugcagac cggcuucugc ugggucaucc agcucuucag 4020

ccuuguaugc accgucaagg gcuacuauga ccccaaggag augauggaca gagaccagga 4080

cugccugcug ccuguggagg aggcuggcau caucugggac agcgucugcu ucuucuuccu 4140

gcugcugcag cgccgcgucu uccuuagcca uuacuaccug cacgucaggg ccgaccucca 4200

ggccaccgcc cugcuagccu ccaggggcuu cgcccucuac aacgcugcca accucaagag 4260

cauugacuuu caccgcagga uagaggagaa gucccuggcc cagcugaaaa gacagaugga 4320

gcguauccgu gccaagcagg agaagcacag gcagggccgg guggaccgca gucgccccca 4380

ggacacccug ggccccaagg accccggccu ggagccaggg cccgacaguc cagggggcuc 4440

cuccccgcca cggaggcagu gguggcggcc cuggcuggac cacgccacag ucauccacuc 4500

cggggacuac uuccuguuug aguccgacag ugaggaagag gaggaggcug uuccugaaga 4560

cccgaggccg ucggcacaga gugccuucca gcuggcguac caggcauggg ugaccaacgc 4620

ccaggcggug cugaggcggc ggcagcagga gcaggagcag gcaaggcagg aacaggcagg 4680

acagcuaccc acaggaggug gucccagcca ggagguggag ccagcagagg gccccgagga 4740

ggcagcggca ggccggagcc auguggugca gagggugcug agcacggcgc aguuccugug 4800

gaugcugggg caggcgcuag uggaugagcu gacacgcugg cugcaggagu ucacccggca 4860

ccacggcacc augagcgacg ugcugcgggc agagcgcuac cuccucacac aggagcuccu 4920

gcagggcggc gaagugcaca ggggcgugcu ggaucagcug uacacaagcc aggccgaggc 4980

cacgcugcca ggccccaccg aggcccccaa ugccccaagc accgugucca gugggcuggg 5040

cgcggaggag ccacucagca gcaugacaga cgacaugggc agcccccuga gcaccggcua 5100

ccacacgcgc aguggcagug aggaggcagu caccgacccc ggggagcgug aggcuggugc 5160

cucucuguac cagggacuga ugcggacggc cagcgagcug cuccuggaca ggcgccugcg 5220

caucccagag cuggaggagg cagagcuguu ugcggagggg cagggccggg cgcugcggcu 5280

gcugcgggcc guguaccagu guguggccgc ccacucggag cugcucugcu acuucaucau 5340

cauccucaac cacaugguca cggccuccgc cggcucgcug gugcugcccg ugcucgucuu 5400

ccugugggcc augcugucga ucccgaggcc cagcaagcgc uucuggauga cggccaucgu 5460

cuucaccgag aucgcggugg ucgucaagua ccuguuccag uuuggguucu uccccuggaa 5520

cagccacgug gugcugcggc gcuacgagaa caagcccuac uucccgcccc gcauccuggg 5580

ccuggagaag acugacggcu acaucaagua cgaccuggug cagcucaugg cccuuuucuu 5640

ccaccgcucc cagcugcugu gcuauggccu cugggaccau gaggaggacu caccauccaa 5700

ggagcaugac aagagcggcg aggaggagca gggagccgag gaggggccag gggugccugc 5760

ggccaccacc gaagaccaca uucaggugga agccaggguc ggacccacgg acgggacccc 5820

agaaccccaa guggagcuca ggccccguga uacgaggcgc aucagucuac guuuuagaag 5880

aaggaagaag gagggcccag cacggaaagg agcggcagcc aucgaagcug aggacaggga 5940

ggaagaagag ggggaggaag agaaagaggc ccccacgggg agagagaaga ggccaagccg 6000

cucuggagga agaguaaggg cggccgggcg gcggcugcag ggcuucugcc ugucccuggc 6060

ccagggcaca uaucggccgc uacggcgcuu cuuccacgac auccugcaca ccaaguaccg 6120

cgcagccacc gacgucuaug cccucauguu ccuggcugau guugucgacu ucaucaucau 6180

cauuuuuggc uucugggccu uugggaagca cucggcggcc acagacauca cguccucccu 6240

aucagacgac cagguacccg aggcuuuccu ggucaugcug cugauccagu ucaguaccau 6300

ggugguugac cgcgcccucu accugcgcaa gaccgugcug ggcaagcugg ccuuccaggu 6360

ggcgcuggug cuggccaucc accuauggau guucuucauc cugcccgccg ucacugagag 6420

gauguucaac cagaaugugg uggcccagcu cugguacuuc gugaagugca ucuacuucgc 6480

ccuguccgcc uaccagaucc gcugcggcua ccccacccgc auccucggca acuuccucac 6540

caagaaguac aaucaucuca accucuuccu cuuccagggg uuccggcugg ugccguuccu 6600

gguggagcug cgggcaguga uggacugggu guggacggac accacgcugu cccuguccag 6660

cuggaugugu guggaggaca ucuaugccaa caucuucauc aucaaaugca gccgagagac 6720

agagaagaaa uacccgcagc ccaaagggca gaagaagaag aagaucguca aguacggcau 6780

ggguggccuc aucauccucu uccucaucgc caucaucugg uucccacugc ucuucauguc 6840

gcuggugcgc uccgugguug ggguugucaa ccagcccauc gaugucaccg ucacccugaa 6900

gcugggcggc uaugagccgc uguucaccau gagcgcccag cagccgucca ucauccccuu 6960

cacggcccag gccuaugagg agcugucccg gcaguuugac ccccagccgc uggccaugca 7020

guucaucagc caguacagcc cugaggacau cgucacggcg cagauugagg gcagcuccgg 7080

ggcgcugugg cgcaucaguc cccccagccg ugcccagaug aagcgggagc ucuacaacgg 7140

cacggccgac aucacccugc gcuucaccug gaacuuccag agggaccugg cgaagggagg 7200

cacuguggag uaugccaacg agaagcacau gcuggcccug gcccccaaca gcacugcacg 7260

gcggcagcug gccagccugc ucgagggcac cucggaccag ucugugguca ucccuaaucu 7320

cuuccccaag uacauccgug cccccaacgg gcccgaagcc aacccuguga agcagcugca 7380

gcccaaugag gaggccgacu accucggcgu gcguauccag cugcggaggg agcagggugc 7440

gggggccacc ggcuuccucg aauggugggu caucgagcug caggagugcc ggaccgacug 7500

caaccugcug cccaugguca uuuucaguga caaggucagc ccaccgagcc ucggcuuccu 7560

ggcuggcuac ggcaucaugg ggcuguacgu guccaucgug cuggucaucg gcaaguucgu 7620

gcgcggauuc uucagcgaga ucucgcacuc cauuauguuc gaggagcugc cgugcgugga 7680

ccgcauccuc aagcucugcc aggacaucuu ccuggugcgg gagacucggg agcuggagcu 7740

ggaggaggag uuguacgcca agcucaucuu ccucuaccgc ucaccggaga ccaugaucaa 7800

guggacucgu gagaaggagu aggagcugcu gcuggcgccc gagagggaag gagccggccu 7860

gcugggcagc guggccacaa ggggcggcac uccucaggcc gggggagcca cugccccguc 7920

caaggccgcc agcugugaug cauccucccg gccugccuga gcccugaugc ugcugucaga 7980

gaaggacacu gcguccccac ggccugcgug gcgcugccgu cccccacgug uacuguagag 8040

uuuuuuuuuu aauuaaaaaa uguuuuauuu auacaaaugg acaaucaga 8089

<210> 3

<211> 8089

<212> ДНК

<213> homo sapien

<400> 3

gggagccgcc gtccggccca gctcggcccc agtgagccga gcgctgcgct ccgccgaggg 60

gcagggcggt cgcctgagcg agcgcgggcc cgggacgtcg gcaccggcgg ggcggccgaa 120

ggagaaggag gaagaggaga aggcggcgcg cgggtccccg cgggtcagcc atggcgcgcc 180

ggccccgggg cccccgcacc gccccatagc gccgcggcgt ccgctcggtc tgggccgggc 240

cctgggccct ccagccatgg agccgcacgt gctcggcgcg gtcctgtact ggctgctgct 300

gccctgcgcg ctgctggctg cctgcctgct ccgcttcagc ggactctcgc tggtctacct 360

gctcttcctg ctgctgctgc cctggttccc cggccccacc cgatgcggcc tccaaggtca 420

cacaggccgc ctcctgcggg cattgctggg cctcagcctg ctcttcctgg tggcccatct 480

cgccctccag atctgcctgc atattgtgcc ccgcctggac cagctcctgg gacccagctg 540

cagccgctgg gagaccctct cgcgacacat aggggtcaca aggctggacc tgaaggacat 600

ccccaacgcc atccggctgg tggcccctga cctgggcatc ttggtggtct cctctgtctg 660

cctcggcatc tgcgggcgcc ttgcaaggaa cacccggcag agcccacatc cacgggagct 720

ggatgatgat gagagggatg tggatgccag cccgacggca gggctgcagg aagcagcaac 780

gctggcccct acacggaggt cacggctggc cgctcgtttc cgagtcacgg cccactggct 840

gctggtggcg gctgggcggg tcctggccgt aacactgctt gcactggcag gcatcgccca 900

cccctcggcc ctctccagtg tctacctgct gctcttcctg gccctctgca cctggtgggc 960

ctgccacttt cccatcagca ctcggggctt cagcagactc tgcgtcgcgg tggggtgctt 1020

cggcgccggc catctcatct gcctctactg ctaccagatg cccttggcac aggctctgct 1080

cccgcctgcc ggcatctggg ctagggtgct gggtctcaag gacttcgtgg gtcccaccaa 1140

ctgctccagc ccccacgcgc tggtcctcaa caccggcctg gactggcctg tgtatgccag 1200

ccccggcgtc ctcctgctgc tgtgctacgc cacggcctct ctgcgcaagc tccgcgcgta 1260

ccgcccctcc ggccagagga aggaggcggc aaaggggtat gaggctcggg agctggagct 1320

agcagagctg gaccagtggc cccaggaacg ggagtctgac cagcacgtgg tgcccacagc 1380

acccgacacc gaggctgata actgcatcgt gcacgagctg accggccaga gctccgtcct 1440

gcggcggcct gtgcggccca agcgggctga gcccagggag gcgtctccgc tccacagcct 1500

gggccacctc atcatggacc agagctatgt gtgcgcgctc attgccatga tggtatggag 1560

catcacctac cacagctggc tgaccttcgt actgctgctc tgggcctgcc tcatctggac 1620

ggtgcgcagc cgccaccaac tggccatgct gtgctcgccc tgcatcctgc tgtatgggat 1680

gacgctgtgc tgcctacgct acgtgtgggc catggacctg cgccctgagc tgcccaccac 1740

cctgggcccc gtcagcctgc gccagctggg gctggagcac acccgctacc cctgtctgga 1800

ccttggtgcc atgttgctct acaccctgac cttctggctc ctgctgcgcc agtttgtgaa 1860

agagaagctg ctgaagtggg cagagtctcc agctgcgctg acggaggtca ccgtggcaga 1920

cacagagccc acgcggacgc agacgctgtt gcagagcctg ggggagctgg tgaagggcgt 1980

gtacgccaag tactggatct atgtgtgtgc tggcatgttc atcgtggtca gcttcgccgg 2040

ccgcctcgtg gtctacaaga ttgtctacat gttcctcttc ctgctctgcc tcaccctctt 2100

ccaggtctac tacagcctgt ggcggaagct gctcaaggcc ttctggtggc tcgtggtggc 2160

ctacaccatg ctggtcctca tcgccgtcta caccttccag ttccaggact tccctgccta 2220

ctggcgcaac ctcactggct tcaccgacga gcagctgggg gacctgggcc tggagcagtt 2280

cagcgtgtcc gagctcttct ccagcatcct ggtgcccggc ttcttcctcc tggcctgcat 2340

cctgcagctg cactacttcc acaggccctt catgcagctc accgacatgg agcacgtgtc 2400

cctgcctggc acgcgcctcc cgcgctgggc tcacaggcag gatgcagtga gtgggacccc 2460

actgctgcgg gaggagcagc aggagcatca gcagcagcag caggaggagg aggaggagga 2520

ggaggactcc agggacgagg ggctgggcgt ggccactccc caccaggcca cgcaggtgcc 2580

tgaaggggca gccaagtggg gcctggtggc tgagcggctg ctggagctgg cagccggctt 2640

ctcggacgtc ctctcacgcg tgcaggtgtt cctgcggcgg ctgctggagc ttcacgtttt 2700

caagctggtg gccctgtaca ccgtctgggt ggccctgaag gaggtgtcgg tgatgaacct 2760

gctgctggtg gtgctgtggg ccttcgccct gccctaccca cgcttccggc ccatggcctc 2820

ctgcctgtcc accgtgtgga cctgcgtcat catcgtgtgt aagatgctgt accagctcaa 2880

ggttgtcaac ccccaggagt attccagcaa ctgcaccgag cccttcccca acagcaccaa 2940

cttgctgccc acggagatca gccagtccct gctgtaccgg gggcccgtgg accctgccaa 3000

ctggtttggg gtgcggaaag ggttccccaa cctgggctac atccagaacc acctgcaagt 3060

gctgctgctg ctggtattcg aggccatcgt gtaccggcgc caggagcact accgccggca 3120

gcaccagctg gccccgctgc ctgcccaggc cgtgtttgcc agcggcaccc gccagcagct 3180

ggaccaggat ctgctcggct gcctcaagta cttcatcaac ttcttcttct acaaattcgg 3240

gctggagatc tgcttcctga tggccgtgaa cgtgatcggg cagcgcatga actttctggt 3300

gaccctgcac ggttgctggc tggtggccat cctcacccgc aggcaccgcc aggccattgc 3360

ccgcctctgg cccaactact gcctcttcct ggcgctgttc ctgctgtacc agtacctgct 3420

gtgcctgggg atgcccccgg ccctgtgcat tgattatccc tggcgctgga gccgggccgt 3480

ccccatgaac tccgcactca tcaagtggct gtacctgcct gatttcttcc gggcccccaa 3540

ctccaccaac ctcatcagcg actttctcct gctgctgtgc gcctcccagc agtggcaggt 3600

gttctcagct gagcgcacag aggagtggca gcgcatggct ggcgtcaaca ccgaccgcct 3660

ggagccgctg cggggggagc ccaaccccgt gcccaacttt atccactgca ggtcctacct 3720

tgacatgctg aaggtggccg tcttccgata cctgttctgg ctggtgctgg tggtggtgtt 3780

tgtcacgggg gccacccgca tcagcatctt cgggctgggc tacctgctgg cctgcttcta 3840

cctgctgctc ttcggcacgg ccctgctgca gagggacaca cgggcccgcc tcgtgctgtg 3900

ggactgcctc attctgtaca acgtcaccgt catcatctcc aagaacatgc tgtcgctcct 3960

ggcctgcgtc ttcgtggagc agatgcagac cggcttctgc tgggtcatcc agctcttcag 4020

ccttgtatgc accgtcaagg gctactatga ccccaaggag atgatggaca gagaccagga 4080

ctgcctgctg cctgtggagg aggctggcat catctgggac agcgtctgct tcttcttcct 4140

gctgctgcag cgccgcgtct tccttagcca ttactacctg cacgtcaggg ccgacctcca 4200

ggccaccgcc ctgctagcct ccaggggctt cgccctctac aacgctgcca acctcaagag 4260

cattgacttt caccgcagga tagaggagaa gtccctggcc cagctgaaaa gacagatgga 4320

gcgtatccgt gccaagcagg agaagcacag gcagggccgg gtggaccgca gtcgccccca 4380

ggacaccctg ggccccaagg accccggcct ggagccaggg cccgacagtc cagggggctc 4440

ctccccgcca cggaggcagt ggtggcggcc ctggctggac cacgccacag tcatccactc 4500

cggggactac ttcctgtttg agtccgacag tgaggaagag gaggaggctg ttcctgaaga 4560

cccgaggccg tcggcacaga gtgccttcca gctggcgtac caggcatggg tgaccaacgc 4620

ccaggcggtg ctgaggcggc ggcagcagga gcaggagcag gcaaggcagg aacaggcagg 4680

acagctaccc acaggaggtg gtcccagcca ggaggtggag ccagcagagg gccccgagga 4740

ggcagcggca ggccggagcc atgtggtgca gagggtgctg agcacggcgc agttcctgtg 4800

gatgctgggg caggcgctag tggatgagct gacacgctgg ctgcaggagt tcacccggca 4860

ccacggcacc atgagcgacg tgctgcgggc agagcgctac ctcctcacac aggagctcct 4920

gcagggcggc gaagtgcaca ggggcgtgct ggatcagctg tacacaagcc aggccgaggc 4980

cacgctgcca ggccccaccg aggcccccaa tgccccaagc accgtgtcca gtgggctggg 5040

cgcggaggag ccactcagca gcatgacaga cgacatgggc agccccctga gcaccggcta 5100

ccacacgcgc agtggcagtg aggaggcagt caccgacccc ggggagcgtg aggctggtgc 5160

ctctctgtac cagggactga tgcggacggc cagcgagctg ctcctggaca ggcgcctgcg 5220

catcccagag ctggaggagg cagagctgtt tgcggagggg cagggccggg cgctgcggct 5280

gctgcgggcc gtgtaccagt gtgtggccgc ccactcggag ctgctctgct acttcatcat 5340

catcctcaac cacatggtca cggcctccgc cggctcgctg gtgctgcccg tgctcgtctt 5400

cctgtgggcc atgctgtcga tcccgaggcc cagcaagcgc ttctggatga cggccatcgt 5460

cttcaccgag atcgcggtgg tcgtcaagta cctgttccag tttgggttct tcccctggaa 5520

cagccacgtg gtgctgcggc gctacgagaa caagccctac ttcccgcccc gcatcctggg 5580

cctggagaag actgacggct acatcaagta cgacctggtg cagctcatgg cccttttctt 5640

ccaccgctcc cagctgctgt gctatggcct ctgggaccat gaggaggact caccatccaa 5700

ggagcatgac aagagcggcg aggaggagca gggagccgag gaggggccag gggtgcctgc 5760

ggccaccacc gaagaccaca ttcaggtgga agccagggtc ggacccacgg acgggacccc 5820

agaaccccaa gtggagctca ggccccgtga tacgaggcgc atcagtctac gttttagaag 5880

aaggaagaag gagggcccag cacggaaagg agcggcagcc atcgaagctg aggacaggga 5940

ggaagaagag ggggaggaag agaaagaggc ccccacgggg agagagaaga ggccaagccg 6000

ctctggagga agagtaaggg cggccgggcg gcggctgcag ggcttctgcc tgtccctggc 6060

ccagggcaca tatcggccgc tacggcgctt cttccacgac atcctgcaca ccaagtaccg 6120

cgcagccacc gacgtctatg ccctcatgtt cctggctgat gttgtcgact tcatcatcat 6180

catttttggc ttctgggcct ttgggaagca ctcggcggcc acagacatca cgtcctccct 6240

atcagacgac caggtacccg aggctttcct ggtcatgctg ctgatccagt tcagtaccat 6300

ggtggttgac cgcgccctct acctgcgcaa gaccgtgctg ggcaagctgg ccttccaggt 6360

ggcgctggtg ctggccatcc acctatggat gttcttcatc ctgcccgccg tcactgagag 6420

gatgttcaac cagaatgtgg tggcccagct ctggtacttc gtgaagtgca tctacttcgc 6480

cctgtccgcc taccagatcc gctgcggcta ccccacccgc atcctcggca acttcctcac 6540

caagaagtac aatcatctca acctcttcct cttccagggg ttccggctgg tgccgttcct 6600

ggtggagctg cgggcagtga tggactgggt gtggacggac accacgctgt ccctgtccag 6660

ctggatgtgt gtggaggaca tctatgccaa catcttcatc atcaaatgca gccgagagac 6720

agagaagaaa tacccgcagc ccaaagggca gaagaagaag aagatcgtca agtacggcat 6780

gggtggcctc atcatcctct tcctcatcgc catcatctgg ttcccactgc tcttcatgtc 6840

gctggtgcgc tccgtggttg gggttgtcaa ccagcccatc gatgtcaccg tcaccctgaa 6900

gctgggcggc tatgagccgc tgttcaccat gagcgcccag cagccgtcca tcatcccctt 6960

cacggcccag gcctatgagg agctgtcccg gcagtttgac ccccagccgc tggccatgca 7020

gttcatcagc cagtacagcc ctgaggacat cgtcacggcg cagattgagg gcagctccgg 7080

ggcgctgtgg cgcatcagtc cccccagccg tgcccagatg aagcgggagc tctacaacgg 7140

cacggccgac atcaccctgc gcttcacctg gaacttccag agggacctgg cgaagggagg 7200

cactgtggag tatgccaacg agaagcacat gctggccctg gcccccaaca gcactgcacg 7260

gcggcagctg gccagcctgc tcgagggcac ctcggaccag tctgtggtca tccctaatct 7320

cttccccaag tacatccgtg cccccaacgg gcccgaagcc aaccctgtga agcagctgca 7380

gcccaatgag gaggccgact acctcggcgt gcgtatccag ctgcggaggg agcagggtgc 7440

gggggccacc ggcttcctcg aatggtgggt catcgagctg caggagtgcc ggaccgactg 7500

caacctgctg cccatggtca ttttcagtga caaggtcagc ccaccgagcc tcggcttcct 7560

ggctggctac ggcatcatgg ggctgtacgt gtccatcgtg ctggtcatcg gcaagttcgt 7620

gcgcggattc ttcagcgaga tctcgcactc cattatgttc gaggagctgc cgtgcgtgga 7680

ccgcatcctc aagctctgcc aggacatctt cctggtgcgg gagactcggg agctggagct 7740

ggaggaggag ttgtacgcca agctcatctt cctctaccgc tcaccggaga ccatgatcaa 7800

gtggactcgt gagaaggagt aggagctgct gctggcgccc gagagggaag gagccggcct 7860

gctgggcagc gtggccacaa ggggcggcac tcctcaggcc gggggagcca ctgccccgtc 7920

caaggccgcc agctgtgatg catcctcccg gcctgcctga gccctgatgc tgctgtcaga 7980

gaaggacact gcgtccccac ggcctgcgtg gcgctgccgt cccccacgtg tactgtagag 8040

tttttttttt aattaaaaaa tgttttattt atacaaatgg acaatcaga 8089

<210> 4

<211> 2521

<212> Белок

<213> homo sapien

<400> 4

Met Glu Pro His Val Leu Gly Ala Val Leu Tyr Trp Leu Leu Leu Pro

1 5 10 15

Cys Ala Leu Leu Ala Ala Cys Leu Leu Arg Phe Ser Gly Leu Ser Leu

20 25 30

Val Tyr Leu Leu Phe Leu Leu Leu Leu Pro Trp Phe Pro Gly Pro Thr

35 40 45

Arg Cys Gly Leu Gln Gly His Thr Gly Arg Leu Leu Arg Ala Leu Leu

50 55 60

Gly Leu Ser Leu Leu Phe Leu Val Ala His Leu Ala Leu Gln Ile Cys

65 70 75 80

Leu His Ile Val Pro Arg Leu Asp Gln Leu Leu Gly Pro Ser Cys Ser

85 90 95

Arg Trp Glu Thr Leu Ser Arg His Ile Gly Val Thr Arg Leu Asp Leu

100 105 110

Lys Asp Ile Pro Asn Ala Ile Arg Leu Val Ala Pro Asp Leu Gly Ile

115 120 125

Leu Val Val Ser Ser Val Cys Leu Gly Ile Cys Gly Arg Leu Ala Arg

130 135 140

Asn Thr Arg Gln Ser Pro His Pro Arg Glu Leu Asp Asp Asp Glu Arg

145 150 155 160

Asp Val Asp Ala Ser Pro Thr Ala Gly Leu Gln Glu Ala Ala Thr Leu

165 170 175

Ala Pro Thr Arg Arg Ser Arg Leu Ala Ala Arg Phe Arg Val Thr Ala

180 185 190

His Trp Leu Leu Val Ala Ala Gly Arg Val Leu Ala Val Thr Leu Leu

195 200 205

Ala Leu Ala Gly Ile Ala His Pro Ser Ala Leu Ser Ser Val Tyr Leu

210 215 220

Leu Leu Phe Leu Ala Leu Cys Thr Trp Trp Ala Cys His Phe Pro Ile

225 230 235 240

Ser Thr Arg Gly Phe Ser Arg Leu Cys Val Ala Val Gly Cys Phe Gly

245 250 255

Ala Gly His Leu Ile Cys Leu Tyr Cys Tyr Gln Met Pro Leu Ala Gln

260 265 270

Ala Leu Leu Pro Pro Ala Gly Ile Trp Ala Arg Val Leu Gly Leu Lys

275 280 285

Asp Phe Val Gly Pro Thr Asn Cys Ser Ser Pro His Ala Leu Val Leu

290 295 300

Asn Thr Gly Leu Asp Trp Pro Val Tyr Ala Ser Pro Gly Val Leu Leu

305 310 315 320

Leu Leu Cys Tyr Ala Thr Ala Ser Leu Arg Lys Leu Arg Ala Tyr Arg

325 330 335

Pro Ser Gly Gln Arg Lys Glu Ala Ala Lys Gly Tyr Glu Ala Arg Glu

340 345 350

Leu Glu Leu Ala Glu Leu Asp Gln Trp Pro Gln Glu Arg Glu Ser Asp

355 360 365

Gln His Val Val Pro Thr Ala Pro Asp Thr Glu Ala Asp Asn Cys Ile

370 375 380

Val His Glu Leu Thr Gly Gln Ser Ser Val Leu Arg Arg Pro Val Arg

385 390 395 400

Pro Lys Arg Ala Glu Pro Arg Glu Ala Ser Pro Leu His Ser Leu Gly

405 410 415

His Leu Ile Met Asp Gln Ser Tyr Val Cys Ala Leu Ile Ala Met Met

420 425 430

Val Trp Ser Ile Thr Tyr His Ser Trp Leu Thr Phe Val Leu Leu Leu

435 440 445

Trp Ala Cys Leu Ile Trp Thr Val Arg Ser Arg His Gln Leu Ala Met

450 455 460

Leu Cys Ser Pro Cys Ile Leu Leu Tyr Gly Met Thr Leu Cys Cys Leu

465 470 475 480

Arg Tyr Val Trp Ala Met Asp Leu Arg Pro Glu Leu Pro Thr Thr Leu

485 490 495

Gly Pro Val Ser Leu Arg Gln Leu Gly Leu Glu His Thr Arg Tyr Pro

500 505 510

Cys Leu Asp Leu Gly Ala Met Leu Leu Tyr Thr Leu Thr Phe Trp Leu

515 520 525

Leu Leu Arg Gln Phe Val Lys Glu Lys Leu Leu Lys Trp Ala Glu Ser

530 535 540

Pro Ala Ala Leu Thr Glu Val Thr Val Ala Asp Thr Glu Pro Thr Arg

545 550 555 560

Thr Gln Thr Leu Leu Gln Ser Leu Gly Glu Leu Val Lys Gly Val Tyr

565 570 575

Ala Lys Tyr Trp Ile Tyr Val Cys Ala Gly Met Phe Ile Val Val Ser

580 585 590

Phe Ala Gly Arg Leu Val Val Tyr Lys Ile Val Tyr Met Phe Leu Phe

595 600 605

Leu Leu Cys Leu Thr Leu Phe Gln Val Tyr Tyr Ser Leu Trp Arg Lys

610 615 620

Leu Leu Lys Ala Phe Trp Trp Leu Val Val Ala Tyr Thr Met Leu Val

625 630 635 640

Leu Ile Ala Val Tyr Thr Phe Gln Phe Gln Asp Phe Pro Ala Tyr Trp

645 650 655

Arg Asn Leu Thr Gly Phe Thr Asp Glu Gln Leu Gly Asp Leu Gly Leu

660 665 670

Glu Gln Phe Ser Val Ser Glu Leu Phe Ser Ser Ile Leu Val Pro Gly

675 680 685

Phe Phe Leu Leu Ala Cys Ile Leu Gln Leu His Tyr Phe His Arg Pro

690 695 700

Phe Met Gln Leu Thr Asp Met Glu His Val Ser Leu Pro Gly Thr Arg

705 710 715 720

Leu Pro Arg Trp Ala His Arg Gln Asp Ala Val Ser Gly Thr Pro Leu

725 730 735

Leu Arg Glu Glu Gln Gln Glu His Gln Gln Gln Gln Gln Glu Glu Glu

740 745 750

Glu Glu Glu Glu Asp Ser Arg Asp Glu Gly Leu Gly Val Ala Thr Pro

755 760 765

His Gln Ala Thr Gln Val Pro Glu Gly Ala Ala Lys Trp Gly Leu Val

770 775 780

Ala Glu Arg Leu Leu Glu Leu Ala Ala Gly Phe Ser Asp Val Leu Ser

785 790 795 800

Arg Val Gln Val Phe Leu Arg Arg Leu Leu Glu Leu His Val Phe Lys

805 810 815

Leu Val Ala Leu Tyr Thr Val Trp Val Ala Leu Lys Glu Val Ser Val

820 825 830

Met Asn Leu Leu Leu Val Val Leu Trp Ala Phe Ala Leu Pro Tyr Pro

835 840 845

Arg Phe Arg Pro Met Ala Ser Cys Leu Ser Thr Val Trp Thr Cys Val

850 855 860

Ile Ile Val Cys Lys Met Leu Tyr Gln Leu Lys Val Val Asn Pro Gln

865 870 875 880

Glu Tyr Ser Ser Asn Cys Thr Glu Pro Phe Pro Asn Ser Thr Asn Leu

885 890 895

Leu Pro Thr Glu Ile Ser Gln Ser Leu Leu Tyr Arg Gly Pro Val Asp

900 905 910

Pro Ala Asn Trp Phe Gly Val Arg Lys Gly Phe Pro Asn Leu Gly Tyr

915 920 925

Ile Gln Asn His Leu Gln Val Leu Leu Leu Leu Val Phe Glu Ala Ile

930 935 940

Val Tyr Arg Arg Gln Glu His Tyr Arg Arg Gln His Gln Leu Ala Pro

945 950 955 960

Leu Pro Ala Gln Ala Val Phe Ala Ser Gly Thr Arg Gln Gln Leu Asp

965 970 975

Gln Asp Leu Leu Gly Cys Leu Lys Tyr Phe Ile Asn Phe Phe Phe Tyr

980 985 990

Lys Phe Gly Leu Glu Ile Cys Phe Leu Met Ala Val Asn Val Ile Gly

995 1000 1005

Gln Arg Met Asn Phe Leu Val Thr Leu His Gly Cys Trp Leu Val

1010 1015 1020

Ala Ile Leu Thr Arg Arg His Arg Gln Ala Ile Ala Arg Leu Trp

1025 1030 1035

Pro Asn Tyr Cys Leu Phe Leu Ala Leu Phe Leu Leu Tyr Gln Tyr

1040 1045 1050

Leu Leu Cys Leu Gly Met Pro Pro Ala Leu Cys Ile Asp Tyr Pro

1055 1060 1065

Trp Arg Trp Ser Arg Ala Val Pro Met Asn Ser Ala Leu Ile Lys

1070 1075 1080

Trp Leu Tyr Leu Pro Asp Phe Phe Arg Ala Pro Asn Ser Thr Asn

1085 1090 1095

Leu Ile Ser Asp Phe Leu Leu Leu Leu Cys Ala Ser Gln Gln Trp

1100 1105 1110

Gln Val Phe Ser Ala Glu Arg Thr Glu Glu Trp Gln Arg Met Ala

1115 1120 1125

Gly Val Asn Thr Asp Arg Leu Glu Pro Leu Arg Gly Glu Pro Asn

1130 1135 1140

Pro Val Pro Asn Phe Ile His Cys Arg Ser Tyr Leu Asp Met Leu

1145 1150 1155

Lys Val Ala Val Phe Arg Tyr Leu Phe Trp Leu Val Leu Val Val

1160 1165 1170

Val Phe Val Thr Gly Ala Thr Arg Ile Ser Ile Phe Gly Leu Gly

1175 1180 1185

Tyr Leu Leu Ala Cys Phe Tyr Leu Leu Leu Phe Gly Thr Ala Leu

1190 1195 1200

Leu Gln Arg Asp Thr Arg Ala Arg Leu Val Leu Trp Asp Cys Leu

1205 1210 1215

Ile Leu Tyr Asn Val Thr Val Ile Ile Ser Lys Asn Met Leu Ser

1220 1225 1230

Leu Leu Ala Cys Val Phe Val Glu Gln Met Gln Thr Gly Phe Cys

1235 1240 1245

Trp Val Ile Gln Leu Phe Ser Leu Val Cys Thr Val Lys Gly Tyr

1250 1255 1260

Tyr Asp Pro Lys Glu Met Met Asp Arg Asp Gln Asp Cys Leu Leu

1265 1270 1275

Pro Val Glu Glu Ala Gly Ile Ile Trp Asp Ser Val Cys Phe Phe

1280 1285 1290

Phe Leu Leu Leu Gln Arg Arg Val Phe Leu Ser His Tyr Tyr Leu

1295 1300 1305

His Val Arg Ala Asp Leu Gln Ala Thr Ala Leu Leu Ala Ser Arg

1310 1315 1320

Gly Phe Ala Leu Tyr Asn Ala Ala Asn Leu Lys Ser Ile Asp Phe

1325 1330 1335

His Arg Arg Ile Glu Glu Lys Ser Leu Ala Gln Leu Lys Arg Gln

1340 1345 1350

Met Glu Arg Ile Arg Ala Lys Gln Glu Lys His Arg Gln Gly Arg

1355 1360 1365

Val Asp Arg Ser Arg Pro Gln Asp Thr Leu Gly Pro Lys Asp Pro

1370 1375 1380

Gly Leu Glu Pro Gly Pro Asp Ser Pro Gly Gly Ser Ser Pro Pro

1385 1390 1395

Arg Arg Gln Trp Trp Arg Pro Trp Leu Asp His Ala Thr Val Ile

1400 1405 1410

His Ser Gly Asp Tyr Phe Leu Phe Glu Ser Asp Ser Glu Glu Glu

1415 1420 1425

Glu Glu Ala Val Pro Glu Asp Pro Arg Pro Ser Ala Gln Ser Ala

1430 1435 1440

Phe Gln Leu Ala Tyr Gln Ala Trp Val Thr Asn Ala Gln Ala Val

1445 1450 1455

Leu Arg Arg Arg Gln Gln Glu Gln Glu Gln Ala Arg Gln Glu Gln

1460 1465 1470

Ala Gly Gln Leu Pro Thr Gly Gly Gly Pro Ser Gln Glu Val Glu

1475 1480 1485

Pro Ala Glu Gly Pro Glu Glu Ala Ala Ala Gly Arg Ser His Val

1490 1495 1500

Val Gln Arg Val Leu Ser Thr Ala Gln Phe Leu Trp Met Leu Gly

1505 1510 1515

Gln Ala Leu Val Asp Glu Leu Thr Arg Trp Leu Gln Glu Phe Thr

1520 1525 1530

Arg His His Gly Thr Met Ser Asp Val Leu Arg Ala Glu Arg Tyr

1535 1540 1545

Leu Leu Thr Gln Glu Leu Leu Gln Gly Gly Glu Val His Arg Gly

1550 1555 1560

Val Leu Asp Gln Leu Tyr Thr Ser Gln Ala Glu Ala Thr Leu Pro

1565 1570 1575

Gly Pro Thr Glu Ala Pro Asn Ala Pro Ser Thr Val Ser Ser Gly

1580 1585 1590

Leu Gly Ala Glu Glu Pro Leu Ser Ser Met Thr Asp Asp Met Gly

1595 1600 1605

Ser Pro Leu Ser Thr Gly Tyr His Thr Arg Ser Gly Ser Glu Glu

1610 1615 1620

Ala Val Thr Asp Pro Gly Glu Arg Glu Ala Gly Ala Ser Leu Tyr

1625 1630 1635

Gln Gly Leu Met Arg Thr Ala Ser Glu Leu Leu Leu Asp Arg Arg

1640 1645 1650

Leu Arg Ile Pro Glu Leu Glu Glu Ala Glu Leu Phe Ala Glu Gly

1655 1660 1665

Gln Gly Arg Ala Leu Arg Leu Leu Arg Ala Val Tyr Gln Cys Val

1670 1675 1680

Ala Ala His Ser Glu Leu Leu Cys Tyr Phe Ile Ile Ile Leu Asn

1685 1690 1695

His Met Val Thr Ala Ser Ala Gly Ser Leu Val Leu Pro Val Leu

1700 1705 1710

Val Phe Leu Trp Ala Met Leu Ser Ile Pro Arg Pro Ser Lys Arg

1715 1720 1725

Phe Trp Met Thr Ala Ile Val Phe Thr Glu Ile Ala Val Val Val

1730 1735 1740

Lys Tyr Leu Phe Gln Phe Gly Phe Phe Pro Trp Asn Ser His Val

1745 1750 1755

Val Leu Arg Arg Tyr Glu Asn Lys Pro Tyr Phe Pro Pro Arg Ile

1760 1765 1770

Leu Gly Leu Glu Lys Thr Asp Gly Tyr Ile Lys Tyr Asp Leu Val

1775 1780 1785

Gln Leu Met Ala Leu Phe Phe His Arg Ser Gln Leu Leu Cys Tyr

1790 1795 1800

Gly Leu Trp Asp His Glu Glu Asp Ser Pro Ser Lys Glu His Asp

1805 1810 1815

Lys Ser Gly Glu Glu Glu Gln Gly Ala Glu Glu Gly Pro Gly Val

1820 1825 1830

Pro Ala Ala Thr Thr Glu Asp His Ile Gln Val Glu Ala Arg Val

1835 1840 1845

Gly Pro Thr Asp Gly Thr Pro Glu Pro Gln Val Glu Leu Arg Pro

1850 1855 1860

Arg Asp Thr Arg Arg Ile Ser Leu Arg Phe Arg Arg Arg Lys Lys

1865 1870 1875

Glu Gly Pro Ala Arg Lys Gly Ala Ala Ala Ile Glu Ala Glu Asp

1880 1885 1890

Arg Glu Glu Glu Glu Gly Glu Glu Glu Lys Glu Ala Pro Thr Gly

1895 1900 1905

Arg Glu Lys Arg Pro Ser Arg Ser Gly Gly Arg Val Arg Ala Ala

1910 1915 1920

Gly Arg Arg Leu Gln Gly Phe Cys Leu Ser Leu Ala Gln Gly Thr

1925 1930 1935

Tyr Arg Pro Leu Arg Arg Phe Phe His Asp Ile Leu His Thr Lys

1940 1945 1950

Tyr Arg Ala Ala Thr Asp Val Tyr Ala Leu Met Phe Leu Ala Asp

1955 1960 1965

Val Val Asp Phe Ile Ile Ile Ile Phe Gly Phe Trp Ala Phe Gly

1970 1975 1980

Lys His Ser Ala Ala Thr Asp Ile Thr Ser Ser Leu Ser Asp Asp

1985 1990 1995

Gln Val Pro Glu Ala Phe Leu Val Met Leu Leu Ile Gln Phe Ser

2000 2005 2010

Thr Met Val Val Asp Arg Ala Leu Tyr Leu Arg Lys Thr Val Leu

2015 2020 2025

Gly Lys Leu Ala Phe Gln Val Ala Leu Val Leu Ala Ile His Leu

2030 2035 2040

Trp Met Phe Phe Ile Leu Pro Ala Val Thr Glu Arg Met Phe Asn

2045 2050 2055

Gln Asn Val Val Ala Gln Leu Trp Tyr Phe Val Lys Cys Ile Tyr

2060 2065 2070

Phe Ala Leu Ser Ala Tyr Gln Ile Arg Cys Gly Tyr Pro Thr Arg

2075 2080 2085

Ile Leu Gly Asn Phe Leu Thr Lys Lys Tyr Asn His Leu Asn Leu

2090 2095 2100

Phe Leu Phe Gln Gly Phe Arg Leu Val Pro Phe Leu Val Glu Leu

2105 2110 2115

Arg Ala Val Met Asp Trp Val Trp Thr Asp Thr Thr Leu Ser Leu

2120 2125 2130

Ser Ser Trp Met Cys Val Glu Asp Ile Tyr Ala Asn Ile Phe Ile

2135 2140 2145

Ile Lys Cys Ser Arg Glu Thr Glu Lys Lys Tyr Pro Gln Pro Lys

2150 2155 2160

Gly Gln Lys Lys Lys Lys Ile Val Lys Tyr Gly Met Gly Gly Leu

2165 2170 2175

Ile Ile Leu Phe Leu Ile Ala Ile Ile Trp Phe Pro Leu Leu Phe

2180 2185 2190

Met Ser Leu Val Arg Ser Val Val Gly Val Val Asn Gln Pro Ile

2195 2200 2205

Asp Val Thr Val Thr Leu Lys Leu Gly Gly Tyr Glu Pro Leu Phe

2210 2215 2220

Thr Met Ser Ala Gln Gln Pro Ser Ile Ile Pro Phe Thr Ala Gln

2225 2230 2235

Ala Tyr Glu Glu Leu Ser Arg Gln Phe Asp Pro Gln Pro Leu Ala

2240 2245 2250

Met Gln Phe Ile Ser Gln Tyr Ser Pro Glu Asp Ile Val Thr Ala

2255 2260 2265

Gln Ile Glu Gly Ser Ser Gly Ala Leu Trp Arg Ile Ser Pro Pro

2270 2275 2280

Ser Arg Ala Gln Met Lys Arg Glu Leu Tyr Asn Gly Thr Ala Asp

2285 2290 2295

Ile Thr Leu Arg Phe Thr Trp Asn Phe Gln Arg Asp Leu Ala Lys

2300 2305 2310

Gly Gly Thr Val Glu Tyr Ala Asn Glu Lys His Met Leu Ala Leu

2315 2320 2325

Ala Pro Asn Ser Thr Ala Arg Arg Gln Leu Ala Ser Leu Leu Glu

2330 2335 2340

Gly Thr Ser Asp Gln Ser Val Val Ile Pro Asn Leu Phe Pro Lys

2345 2350 2355

Tyr Ile Arg Ala Pro Asn Gly Pro Glu Ala Asn Pro Val Lys Gln

2360 2365 2370

Leu Gln Pro Asn Glu Glu Ala Asp Tyr Leu Gly Val Arg Ile Gln

2375 2380 2385

Leu Arg Arg Glu Gln Gly Ala Gly Ala Thr Gly Phe Leu Glu Trp

2390 2395 2400

Trp Val Ile Glu Leu Gln Glu Cys Arg Thr Asp Cys Asn Leu Leu

2405 2410 2415

Pro Met Val Ile Phe Ser Asp Lys Val Ser Pro Pro Ser Leu Gly

2420 2425 2430

Phe Leu Ala Gly Tyr Gly Ile Met Gly Leu Tyr Val Ser Ile Val

2435 2440 2445

Leu Val Ile Gly Lys Phe Val Arg Gly Phe Phe Ser Glu Ile Ser

2450 2455 2460

His Ser Ile Met Phe Glu Glu Leu Pro Cys Val Asp Arg Ile Leu

2465 2470 2475

Lys Leu Cys Gln Asp Ile Phe Leu Val Arg Glu Thr Arg Glu Leu

2480 2485 2490

Glu Leu Glu Glu Glu Leu Tyr Ala Lys Leu Ile Phe Leu Tyr Arg

2495 2500 2505

Ser Pro Glu Thr Met Ile Lys Trp Thr Arg Glu Lys Glu

2510 2515 2520

<---

Похожие патенты RU2812362C2

название год авторы номер документа
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение 2022
  • Перепелкина Мария Павловна
  • Власова Елена Вениаминовна
  • Фомина Анастасия Владимировна
  • Гершович Павел Михайлович
  • Маркова Виталия Александровна
  • Морозов Дмитрий Валентинович
RU2818229C2
КОНСТРУКЦИИ ДНК-АНТИТЕЛ ДЛЯ ПРИМЕНЕНИЯ ПРОТИВ БОЛЕЗНИ ЛАЙМА 2017
  • Уэйнер, Дэвид, Б.
  • Флингай, Селеке
RU2813829C2
ЛЕЧЕНИЕ ЗАБОЛЕВАНИЙ ПОСРЕДСТВОМ ЭКСПРЕССИИ ФЕРМЕНТА, ОБЛАДАЮЩЕГО ДЕЗОКСИРИБОНУКЛЕАЗНОЙ (ДНКазной) АКТИВНОСТЬЮ, В ПЕЧЕНИ 2019
  • Генкин, Дмитрий Дмитриевич
  • Тец, Георгий Викторович
  • Тец, Виктор Вениаминович
RU2773691C2
ДОСТАВКА ТЕРАПЕВТИЧЕСКИХ ПОЛИПЕПТИДОВ ПОСРЕДСТВОМ ПСЕВДОТИПИРОВАННЫХ ОНКОЛИТИЧЕСКИХ ВИРУСОВ 2017
  • Ивнин, Люк
  • Финер, Митчелл Х.
RU2758007C2
Выделенный модифицированный белок VP1 капсида аденоассоциированного вируса 5 серотипа (AAV5), капсид и вектор на его основе 2019
  • Стрелкова Анна Николаевна
  • Карабельский Александр Владимирович
  • Мадера Дмитрий Александрович
  • Перепелкина Мария Павловна
  • Юрлова Елена Викторовна
  • Гершович Павел Михайлович
  • Прокофьев Александр Владимирович
  • Морозов Дмитрий Валентинович
RU2751592C2
КОМПОЗИЦИИ И СПОСОБЫ ИММУНОТЕРАПИИ ПРОТИВ CD20 2017
  • Пресс Оливер
  • Тилл Брайан
RU2782699C2
АНТИТЕЛА ПРОТИВ E-СЕЛЕКТИНА, КОМПОЗИЦИИ И СПОСОБЫ ПРИМЕНЕНИЯ 2021
  • Апгар, Джеймс Ризонер
  • Боули, Шерил Рубио
  • Элвелл, Джоанн Элизабет-Айрисс
  • Линь, Лаура
  • Нарула, Джатин
  • Парнг, Чуэньлей
  • Питтман, Дебра Денене
  • Ракхе, Свапнил
  • Юй, Чихий Винсент
RU2805176C1
КОМПОЗИЦИИ И СПОСОБЫ ДЛЯ МОДУЛЯЦИИ ПЕРЕДАЧИ СИГНАЛА LAIR 2017
  • Флис, Даллас, Бенджамин
  • Лю, Линда
  • Лангерманн, Соломон
RU2757394C2
ХИМЕРНЫЙ ЦИТОКИНОВЫЙ РЕЦЕПТОР 2016
  • Пюле, Мартин
  • Кордоба, Шон
  • Риги, Маттео
  • Силлибурн, Джеймс
  • Онуоха, Симоби
  • Томас, Саймон
RU2826122C1
СПОСОБЫ ПОЛУЧЕНИЯ ЭКСПРЕССИРУЮЩИХ ХИМЕРНЫЙ АНТИГЕННЫЙ РЕЦЕПТОР КЛЕТОК 2015
  • Бедойа Фелипе
  • Гхассеми Саба
  • Джун Карл Х.
  • Левин Брюс Л.
  • Миленхорст Ян Дж.
  • Майлон Майкл С.
  • Пауэлл Дэниэл Дж. Мл.
  • Чжэн Зоуи
RU2751362C2

Иллюстрации к изобретению RU 2 812 362 C2

Реферат патента 2024 года КОМПОНЕНТ 1 МЕХАНОЧУВСТВИТЕЛЬНОГО ИОННОГО КАНАЛА ПЬЕЗОТИПА (PIEZO1) И ЕГО ПРИМЕНЕНИЕ

Изобретение относится к области молекулярной биологии. В данном документе предложены способы лечения пациентов с варикозным расширением вен, способы выявления субъектов с повышенным риском развития варикозного расширения вен и способы диагностики варикозного расширения вен у субъекта-человека, включающие обнаружение присутствия молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции в биологическом образце пациента или субъекта. Техническим результатом является расширение арсенала средств диагностики варикозного расширения вен. 3 н. и 9 з.п. ф-лы, 5 ил., 3 табл., 5 пр.

Формула изобретения RU 2 812 362 C2

1. Способ идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, где способ включает определение, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия:

молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции;

молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции;

молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или

полипептида варианта PIEZO1 с прогнозируемой потерей функции;

где:

отсутствие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект не имеет повышенного риска развития варикозного расширения вен; и

наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.

2. Способ диагностирования варикозного расширения вен у субъекта-человека, включающий обнаружение в образце, полученном от субъекта, наличия или отсутствия:

молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции;

молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции;

молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или

полипептида варианта PIEZO1 с прогнозируемой потерей функции;

где, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют как имеющего варикозное расширение вен.

3. Способ по п. 1 или 2, где способ дополнительно включает лечение субъекта с варикозным расширением вен или повышенным риском развития варикозного расширения вен средством, эффективным для лечения варикозного расширения вен.

4. Способ лечения пациента с помощью терапевтического агента, который лечит или ингибирует варикозное расширение вен, где указанный пациент страдает варикозным расширением вен, включающий этапы:

определения того, имеет ли пациент молекулу нуклеиновой кислоты компонента механочувствительного ионного канала 1 пьезотипа (PIEZO1) с прогнозируемой потерей функции, кодирующую полипептид PIEZO1 человека, путем:

получения, запланированного или уже осуществленного, биологического образца от пациента; и

проведения запланированного или уже осуществленного, анализа генотипирования биологического образца, чтобы определить, имеет ли пациент генотип, включающий молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; и,

введение или продолжение введения пациенту, соответствующему стандарту PIEZO1, терапевтического агента, который лечит или ингибирует варикозное расширение вен, в стандартной дозе; или,

введение или продолжение введения пациенту, который является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, терапевтического агента, который лечит или ингибирует варикозное расширение вен, в количестве, которое равно или превышает стандартную дозу;

при этом наличие генотипа, включающего молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен.

5. Способ по любому из пп. 1-4, где этап определения, этап обнаружения или анализ генотипирования проводят in vitro.

6. Способ по любому из пп. 1-5, где этап определения, этап обнаружения или анализ генотипирования включает секвенирование по меньшей мере части нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1 в биологическом образце, при этом секвенированная часть содержит позицию, соответствующую позиции варианта с прогнозируемой потерей функции, где в случае обнаружения вариантного нуклеотида в позиции варианта с прогнозируемой потерей функции молекула нуклеиновой кислоты PIEZO1 в биологическом образце представляет собой молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.

7. Способ по любому из пп. 1-6, где этап определения, этап обнаружения или анализ генотипирования включает:

a) приведение биологического образца в контакт с праймером, гибридизирующимся с частью нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1, которая находится вблизи позиции варианта с прогнозируемой потерей функции;

b) удлинение праймера по меньшей мере через позицию варианта с прогнозируемой потерей функции; и

c) определение, содержит ли продукт удлинения праймера вариантный нуклеотид в позиции варианта с прогнозируемой потерей функции.

8. Способ по п. 6 или 7, где этап определения, этап обнаружения или анализ генотипирования включает секвенирование всей молекулы нуклеиновой кислоты.

9. Способ по любому из пп. 1-5, где этап определения, этап обнаружения или анализ генотипирования включает:

а) амплификацию по меньшей мере части молекулы нуклеиновой кислоты PIEZO1, которая кодирует человеческий полипептид PIEZO1, при этом часть содержит позицию варианта с прогнозируемой потерей функции;

b) мечение амплифицированной молекулы нуклеиновой кислоты обнаруживаемой меткой;

c) приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей специфический в отношении изменения зонд, где специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и

d) обнаружение обнаруживаемой метки.

10. Способ по п. 9, где молекула нуклеиновой кислоты в образце представляет собой мРНК, и эту мРНК обратно транскрибируют в кДНК перед этапом амплификации.

11. Способ по п. 9 или 10, где этап определения, этап обнаружения или анализ генотипирования включает:

приведение молекулы нуклеиновой кислоты в биологическом образце в контакт со специфическим в отношении изменения зондом, содержащим обнаруживаемую метку, при этом специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и

обнаружение обнаруживаемой метки.

12. Способ по любому из пп. 1-11, где молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции представляет собой 16:88715629:G:A, 16:88715728:G:T, 16:88715767:G:A, 16:88715802:C:A, 16:88715822:D:4, 16:88715987:I:1, 16:88716359:A:G, 16:88716570:C:T, 16:88716874:G:A, 16:88717213:T:A, 16:88719588:G:A, 16:88719722:C:G, 16:88719870:G:T, 16:88720068:D:2, 16:88720229:C:A, 16:88720248:D:4, 16:88720394:C:T, 16:88720644:D:1, 16:88720698:D:1, 16:88720698:I:1, 16:88721165:C:A, 16:88721268:D:1, 16:88721307:G:A, 16:88721586:G:C, 16:88721652:G:C, 16:88722217:C:T, 16:88722605:I:1, 16:88723005:I:7, 16:88723253:G:A, 16:88723311:C:T, 16:88725081:C:A, 16:88726282:G:A, 16:88726546:C:T, 16:88726619:G:A, 16:88726924:G:A, 16:88727038:C:T, 16:88727072:D:1, 16:88727163:G:A, 16:88731768:D:1, 16:88732334:C:G, 16:88732411:D:1, 16:88732720:D:1, 16:88733326:G:C, 16:88733337:D:4, 16:88733587:C:A, 16:88733965:D:1, 16:88734017:C:A, 16:88734042:I:1, 16:88734679:C:T, 16:88734909:I:1, 16:88736167:D:2, 16:88736324:G:A, 16:88736391:G:T, 16:88736409:C:T, 16:88736671:G:A, 16:88737557:A:C, 16:88737727:C:G, 16:88737815:C:T, 16:88738283:G:C, 16:88738637:G:A, 16:88738735:D:1, 16:88741477:C:T, 16:88742306:D:1, 16:88749399:G:A или 16:88784929:C:T, или полученную из нее молекулу мРНК, или молекулу кДНК, полученную из молекулы мРНК.

Документы, цитированные в отчете о поиске Патент 2024 года RU2812362C2

Varicose veins of lower extremities: insights from the first large-scale genetic study, Alexandra S
Shadrina, Sodbo Z
Sharapov, Tatiana I
Shashkova, Yakov A
СПОСОБ ПОЛУЧЕНИЯ ЦЕЛЛЮЛОЗЫ-^ЙСЕООЮЗНАЯ j .i>& -••;^V«i')_tJ;Yii"vF''--'^3J>&!;•% i Lei-'UU :->&.-••->&'.':' гЗ_...- • -.| 0
SU368365A1
Fukaya E
et al
Clinical and genetic determinants of varicose veins: prospective, community-based study of≈ 500

RU 2 812 362 C2

Авторы

Бэкмэн, Джошуа

Барас, Арис

Даты

2024-01-30Публикация

2020-02-07Подача