Ссылка на перечень последовательностей
Данная заявка включает Перечень последовательностей, поданный в электронной форме в виде текстового файла под названием 18923802502SEQ, созданного 5 февраля 2020 г. и имеющего размер 132 килобайта. Перечень последовательностей включен в данный документ посредством ссылки.
Область техники изобретения
В настоящем изобретении предложены способы лечения пациентов, имеющих варикозное расширение вен, способы идентификации субъектов, имеющих повышенный риск развития варикозного расширения вен, и способы диагностики варикозного расширения вен у субъекта-человека, включающие выявление наличия молекул нуклеиновых кислот и полипептидов варианта PIEZO1 с прогнозируемой потерей функции в биологическом образце от пациента или субъекта.
Уровень техники изобретения
Варикозное расширение вен - это распространенное многофакторное заболевание с большей частью неизвестными генетическими причинами, которое часто наблюдается у пациентов с хронической венозной недостаточностью, что вместе классифицируется как хроническая венозная болезнь. Дисфункция венозных клапанов вызывает варикозное расширение вен, венозную гипертензию и тромбоз. Некоторые процессы, такие как изменения гемодинамических сил, активация эндотелия, воспаление, гипоксия и нарушение регуляции матриксных металлопротеиназ и их тканевых ингибиторов, были связаны с развитием варикозного расширения вен. К факторам риска варикозного расширения вен относятся пожилой возраст, женский пол, количество беременностей, ожирение, тромбоз глубоких вен в анамнезе и длительное пребывание в стоячем положении. Варикозное расширение вен также связано с недостаточным оттоком лимфы и хронической венозной недостаточностью. Помимо этого, некоторые полногеномные исследования ассоциаций (GWAS) показали, что наследуемость варикозного расширения вен составляет около 18,5%.
PIEZO1 кодируется 70 т. п. о. геном, расположенным в 16q24.3, и имеющим пять потенциальных изоформ. Белок варианта PIEZO1 имеет длину 2 521 аминокислот и представляет собой трансмембранный белок массой 286 кДа, который содержит 38 трансмембранных доменов и функционирует в виде гомотетрамера. PIEZO1 кодирует эволюционно консервативный эндотелиальный механочувствительный катионный канал, который генерирует токи, характеризующиеся линейной зависимостью тока от напряжения, которые чувствительны к рутению красному и гадолинию. PIEZO1 экспрессируется повсеместно и играет роль в адгезии эпителиальных клеток, поддерживая активацию интегринов путем привлечения R-Ras в эндоплазматический ретикулум, вероятно, в активированном состоянии, и последующей стимуляции передачи сигналов кальпаина. В сосудистой сети PIEZO1 участвует в миграции эндотелиальных клеток и ангиогенезе, путем прорастания. Если говорить точнее, PIEZO1 действует как датчик гемодинамического удара, связанного с током крови, и способствует организации и выравниванию эндотелиальных клеток в направлении потока крови, обеспечивая правильное формирование, ремоделирование и дозревание сосудов. PIEZO1 также необходим для формирования лимфатических клапанов. Другие известные функции включают регуляцию кровяного давления, осмолярность мочи, целостность эритроцитов, определение давления и осморегуляцию собирательных трубочек.
Сущность изобретения
В настоящем изобретении предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия: молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции; молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем отсутствие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект не имеет повышенного риска развития варикозного расширения вен; а наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.
В настоящем изобретении также предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия: молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции; молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.
В настоящем изобретении также предложены способы лечения пациента терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, причем пациент имеет варикозное расширение вен или имеет повышенный риск развития варикозного расширение вен, включающие этапы: определения, имеет ли пациент молекулу нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, путем: получения, запланированного или уже осуществленного, биологического образца от пациента; и проведения, запланированного или уже осуществленного, анализа генотипирования биологического образца, чтобы определить, имеет ли пациент генотип, включающий молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; и, если пациент соответствует стандарту PIEZO1, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует развитие варикозного расширения вен, в стандартной дозе; и, если пациент является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует развитие варикозного расширения вен, в количестве, которое равно или превышает стандартную дозу; при этом наличие генотипа, включающего молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен.
Краткое описание графических материалов
Сопроводительные фигуры, которые включены и составляют часть этого описания изобретения, иллюстрируют несколько аспектов и вместе с описанием служат для пояснения принципов настоящего изобретения.
На Фиг. 1 показано репрезентативное распределение IBD, общей для пар индивидов в UKB 50k WES; оценочная для генотипов WES с отсутствие аллелей, идентичных по происхождению (IBD, от англ. «identical by descent») в сравнении с 1 аллелью IBD среди всех пар, для которых оценивали экзом UKB 50k.
На Фиг. 2 показан спектр частоты использования сайта (SFS) для всех аутосомных вариантов и по функциональному прогнозированию; экзомы UKB 50k были случайным образом отобраны для числа индивидов, указанного по горизонтальной оси; число генов, содержащих по меньшей мере указанное количество ЧАА ПП < 1% в соответствии с подписью, отложено по вертикальной оси; максимальное число аутосомных генов составляет 18272.
На Фиг. 3 показано континентальное происхождение в UK Biobank (Биобанк Объединенного королевства) 500k и 50k; основной компонент 1 и 2 для n=488377 индивидов, для которых доступны данные UK Biobank; три предопределенные области графика представляют африканское (синий цвет), восточно-азиатское (зеленый цвет) и европейское (красный цвет) происхождение.
На Фиг. 4 показаны одноточечные и общие результаты для 65 вариантов пПП в PIEZO1.
На Фиг. 5 показано оценку LD для варианта PIEZO1.
Описание
Различные термины, относящиеся к аспектам данного изобретения, используются по всему тексту данного описания и формулы изобретения. Таким терминам следует придавать их обычное значение в данной области техники, если не указано иное. Другие конкретно определенные термины следует толковать в соответствии с определениями, приведенными в данном документе.
Если четко не указано иное, любой способ или аспект, приведенный в данном документе, никоим образом не следует воспринимать, как требующий проведения его этапов в конкретном порядке. Соответственно, если в формуле изобретения или описании способа конкретно не указано, что стадии должны быть ограничены конкретным порядком, никоим образом не предусматривается, что подразумевается порядок, в любом отношении. Это относится к любой возможной не выраженной основе для интерпретации, включая вопросы логики в отношении организации стадий или производственного потока, простого значения, полученного из грамматической организации или пунктуации, или количества или типа аспектов, описанных в данном раскрытии.
Употребляемые в данном документе формы единственного числа включают ссылки на формы множественного числа, если из контекста явно следует иное.
В контексте данного документа термины «субъект» и «пациент» употребляются взаимозаменяемо. Субъект может включать в себя любое животное, включая млекопитающих. Млекопитающие включают в себя, но не ограничиваются ими, сельскохозяйственных животных (таких как, например, лошадь, корова, свинья), домашних животных (таких как, например, собака, кошка), лабораторных животных (таких как, например, мышь, крыса, кролики) и приматов, отличных от человека. В некоторых вариантах осуществления субъектом является человек.
В контексте данного документа термины «нуклеиновая кислота», «молекула нуклеиновой кислоты», «последовательность нуклеиновой кислоты», «полинуклеотид» или «олигонуклеотид» могут включать полимерную форму нуклеотидов любой длины, Рак включать ДНК и/или РНК, и могут быть одноцепочечными, двухцепочечными или многоцепочечными. Одна цепь нуклеиновой кислоты также относится к ее комплементарной последовательности.
В контексте данного документа термин «содержащая (-ий)» может быть заменен на «состоящая (-ий) из» или «по существу состоящая (-ий) из» в конкретных вариантах осуществления произвольно.
В контексте данного документа выражение «соответствующий» или его грамматические вариации, употребляемые в контексте нумерации конкретной аминокислотной или нуклеотидной последовательности или позиции, относится к нумерации определенной референсной последовательности, когда проводится сравнение конкретной аминокислотной или нуклеотидной последовательности с референсной последовательностью (например, в данном случае с референсной последовательностью, являющейся молекулой нуклеиновой кислоты или полипептидом (дикого типа) PIEZO1). Другими словами, номер остатка (например, аминокислоты или нуклеотида) или позицию остатка (например, аминокислоты или нуклеотида) конкретного полимера обозначают относительно референсной последовательности, а не по действительному номеру позиции остатка в конкретной аминокислотной или нуклеотидной последовательности. Например, конкретная аминокислотная последовательность может быть выровнена относительно референсной последовательности посредством внесения гэпов для оптимизации совпадения остатков между двумя последовательностями. В этих случаях, несмотря на наличие гэпов, нумерацию остатка в конкретной аминокислотной последовательности делают относительно референсной последовательности, с которой она была выровнена.
В соответствии с настоящим изобретением были получены данные, что определенные вариации в PIEZO1 связаны с риском развития варикозного расширения вен. Считается, что варианты гена PIEZO1 или его белка не имеют какой-либо известной связи с варикозным расширением вен у людей. Следовательно, субъектов-людей, имеющих изменения в PIEZO1, которые связаны с варикозным расширением вен, можно лечить так, чтобы ингибировать варикозное расширение вен, уменьшать его симптомы и/или подавлять развитие симптомов. Соответственно, в настоящем изобретении предложены способы использования идентификации таких вариантов у субъекта, чтобы идентифицировать или стратифицировать риск развития варикозного расширения вен у таких субъектов, или чтобы диагностировать субъектов, как имеющих варикозное расширение вен, чтобы субъектов, подверженных риску, или субъектов с активным заболеванием можно было лечить.
В целях настоящего изобретения любого конкретного человека можно классифицировать как имеющего один из трех генотипов PIEZO1: i) стандартный по PIEZO1; ii) гетерозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции; или iii) гомозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции. Человек является стандартным по PIEZO1, когда у этого человека отсутствует копия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. Человек является гетерозиготным в отношении варианта PIEZO1 с прогнозируемой потерей функции, когда у этого человека присутствует одна копия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. Молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции представляет собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Человек, который имеет полипептид PIEZO1 с частичной потерей функции (или прогнозируемой частичной потерей функции), является гипоморфным в отношении PIEZO1. Молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую описанную в данном документе вариантную молекулу нуклеиновой кислоты. Человек является гомозиготным в отношении варианта PIEZO1 с прогнозируемой потерей функции, когда у этого человека присутствуют две копии любой из молекул нуклеиновых кислот варианта PIEZO1 с прогнозируемой потерей функции.
В случае субъектов-людей или пациентов, которые генотипированы или определены как гетерозиготные или гомозиготные в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, такие субъекты-люди или пациенты имеют повышенный риск развития варикозного расширения вен. В случае субъектов-людей или пациентов, которые генотипированы или определены как гетерозиготные или гомозиготные в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, таких субъектов-людей или пациентов можно лечить агентом, эффективным для лечения варикозного расширения вен.
В настоящем изобретении предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК) или полипептида; причем отсутствие молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции или полипептида указывает на то, что субъект не имеет повышенного риска снижения минеральной плотности костной ткани и/или развития остеопороза; а наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.
В настоящем изобретении также предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия: i) молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; ii) молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; iii) молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или iv) полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем отсутствие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект не имеет повышенного риска развития варикозного расширения вен; а наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.
В настоящем изобретении также предложены способы идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, включающие: выявление, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК), кодирующей человеческий полипептид PIEZO1; причем: i) если у субъекта-человека отсутствует молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (т. е. субъект-человек генотипически категоризован как соответствующий стандарту PIEZO1), субъект-человек не имеет повышенный риск развития варикозного расширения вен; и ii) если у субъекта-человека присутствует молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (т. е. субъект-человек генотипически категоризован как гетерозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции или гомозиготный в отношении варианта PIEZO1 с прогнозируемой потерей функции), субъект-человек имеет повышенный риск развития варикозного расширения вен.
В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.
Определение, присутствует ли в биологическом образце субъекта-человека молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления молекула нуклеиновой кислоты может присутствовать в клетке, полученной от субъекта-человека.
В любом из вариантов осуществления, описанных в данном документе, варикозное расширение вен может быть варикозным расширением вен на ранней стадии (например, C0 согласно классификации CEAP (клинической, этиологической, анатомической и патофизиологической)). В некоторых вариантах осуществления варикозное расширение вен может быть варикозным расширением вен на поздней стадии (например, C6 согласно классификации CEAP). В некоторых вариантах осуществления варикозное расширение вен может соответствовать любой стадии заболевания (например, C0-C6 согласно классификации CEAP). В некоторых вариантах осуществления субъект-человек является женщиной.
В некоторых вариантах осуществления, когда субъект-человек идентифицирован как имеющий повышенный риск развития варикозного расширения вен, субъекта-человека дополнительно лечат терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, как описано в данном документе. Например, когда субъект-человек является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции и, следовательно, имеет повышенный риск развития варикозного расширения вен, субъекту-человеку вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен. В некоторых вариантах осуществления, когда субъект-человек является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, пациенту вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен, в дозе, которая равна или превышает стандартную дозу, вводимую пациенту, который является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
В настоящем изобретении предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК) или полипептида; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.
В настоящем изобретении также предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия: i) молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; ii) молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции; iii) молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или iv) полипептида варианта PIEZO1 с прогнозируемой потерей функции; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.
В настоящем изобретении также предложены способы диагностирования варикозного расширения вен у субъекта-человека, включающие выявление в образце, полученном от субъекта, наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК), кодирующей человеческий полипептид PIEZO1; причем, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид (т. е. субъект-человек категоризован как гетерозиготный или гомозиготный в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции) и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют, как имеющего варикозное расширение вен.
В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.
Определение наличия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции в образце, полученном от субъекта, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления молекула нуклеиновой кислоты может присутствовать в клетке, полученной от субъекта-человека.
В любом из вариантов осуществления, описанных в данном документе, варикозное расширение вен может быть варикозным расширением вен на ранней стадии (например, C0 согласно классификации CEAP (клинической, этиологической, анатомической и патофизиологической)). В некоторых вариантах осуществления варикозное расширение вен может быть варикозным расширением вен на поздней стадии (например, C6 согласно классификации CEAP). В некоторых вариантах осуществления варикозное расширение вен может соответствовать любой стадии заболевания (например, C0-C6 согласно классификации CEAP). В некоторых вариантах осуществления субъект-человек является женщиной.
В некоторых вариантах осуществления, когда субъект-человек диагностирован как имеющий варикозное расширение вен, субъекта-человека дополнительно лечат терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, как описано в данном документе. Например, когда субъект-человек определен как гетерозиготный или гомозиготный в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции и имеет один или более симптомов варикозного расширения вен, субъекту-человеку вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен. В некоторых вариантах осуществления, когда субъект-человек является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, пациенту вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен, в дозе, которая равна или превышает стандартную дозу, вводимую пациенту, который является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
В настоящем изобретении также предложены способы лечения пациента терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, причем пациент имеет варикозное расширение вен или имеет повышенный риск развития варикозного расширения вен, включающие этапы: определения, имеет ли пациент молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, путем: получения, запланированного или уже осуществленного, биологического образца от пациента; и проведения, запланированного или уже осуществленного, анализа генотипирования биологического образца, чтобы определить, имеет ли пациент генотип, включающий молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; и, если пациент соответствует стандарту PIEZO1, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в стандартной дозе; и, если пациент является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в количестве, которое равно или превышает стандартную дозу; при этом наличие генотипа, включающего молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен. В некоторых вариантах осуществления пациент является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.
Анализ генотипирования для определения, присутствует ли у пациента молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующая человеческий полипептид PIEZO1, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления молекула нуклеиновой кислоты может присутствовать в клетке, полученной от субъекта-человека.
В некоторых вариантах осуществления, когда субъект-человек является гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, пациенту вводят терапевтический агент, который лечит или ингибирует варикозное расширение вен, в дозе, которая равна или превышает стандартную дозу, вводимую пациенту, который является гетерозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
В настоящем изобретении также предложены способы лечения пациента терапевтическим агентом, который лечит или ингибирует варикозное расширение вен, причем пациент имеет варикозное расширение вен или имеет повышенный риск развития варикозного расширения вен, включающие этапы: определения, имеет ли пациент вариантный полипептид PIEZO1 с прогнозируемой потерей функции, путем: получения, запланированного или уже осуществленного, биологического образца от пациента; и проведения, запланированного или уже осуществленного, анализа биологического образца, чтобы определить, имеет ли пациент вариантный полипептид PIEZO1 с прогнозируемой потерей функции; и, если пациент не имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в стандартной дозе; и, если пациент имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции, введение или продолжение введения пациенту терапевтического агента, который лечит или ингибирует варикозное расширение вен, в количестве, которое равно или превышает стандартную дозу; при этом наличие вариантного полипептида PIEZO1 с прогнозируемой потерей функции указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен. В некоторых вариантах осуществления пациент имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления пациент не имеет вариантный полипептид PIEZO1 с прогнозируемой потерей функции.
Анализ для определения, присутствует ли у пациента вариантный полипептид PIEZO1 с прогнозируемой потерей функции, можно проводить любыми описанными в данном документе способами. В некоторых вариантах осуществления эти способы можно проводить in vitro. В некоторых вариантах осуществления эти способы можно проводить in situ. В некоторых вариантах осуществления эти способы можно проводить in vivo. В любом из этих вариантов осуществления полипептид может присутствовать в клетке, полученной от субъекта-человека.
В любом из описанных в данном документе вариантов осуществления вариантный полипептид PIEZO1 с прогнозируемой потерей функции может представлять собой любой полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, вариантный полипептид PIEZO1 с прогнозируемой потерей функции может представлять собой любой из описанных в данном документе вариантных полипептидов PIEZO1.
В любом из вариантов осуществления, описанных в данном документе, варикозное расширение вен может быть варикозным расширением вен на ранней стадии (например, C0 согласно классификации CEAP (клинической, этиологической, анатомической и патофизиологической)). В некоторых вариантах осуществления варикозное расширение вен может быть варикозным расширением вен на поздней стадии (например, C6 согласно классификации CEAP). В некоторых вариантах осуществления варикозное расширение вен может соответствовать любой стадии заболевания (например, C0-C6 согласно классификации CEAP). В некоторых вариантах осуществления субъект-человек является женщиной.
Симптомы варикозного расширения вен включают, но не ограничиваются этим, тяжесть в ногах, появление сосудистой сетки вен (телеангиэктазии) на пораженной ноге, припухлость голеностопного сустава, особенно к вечеру, коричневато-желтый лоснящийся цвет кожи вблизи пораженных вен, покраснение, сухость и зуд участков кожи (так называемый застойный дерматит или венозная экзема), судороги, особенно при резком движении, например, при вставании, незначительные повреждения пораженного участка, кровотечение, превышающее норму или требующее длительного времени для заживления, уменьшение объема кожи над голеностопным суставом (липодерматосклероз), синдром беспокойных ног, побелевшие, неровные пятнами, похожие на рубцы, появляющиеся на голеностопных суставах (белая атрофия кожи), или любую их комбинацию.
Примеры терапевтических средств, которые лечат или ингибируют варикозное расширение вен, включают, но не ограничиваются этим, флавоноиды, такие как диосмин или гесперидин, и противовоспалительные средства, такие как ибупрофен и аспирин.
В некоторых вариантах осуществления доза терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, может быть снижена на около 10%, на около 20%, на около 30%, на около 40%, на около 50%, на около 60%, на около 70%, на около 80% или на около 90% для пациентов или субъектов-людей, которые являются гетерозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции(т. е. ниже стандартной дозы), по сравнению с пациентами или субъектами-людьми, которые являются гомозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (которые могут получать стандартную дозу). В некоторых вариантах осуществления доза терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, может быть снижена на около 10%, на около 20%, на около 30%, на около 40% или на около 50%. Кроме того, дозу терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, для пациентов или субъектов-людей, которые являются гетерозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, можно вводить реже по сравнению с пациентами или субъектами-людьми, которые являются гомозиготными в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
Введение терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, можно проводить повторно, например, через одни сутки, двое суток, трое суток, пять суток, одну неделю, две недели, три недели, один месяц, пять недель, шесть недель, семь недель, восемь недель, два месяца или три месяца. Повторное введение можно проводить в той же дозе или в отличной дозе. Введение можно повторять один раз, два раза, три раза, четыре раза, пять раз, шесть раз, семь раз, восемь раз, девять раз, десять раз или большее число раз. Например, в соответствии с определенными схемами введения доз, пациент может получать терапию в течение продолжительного периода времени, такого как, например, 6 месяцев, 1 год или дольше.
Введение терапевтических агентов, которые лечат или ингибируют варикозное расширение вен, можно осуществлять любым подходящим путем, включая, но не ограничиваясь этим, следующие: парентеральный, внутривенный, пероральный, подкожный, внутриартериальный, внутричерепной, интратекальный, внутрибрюшинный, местный, интраназальный или внутримышечный. Фармацевтические композиции для введения предпочтительно являются стерильными и по существу изотоничными, и произведены согласно условиям правил производства и контроля качества лекарственных средств (GMP). Фармацевтические композиции могут быть представлены в единичной лекарственной форме (т. е. дозированной форме для единичного введения). Фармацевтические композиции могут быть составлены с использованием одного или более физиологически и фармацевтически приемлемых носителей, разбавителей, эксципиентов или вспомогательных веществ. Подходящий лекарственный состав зависит от выбранного пути введения. Термин «фармацевтически приемлемый» означает, что носитель, разбавитель, эксципиент или вспомогательное вещество совместимы с другими ингредиентами лекарственного состава и по существу не являются вредными для их реципиента.
В контексте данного документа термины «лечить» и «лечение», а также «предотвращать» и «предотвращение» относятся к обеспечению необходимого биологического ответа, такого как терапевтический и профилактический эффект, соответственно. В некоторых вариантах осуществления терапевтический эффект включает одно или более из снижения/уменьшения варикозного расширения вен, снижения/уменьшения тяжести варикозного расширения вен (например, уменьшения или ингибирования варикозного расширения вен), снижения/уменьшения симптомов и снижения связанных с варикозным расширением вен эффектов, отсрочки появления симптомов и связанных с варикозным расширением вен эффектов, уменьшения тяжести симптомов связанных с варикозным расширением вен эффектов, уменьшения тяжести эпизодов острого заболевания, уменьшения числа симптомов и связанных с варикозным расширением вен эффектов, уменьшения латентного периода симптомов и связанных с варикозным расширением вен эффектов, смягчения симптомов и связанных с варикозным расширением вен эффектов, уменьшения вторичных симптомов, уменьшения вторичных инфекций, предотвращения рецидива до варикозного расширения вен, снижения числа или частоты эпизодов рецидивов, увеличения латентного периода между симптоматическими эпизодами, увеличения времени до постоянного прогрессирования, ускорения выздоровления и/или увеличения эффективности или снижения резистентности к альтернативным терапевтическим средствам после введения агента или композиции, содержащей агент. Профилактический эффект может включать полное или частичное предотвращение/ингибирование или задержку развития/прогрессирования варикозного расширения вен (например, полные или частичные предотвращение/ингибирование или задержку) после применения терапевтического протокола. Лечение варикозного расширения вен включает в себя лечение пациентов, у которых уже диагностирована любая форма варикозного расширения вен на любой клинической стадии или проявлении, задержку начала или развития, или обострения, или ухудшения симптомов или признаков варикозного расширения вен, и/или предотвращение, и/или уменьшение тяжести варикозного расширения вен.
В настоящем изобретении также предложены, в любом из описанных в данном документе способов, обнаружение или определение наличия молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции и/или молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции в биологическом образце от субъекта-человека. Следует понимать, что генные последовательности в пределах популяции и молекулы мРНК, кодируемые такими генами, могут варьировать из-за полиморфизмов, таких как однонуклеотидные полиморфизмы. Предложенные в данном документе последовательности для описанных в данном документе вариантных молекул нуклеиновых кислот PIEZO1 являются исключительно примерами последовательностей. Также возможны другие последовательности вариантных молекул нуклеиновых кислот PIEZO1.
Биологический образец может быть получен из любой клетки, ткани или биологической жидкости субъекта. Образец может содержать любую клинически значимую ткань, например, образец костного мозга, биопсию опухоли, тонкоигольный аспират, или образец жидкости организма, такой как кровь, зубодесневая жидкость, плазма крови, сыворотка крови, лимфа, асцитическая жидкость, кистозная жидкость или моча. В некоторых случаях образец содержит ротовой мазок. Образец, используемый в описанных в данном документе способах, будет варьировать в зависимости от формата анализа, природы способа обнаружения и тканей, клеток или экстрактов, которые используются в качестве образца. Биологический образец может проходить разную обработку в зависимости от применяемого анализа. Например, при обнаружении вариантной молекулы нуклеиновой кислоты PIEZO1 можно применять предварительную обработку с целью выделения или обогащения образца в отношении геномной ДНК. В этих целях можно использовать множество известных способов. При обнаружении уровня любой вариантной мРНК PIEZO1 можно применять разные методики для обогащения биологического образца мРНК. Можно применять различные способы для обнаружения наличия или уровня молекулы мРНК или наличия конкретного локуса вариантной геномной ДНК.
В некоторых вариантах осуществления обнаружение молекулы нуклеиновой кислоты человеческого варианта PIEZO1 с прогнозируемой потерей функции у субъекта-человека включает анализ или генотипирование биологического образца, полученного от субъекта-человека, для определения, содержит ли молекула геномной нуклеиновой кислоты PIEZO1, молекула мРНК PIEZO1 или молекула кДНК PIEZO1, полученная из молекулы мРНК, в биологическом образце одну или более вариаций, которые вызывают потерю функции (частичную или полную), или, как прогнозируется, вызывают потерю функции (частичную или полную).
В некоторых вариантах осуществления способы обнаружения присутствия или отсутствия молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции (такой как, например, молекула геномной нуклеиновой кислоты, молекула мРНК и/или молекула кДНК) у субъекта-человека включают: проведение анализа биологического образца, полученного от субъекта-человека, который позволяет определить, содержит ли молекула нуклеиновой кислоты в биологическом образце конкретную нуклеотидную последовательность.
В некоторых вариантах осуществления биологический образец включает клетку или клеточный лизат. Такие способы могут дополнительно включать, например, получение от субъекта биологического образца, содержащего молекулу геномной нуклеиновой кислоты PIEZO1 или молекулу мРНК, и, в случае мРНК, необязательное проведение обратной транскрипции мРНК в кДНК. Такие анализы могут включать, например, определение идентичности этих позиций конкретной молекулы нуклеиновой кислоты PIEZO1. В некоторых вариантах осуществления способ представляет собой способ in vitro.
В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает секвенирование по меньшей мере части нуклеотидной последовательности молекулы геномной нуклеиновой кислоты PIEZO1, молекулы мРНК PIEZO1 или молекулы кДНК PIEZO1, полученной из молекулы мРНК, в биологическом образце, при этом секвенированная часть содержит одну или более вариаций, которые вызывают потерю функции (частичную или полную) или, как прогнозируется, вызывают потерю функции (частичную или полную).
В любом из описанных в данном документе способов этап определения, этап обнаружения или анализ генотипирования включает секвенирование по меньшей мере части нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1 в биологическом образце, при этом секвенированная часть содержит позицию, соответствующую позиции варианта с прогнозируемой потерей функции, причем в случае обнаружения вариантного нуклеотида в позиции варианта с прогнозируемой потерей функции молекула нуклеиновой кислоты PIEZO1 в биологическом образце представляет собой молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает: a) приведение биологического образца в контакт с праймером, гибридизирующимся с частью нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1, которая находится вблизи позиции варианта с прогнозируемой потерей функции; b) удлинение праймера по меньшей мере через позицию варианта с прогнозируемой потерей функции; и c) определение, содержит ли продукт удлинения праймера вариантный нуклеотид в позиции варианта с прогнозируемой потерей функции.
В некоторых вариантах осуществления анализ включает секвенирование всей молекулы нуклеиновой кислоты. В некоторых вариантах осуществления анализируют только молекулу геномной нуклеиновой кислоты PIEZO1. В некоторых вариантах осуществления анализируют только мРНК PIEZO1. В некоторых вариантах осуществления анализируют только кДНК PIEZO1, полученную из мРНК PIEZO1.
В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает: а) амплификацию по меньшей мере части молекулы нуклеиновой кислоты PIEZO1, которая кодирует человеческий полипептид PIEZO1, при этом часть содержит позицию варианта с прогнозируемой потерей функции; b) мечение амплифицированной молекулы нуклеиновой кислоты обнаруживаемой меткой; c) приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей специфический в отношении изменения зонд, причем специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и d) обнаружение обнаруживаемой метки.
В некоторых вариантах осуществления молекула нуклеиновой кислоты представляет собой мРНК, а этап определения дополнительно включает обратную транскрипцию мРНК в кДНК перед этапом амплификации.
В некоторых вариантах осуществления этап определения, этап обнаружения или анализ генотипирования включает: приведение молекулы нуклеиновой кислоты в биологическом образце в контакт со специфическим в отношении изменения зондом, содержащим обнаруживаемую метку, при этом специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и обнаружение обнаруживаемой метки.
Специфические в отношении изменения зонды или специфические в отношении изменения праймеры, описанные в данном документе, содержат последовательность нуклеиновой кислоты, которая является комплементарной и/или гибридизируется или специфически гибридизируется с молекулой нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции или ее комплементарной последовательностью. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры содержат или состоят из по меньшей мере около 5, по меньшей мере около 8, по меньшей мере около 10, по меньшей мере около 11, по меньшей мере около 12, по меньшей мере около 13, по меньшей мере около 14, по меньшей мере около 15, по меньшей мере около 16, по меньшей мере около 17, по меньшей мере около 18, по меньшей мере около 19, по меньшей мере около 20, по меньшей мере около 21, по меньшей мере около 22, по меньшей мере около 23, по меньшей мере около 24, по меньшей мере около 25, по меньшей мере около 30, по меньшей мере около 35, по меньшей мере около 40, по меньшей мере около 45 или по меньшей мере около 50 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры содержат или состоят из по меньшей мере 15 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры содержат или состоят из от по меньшей мере 15 нуклеотидов до по меньшей мере 35 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды или специфические в отношении изменения праймеры гибридизируется с молекулами геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулами мРНК варианта PIEZO1 с прогнозируемой потерей функции и/или молекулами кДНК варианта PIEZO1 с прогнозируемой потерей функции в жестких условиях.
Для обнаружения мутаций, таких как ОНП, в последовательности нуклеиновой кислоты можно применять методики специфической в отношении изменения полимеразной цепной реакции. Можно применять специфические в отношении изменения праймеры, поскольку ДНК-полимераза не будет осуществлять удлинение при наличии несовпадения с матрицей.
В некоторых вариантах осуществления молекула нуклеиновой кислоты в образце представляет собой мРНК, и эту мРНК обратно транскрибируют в кДНК перед этапом амплификации. В некоторых вариантах осуществления молекула нуклеиновой кислоты присутствует в клетке, полученной от субъекта-человека.
В любом из описанных в данном документе вариантов осуществления молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую молекулу нуклеиновой кислоты PIEZO1 (такую как, например, молекула геномной нуклеиновой кислоты, молекула мРНК или молекула кДНК), кодирующую полипептид PIEZO1, имеющий частичную потерю функции, полную потерю функции, прогнозируемую частичную потерю функции или прогнозируемую полную потерю функции. Например, молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции может представлять собой любую из описанных в данном документе молекул нуклеиновых кислот варианта PIEZO1.
В некоторых вариантах осуществления анализ может включать приведение биологического образца в контакт с праймером или зондом, таким как специфический в отношении изменения праймер или специфический в отношении изменения зонд, которые специфически гибридизируются с вариантной геномной последовательностью PIEZO1, вариантной последовательностью мРНК или вариантной последовательностью кДНК, но не с соответствующей референсной последовательностью PIEZO1 в жестких условиях, и определение, произошла ли гибридизация.
В некоторых вариантах осуществления анализ включает секвенирование РНК (РНК-секвенирование). В некоторых вариантах осуществления анализы также включают проведение обратной транскрипции мРНК в кДНК, например, с помощью полимеразной цепной реакции с обратной транскриптазой (ОТ-ПЦР).
В некоторых вариантах осуществления в способах используют зонды и праймеры достаточной нуклеотидной длины для связывания с целевой нуклеотидной последовательностью и, в частности, для обнаружения и/или идентификации полинуклеотида, содержащего молекулу вариантной геномной нуклеиновой кислоты PIEZO1, молекулу вариантной мРНК или молекулу вариантной кДНК. Условия гибридизации или условия реакции могут определяться проводящим эксперимент человеком для достижения данного результата. Нуклеотидная длина может быть любой длиной, достаточной для использования в выбранном способе обнаружения, включая любой анализ, описанный или приведенный в качестве примера в данном документе. Такие зонды и праймеры могут специфически гибридизоваться с целевой нуклеотидной последовательностью в условиях гибридизации высокой жесткости. Зонды и праймеры могут быть полностью идентичными последовательности смежных нуклеотидов в пределах целевой нуклеотидной последовательности, хотя с помощью традиционных способов можно конструировать зонды, отличающиеся от целевой нуклеотидной последовательности, но которые сохраняют способность специфическим образом выявлять и/или идентифицировать целевую нуклеотидную последовательность. Зонды и праймеры могут быть на около 80%, около 85%, около 90%, около 91%, около 92%, около 93%, около 94%, около 95%, около 96%, около 97%, около 98%, около 99% или на 100% идентичны или комплементарны нуклеотидной последовательности целевой молекулы нуклеиновой кислоты.
Иллюстративные примеры методик секвенирования нуклеиновых кислот включают, но не ограничиваются этим, секвенирование с терминатором синтеза цепи (по Сэнгеру) и секвенирование с терминатором красителя. Другие способы включают в себя способы гибридизации нуклеиновых кислот, отличные от секвенирования, включая применение меченных праймеров или зондов, направленных против очищенной ДНК, амплифицированной ДНК и фиксированных клеточных препаратов (флуоресцентная гибридизация in situ (FISH)). В некоторых способах целевую молекулу нуклеиновой кислоты можно амплифицировать до обнаружения или одновременно с ним. Иллюстративные примеры методик амплификации нуклеиновых кислот включают в себя, но не ограничиваются ими, полимеразную цепную реакцию (ПЦР), лигазную цепную реакцию (ЛЦР), амплификацию с замещением цепей (АЗЦ) и амплификацию на основании нуклеотидной последовательности (АОНП). Другие способы включают в себя, но не ограничиваются ими, лигазную цепную реакцию, амплификацию с замещением цепей и термофильную АЗЦ (тАЗЦ).
В методах гибридизации могут применяться жесткие условия так, чтобы зонд или праймер специфически гибридизировался со своей мишенью. В некоторых вариантах осуществления полинуклеотидный праймер или зонд в жестких условиях будут гибридизоваться со своей целевой последовательностью в выявляемо большей степени, чем с другими, нецелевыми, последовательностями, например, по меньшей мере в 2 раза, по меньшей мере в 3 раза, по меньшей мере в 4 раза или в большее число раз превышая фон, включая превышение фона больше чем в 10 раз. Жесткие условия зависят от последовательности и будут разными в разных обстоятельствах.
Соответствующие условия жесткости, которые стимулируют гибридизацию ДНК, например, 6X хлорид натрия/цитрат натрия (SSC) при около 45°C с последующей промывкой 2X SSC при 50°C, являются известными или же их можно найти в Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. Как правило, жесткие условия для гибридизации и обнаружения будут таковыми, при которых концентрация соли составляет меньше чем около 1,5 M ионов Na+, как правило, это концентрации ионов Na+ (или других солей) от около 0,01 до около 1,0 M при pH от 7,0 до 8,3, а температура составляет по меньшей мере около 30°C для коротких зондов (например, от 10 до 50 нуклеотидов) и по меньшей мере около 60°C для более длинных зондов (например, больше чем 50 нуклеотидов). Жесткие условия также можно обеспечить путем добавления дестабилизирующих агентов, таких как формамид. Необязательно, буферы для промывки могут содержать от 0,1% до 1% ДСН. Длительность гибридизации в общем случает составляет меньше чем около 24 часа, обычно - от около 4 часов до около 12 часов. Длительность времени промывки будет составлять по меньшей мере тот промежуток времени, который необходим для достижения равновесия.
В данном изобретении также предложены молекулярные комплексы, содержащие любую из молекул нуклеиновой кислоты PIEZO1 (молекул геномной нуклеиновой кислоты, молекул мРНК или молекул кДНК) или их комплементарных последовательностей, описанных в данном документе, и любой из специфических в отношении изменения праймеров или специфических в отношении изменения зондов, описанных в данном документе. В некоторых вариантах осуществления молекулы нуклеиновой кислоты PIEZO1 (молекулы геномной нуклеиновой кислоты, молекулы мРНК или молекулы кДНК) или их комплементарные последовательности в молекулярных комплексах являются одноцепочечными. В некоторых вариантах осуществления молекула нуклеиновой кислоты PIEZO1 представляет собой любую из молекул геномных нуклеиновых кислот, описанных в данном документе. В некоторых вариантах осуществления молекула нуклеиновой кислоты PIEZO1 представляет собой любую из молекул мРНК, описанных в данном документе. В некоторых вариантах осуществления молекула нуклеиновой кислоты PIEZO1 представляет собой любую из молекул кДНК, описанных в данном документе. В некоторых вариантах осуществления молекулярный комплекс содержит любую из молекул нуклеиновой кислоты PIEZO1 (молекул геномной нуклеиновой кислоты, молекул мРНК или молекул кДНК) или их комплементарных последовательностей, описанных в данном документе, и любой из специфических в отношении изменения праймеров, описанных в данном документе. В некоторых вариантах осуществления молекулярный комплекс содержит любую из молекул нуклеиновой кислоты PIEZO1 (молекул геномной нуклеиновой кислоты, молекул мРНК или молекул кДНК) или их комплементарных последовательностей, описанных в данном документе, и любой из специфических в отношении изменения зондов, описанных в данном документе. В некоторых вариантах осуществления молекулярный комплекс содержит нечеловеческую полимеразу.
В некоторых вариантах осуществления обнаружение наличия человеческого полипептида PIEZO1 с прогнозируемой потерей функции включает проведение анализа образца, полученного от субъекта-человека, для определения, содержит ли полипептид PIEZO1 у субъекта одну или более вариаций, которые вызывают потерю функции (частичную или полную) или прогнозируемую потерю функции (частичную или полную) полипептида. В некоторых вариантах осуществления анализ включает секвенирование по меньшей мере части полипептида PIEZO1, которая содержит вариантную позицию. В некоторых вариантах осуществления этап обнаружения включает секвенирование всего полипептида. Идентификация вариантной аминокислоты в вариантной позиции полипептида PIEZO1 указывает на то, что полипептид PIEZO1 представляет собой полипептид PIEZO1 с прогнозируемой потерей функции. В некоторых вариантах осуществления анализ включает иммуноанализ для обнаружения наличия полипептида, который содержит вариант. Обнаружение вариантной аминокислоты в вариантной позиции полипептида PIEZO1 указывает на то, что полипептид PIEZO1 представляет собой полипептид PIEZO1 с прогнозируемой потерей функции.
Зонды и/или праймеры (включая специфические в отношении изменения зонды и специфические в отношении изменения праймеры), описанные в данном документе, содержат или состоят из от около 15 до около 100, от около 15 до около 35 нуклеотидов. В некоторых вариантах осуществления специфические в отношении изменения зонды и специфические в отношении изменения праймеры содержат ДНК. В некоторых вариантах осуществления специфические в отношении изменения зонды и специфические в отношении изменения праймеры содержат РНК. В некоторых вариантах осуществления зонды и праймеры, описанные в данном документе (включая специфические в отношении изменения зонды и специфические в отношении изменения праймеры), имеют нуклеотидную последовательность, которая специфически гибридизируется с любой из молекул нуклеиновых кислот, описанных в данном документе, или их комплементарной последовательностью. В некоторых вариантах осуществления зонды и праймеры (включая специфические в отношении изменения зонды и специфические в отношении изменения праймеры) специфически гибридизируются с любой из молекул нуклеиновых кислот, описанных в данном документе, в жестких условиях. В контексте данного описания выражение «специфически гибридизируется» означает, что зонд или праймер (включает специфические в отношении изменения зонды и специфические в отношении изменения праймеры) не гибридизируется с последовательностью нуклеиновой кислоты, кодирующей молекулу референсной геномной нуклеиновой кислоты PIEZO1, молекулу референсной мРНК PIEZO1 и/или молекулу референсной кДНК PIEZO1. В некоторых вариантах осуществления зонды (такие как, например, специфический в отношении изменения зонд) содержат метку. В некоторых вариантах осуществления метка представляет собой флуоресцентную метку, радиоизотопную метку или биотин.
Нуклеотидная последовательность молекулы референсной геномной нуклеиновой кислоты PIEZO1 приведена в SEQ ID NO:1, длина которой составляет 69883 нуклеотидов. Первый нуклеотид, приведенный в SEQ ID NO:1, соответствует нуклеотиду в позиции 88715338 хромосомы 16 (см. hg38_knownGene_ENST00000301015.14).
Существуют многочисленные вариантные молекулы геномной нуклеиновой кислоты PIEZO1, включая, но не ограничиваясь этим (по референсной версии генома человека GRch38): 16:88715629:G:A, 16:88715728:G:T, 16:88715767:G:A, 16:88715802:C:A, 16:88715822:D:4, 16:88715987:I:1, 16:88716359:A:G, 16:88716570:C:T, 16:88716874:G:A, 16:88717213:T:A, 16:88719588:G:A, 16:88719722:C:G, 16:88719870:G:T, 16:88720068:D:2, 16:88720229:C:A, 16:88720248:D:4, 16:88720394:C:T, 16:88720644:D:1, 16:88720698:D:1, 16:88720698:I:1, 16:88721165:C:A, 16:88721268:D:1, 16:88721307:G:A, 16:88721586:G:C, 16:88721652:G:C, 16:88722217:C:T, 16:88722605:I:1, 16:88723005:I:7, 16:88723253:G:A, 16:88723311:C:T, 16:88725081:C:A, 16:88726282:G:A, 16:88726546:C:T, 16:88726619:G:A, 16:88726924:G:A, 16:88727038:C:T, 16:88727072:D:1, 16:88727163:G:A, 16:88731768:D:1, 16:88732334:C:G, 16:88732411:D:1, 16:88732720:D:1, 16:88733326:G:C, 16:88733337:D:4, 16:88733587:C:A, 16:88733965:D:1, 16:88734017:C:A, 16:88734042:I:1, 16:88734679:C:T, 16:88734909:I:1, 16:88736167:D:2, 16:88736324:G:A, 16:88736391:G:T, 16:88736409:C:T, 16:88736671:G:A, 16:88737557:A:C, 16:88737727:C:G, 16:88737815:C:T, 16:88738283:G:C, 16:88738637:G:A, 16:88738735:D:1, 16:88741477:C:T, 16:88742306:D:1, 16:88749399:G:A и 16:88784929:C:T. Так, например, если использовать в качестве основы референсную геномную нуклеотидную последовательность SEQ ID NO:1 (в которой первый нуклеотид обозначен как позиция 88715338), первый из перечисленных вариантов (16:88715629:G:A) будет иметь замену гуанина на аденин (обозначенный как «нуклеотид варианта») в позиции 88715629 (обозначенном как «позиция варианта»). Те варианты, в обозначении которых за числом следует «D», имеют делецию указанного числа нуклеотидов. Те варианты, в обозначении которых за числом следует «I», имеют вставку указанного числа нуклеотидов (любого нуклеотида). Любые из этих молекул геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.
Нуклеотидная последовательность референсной молекулы мРНК PIEZO1 указана в SEQ ID NO:2 (см. референсную последовательность NCBI: NM_001142864.4), длина которой составляет 8089 нуклеотидов. Вариантные нуклеотиды в их соответствующих вариантных позициях для вариантных молекул геномной нуклеиновой кислоты, описанных в данном документе, также имеют соответствующие вариантные нуклеотиды в своих соответствующих вариантных позициях для вариантных молекул мРНК на основании референсной последовательности мРНК PIEZO1 в соответствии с SEQ ID NO:2. Любые из этих молекул мРНК варианта PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.
Нуклеотидная последовательность референсной молекулы кДНК PIEZO1 указана в SEQ ID NO:3 (на основе референсной последовательности NCBI: NM_001142864.4), длина которой составляет 8089 нуклеотидов. Вариантные нуклеотиды в их соответствующих вариантных позициях для вариантных молекул геномной нуклеиновой кислоты, описанных в данном документе, также имеют соответствующие вариантные нуклеотиды в своих соответствующих вариантных позициях для вариантных молекул кДНК на основании референсной последовательности кДНК PIEZO1 в соответствии с SEQ ID NO:3. Любые из этих молекул кДНК варианта PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.
Аминокислотная последовательность референсного полипептида PIEZO1 приведена в SEQ ID NO:4 (см. номер доступа UniProt № Q92508.4 и номер доступа NCBI RefSeq NM_001142864.4), длина которой составляет 2 521 аминокислот. Используя транслированную нуклеотидную последовательность любой из молекул мРНК или кДНК PIEZO1, вариантные полипептиды PIEZO1, имеющие соответствующие транслированные вариантные аминокислоты в вариантных позициях (кодоны). Любые из этих вариантных полипептидов PIEZO1 с прогнозируемой потерей функции можно обнаружить любыми из способов, описанных в данном документе.
Нуклеотидные и аминокислотные последовательности, перечисленные в приложенном перечне последовательностей, приведены с помощью стандартных буквенных обозначений для нуклеотидных оснований и трехбуквенного кода для аминокислот. Нуклеотидные последовательности соответствуют стандартной системе, начинаясь с 5’ конца указанной последовательности, продолжаясь вперед (т. е. слева направо в каждой строке) до 3’ конца. Приведена только одна цепь каждой нуклеотидной последовательности, но подразумевается, что комплементарная цепь включена в любую ссылку на приведенную цепь. Аминокислотные последовательности соответствуют стандартной системе, начинаясь с амино-конца последовательности и продолжаясь вперед (т. е. слева направо в каждой строке) до карбокси-конца.
В данном документе выражение «соответствующий» или его грамматические вариации, при употреблении в контексте нумерации конкретных нуклеотида, или нуклеотидной последовательности, или позиции, относится к нумерации определенной референсной последовательности, когда конкретный нуклеотид или нуклеотидную последовательность сравнивают с референсной последовательностью. Другими словами, номер остатка (такого как, например, нуклеотид или аминокислота) или позицию остатка (такого как, например, нуклеотид или аминокислота) конкретного полимера обозначают относительно референсной последовательности, а не по фактическому номеру позиции остатка в конкретном нуклеотиде или нуклеотидной последовательности. Например, конкретная нуклеотидная последовательность может быть выровнена относительно референсной последовательности посредством внесения гэпов для оптимизации совпадения остатков между двумя последовательностями. В этих случаях, несмотря на наличие гэпов, нумерацию остатка в конкретном нуклеотиде или нуклеотидной последовательности проводят относительно референсной последовательности, с которой она была выровнена. Существует ряд компьютерных алгоритмов, которые можно использовать для проведения выравнивания последовательностей для идентификации нуклеотидной или аминокислотной позиции в одной полимерной молекуле, которая соответствует нуклеотидной или аминокислотной позиции в другой полимерной молекуле. Например, используя алгоритм NCBI BLAST (Altschul et al., Nucleic Acids Res., 1997, 25, 3389-3402) или программное обеспечение CLUSTALW (Sievers and Higgins, Methods Mol. Biol., 2014, 1079, 105-116) можно проводить выравнивание последовательностей. При этом последовательности также можно выравнивать вручную.
Все патентные документы, веб-сайты, другие публикации, номера доступа и т. п., цитируемые выше или ниже, в полном объеме и во всех отношениях включены посредством ссылки в той же степени, как если бы для каждого отдельного элемента было специально и отдельно указано его включение посредством ссылки. Если с номером доступа в разное время связаны разные версии последовательности, подразумевается версия, связанная с номером доступа на момент действительной даты подачи данной заявки. Действительная дата подачи означает более раннюю фактическую дату подачи или дату подачи приоритетной заявки, ссылающейся на номер доступа, если это применимо. Аналогично, если разные версии публикации, веб-сайта и т. п. опубликованы в разное время, подразумевается версия, опубликованная ближе всего к действительной дате подачи заявки, если не указано иное. Любой признак, стадия, элемент, вариант осуществления или аспект данного изобретения можно использовать в комбинации в любым другим признаком, стадией, элементом, вариантом осуществления или аспектом, если явно не указано иное. Несмотря на то, что данное изобретение было достаточно подробно описано с помощью иллюстрации и примера в целях ясности и понимания, является очевидным, что определенные изменения и модификации могут быть реализованы в рамках объема прилагаемой формулы изобретения.
Следующие примеры приведены для более подробного описания вариантов реализации. Они предназначены для иллюстрации, но не ограничения заявляемых вариантов осуществления. Следующие примеры приведены для того, чтобы предоставить рядовым специалистам в данной области техники раскрытие и описание создания и оценки соединений, композиций, изделий, устройств и/или способов, описанных в данном документе, и предназначены исключительно для иллюстрации, но не для ограничения объема любых пунктов прилагаемой формулы изобретения. Были предприняты усилия, чтобы обеспечить точность в отношении используемых чисел (например, количества, температуры и т. д.), но должны учитываться некоторые экспериментальные ошибки и отклонения. Если не указано иное, доли представляют собой массовые доли, температура выражена в °C или равна температуре окружающей среды, а давление находится на уровне атмосферного или около него.
Примеры
Пример 1. Материалы и способы
Получение и секвенирование образцов WES
Образцы геномной ДНК, нормализованные приблизительно до 16 нг/мл, переносили в лаборатории из UK Biobank (Биобанк Соединенного Королевства) в 0,5 мл стандартных калибровочных пробирках 2D (Thermo Fisher Scientific) и хранили в автоматизированном биобанке образцов (LiCONiC Instruments) при -80 °C перед приготовлением образцов. Один образец содержал недостаточно ДНК для секвенирования. Захват экзома проводили, используя высокоэффективный полностью автоматизированный подход, разработанный в лаборатории. Вкратце, создавали библиотеки ДНК путем ферментативной фрагментации 100 нг геномной ДНК до среднего размера фрагментов в 200 пар оснований, используя специальный набор для получения библиотек ДНК NEBNext Ultra II FS (New England Biolabs), и во все библиотеки ДНК лигировали обычный Y-образный адаптер (Integrated DNA Technologies). Во время амплификации библиотеки полимеразой KAPA HiFi (KAPA Biosystems) к фрагменту ДНК добавляли уникальные, асимметричные баркоды из 10 пар оснований, чтобы облегчить мультиплексные захват и секвенирование экзома. Одинаковые количества образца объединяли перед захватом экзома в течение ночи, приблизительно 16 часов, с помощью немного модифицированной версии библиотеки зондов IDT’s xGen; добавляли дополнительные зонды для захвата областей генома, хорошо охваченных предыдущим реагентом для захвата (NimbleGen VCRome), но плохо охваченных стандартными зондами xGen. В целевые области вошло всего n=38997831 оснований. Захваченные фрагменты связывали с покрытыми стрептавидином гранулами DYNABEADS® (Thermo Fisher Scientific) и удаляли неспецифические фрагменты ДНК с помощью серии промывок в жестких условиях с использованием набора для гибридизации и промывки xGen в соответствии с рекомендованным производителем протоколом (Integrated DNA Technologies). Проводили ПЦР-амплификацию захваченной ДНК с помощью KAPA HiFi и количественно оценивали методом кПЦР с помощью набора для количественной оценки библиотек KAPA (KAPA Biosystems). Мультиплексированные образцы объединяли, а затем секвенировали, используя считывания со спаренными концами из 75 пар оснований с двумя индексными считываниями из 10 пар оснований на платформе Illumina NOVASEQ® 6000, используя проточные ячейки S2.
Выравнивание последовательностей, идентификация вариантов и присвоение генотипа
После завершения секвенирования исходные данные каждого подхода Illumina NOVASEQ® собирали в локальном буферном хранилище и загружали в платформу DNAnexus для автоматического анализа. После завершения загрузки начинался анализ с преобразованием файлов CBCL в FASTQ-форматированные считывания с присвоением, посредством специальных баркодов, образцам с использованием программного обеспечения для преобразования bcl2fastq (Illumina Inc., San Diego, CA). Затем соответствующие образцам файлы FASTQ, представляющие все считывания, созданные для этого образца, выравнивались с референсным геномом GRCh38 с помощью BWA-mem. Полученный в результате бинарный файл выравнивания (BAM) для каждого образца содержал картированные геномные координаты считывания, информацию по качеству и степени, в которой конкретное считывание отличалось от референса в его картированной локации. Затем оценивали выровненные считывания в файле BAM, чтобы идентифицировать и пометить дублирующие считывания, с помощью инструмента Picard MarkDuplicates (сеть Интернет, «picard.sourceforge.net») с получением файла выравнивания (duplicatesMarked.BAM) со всеми потенциальными дублирующими считываниями, помеченными для исключения в последующем анализе.
Затем для каждого индивидуального образца получали файлы GVCF, включающие определение вариантов, используя инструмент для определения вариантов WeCall (сеть Интернет, «github.com/Genomicsplc/wecall») от Genomics PLC, с идентификацией как ОНВ, так и ИНДЕЛов по сравнению с референсом. Дополнительно каждый файл GVCF содержал информацию по зиготности каждого варианта, числу считываний как референсной, так и альтернативной аллелей, качеству генотипа, представляющему достоверность определения генотипа, и общему качеству определения вариантов в этой позиции.
После завершения поиска вариантов файлы BAM для индивидуальных образцов преобразовывали в полностью не допускающие потерь файлы CRAM, используя samtools. Метрическую статистику получали для каждого образца, чтобы оценить захват, выравнивание, размер вставки и качество определения вариантов, используя Picard (сеть Интернет, «picard.sourceforge.net»), bcftools (сеть Интернет, «samtools.github.io/Bcftools») и FastQC («bioinformatics.babraham.ac.uk/projects/fastqc»).
После завершения секвенирования образцов исключали образцы, демонстрирующие расхождение между генетически определенным и заявленным полом (n=15), высокий уровень гетерозиготности/загрязнения (D-стат. > 0,4) (n=7), низкий охват последовательности (менее 85% целевых оснований достигает охвата 20X) (n=1) или генетически идентифицированные дубликаты образцов (n=14), а также варианты WES, противоречащие чипу генотипирования (n=9). Шесть образцов не прошли контроль качества в нескольких категориях, что привело к исключению 38 индивидов. Оставшиеся 49960 затем использовали для компиляции VCF на уровне проекта (PVCF) для последующего анализа. PVCF создавали, используя инструмент для совместного генотипирования GLnexus. Заботились о том, чтобы перенести все гомозиготные референсные, гетерозиготные, гомозиготные альтернативные и неопределенные генотипы в VCF на уровне проекта. Также создавали дополнительный отфильтрованный PVCF «Goldilocks». В отфильтрованном PVCF Goldilocks образцы, несущие определенные варианты с ОНП в процессе, включающем один образец, или DP < 7 преобразовывали в «неопределенные». После применения фильтра DP исключали сайты, в которых все оставшиеся образцы были определены как гетерозиготные, и все образцы имели AB < 85%реф./15%альт. Образцы, несущие определенные варианты с ИНДЕЛом в процессе, включающем один образец, с DP < 10 преобразовывали в «неопределенные». После применения фильтра DP исключали сайты, в которых все оставшиеся образцы были определены как гетерозиготные, и все образцы имели AB < 80%реф./20%альт. Сайты многоаллельных вариантов в файле PVCF нормализовали путем левого выравнивания и представляли как биаллельные.
Определение фенотипа
Для случаев на основе ICD10 необходимо одно или более из следующего: первичный диагноз или вторичный диагноз в записях по статистике эпизодов, связанных с состоянием здоровья (HES, от англ. «Health Episode Statistics»), стационарных пациентов. Исключение на основе ICD10 предусматривало ≥ 1 первичных или вторичных диагнозов в диапазоне кодов. Контрольных индивидов на основе ICD10 определяли как тех, которые не соответствовали случаям или исключениям. Индивидуальные определения фенотипа включали одно или более из следующего: диагноз ICD-10, самостоятельное сообщение о болезни по результатам устного интервью и диагностированная врачом болезнь по результатам онлайн-наблюдения, информация с сенсорного экрана. Количественные результаты (такие как физикальные измерения, анализ крови, тестирование когнитивных функций и полученные по визуализации фенотипы) загружали из хранилища UK Biobank (UKB) и охватывали один или более визитов. Всего в анализе ассоциаций WES исследовали 1073 бинарных признаков с числом случаев ≥ 50 и числом количественных признаков 669.
Аннотация вариантов с прогнозируемой потерей функции (ПП)
Варианты аннотировали, используя snpEff и генные модели из Ensembl Release 85. Получали исчерпывающий и высококачественный набор транскриптов для кодирующих белок областей, которые включали все кодирующие белок транскрипты с аннотированными стартовым и стоп-кодонами из генных моделей Ensembl. Варианты, аннотированные как стоп_прибавление, старт_потеря, сплайс_донор, сплайс_акцептор, стоп_потеря и сдвиг рамки считали вариантами с ПП.
Недавнее крупномасштабное исследование генетических вариаций у 141456 индивидов позволило получить каталог вариантов с ПП. Прямое сравнение с этими данными является затруднительным вследствие многочисленных факторов, таких как разница в платформах секвенирования экзома, алгоритмах определения вариантов и аннотациях. Кроме того, число индивидов и географическое распределение определения (и, следовательно, генетическое разнообразие) в подгруппе NFE из gnomAD может быть больше, чем для UK Biobank с WES в этой работе. Несмотря на это, сайты экзома gnomAD, помеченные как «PASS», из gnomAD r2.1 были аннотированы с помощью процесса аннотации. Данные из gnomAD переносили в HG38, используя Picard LiftoverVcf. Данные представляли подгруппу индивидов-европейцев не финского происхождения (NFE, от англ «Non-Finnish Europeans») (n=56885 образцов), ограниченную вариантами с ЧМАNFE < 1%, и позволили получить 261309 ПП в любом транскрипте в 17951 гене. С учетом ограничения ПП только теми, которые присутствуют во всех транскриптах, было обнаружено 175162 ПП в 16462 генах. 134745 ПП было обнаружено во всех транскриптах генов у участников UKB с WES европейского происхождения.
Методы анализа ассоциаций нагрузки ПП
Тесты нагрузки ассоциаций проводили для редких ПП среди 49960 индивидов европейского происхождения. Для каждой генной области по определению Ensembl. ПП с ЧМА ≤ 0,01 сжимали так, чтобы любой индивид, который является гетерозиготным в отношении по меньшей мере одной ПП в этой генной области, считался гетерозиготным, и только индивиды, которые несут две копии той же ПП, считались гомозиготными. Редкие варианты не были фазированы и поэтому сложные гетерозиготы в этом анализе не учитывали.
Для каждой генной области оценивали 668 ранжированных обратных нормальных трансформированных (RINT) количественных показателей (включая всех субъектов и стратифицированные по полу модели) с ≥ 5 индивидами с не отсутствующей информацией по фенотипу, используя аддитивную смешанную модель, реализованную в BOLT-LMM v2. Перед нормализацией сначала должным образом трансформировали признаки (log10, квадрат) и корректировали в отношении стандартного набора ковариат, включая возраст, пол, место исследования, первые четыре основных признака происхождения и, в некоторых случаях, ИМТ и/или статус курения. Данные, превышающие пять медианных абсолютных отклонений от медианы, исключали как выбросы перед нормализацией. 1073 дискретных результатов (включая всех субъектов и стратифицированные по полу модели) с ≥ 50 случаями оценивали с корректировкой на ковариат в отношении возраста, пола и четырех основных компонентов происхождения, используя генерализованную смешанную модель, реализованную в SAIGE. В случае каждого количественного и дискретного признака, включенного в анализ, оценивали только генные области, для которых было > 3 носителей ПП с не отсутствующим фенотипом и информацией по ковариатам.
Положительные контроли определяли системно, используя двухэтапный подход. Сначала аннотировали каждый ген в отношении релевантного заболевания, признака, биологических или функциональных данных, используя общедоступные ресурсы, включая OMIM, NCBI MedGen и каталог NHGRI-EBI GWAS. Гены с подтверждающими данными из по меньшей мере одного источника затем отбирали вручную, используя NCBI PubMed, чтобы подтвердить взаимосвязь между признаком и вариантами ПП в представляющем интерес гене. Гены с подтверждением на уровне локуса в отношении представляющего интерес признака или родственные фенотипы в каталоге GWAS, но для которых отсутствовали подтверждающие данные в отношении ассоциации ПП, представлены в данном документе как новые ассоциации ПП.
Методы для одновариантного анализа ассоциаций ПП
Одновариантный анализ ассоциаций проводили, используя те же методы, которые описаны в разделе для анализа ассоциаций нагрузки. Для ассоциаций ген - признак с p < 10-7 рассчитывали статистику одновариантных ассоциаций с представляющим интерес фенотипом для всех ПП, включенных в тест по нагрузке, для которых число минорных аллелей составляло ≥ 5 у 49960 индивидов европейского происхождения с WES. Статистика по ассоциациям для этих вариантов приведена в расширенных данных (ExtData_SingleVariantLOFs_V1.xlsx).
P-значение в методе исключения по одному (LOO, от англ. «Leave-One-Out») для нагрузки - p-значение в тесте на отсутствие/присутствие с исключением тестируемого варианта. Дельта P-значение для нагрузки - это отношение p-значения в анализе с исключением по одному по сравнению с тестом на нагрузку с использованием всех 65 вариантов. Сводные данные по нагрузке с использованием всех 65 вариантов у неродственных индивидов: B=1,44, SE=0,26, p-значение=3,12E-08, cMAF=0,00174, cMAC=152, cMAF_cases=0,0066, cMAC_cases=17, cMAF_controls=0,0016, cMAC_cases=135. Пошаговая логистическая регрессия позволила выделить 11/65 вариантов (AIC 11451). Сводные данные по нагрузке с использованием всех 11 вариантов: B=3,71, SE=0,437, p-значение < 2e-16, cMAF=0,0003, cMAC=22, cMAF_cases=0,005, cMAC_cases=12, cMAF_controls=0,0001, cMAC_controls=10. Когда анализ ограничен вариантами с MAC > 1, пошаговая логистическая регрессия позволяет выделить 5/13 вариантов (AIC 11484). Сводные данные по нагрузке с использованием всех 5 вариантов: B=3,02, SE=0,53, p-значение=8,92e-09.
LD (r2) по 11 вариантам пПП, выделенным с помощью пошаговой регрессии для варианта PIEZO1 и положительному контролю (16:88835545_G_A; выделено зеленым цветом), данные по которому можно найти в литературе для варианта PIEZO1. Ни один из этих 12 вариантов не находится в LD, R2 > 0,01. Когда тест на нагрузку корректируют в отношении известного из литературы варианта rs2911463 (16:88835545_G_A), p-значение теста на нагрузку остается < 2E-16 (AIC 11,444), что указывает на то, что нагрузка не определяет известный вариант.
Пример 2. Демографические и клинические характеристики подвергнутых секвенированию участников
Всего было отобрано 50 000 участников, причем приоритет отдавался индивидам с полными фенотипическими данными: тем, которые имели данные по МРТ-визуализации всего тела из исследования по визуализации UK Biobank, дополнительные измерения на исходном уровне, статистику эпизодов в больницах (HES, от англ. «hospital episode statistics») и/или связанные записи о первичной помощи (которые вскоре будут доступны лицензированным исследователям). Во время получения данных были исключены образцы от 40 участников вследствие непрохождения измерений контроля качества или отзыва согласия участником, что в результате привело к конечной группе из 49 960 участников. В целом секвенированный образец является репрезентативным по 500 000 участникам UKB (таблица 1). Заметная разница в возрасте, поле или происхождении между секвенированным образцом и общей исследуемой популяцией отсутствовала. Подвергнутые секвенированию участники с большей вероятностью имели коды диагноза HES (84,2% среди секвенированных по сравнению с 77,3% в целом) и дополнительные измерения (таблица 1).
Таблица 1: Клинические характеристики участников полноэкзомного секвенирования и всех участников UK Biobank
a Число образцов с по меньшей мере одним не отсутствующим значением фенотипа, полученным по изображению, из данных, загруженных из UK Biobank в ноябре 2018 года.
b Число образцов с данными секвенирования экзома и по меньшей мере одним не отсутствующим значением фенотипа, полученным по изображению, из данных, загруженных из UK Biobank в ноябре 2018 года.
c Число образцов в 3-х предопределенных областях графика первых двух оценок генетических основных компонентов, где области выбраны так, чтобы представлять африканское, восточно-азиатское и европейское происхождение (см. Фиг. 3).
Участники с WES с по меньшей мере одним кодом диагноза HES не отличались от несеквенированных участников по медианному числу первичных и вторичных кодов ICD10 или широкому распределению фенотипов, отличных от кодов для астмы (ICD10 J45) и астматического статуса (ICD10 J46), как наиболее представленных в секвенированных образцах, и сенильной катаракты (ICD10 H25) и неизвестных и неуточненных причин заболеваемости (ICD10 R69), как наименее представленных. Секвенированная подгруппа включает 194 пар родитель - ребенок, 613 пар родных братьев и сестер, 1 пару монозиготных близнецов и 195 родственных связей второй степени. Распределение родства между парами индивидов в UKB WES включено в Фиг. 1.
Пример 3. Обобщенные данные и характеристики кодирующей вариации из WES
Целью были кодирующие белок области и сайты сплайсинга экзон - интрон 19 467 генов. Число аутосомальных вариантов, наблюдаемое среди всех индивидов по типу/функциональному классу для всех и для частоты ЧМА < 1%. Все варианты прошли критерии КК, индивидуальные и вариантные пропуски < 10%, и p-значение Харди - Вайнберга > 10-15. Медианное число вариантов и межквартильный размах (МКР) для всех вариантов и для ЧМА < 1%. Средняя доля целевых оснований (n=38997831) с достижением по меньшей мере 20x охвата в каждом образце составляла 94,6% (стандартное отклонение 2,1%). После контроля качества наблюдали 10 028 025 однонуклеотидных вариантов и вариантов с инделами, 98,5% с частотой минорной аллели (ЧМА) < 1% (таблица 2). Из всего количества вариантов 3 995 785 находятся в целевых областях. Эти варианты включали 2 431 680 несинонимичных (98,9% с ЧМА < 1%), 1 200 882 синонимичных (97,8% с ЧМА < 1%) и 205 867 вариантов с прогнозируемой потерей функции (пПП), присутствующих в по меньшей мере одном кодирующем транскрипте (потеря кодона инициации, преждевременные стоп-кодоны, сплайсинг и варианты с инделами и сдвигом рамки; 99,7% с ЧМА < 1%) (Фиг. 2). Число 9 403 синонимичных (МКР 125), 8 369 несинонимичных (МКР 132) и 161 пПП вариантов (МКР 14) на индивида (медианные значения) сравнимо с предыдущими исследованиями секвенирования экзома. Если анализ ограничен вариантами пПП, которые присутствуют во всех транскриптах для гена, число вариантов пПП падает в целом до 140 850 и 96 на индивида (снижение около 31,6% и около 40,4%, соответственно), что согласуется с предыдущими исследованиями.
Таблица 2: Обобщенная статистика для вариантов в секвенированных экзомах участников 49 960 UKB
Пример 4. Фенотипические ассоциации с вариацией ПП
Комбинация WES и обширной информации по состоянию здоровья позволяет провести широкое исследование фенотипических последствий человеческой генетической вариации. Вариация ПП может обеспечить возможность понять функцию гена; однако в расчетных наборах данных отсутствует большинство таких вариаций. WES хорошо подходит для идентификации вариантов ПП и для оценки их фенотипических ассоциаций. Тесты ассоциаций генной нагрузки для редких (ЧАА < 1%) вариантов пПП (вариантов пПП, идентифицированных в WES среди всех генов с > 3 носителями варианта пПП) проводили с 1 741 признаком (1 073 дискретных признаков с по меньшей мере 50 случаями, определенными по статистике эпизодов в больницах и самостоятельно сообщенным данным, 668 количественных, антропометрических и кровных признаков) у n=46 979 индивидов преимущественно европейского происхождения. Для каждой ассоциации ген - признак силу ассоциации для теста генной нагрузки пПП также сравнивали с результатами ассоциаций для каждого ОНВ, включенного в тест нагрузки.
Пример 5. Ассоциации ПП и открытие новых генов
В анализе ассоциаций для генной нагрузки пПП была выявлена новая связь между ПП варианта PIEZO1 (совокупная частота аллелей=0,2%) и значительно повышенным риском варикозного расширения вен. Результаты для варианта PIEZO1 для бинарного фенотипа бессимптомного варикозного расширения вен нижних конечностей, расположенного в экзоме UKB 50k и экзоме UKB 150k, представлены в таблице 3.
Таблица 3: Ассоциации генной нагрузки PIEZO1 ПП
RR|RA|AA
(95% ДИ)
Случаи: 1267|20|0
Случаи: 3559|36|0
Этот результат обусловлен наличием редких вариантов ПП, причем наиболее значимая одновариантная ассоциация ПП PIEZO1, расположенного в экзоме UKB 50k, имеет p-значение 2,29×10-3. Анализ экзома UKB 50k методом исключения по одному показывает, что ни один одиночный вариант не обеспечивает весь сигнал, а пошаговый регрессионный анализ показал, что 11 отдельных вариантов (5 из которых имели MAC > 1) вносили вклад в общий сигнал нагрузки (Фиг. 4).
Этот результат был повторен в 2953 случаях с варикозным расширением вен и 75694 контрольных случаях с ранее подвергнутым секвенированию экзомом (OR=2,7, p=1,86×10-9). Эта область ранее была связана с обычными некодирующими вариантами, с незначительным влиянием на риск развития заболевания, при этом rs2911463 и другие близкорасположенные обычные варианты в хромосоме 16 недавно были связаны с варикозным расширением вен (частота=0,69, ОР=0,996, р-значение=1,0 x10-27 в GWAS 408455 генотипированных участников U.K. Biobank). Вариант rs2911463 не находится в LD ни с одним из выявленных ключевых вариантов (Фиг. 5), и тест на нагрузку остается значимым при корректировке в отношении rs2911463.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Regeneron Pharmaceuticals, Inc.
<120> Компонент 1 механочувствительного ионного канала пьезо-типа
(PIEZO1)и его применение
<130> 189238.02502 (3172)
<150> 62/862847
<151> 2019-06-18
<150> 62/806932
<151> 18.02.2019
<160> 4
<170> PatentIn версии 3.5
<210> 1
<211> 69883
<212> ДНК
<213> homo sapien
<400> 1
gggagccgcc gtccggccca gctcggcccc agtgagccga gcgctgcgct ccgccgaggg 60
gcagggcggt cgcctgagcg agcgcgggcc cgggacgtcg gcaccggcgg ggcggccgaa 120
ggagaaggag gaagaggaga aggcggcgcg cgggtccccg cgggtcagcc atggcgcgcc 180
ggccccgggg cccccgcacc gccccatagc gccgcggcgt ccgctcggtc tgggccgggc 240
cctgggccct ccagccatgg agccgcacgt gctcggcgcg gtcctgtact ggctgctgct 300
gccctgcgcg ctgctggctg gtgagtgggg ggcgggcgcc tgggggcgac gggagggggc 360
tgcgtctcgg ctccccacgg cctggacacc ggacgacgcc ggccggggcg agggctgcgg 420
gcgagcgggc gcggaaattc ccagggacgc gcgacccggg cgcccgcatt cctgaagcat 480
gagcgcgcca ggcggcggcg gggctcctgt cccagggccg ggctggaagg gcggcggcgg 540
ctgggggaga cggcaccgcg tgcccacggg ggcggtcgag cgagcgccgg gcatagcgcg 600
gctggcgtct ccgccggggc gctgcggaga ggaggccgcc gggcgaggcg gtgtttgccc 660
cggtgggaag ggccgcggcg gtggtggggg gagcacgaat ctctttttct ctttcgggtt 720
taaaaaaaaa agcgcaaagt tgcatcagga cttcctgaca atctgggaga aggcgggctt 780
cctgcctgga gctgtttaat ttggagcttc ccgagcccaa cgaacgtccg tgcccagggc 840
ccagccccgc tcaccgctgc acccccctct gccggactga ggcggtccca cactttggaa 900
aaaaatagtg tgggttcctc cctggtcctc ccttgcccta ctgggctcag tttcgcaggg 960
gcgggggccg gcctctgccc tggtctgggg gaggggacac ccccggaggc tgtggcctgg 1020
tgtcagggcg gggcaggggt ccccagtcct ggcatctgtg ttccctgctt gccgggcagt 1080
ggtgcccctt tcgcgaagca cacccgggtg gcttggtgct gcacggcctg gcacccctac 1140
ccttccccga ccctggccta gccgggaccc agggtccgcg ccctccgccc gggggctccc 1200
cacgtgtgat tgatctggga agcagtcgga tggaattaac ccacggacaa gtgggacggt 1260
ttgcattggg agtccgccat ggacacggca ggtggggcct tttgattgta aaagcccttt 1320
cggagccctt gcctcgctcc aggtgggagc tcgcccagcg ctagctttgg ggatctagag 1380
ccgcctgcct gaggctccca gacagactgc gttttgatcg gtcgcacaga aaggtggtga 1440
aacttgggga agattttcta gacaggaatc aatgaaaacc attgaggctg gagaggagag 1500
gttttgagca actctcttca gtgcggtcag ccctgtgtgg actgggcagc ctgggacctg 1560
ctcccagtgc agggtcagat gggccgtaaa cagggcccgg ctgtgttcct tcctgtgcct 1620
tgaaaacaag caggacagcc tggcacagag gcagagtcta gagctgacag gccttagaga 1680
gggaaacagg aaagcttctg aaacgtcccg ttcacactga tcgttccatt tcctcttgtg 1740
tctgagtggg agcgggtgtc ctccctgcag ggaatgcccc ccctctcaga tggcagctgc 1800
tccttgggca gagttggcaa tgtttttctt taaatgacca gatggtaaat attttcatgt 1860
cacaaaatct tcttcttctg gtatttttcc agccattaaa tgtaaaagcc ctcctgagtt 1920
catgggctgt acctaaacag gtgttgagcc cgattctgtg gcacatgtgg tttgctgccc 1980
cctgggcatt ggtcaggggg cctgggttct gccttctcga ttgctatccg cgtgggggat 2040
ctgggggagg gatcactgtt cttcttgctt ttggcctcct tggggaggat ggggaggtag 2100
cccaggggtg ctcacccagg ccccgtgtca gtcttctatg aaacttttaa agaatagtga 2160
tgactgactg tctgtctgta tggtactttc cttaaaccta aaactggtcc caaataaagt 2220
ctcttaattt gaaagatgct gaagcccggg ccatacccca cactgattct gtgtctgggg 2280
atggggcgtg gggcctgggc ctcactcagt gttttctctc agtcacctgg gggagatgga 2340
agtggagccg gccaagaacc ctgcctgcct gcctgctggc cgggactcct gagtcaggct 2400
ctctggccct ggggtgtggg cagctccaga tggacccgcg atgtgcaggt tcagctggcc 2460
tggccggagg tgggacactg gctttgctgt ctttggagtg ccccctccct ctctggcgag 2520
ctttggctgg aagcagttct accgtgtttt ggaaatgaat gaggccttca gaaggcatta 2580
gtcagtgtgt gcctgcgctg gctcagacag tgcctggtga gggtttgagt catcctgggg 2640
tgcccctggc ccccacgccc tccctctcca gtgcaggatc attacccaaa aatctggcag 2700
ggagctgccc cacccacagg gagcaggggc ctccttcagc agtctcacct aatgttgctg 2760
gagccttggg ggatcagggc ccatctcttc tagagagatg tcagggcagg gctgggcgcg 2820
atggctcaca cctgtaatcc cagagcttcg ggaggccaag gtgggaggat tgcttgagcg 2880
tagccattcg agagcagcct gggcaacgta gagatcccca tctctatgaa aaatatttaa 2940
aaattagctg ggcatggtgg tagtgcacct gtagtcccag ctactcagga ggccaaggtg 3000
ggatgattgt ttgagtccag gagttggagg ctacagtgag ccatgattgt atgactgcac 3060
tccagcctgg gtgacagacc ctgtctcaaa aaagaaaaag gaaaaaaaag ggcaggacat 3120
ttgtgattct gataatatgg gaccgcacct ccagttctat cagtgggaaa tctagacagg 3180
gctgcggaaa gccagctggt gcgagaggag ccaccgtgtc actgactgtg ggacacccac 3240
gtgggctgac aatatggctt ctgcttttca gggtgcctcg tggcacagcc taggggcaca 3300
cccacggccg gcaagctggg cgtcacctcc ttcaggctga ttgtcactga gaagtgtcac 3360
catttagcat gagggatgct gcctcctttt tcagaacatt gtcaccatca gggtctcacc 3420
actcctggga ggcggccgag aagctgggga acagcaggca ctcggctcac agttgctcag 3480
cagtgcagac cctctgagct gagcatggca gagtcaccct tcggaggcct gtgcccgggt 3540
ctcaggacct gcacagaacc ctggcctgtc ccatccgagg gtgctgggaa gagcatggcc 3600
gtggcagagt agggtgggag ctgctttcct ctgtggcttg ggggcccctt ctgagcatca 3660
gctccctggt gtgacagagg ggcgcactct gtccccatgc tgggcctgga ggctggatga 3720
gtcagcagga gagcctgggg cctgcctcac agcaccaagg gctgcaggtg tgagtgtgca 3780
catgtgtgcg tgtttgggga aggggccagg gactgcccag gagctgagga tgggtcacag 3840
cgggtgctcg tcccgcagcg ggtcactggt gcccaggaca cagggagctc cagccccagc 3900
tgccagggtc ccacagagag gaagtttcct ctgggggtgg gtgggggcgc acagtctctg 3960
atcctggccc caaggcagct tcctgggcgg tgtctctcct gtgctgactc ggcagtgcat 4020
ttgctttcgg tgctcaaaga tgaaggggaa ccaccgtggg ccttgacggc ctcatctgcc 4080
cgctgcagcc cactcctgag atgggaccac cgcagtcgtc agggtccagt gagagccgca 4140
tcttgcagga agccattcct ggcctctctg gcctcagaaa tccccttttc aattcaacaa 4200
aatgttagtc ttctgtttag ctattttaga aatagacagt taggcttttt tctctttttt 4260
cttaaagaca gaggctcact ctgtcgccca ggctggagtg tagcggcgtg attttggctc 4320
cctacaactt cagcctccag ggctcaagcc atcctcctgc ctcagcctcc tgagtagctg 4380
agattacagg tgtgtagcac catacctaat ttttgtattt tttgtagaga cggggtttca 4440
ccactttggc caggctggcc ttgaactcct gaccttaagc gatctgcccg cctcagcctc 4500
caaaagtgct ggggttacag gcatgagcca ccgcgcccgg ctgacagtta gacttttgct 4560
tctttgttta tataagcttt ttcttctggt tccaaaagca agtttgccct tccttgtggt 4620
agagaatcct agctcacaga gcagtttaga agccagcaca gtatcccaca cacacatctg 4680
gcatggacag acccttcctt gctgggtgtg ggtcctgtgt tcttctgaaa ggcaagctgt 4740
tcccagccaa cccctgcccc tctctgcctt agcctgcctg gaggcctgag tctcctgggt 4800
gactgtgagg tgggaccccc ccttccccta cccccaccca catcctctgt atctgccttc 4860
tgtcctgctc ttgacctttg agctcctctg ctggcttcag ggtgcggctg ttgagcctat 4920
tttttggatt aggactctgg ggtgagggaa gttaattcac acacccaaga tcacactggt 4980
gggaagggac aggcccgggg tgaaggcttc tcctctcctt ggcggttgag tcccacacct 5040
gctggccgag gcacctgaag gggacttggg gtccagggtc actgggagga cgggggcagg 5100
cagaggggtg gccgacctgg tggcggctcg tgggcagcag ccgaccctat cttgctctga 5160
acgtgtgggg ccctcacccc cttctctggg tctgggtttc ctcccctgta agtgacaccg 5220
taaaagcttc acagccgctt ccaagtctca ggtctctcgg gctttggatc tcacacccag 5280
gctgggtggg ggtaggggcg ggacagccgt cccccccgga aggctcagaa ttcctcgcac 5340
aatcgtgggg ccaggagacc cgcaacacag gctttcccag ctgcgctgag tgccgcggtg 5400
gccgggggtc cgtcgggcct ccatggagct gaggggaagg ggccactcac cgcctggtcc 5460
cggagcacac agggcagctc ccaggagcac agaggctcct tgggacctgt ggggctgtcg 5520
gcctccctca tgctgcacac acagcgcgtc cccaggggtg tctgcagccc agcccatccc 5580
actgcagatt cccgaccact cagattcatt catgcatcct ctcacgccgg tcctgtggga 5640
cagagctctg ggcagcagcc agaagtccaa gttctggttc agggccagtg gaggtgggtg 5700
ttggggtggg gctggagctc cctgctctcc ctcccaagct agccaggaaa ggaggttggg 5760
ggccccgcac ggtcattgct gtttattcac aaagcgcgat gctgagcaca ggcggggaaa 5820
gaaaagtgcg atcagtgcca ggaaaatggg gctcccccga cgccgtccaa aatgggatcc 5880
cttgccgggc gcggtggctc acacctgtaa tcccagcact ttgggaagcc gaggcaggtg 5940
gatcacctga ggtcaggagt tcgagaccag cctgaccaac atggcaaaac tccatctcag 6000
ctaaaaatac aaaaattagc tgggcatggt ggcgggcacc tgtattccca gctgggaagg 6060
ctgagacagg agaatcgccg gaacccagga ggtagaggtt gcagtgagcc acagtcgtgc 6120
cactgcactc cagcttgggg gcttggggga cagcaagact ccctctcaaa aaaaaaaaaa 6180
aaaagtgaag tcgtaaatca gattaaattc cctttttaac cctttgaacc tctgtcctcc 6240
cctgttccca gcgggaagcc tctggtgaac gcgccatgca ccccacctgc ccccgctctc 6300
tgggtctctc tcccagctgg aacggccgct tccccaggtg ccttccctgg gccacagcct 6360
tgtgcctcgg cggctgctgg atgcctgggt gtgtgggtgg ctcccagtgt gtgggatggc 6420
acacgagcct ctcgcccttc tgtgtggggt cgcacaccca ccgcaggccg tatttttgct 6480
cacgttcatg tttctccacg gtggacgctg ggttgcaggg acccttcctg tgtgcgggtg 6540
aggatctggg cagctgctgg tgccgggccc atggggacgc tgaccgtccc gggtgccggc 6600
tctgaggtgt gcagtggacg gctgtcctgc cgggcgctgc cagggcccct taggccgacg 6660
tgcgtggcca cccgattccc cgccgttgtc tcaggaacct ttgccgagtg gggtggatca 6720
atttttcggg tgtgttttaa tagcataatt acagggagta tttcaggctc cctctgacgg 6780
gccggcaggg tttggctgcc ggctgtttac caggctccaa tctgcacact atttttctgt 6840
gggtatatat agctggggct gcttctcctt cctcaggttc aggctaaaga gggacagcag 6900
ccgcctcagc caccccctgt ggtttccttt gcctgtggat gggcggctaa aatgggccca 6960
ggaagagtca agaacaaggc cggctctcgg tgccacagct ctacccccaa aagcaggaag 7020
ggggctcggg ccatgcccat ctgtgagcta caccggtccg ggagcggcat caggcagggg 7080
agtcctggac ccccgcagtg ctggggtgtg tttgtccgcc ctccctcccg tgtgtctaga 7140
agcctccagc ctcggggaaa acaatgaaac tcaactgtga cttaaacaga ttcccaggcc 7200
cgcaggagct cccggaggct tgtggctgtg gcgagacctg gagggccatg cgggagggac 7260
agacgcaggt ttgcggaggc cgcctgccca ggaggggcgt caaaggaggg gacagatgtg 7320
ggtttaggga ggccacctgc ccgggaggag cctcgaagga aggcacaggc gtgggtttgg 7380
ggctgcctgc cctggagggg cctcaaggac cccaggtctg gtcttggtct cactcacctc 7440
ctggaccccc caaggcctgc agtttgcaat ctgtcgcctg ggacccccac tgtctgcctt 7500
tacgcagctc agccaccacg cggccctcgc tccctcattt acttgatttc tgtttatggt 7560
taaagtaccg tttaaaacga cacatcatta aagcaacatg aaagggagtt ttgaaaaggg 7620
aagccatcgt ccatcccact gcccctgcct cagcggggat ttacttttcc tttcctgtct 7680
gcgggccagt gacaatgagg accccgcaat gtgtctgcgg gccagtgaca atgaggaccc 7740
cgcaatgtgt ctgcgggcca gtgacagtga ggaccccgca atgtgtctgc gggccagtga 7800
cagtgaggac cctgcaatgt gtctgcgggc cagtgacaat gaggaccctg caatgggcgg 7860
cctgtaaggc tctgccctgg cctccgctgc cttcgctttc tccctccttg gtgggtgcac 7920
gcccttgtgc ttttcctaaa agagcaggtc ctccgggcat ggtggctcac gccggtaatc 7980
ccagcacttt gggaggccga gacgggtgga tcccaaggcc aggagttcaa gaccagcctg 8040
gccaacatgg caaaaccctg tccctactga aaatacaaaa attagctggg tatggtgaca 8100
ggcatctgta atcctagcta ctcgggaggc tgaggcagga gaatcacttg aatccgggag 8160
acggagtttg cagtgagccg agatcacacc attgcactcc agcctgggca acaagagcga 8220
aactccatct caaaaaagaa gaagaagaaa atcctgacac ttcagcctgg tgcaggccct 8280
tccctccttc tagtccctgc caagaagtga gccgggccca gatctcctgc cgggcgggga 8340
atgagcacac acattcccct cttgggacag acagcagcag cagccctgtt gcacacatga 8400
ggacgtacag gctcaggggc cgtgggtggc agagaggcta tcagcgccgg actggcccgc 8460
cccgagccag ggtccagccc cacagtcctg tccccaagcc ctggcccttc tgcggtcact 8520
cccgtctgct gaatccccta ctctgcccct ggtgtgtggc cccccagttc cctcctgtgt 8580
tcattccctg ctaacctccc gtggcttcgc ctccccagat gccctgagca cacagcctct 8640
ccccttcctc ccctcctaga tgtgcacata ggagccgccc aaaggctggg gcagctagtg 8700
gggcccctcc aagggaagct gggccccggg caatgccctg agccaccagg tcctggccct 8760
gcgtctcatc ccttcttttt tttttttgag acagagtctc gctctgtcgc cctggctgga 8820
gtgcagtggc ccagtctggg ctcactgcaa gctctgcctc ccaggttcac gccattctcc 8880
ttcctcagcc tcccgagtag ctgggactac aggcgcccac caccacactc cgctaatttt 8940
ttgtattttt agtagagacg gggtttcacc gtgttaacca ggatggtctc aatctcctga 9000
cctcatgatc cacccgcctc ggcctcccag aatgctggga tgacaggcgt gagccaccgc 9060
gcccggcctc atttggttcc ttctgtgcac cacagtgtgg gatctcgggt cctgggtggc 9120
acgtgtttaa cctgaaagga aactgcccct gcgctcccca gcttgtagcc cgtgggcctg 9180
gctctgaggc cccgactgcc ccacggcctg tgctgcgcat gctggagcca ggctccggct 9240
ctggttggcg cctcccgtgg ctttaatctg cagtgacctg ggtgcttaac gagggccttt 9300
gcctctgcgt gtgcactgcc ttcttctgag gagtctcctc aagtctccca gctgtttaaa 9360
caatggggtc ttttgtcttt tgacctgttg gtgccatcag ccagcctcct gcacatactc 9420
tccctaccct tggctgccac tcctgtcctg cccttcgcca tgtctttttt cttttctttt 9480
tttttttttt ttttgacagc gtcttattct gccacccagg ctgtagtgga gtggcacgat 9540
cttggctcac tgcaccctcc gcctccctgg ttcaaccgat tctcctgcct tagcctccca 9600
agtagctagg actacaggtg cccaccacca cacccggcta atttttgtat tgttagtgga 9660
gatggagttt caccattttg gccaggctgg tctcaaactc ctgaccttag gtgatccgcc 9720
tgccttggcc tcccaaagtg ctgggattac aggcgtgagc cactgcgccg ggcccccgcc 9780
atgtgttttt aagagcaggc atttcattca gatgaagccc ggacactctt gggggttctg 9840
ctcaggggct ctacctgcca ctgaacgtcc tctccctgtg tgggtggcca tggcattcag 9900
cctgtgttgg gccttgttct gcctggctac tggccgctag gtctgccccg gcatcctctg 9960
tgtcctgtgt gggcgcctct gcctcctgct ccagcctgtg ccaggcaatc ctgctcacct 10020
tccaggagcc aggcctctcc ccagggcctg cgtcctgtca gggtcaggga cggcccctct 10080
gccatgctcc ggagtccctg gtcccctcac tccgttacgt cctgggtgtc acgggtacgg 10140
ccgggaactc tgtcgtcttc actgtctggg ccggggcctc cctgggtgtc tgctggatgg 10200
agtgggtgcc tttgggtccc tgcaaagtga gcctgcctcc cagcaccgcc ctgtcgttac 10260
atagccacta tctttgcgcc tgtttttcct tcctttgact ggttcctctg gggttaattc 10320
ccaggcctgg tattaccatc tctgaatgcc tgggtggttt cagcgcccag gaggctgtgc 10380
tgaggtatct tagaccatgt gggcaccgtt cgctcctgcg cagccggctc cggggtgccc 10440
tgtttttgcg gaatcctgca gggaacccca tgtaccctaa gagtgctctc cccagccact 10500
gtggcataag acaagcggtc tctttgccct tgggccccat ccttgtctgg tcggcccttc 10560
ttcatgggtc cagcgcggga ttgccggctt ccttttcagg cttcctggga cccccactca 10620
gacctgcagc tgggccagcg atgcccaccc gtttctcctc cacgtggtat acagaggtgc 10680
ccaggctgct gctggggact ctggagccca ggagtgagtc tccttgaccc tgagctgtcc 10740
tggctatcac agctgggtcc tgttttcccc ttcagcaccc acgggtgtct ttctccagtt 10800
tatattgtta tttttattta tttacttatc gagacagagt ctcgctctgt cgcccaagct 10860
ggtgtgcagt ggcacaatct cgactcatcg caaactccgc ctcccgggtt caagcgattc 10920
tcatgcctca gcctcctgag tagctgggat tacaggcatg tatcaccagg ctggacctct 10980
agtttatatt attacagcct ggtcagggag tcactgggcg tcgccatcct gtgggtggga 11040
agggggccca ggcagaggcc aggaggaggt gacagtcatg cgcttagaag ctcaggccac 11100
gcccacccag ccctgcctgg tgaccggttc ctgctgtgtt gggagctgca tcccagacct 11160
tatcgccggg cacagaactt ccaagccagg ggagagggag gcctggaggg gccccaatct 11220
ctgaaggtca gcagtggcgg ggaggaggct tgcggtgctg aagggactcg ggggacctgc 11280
agggaggtgt tggtggtcag ggatggtggc acctgagggg acttttggca gggccagaag 11340
tgcccagagc aagctccggt ggggccctgc actggagggc tggggtcgag tgaccctctt 11400
cctaagacca cccaggagga cactgggtgc agggtggccg gagccctcac ccccagtagg 11460
cagctgctgt ccactccgcc gacctgcctg tcacccagta ggcagctgct gtccactccc 11520
ccgacctgcc tgtcacccag taggcagctg ctgtccactc ccccgacctg cctgtcaccc 11580
aataggcagc tgctgtccag tcccccgacc tgcctgtcag ccttttccct gtcaggccct 11640
gttcctagga gcctggagac ctcaggggtg gccttgagcc cccagggttt ttttgagggg 11700
aagcgccagc tgctgtcttc acccttcccc tagtgaggcc aggctgtgca gggccacgtg 11760
gaggcagtct gtgctgcgcc catcggtcgc ctggcttcct gccgaccctc ggcccccagc 11820
cacctctggt ctcgggcaag gcccctcccc ctgcccacct cctccctggc ccccacgcca 11880
ggtgggcaga cctcctctgc ggtttttatt cagggggtcc ctcgttggct gcccactctt 11940
ggagggctgt cctgactcag gcctcccctc tactcagatc ccctgagcga gggcctgggc 12000
gtgacgccgg gagttactgg ggggccagag ggggaggctc agcctgaatc aatgagaccc 12060
aggaggaagg aggcacgtgg acctgagggc tggctggagc cgctggtgac agatggagga 12120
gtaattgctg cttccagagc acagcgagct cgagctccct ggagtgccag aagcttctgg 12180
gtggacagac aggccgcctc acattccaga ggctgacaca gtcttccagg cacccctggg 12240
gccagctgga agccatgtgc ctccactcac gtgtcccgtg ggtgtttgga ggggaggctg 12300
gccctgccat ggcccacccc agcctgcggc ctcaggagct tgcacatttg caagggggtg 12360
acatgaagac tgagccaggg ctgcggcggg catccccctc agagaacagg gaggaggggg 12420
cacaggcctt tttttttttt tttttgacag agtctcactc tttggccagg ctggaatgca 12480
gtggcacgat ctcagctcac tgccaccttc gcctcccagg ttcaagcgat tctcctgcct 12540
cagcctcccc agtagctgag attacaggca cccaccatca cgcccggctc atttttgtat 12600
ttttagtaga gacggggttt taccatgttg tccaggatgg tcttgatctg ttgacctcgt 12660
gatctgcttg cctcggcctc ccaaagtgct gggattacag gcgtgagcca ctgtgccctg 12720
ccaggcacgg gcctttttat gagggaggaa gccgtgccct ctgccacctg cctgtgggct 12780
ggggcctgca ggctcccagg gccctcagct ccagcgtggc tgttggttat tggcacctgg 12840
gcctcatgtc cacatggaaa gtatattccg agctggtggc taagccacaa gagcctgctt 12900
acctgtccca acccccggct cacttgctgc catgatacgt ctgggattct gggccctcct 12960
tctgagcttg gacacagact tgggacttca gcgctggaca caggtgctgg atctggggtc 13020
tcaatggcac cagggatggt cattctgaca gccatgccca gagtctcagg agggcctggg 13080
gccgcaggtg gacaggcatc ctgaccagag tctcaggagg gcctggggcc gcgggtggac 13140
aggcatagag tctcaggtgg gcctggggcc gcgggtggac gggcatagag tctcaggagg 13200
gcctggggcc gcgggtggat gggcatagag tctcaggagg gcctggggcc gcgggtggac 13260
gggcatagag tctcaggtgg gcctggggcc gcgggtggac gggcatagag tctcaggagg 13320
gcctggggcc gcgggtggac gggcatagag tctcaggagg gcctggggcc gcgggtggac 13380
gggcatagag tctcaggagg gcctggggcc gcgggtggac gggcatagag tctcaggagg 13440
gcctggggcc gcgggtggac gggcatagag tctcaggagg gcctggggcc gcgggtggac 13500
gggcatctgg acgtcggctc cactagtgtc acctctgcaa ccttgtccca cccagcacct 13560
ccctatggcc ctgctctgac tgtgggctga gggggacccc catggctagc ttgggacctc 13620
cgctggacac tgtcataggg cacttgtcga gtggccctgc tgaggttcag gcttgggcgt 13680
gtgtggcccc tgagcccagc agctgcgtga gccgtgggga gccgagcccc cagtcaagaa 13740
agctgtgtgc tccttaccct gcctgctggg cttggggcct gcagggcaag ggaggcggtg 13800
ggatgggagc cccgcctggc ctggtttctt gttgtcgccg cactcctagc tgtatgtagt 13860
cagatgaggc tcccagtcct ggctctgctg ctgagcacca ttgggccggt ggttgggtga 13920
atctctcagc ctctctgagc ctccagcact tcgtccttaa gagtggaact ggtctggacc 13980
tcccaagggg gggtcactgg gtgcagagtt cctgcaaggc tgggcccggt gccagtagcg 14040
gtcgctctgt ggggcctttc gcacggttga tttttatctc cctgtgagat tagcgcctgc 14100
cctgctctgc ctcacggctc tggctctccg ggactgagac cacctgctaa gtgacagggg 14160
cggaaggacc ttgcaacaca gagcaagacg tgatagggtg gagctgctcc gcccaggccc 14220
cgcctgcaga tgagagggcc cagagcctct taatcccctg cgctcagggc atgtgacggc 14280
agggagtctc tccagtgccg cccaccggat tcctatagtt agagctcctc gcccaagccc 14340
ccagggcacc tcactggcct cccaggtgag gacatgaggc ccagcgactc tggtggtggc 14400
tggtgtcacc tatggcaggg ccgcgcgggg cccagtggag gacgcctggc ccggacctga 14460
ctgctccgtg ggaaccgtgg ggcgtgctca gggtgacttg gtgcggctgg gctgccagcc 14520
ggcctggctg agtcactggc agtgaaggca ccaggtggtg gacgtgctcg gcagctggcg 14580
ggagagtacc cccacccagg accgtgttca ggctgagggg gaagggagcg gcccaggcag 14640
gcaccgccca tggcggggcc cccgcactaa cggccacctc tcccgatgga ctgcagttct 14700
ggagccgccc ctgaggagaa cgccctgctc agtgtcctgg cagactctgg actcttcacc 14760
gtgccatcct cgctacagcc tggccaggca gccgctcccg tccccccacc ccacagacag 14820
gaactgcaga ctcctaaagg tcgagccagc tcccaagtcc atagccagaa agtgatgcag 14880
gcggggcccg gctggggggc aggtgtgacc gggtcatggg ggagcgggct gtgcacaggc 14940
atcaggctga gaggtctcgg ggatacgtcc tgggagccgc ctgccaggcg tcctgtgggg 15000
ctgcctgcag gcctcctctg gctttggcag gttctgtccc gacagaccga ggcttgggaa 15060
gaccggattg tgcactctct gcctggagag agggtgggga ggggctgggg cgtgtgggca 15120
gggagaacac cctgggaggc atcagtcctc ttccctgggg acgggccatg cgtcaacagt 15180
ccctcacttc ctctctcagg ggcagaggcg tgggggtccc gagcctccag gttggagtag 15240
gttaggaggg cctcagagcc ccctgctgcc ccgccatgtg gcattggaag gggtgtgacc 15300
ccctagggga tctgttaacc acactccgcc ccatgccggc ctctctgttc cctctaacct 15360
gcgcaggagc agggccagct ctgagctagc agaggtgaca tgaggctcgt cctggccccg 15420
cccaccctgg cccctccctg tttcccacca cgctccgccc accagagcta catgttgtgt 15480
ttgagcctca gccccagacc tggctcaggt cctcaggagg aagcagtgac agccaggccc 15540
ggggtcctct ccctgctctg ctccctgcgt gctgactgga ggctgcaggt ccccaggctt 15600
ggccctgacc ctcaggaatg gagccggccg atgtgaggtg ggggctccgg tcatgtgcag 15660
tggtaggaga ggaggcggga ccggtcccac agctccattg ctgccgaggc gttccgcagg 15720
tctgtcttca tattggtaag gaaaatgcga ggatggtgta gcctgggcat cccagtcccc 15780
aagtccgaaa tctaaatcca agcggaaaat tccaggcctg acttcatacg ccaggtcaca 15840
gtcagaagcc agaattattg aaagtatgct ctgggcgtgg tggcctcaca cctgtaatcc 15900
cagcactttg ggaggccatg gtgggaggat cacttgaggc caggagtttg agagcagcct 15960
gggtaacata gtgagacccc cgtcattatt tacacaaaat tatgtgactg cctttagggt 16020
atgtgtacga ggtatatatt gaaatgtgag tagaattttg tgttgagtcc catccccaag 16080
atacctcatt atgcgtgtgc aaatattcca aaatccagaa aatcctaaac tggaaatact 16140
tctggcccct ttggatgagg ggcccccact ctgcatagca agtgtgggcg cgggtgctgc 16200
tgtgtcctag cgtacttcag tgtgtggcct ttgcagtgaa tagggctggt gtcctcactg 16260
tacagatgag gaaactgagg cccagcttgc tttgccaagg tgcatccggc cccggccatg 16320
gctattctgg ctccagatcc catggtctgc agccacaata ctgctgtgcc ccggactggg 16380
ccctgcagct cgcggtgtcg ctggcctgcc cattgtgggc accgccccca ccccagactg 16440
gccgaggcct agaagggagc agggcctggc tgaggctgca ggggtgggga cggtcagcca 16500
gcccctcact gccaggaagg gcgcatccat cctggcctct ccccagggag aagggaggag 16560
cggctgagag ggaagcgctc ttgccctgtg gacgagctcc tgccccacgg actagggagc 16620
ccccgcccac aacctgcttg tcagggccac ccgggacccc cgggagttcg gctgctcgct 16680
ctgctgttag gaattggatt agttttccat aaaaacagga tgtggtgggt gagagggcag 16740
tgtgtccgtc tttctcactc ccctttttcc aggaactgag cacgcgcata ggttttagcc 16800
agggccgtcc agtcccctcc ccacccccca cagggaacaa tccactctct gctcttaagt 16860
ggccacttaa tcagcttctc ctcctggccc ggggagcttc ttggagccgg cctgccgtgg 16920
tgggaacagc tatggggaca ccctgccata aggtccagca gctaagctgg gatgtggggg 16980
gaggggctgc gaggcccagg cagtgtgcca ggccgcacaa gaggagccca gctcttgccc 17040
caccagctgg cagccctgga ccgaggttgg gcccgtgagg ttggctgggc cctgggccct 17100
gggcccccct ccccaggaca cgactgtggt ggcacatggc tttgggggct cgtgggtccc 17160
actttgcaga cctctgcttt aaggggtctg gtccacgggg tcccctctgg agggcctggg 17220
ggaaatctca gggacctggg gtctggaccc gggggaggga gcgggagaag catgtgcgtg 17280
agtctcgtgc tgtcagggag cccgggaagt ctgcgagggc ttgggggttg tgtcagggag 17340
tgtgggtttt gcccttcagt ggtggaagct ggcttgagtc ccctcgatcc ctcaaggctg 17400
tagtcctgac tcggggctgt agggcagggc agggtggggt caccctgagg cagaaggctc 17460
agcggagatg ttctggcttg gctctgcccc tccctggctg ggtggcctca ccctgtgacc 17520
tttggggacc ctggttcctc tgagccaggg gacagcagtg actccgcctt cctaggtggc 17580
tgaggatgac atgggctccc cctgcaaatg tgggttctgg ctcagtggcc aagtgtatga 17640
tggtatgtgg ctcttggggt cctgagagag atgggagagg agcaggggtt tgtagggaag 17700
ctggcggctt ccaccccagc cagtcacctg cagtggggga gttccaaagc tgactgaagc 17760
ttcgaccttg tggctggtcc ccttccttcc tgcctcagtc attctggtct ctgggggatc 17820
agggctgggg ggctctgggc tgtgggggcc tgtttttgtg acttaaagct ctcccagcac 17880
agccccctga cctccttcct catgggcagg acctggccca ggggtctcag cacagccaca 17940
ggccagggat gcccttgcag atggccctgg atggaattcc agaactcaga aatgtctcct 18000
tcccgtaagg atgtcccgag actcatgaga ccgtttcctt ctgggaaggg ggaggaatgg 18060
ggagatgagt gaagagcgca ctgcagctca atccgggaag aagctaatca atcaatcagg 18120
gaagccaatc gatcggagaa gctgatggga aagctgtgct tggtagaata ggctcgtgcg 18180
ggcagagcag tcgcggcact cacaggctga ctgtgaggac cttgggtgtt actttgtgct 18240
tctctgcatt ttaaaaactt ttgaaagtgg agaagaggaa agtgaatgtt ctctgagatt 18300
tcatggaaag gggaaactga ggcccactct agccagtttg ggcccagggt tccaacctgg 18360
ggtggccccg gccctcgtgg cctgaggtga tcgtccctgt ggctctgaga gcagctgggg 18420
ccgggtcccc gttctggggc tggtgatcct ggggaagagc caggcagtgc cctgcccacc 18480
tagtggttat gagcccagaa tgttgatttt tttcccttgg ttgcttcatg actttgttga 18540
atttccagag tatgtgtggg ggcccccggc gtcccactcg ccccagccct gtggcagcag 18600
agctggctgt caagctcagt cagctgggcc cagggccccg gaggtaggtg ggtgtgtgcc 18660
tgagcttccc ctttgggccc tgccaggtgc tgggagggac cacacaggcg gcaggaactc 18720
ggggtcccca ggcctcggcc acaccagcct ggtgcttgtt atatattgat atgtctctct 18780
acctgtgaaa tgggtattta ttttaaggag ctgacgcacg cgattgtggg gctgtcacgt 18840
ctgaagttcg cagggcgcgc tggctgtcaa gagccgctgt tgcagtctcg agtccaggct 18900
gtgcgctcag gccgggcttc tctgtggcgg tcctgggaat tcctcctccg ggcccttagg 18960
cgacactccc ctgccttcag ctgattggat gaggccctca tgccgtctgc tgatttaaat 19020
caatctcatt ttaaaaacac ctgcacacca aattgcgatt ggcgtttgac taaactgggc 19080
agcgtggccc agcagcgctg acacatgaat caaccctcac accccacccg caggcgtgac 19140
cacggcaccc acgctgccga ctgagaacac agccgtgcgc tgactcgcat gtgatgtctc 19200
tggtcgcacc tcctccatcc tcagcaccct gttcagaatg gagatagcgg ccgggtgcag 19260
tgctcacacc tgtatcccca gcaccttggg aggcctgggt gggcgggtca cctgaggtca 19320
ggagttcgag accagcctgg ccaacatggt gaaaccccat ctctactgaa aatagaaaaa 19380
ttagccgggt gtggtggcag gtgtctgtag tcccagctac tcgggaggct gaggcaggag 19440
aatcgcttga acccaggagg tagaggttgt agtgcgcgag attgtgccac tgcactccag 19500
cctgggcggg cgacagagtg agactctgtc tcaaaaaaaa aaaaaaaaaa aattagagat 19560
aacgacttgg gctctctaga gaccagggag ccaggctcca ggcgctgctg tccagcccct 19620
tgccagctat acgaggtgct cacctggcca cgtgtccggg cagtgcttct ggggtggcat 19680
ccactgggag ggcaagatgg ttctggtaca ggtgcccaat tctgtcccca tttcacttac 19740
tgggaactca aggcacagag aggggagggc tgagctagga ccagacccca gtctcctgca 19800
gaagtacaca gacatgatgt acgaccatcc tggacacctg ccctgagatt cccctccctc 19860
tcctgccctg tcccagtggc ctggggggaa ggggaagcaa ggttctgaag ggagtgtgac 19920
cagacacctg cccgtgacac cccctctcca ggctgcctcc gagtggctgg tgactcccct 19980
cctgcctgcg agggaggtgg ccaggttgca ttcctctctg agtgccgggg aagtccctag 20040
agagcaggcc agcctgtgac tgggccctgg ggcagtctag acaggccaga ctggacaggc 20100
cagggggctg ggtgccgctg ggtaaatcac agggtgaggg ctctgagtca gcaccccatc 20160
ttctgtcctg ggtccagcac cgctgaggac acagtgggca gccgggtctg ccagggccag 20220
gtagctgtgt tgagaaggca gtgctcctga gaggcggcta ccgggaggtt ttcaatggcc 20280
aggcttctta ggaagccctt gttgcctctc tggggtgagt tgctggggcc atggttggag 20340
tggtcgccag tgtctgcccc tggtgccgag ggcggagtcc tcgttttggg aggtcacggc 20400
atgatgctgg gagtcaaagg caggccgtgg caggggcatt ccttttttct ttcttttttt 20460
tttttttttg agacggagtt tcactcttgt cgcccaggct ggagtgcagt ggtgcgatcc 20520
cagctcactg ggatcccagg ctcccaggtt caagcgattc tcctgcctca gcctcccgag 20580
tagctgggat tacaggtacg tgccaccatg cccggctaat ttttgtattt ttagtagcga 20640
cggggtttcg tcatgttggc caggctggtc tcgaactcct gacctcatga tccacccgcc 20700
ttagcttccc aaagtgttgg cattacaggt gtgagccacc gcgcccggcc tggcagggga 20760
atgtcgacgc gtgatctctg cctggagagc acgttcatgt ttcccagagg acactttaga 20820
acatggcgcc tgggtttgga tgaacctcag cctaagaatc tacctgctca ggatccagcg 20880
acgctggtgg tgtggacttc agctctggag aatgggttat atggaacctg ggcgccggga 20940
gggcattgcc acgtgcttgc tgctggggct tcaagaggac cccatctcct gtggccgaga 21000
ccccgtgtct caaggcacat cccctttcgt accccgcccc accctccgca gcttcatgac 21060
ctctgggttt cccccaggac cttcgcatct gatgttccca gatccttcct gccactgggt 21120
cctgctctgg tgccccccgg ggaagccttc cctgaggacc cagctcagca tctggtgcta 21180
actgtggctc atcgtgcact ttggccccca ggaggctgtg ggctcctgaa acccctctga 21240
accacgggct tccaaccaca cctgaccccc tgcgtgccga ccctgtgtgc aggtgtacag 21300
gtgtgcctgg ggcaggatgg ctgtgacggc ctcacagagc ccggagagct gcctcctagc 21360
ttccaaagcc ttcatttcag gaatcttacc ctctcaatta gtctggaatg ctgggggcgg 21420
ggccagctcc aggtcacaga gcgaccttgt ttacccagac cttaacatcg gcccttccat 21480
gctaatcaat gtaatcattg tggtccatgc ggcctctgga atgtgctgtc cactccctgg 21540
gtcagccaga gagtgtcagg gagcacctac cggctgttac ccagtgctgc cctgacctgg 21600
ttcttcactc tgcacatttg tatcacgcca gaccctggct ggcagctcca ggtgacgagg 21660
catgtcagtg ccttcctgtt ctgttctgtt ttgttttgtt ttttaaatcg ggatgaggcc 21720
ttcctgtgtt gcccaggttg gtcttgaact ctcagggtca agcgaacctt ctgccttggc 21780
ctcataaact gctggattac aggcaggagt caccatacct ggcccactgc tactttctag 21840
atgaagagac agaatcccag agaagaagca ggggtttggc tgctggtctg gagccggttc 21900
tgctcacctc cagcttctgc cttgggccgc cctgttcaca caggagctgc tcacaggctg 21960
agacctcgag cagggccctc ctagaggaac tgggcccccg taagtgccct gagccgccag 22020
gagccggccc tgcgtctcat ccctatctcc ggaggacatt ggctgctagc tcaccagctg 22080
gcccctgggc aggcttgaat catgacctgg aacgccaggt gtctctggct ctacccctgg 22140
acctgcaccc tgtccaagtg ccccagggcc agactgtttt ggttgcaccc tctggacggg 22200
ctacccccat gatggctgct catggaaagc tgtggttctt agggagctgc caattcctag 22260
tcctgcagcc tggagctcct gggtataagg tgggggctcg ggcgtattgg ggactggggg 22320
tctcaggaaa gagcctgtgg gacctgtgaa ctcatagctg ctggccgagg gaccaccttg 22380
tggctgtcct tctcagctag gcctggtcag ggcttgtgtg cagggcggct gaagctgtgg 22440
gaggccacac tgtccacaca gtgccctgta agcccaccgt gcctcagttt ccccgtctga 22500
caagtggcac aacagaagcc acttcctggc acacagctca gggtcagggc cgacacagca 22560
cttgtgggct gccgggagac ccgagaggct gccccttcct tgccttggct gccacgggtg 22620
acctggcaaa cccctctggc cgtggcacca ctgggggtct acccttggca gtcagggttg 22680
gccgcttggc tgggagcccc ttctcctccc cagacacatc ctctccttgg ggctggaggg 22740
ggtcctgccg tccccgggat tgtcgagcag caggaatcca ggagggcagt gcctgcagct 22800
cagatggggg ccagtgggca gggccgatcc aagggtggca ggaaagtgcc catcactgac 22860
ctcaggtggg ggaggccatg gtgtgtgaag gaaggagagc tgagtgggag gtcttacttt 22920
gtcaccgccc ctctgagtgc ctgctgtgtg caaaggccag cgggggccct ttcttcagct 22980
gggctctgcc cagacccctg agctctgggt gggccgggag ggagaccttg ctgctcacag 23040
aggtggctct gcctgaccca gctcccttcc cagggcacag tgggggcata gggtcggctc 23100
cgtcagacat tccgggacct gcgtccttcc tggggccaca ccctctaccc actgtccccc 23160
acctatttac ctgtatctgc gccagagatg gctgcccaga taagccctgg tttcctccct 23220
ttctggagag gctgcggggg ctggcgagga acccacctgc gcagagagtc aggggattgc 23280
tctgtgtgga acgcaggcct cacccatgcc ctggaatctg tccccttctc tgttgctgag 23340
ggatgagtcc cagatccctg accctgcagg ggagcccagc acagaaaaac tctgaggcct 23400
ccacaccctg gcagcgctgc tggtcgtctg tggggaagga caggccctgg gagggagggg 23460
gaggtgcgga gggcagtggg gagggtcagg aggaagtggg ggaagggcca cccaggcccc 23520
gatgtggggg atgtctcacg cgtggggtgg ggcattctca tctctgcttg gtctcctgcc 23580
atgctggggg tcgttcactg cggaccccaa gtaccatgaa gatggggatg ggatgctgag 23640
cagcatcggg gagaacgcaa aggcacctcc cagctcaccc gcccccaccc cgcaagcaca 23700
accattgcca tggtgtgggg accggaaggc ggcggctttg ggaccagact gcttctgcct 23760
cgggccgtgc cgctgggcct ttggtcagca ccatcgtgcc ctgcaagtca ctcttagcct 23820
ggtgccctcc tgggcagggc agtgccacaa gagctcaggc ccagatgtgc aggtgccact 23880
gttccaccca ccagcaggtc acctggggaa ccctcccctc ctgcagcctc tgtgtgctca 23940
tctgtgaaat gggcgtggtg gagtcacccc tggcttgtgg gagaatccca ggggctgatg 24000
cctgcaggac cctgtgggct ttgccccgct ccctgggcag agacagttcc cccagtccca 24060
cccacgtggc tgtgtgcagc aggtgcctgc tgaccctctg ttcctgcaca gtcaccttct 24120
tcacagacgg acccccaccc tgccctgcaa acccctccag gggctgcggg ctgagtgtgt 24180
ccgggagggt gtcctgactc tccacgccag caggtctgag agcagatggc tgtggcaggt 24240
gcggtgggtg cccagcccac agcagccacc aggcctgcag gaccctgccc cgtgtaggtc 24300
agatgagcca taaaactgag tttcctggac actgagctaa ttaaacctgg acaccgagct 24360
aattaaatgg tccagaagct cctcagtgcc ccaggctgct ggccgggctc caagtaggtg 24420
aggaacattc cgtttacctc ctgctgcgtc gaaggcgggt ggctcccctc gggcccctgc 24480
ctgtcccggg ccccctgggt gctgctgcgt caaaggcggg tgtctccgct tgggaccctg 24540
cctgtcctgg gcttcctggg tgctgctgcc tcgaagacgg gtggctcccc tcgggcccct 24600
gcctgtcctg ggctccctgg gtcctgctgc cttaaaggcg ggtcgttccc ctcggatccc 24660
tgcctgtctt gagctccctg ggtgctgcct gccctgtggc cacgtcccac tgttgccttt 24720
ggacaaagct ctcctagggc ctggggttct cccatgagat gacaggggtt ggttcaaagg 24780
tctctgaggt ttttagagct ttgtgaagtg ttctagaatc cattttctct ctcattgctg 24840
gacagagagt atagactggg ctttttcttg agtttctctc aactcttctt tgtccatgag 24900
gcaggaagag gggcttcctc agtcctcagc ttggggtgga ttgggatgga cagagaaccg 24960
tgcaggatcc cagcctgaga cggtccagcg ccccggggga gcggagcccg tggctcagcc 25020
gtctgtagcc acggccgggg tcactgtcac tgagggcacg gaggccccgc cggcgaggtc 25080
cgaggtgggc gtgtggggtg gtgggcgctg gaggcaggac ctctgcttgt ggagggtggg 25140
ccaggcgtgg accaggtgtc acgtccgctg gggcctttga ggggcaggtg gggattggcg 25200
cggagaagga gtgaagcagc tggggttttg ggagcctgtg cggagcaggc ccggatgcca 25260
gggtggctgg tgaaggtggg cctggccggg ctcggcctcc attgggggag ccccccaggt 25320
cccctcccca cacagcttcc ccctctgtct gctgtccaag gctcctgtgc tggcactctg 25380
gggtggtagg ccatgcagcc cgtgtgaacc tccatagacc ttgctgtgaa cgctgcacgg 25440
ggcgtctggg ggcgggctgg cttccccccg tcccctgggc caaccttgcc agccttcttc 25500
ttccataaaa gtgggatccg tctgagccct catggcccct ctgggtctgg gtttgctttt 25560
tgtgctctgc ctggggtcat ggcagggaag gcccagcagg ctcccttgca gagcagggca 25620
gagcagcggc cgccaggagc tgcctgtacc acgtctgctc ttcttcctct cttcctctgc 25680
ccggccccgc ccaccgtcga aagcactagc acgggagtgt ttatcggttt ctcttccaag 25740
ccaaataagg cagagagcgc tcttgcagga gttggagcag gccaggggga gggcagctgg 25800
ggcttggacc aggaccccgg ctccctgtag ctgccctggc ctggcagctg tcatccgcga 25860
actctgatcc tcgcctgccc tcacccggcc cctttcagag cttcccatgc tcagctggta 25920
gcaaaagaag tcaagaccta gcaaggtgcc tgccccggcc aggaggccca ggttctagcc 25980
ctgcagctgc cgctgtgagc tctggggact cagacgactg atgtccttcc cagcttctgt 26040
ttcctttgat gagaggaagg ttggaccaag cgacctgccc tgcttctgtc tgtttcctcc 26100
agtccttttc ctttttgacc agttcacttg ttgataactc cagcaacgca tgaaaacatt 26160
ccccttgtaa aaaagggaaa tgccgtgggt aggggggacc aaggacctct tctgcaggag 26220
cagacgcaac agcttggtgt ggatcttcct cagccttttt gtccatccta gacatgtgga 26280
atttcagttt tacacaaaag gaatggtagg cgtctgactc tctgtggctt gtatcacttg 26340
gcagtgccac agggattggt gcatgtttgc tctctcatgc tatgtgtcag gcactgttgt 26400
ctctgcgaca atcctgtgag gagggagtta tggttcttga tttatagacg aacaaactaa 26460
gacagaggag attgggctca tctgtggtca tctcagcagt tgtgagaggt cagggccaga 26520
gcccagtggt gtcattctgc agggcacata cagacacgac ccacagggtt ctgccgcacc 26580
ccctgccgct tggcctgctc tgcaggtggg tgccgaggct gttcctgcat ctgctgtgtc 26640
ttgtgagtcc gtgggtgcct gtggagtggg ggcagtgggt ttgcatttcc aagcactgcc 26700
tctgtcatag gctcagggag aagcagttac gcatgagctg ctatgagcca cgggtatgac 26760
tggcatcaca gcaggaggag ccctggggat ggctgagtga cgatgggtgg ggacagagct 26820
cacagaagcc agggttgccc ccaggccagg ccactgctgg ggccaaggct gggatgcagc 26880
acgatgttgg tctgtcaggg agtggcagga agcccacagg gtcagctgac acttaaccca 26940
gagtggtggg agccttgaat gccagactga gggccacaca gttggtctcg gtgcacaagg 27000
acttgggctg agagggctgt tgctcctcaa tggccatctc cttgtgggag gagagtccgg 27060
gcagccgctt ccaggaaccc acccatgctt gaaatagtgg gaccacaggg ctgaggaggc 27120
tcctggggat tcctcccagg attcagctgc tctgtcccca accccggagg gcctattcgt 27180
ctagccctat atcctctctg ccagttaggt cagggcagag aagtagaggc acagagggtg 27240
gcggaggggt gtccagccag gcctttctgt ggcaccttct gaggctggct ggagtctgtg 27300
aaatctgtga taactggccc agacccttcc tgcctcctgg ggcatctgct ggagctgagg 27360
ctgctggggg agtctgcctg tgacttgagt ctcttgctgg gccatgctgg gctcagttcg 27420
cctgtctgtg gggtgggatg gtgccaccct taggttgttg ggaggaccca aggagagtga 27480
tgcctccagc catggcagct ggcccagctc cggcccgcag cctggctcct tcagggccag 27540
gaacccccag gtcatggact ccaaccctcg ggctctcctg cttcccaggt gacgaagctt 27600
caacccatgg gctctccttc ctgggtgtgg aagccctgga gaaggtggag atgggatctc 27660
agtccagccc attggctcca cttcctttga gaagctcttt cccccgtctt ggcccccagc 27720
ccttgttcaa gcacctgtcc ctctcctgtc tcctaggccc cgtcagtcct tttggagacc 27780
tgttcccacc cgcccctgct ctcacaggct gccagtgtcc acacactctc aggcactgtc 27840
attggagcct tttaaccaca cgggaaagca ggcaggttag gtaactaccc cccacccccc 27900
cgccagcaac gccccctgca tacccagggc ctgcaccagg tgctgctgcg ctgccagctc 27960
tctcgaggtc cctcctccta acctcaatgc atcgcgtctt ccagcccccg gctccgaggg 28020
ctcagcctcc aggtggtcta acctggagtc taaacctgga ttgccatctg cctgcctcag 28080
cccttccctt ccccagggac cgagggccag tgcggctccc cagccaccca ttttttgttt 28140
gttttgagac ggagtctcgc tctgtcgccc aggctggagt gcagtgtcct gatctcggct 28200
cactgcaagc tccatctcct gggttcacgc cattctcctg cctcagcccc ccaagtagct 28260
gggactacag gtgcccgcca ccacacccgg ctactttttt gtatttttag tagagacagg 28320
gtttcaccat gttggccagg atggtctcga tctcctgacc ttctgatctg cccgcctcgg 28380
cctcccaaag tgctgggatt acaggcatga gccactgcac ctggcttgtt tgtttttatt 28440
tttattgttt tttgagacgg aatcttgctc tattgcccag gctggagtgc agtgacataa 28500
tctcagctca ctgcaacctc cacctcccag gttcaagcga ttctcttgcc tcagcctccc 28560
aagtagctgg gactacaggc acccaccacc acacccagat acattttgta tttttagtag 28620
agatggggtt tcaccatgtt ggccaggctg gtttcgaact cctgaccatg agatggcggg 28680
cttgagccat cttcccgcct cggcctccca aagtgctggg attacaggcg tgagccacgg 28740
tgcccggccc cagccaccag ttttgtacag cactcaggtg ggtgtggttc ctgaggacat 28800
gtcacacgag atccttccgg tccattagcc caccccgccc catcagtggc cagtgcggcc 28860
attgtggggt ccagagtccc gaggcagaac gactgactcc aggttgtgga ggggcctctt 28920
aggatccttc taggcaccca ggttgggcag gtgcctccat gcctaagact gagctcctgg 28980
tggacatcgg gctgggtgtg ggcgtcctgc acaccctccc tgtggcctgg tgcccgtgag 29040
gagtggacag tcaccccgag agcatagacc accctcgagg ctcccagatg gcggccgcag 29100
agccccactt ccctgcctgg tgtgtgatac cttccatggc tgaggacacc tctgactgct 29160
cactcctgtg accctggacc caagtgctgg gccacacctg gactccaggc cccagtcctt 29220
ccttcttctg ctgtcctggc tcctgggtgg cccccgccct ccccgctccg aggctctgcc 29280
ctgtgctggg aacccaggaa ttgccacccc ctggccccgg tttctcatgt caggatctgc 29340
tggccaggtt gactcctgag cgccactgtc tcctcagact tgctggtccc acccggtccc 29400
cacctgtcca ccgcccgagg ctctcctgtg aggccgctct gcagctcttg gcctgggggc 29460
ccccggcctc tcatggtgcc ttctgcactg tcccctttgg agatgggagc tttgagggta 29520
ggcgccaccg ttcggtgaaa aggcggtata agcaaagcaa cccccagata ctgaaggagc 29580
cgggaaataa aaggaggcag acagagcaag tgtgttggta cccgcctatt tactggcagg 29640
aacttacaga cggaaacatg gcctcaggca gcctccaggc aggtagagct ctgaacccaa 29700
acgcccgatc tggggctcgt atcgtgccct gggaggaatg tgcaggtggc tgggaacgtg 29760
gcgggtgggg tggccagatt cctgctgcag caccgggttt gtttaggaag aaacgtacga 29820
ggactagaca ctcttttttt tctttcctgc acgtgaatgc cagggagtag gtgctcctgc 29880
aggaagatga tgcatcaacc agccagtctg gaggcattcc gagacccggg gttaatcagc 29940
agattagcat ttaaataaag ttactctgtc cccacagcca gctaggcccg agccacatgg 30000
cgggggcggc gggggcggct gttcgccgca tcccaggctt gctccatctc ctcgtctgca 30060
atgtggaggt gacagtcgtg gtcctcggct agtgccacag gactgtacgg gacagatcac 30120
ccagccccgt gcctgcactg ggggcggcgg tgacgtgatg gccgcggcgg tgacctgatg 30180
gccgcaggtg tgtccaccct ctggttaggc ctctcctctc cctggggcgc aacaggtgtc 30240
ctcgggtggg aggttcagct gctgggcctg gggccccagc tttcagctcc tgtgcaggcg 30300
tggagcggga cggcacgccg gggcgttcgt tcacacgatg cccccagctc gtctctgcct 30360
gctctgtgat gcagcctcag ctcctgtggg tcccgggtca cccacccgtg tgggccgcag 30420
tctttctgca ccacgtcctg ctctcggcca gcgctggcct gcgggccccg gcagtgtggg 30480
gtcacacaca ggccgcaccg gctgtttcac ggagcccccc tgctcaaaat cctggccttg 30540
ggtctctgtg tggctcctgg agggagcatg tatgaggtgt ccaggttgtg aaagccccat 30600
ccggcagccc tccctgtgac agtccttcag gcctcgtcag gcttggttca gcccgtgtta 30660
gaggaggcca gacagctcct cctcgatcac cacagggaac gagggttggg cagtttctcc 30720
tctcccaccc gggcgtgggt cagctgcaag ggtctcatcc caggaactgg atcctggcag 30780
gggggctcag gcatctgaca tcccctggca ggtcttccta tgtgccagtg ggagtgggtg 30840
gtgtccagcc ctctttgtgg aatgttccgg ttgagtggtg tgtggtcctg gttaccacca 30900
tgtggcattt gtggctttcc tggccagcac ccactgaaag cagaggccag cccagccctt 30960
ggacacccag gggcccagca gctaccgtgg gggcagcctc tcccctcctg actgtgctcc 31020
tctcagctgt aggatgaagg tctgtggatg ggtgatggct gggctctctg cttcccaagg 31080
agctggatgt gggccatagt caggcgtgtg ctggtgaggc gagggggttg ggggttggga 31140
accacagctc tctctgaccc catcccattg cagctgactc aggaaaaggc attaccccca 31200
cggggtcaca ggcccagcct gggcagctcc tgatgggaac atgggagcca cagggcaggg 31260
caggctcctg tccccgctcc ttggattgtc tcaggccccg cctccccttt ggctgaattt 31320
cttccttctc tgcctgagcc tgatctgcga agcttccgac ctgccctgag ttggagccag 31380
tcttcagggc caaaagcaat gccgtctcct ccaggcagcc tgctctgaag tctccccctc 31440
tggctttagc ccacaaagtc acagctgagg ccacatcaac acacttagac caagagcact 31500
gccggctgca tagacagcac aggtagatcc aaggagtgtt tcgaaaagcc gtggccctgc 31560
ggccgggatg cccggacctg ggtcctgacc actcttggga gctcctcccc tctcagagcc 31620
catcccatct gaaaatgggg gcattggagc attggaggag tgctcctcac tcctgccctg 31680
ctagccggct actccgagga ccccaagacc agatgatggg agaagtggtg ggctgggctg 31740
tgaccctgag cccccttctc atcccacccg tgaggctgcc cctgcttggt gtctgtggca 31800
aggctgacag aagatggcgc cagggaccag ccagggccct cctgtctcag cccgtccttg 31860
ggtgagtggg tgtgctctgg gggtggcagg tgtgctccgg gggcgggagg tgtgctgcgg 31920
ggggccgggt acgctctggg ggggcgggtg agctctgggg ggctgggtgc gctctggggg 31980
ggctggtgtg ctctggggat ggacaggtgt gctctggggg gcggggtgtg ctctggggat 32040
ggataggtgt gctctggggg ggcggttgtg ctctgggggg gcaggggtgc tccgggggtg 32100
agtgtgctct ggggggcggt gggtgtgctc tgggggcggt gggtgggctt tgggctaagt 32160
agccctcttc ctctctgagc cttttccttg tctgtgttgt tggtgagtgg ccgccacctg 32220
ggacaagcct tagctgtctg tccaactgtc caccatgtcc ccggacccta gaccaagccc 32280
gctgcctggt ggggcctgct tggtattgaa tgaatgaatg aatggatgaa tggatgaatg 32340
gatgaatgaa tgagtgaaca aactctgggg ggcgtgttgc tgatcacccc agggcaggcc 32400
cgtggtgggt catggtctca ggcaggggac ttgccctgcc gggtgacgtt ggcctgccgg 32460
ggaacccctg ccaaggtgcc tcccatgccc ccatcgtcct ctgcctttga gtccactctg 32520
cccctcaagg ttcccctctg gctcggccag gggcagggcg gtcagggagg cctccagctc 32580
cagcccctcc ctcatctcca tcctcagccc ctgcacccgc ctcatctcca gccccagccc 32640
cttgcagcct caggctcggg cttctgagaa tcctttgcag atttcagggc tggttatttt 32700
tttattctgg caaaatatac atccataaag ctttgtttcc tgagatgatc tcaccctgtc 32760
gcccaggctg gagtgcggca gcgtgatcat ggctcactgc ggcctcagcc tcctgggctc 32820
aagtgatcct cctgctccag cctcctgagt agctgggacc acaggcatgc accatcatcc 32880
ccggctaatt tttgaatttt tttgtagaga tggggtctct gtgttgcctg gtctggtctc 32940
gaactcctgg gctcaagtga tccgcctgcc ttggcctccc aaagtgctgg gattacaggc 33000
ctcagccacc acacccggcc taaagtttgt cacgttagcc gcattgaagg gcacaggtca 33060
gcagcggtaa gcatgttcgc attgttgtgc agccatcact gacacccatc tctagaactt 33120
cttcgttttc ccaaaggaaa ctgcacgcac ggcaccacct ccctggcctc cccacagcct 33180
cagggtctgg tgaccttcat ccccaggacc tacgcttctg actccaggag ccctgcctgg 33240
tgtccacacc acactaaggt gccctgccac gggcttcgaa cccaaccctg gtgcacttgt 33300
tgagcattgg acgttcctgg caggtcagac cgtgagctcc tctgctctga cggatgcatg 33360
gacggctgcc acctggctgg acaggtgcag aggggaggtg ccaccttctc tggggacagg 33420
actggggcag aactcacccg gctgaaaagt gcagctgtgg agaacttcag aacttcagaa 33480
gcctttgctg tgaatgcatt ttcctcctgc ctcttgggcc agatcttagg gatttttttt 33540
ttttttaatg aaaatgtata atcgtcaaaa aactttagat ttaaaagcat ggagccgatg 33600
gctatgcttg gtgcgttaat gggaggaaga ggggatctta acttcaggga gggctcctgg 33660
gggagctggg ggaggctgct gtgtccagca gggcgggcgg tgccccccgg agcccggcac 33720
tccgcgatgt gtgcgctaag ccgaggccgc cttgagcccg tagcagcgcc gagcgcgatt 33780
ctttcgtgtc tgcttccggg agggtggaag ggtgaagctg ttgagagtgg gaagggaggg 33840
gctgtgcttc ttgagtttgc cgtgtgcccc tgaccctttc aggtgcaagc gtcagctcca 33900
cggtgccaat ggggagatgg gtctggaggc cccaccaggc tgtgaaaggc ccggcctcct 33960
gtgctgtccg tggaggtcgg ggtctccctc tgccctgcgc ctcctctaac ttgccctgcg 34020
ttttccgtgc ccctggtcta gggtgaggct cgggtcttgg ggactgaggg gcaggtgggt 34080
gtcaaggtga gagctgggct gggctgggcc tccctccaga agacttcccg gggctccttt 34140
ggcaccaagg atggggcaga tggtggcacg catggcctcc cctgggcaca gagccagact 34200
atggagggat ctcgttggct acatcctggc tggggctttg gggtcatggt gggagcagca 34260
gccaggggtc tcgcttggac acgggtctga gctcactgtg gcctccttcc tcagcctcct 34320
gaccggggtc ctgaggctgg agggtgggtg gagggtggag ggtgggtgga tagtgggctg 34380
gaggatgggc tgctggcgcc ccttaggcag catgaggcgc ctttccagtc ccagtgtcct 34440
ccctggtagc cccggaaagg ctgagtggtc cctcaggtcc cctgcgagga gacgacatca 34500
ggccccaccc ctcatctcct gacaaacctc acattcctag gaggaagcag gcctggctag 34560
cacgtggcag gcacagcctc cctgactcca gaccttatca gatcagtgca agtgccaggg 34620
agaccccggg tgggagctgt gtggttggga ctgatgcagg cactggccgg actctcagga 34680
tgagggtggg aggccaggcc ccgggacctt ctgggacagg caggagggca gacacgggac 34740
atggtgtggg ggctgtggcg agtgcggcca cgcagagcat ttgggctgaa ggcgcgctgt 34800
gtcccactgc cccatacgtg tgcgggggct cccagacacg tgctgggggc aggaatcata 34860
gcattttttt gtttgattgt tttttgagat ggagtctcgc tctgtcgccc aggctggagt 34920
gcagtggctc aatctcggct cactgcaacc tccacctccc gggttcaagc gattctcctg 34980
cctcagcctc ctgagtagct ggaattacag gtgcccgcca ccacacccag ctaatttttg 35040
tatttttttg tcaagacagg gattcaccat attggccagg ctggtcttga actcctgacc 35100
tcaggtgatc ctcctgctgc agcctcccaa actgctggga ttacaggcgt gagccaccac 35160
acccagccaa gaatagcatt ttctttcttt ctctttttga ggcggagtct tgctctgttg 35220
cccaggctgg agtgcagtgg tgccatctca gtgtaacctc cgcctcccgg tttcaagcaa 35280
ttcttctgcc tcagcctccc gagtagctgg gattacaggt gcccgccacc atgcccggct 35340
aatttttgta ttttcggtgg agacagggtt tcaccacgtt ggccaggctg gtcttgaact 35400
cctgacctca agtgatccgc ccgccttggc ctcccaaagt gctgggatga caggtgtgaa 35460
ccactgcacc cagcccaaga atagcatttt taaaggaaaa aaagcaaggt agaaagatgg 35520
gtcaaaaccc cagcgccccg ctgggaggct ggtgcccgtg tcgtggcgtg tgtgagatat 35580
gtacggaagc gcgaggcggc ttccacggct ctggctcagg gcagcactca cagggcacac 35640
ggcctcggcg gtgtgacgag ctgggccgtg ggtgcgctgt cctctggggt ggggctggcc 35700
atcctctgtt ggcgacctag ttaacgccca tctccccgca gcctgcctgc tccgcttcag 35760
cggactctcg ctggtctacc tgctcttcct gctgctgctg ccctggttcc ccggccccac 35820
ccgatgcggc ctccaaggta aggccagggg accctgccca cgctctcagg gtgggagggg 35880
gtgggcattc gtttggggcc aaaattcgta cagctttcct cacctttaac agcccggggt 35940
ggaagatgag gggtcccgaa ataaaatttt tttttttttt tgagacggag tctcgctcag 36000
tcgcccaggc tggagtgcag tggcgcgatc tctgctcact gcaggcttcg cctcccaggt 36060
tcacgccatt ctcctgcctc agcctcccgg gtagctggga ctacaggcgc ccgccaccac 36120
gcctggctta tttttttttg tatttttagt agagacgggg tttcaccgtg atagccagga 36180
tggtctcgat ctcctgacct tgtgatccgc ccgcctcggc ctcccaaagt gctgggatta 36240
cagacgtgag ccaccgcgcc cggctttttt tttttttttt ttttttttga gaccgagtct 36300
cgctctatct cccaggctgg agtgcagtgg cacaatcttg gctcactgca acctccgcat 36360
cccaggttca agtaatcctc gcatcccagc ctcccaagta gctgcaatta caggtgtgag 36420
ccaccacgcc cagccatcaa agtttcttat tttcattgta gaccccaagc taagctcaga 36480
atcttttctg atccgtgttg caggggctgt gaggggcgag gagggtcatg ggggtggagt 36540
ctctgtgtcc cttgggaggc cacagggagt ggatgggccc caactgccca ctctctgcag 36600
gctccaggca cgtttcctgc ctgctgaggc tctggcagcc tgggagttcc agccgcctgg 36660
accgccctcc cgctgcccgc tgtggggttg gacctcagtt gactttgatc cacttgtgcg 36720
gggggggggg ggagctgaga ccccccttgg gaaccacctt ggggtctgag ctgggccagg 36780
actgtgttgc tctcccgtat cctccaaaca gagggcggtg aggccacgtg ccaagcctgc 36840
agcctgggtg acgagggtag cagcaaaccc tccatcctgt gacatgtcac ctacctgccc 36900
tgtgggggcc atgtccattt tgtgcccacg ttttaggaga gcgcgttttg gagcaaacac 36960
tcagagacct gtccccaaag gccatgggcc aaacgtgggt ggggccgggc cctccgctgg 37020
tctttgggtt tggagggtga agagccactg aaaggaagga aggtccccag ggagggcaag 37080
tgtaggcagc aagagacctt ccccagcaga gggcagagag gaggccaagc aggaccaggg 37140
ggcgtgactg tggagacagg ctcttgggtg ccgcccttct gggaggtgct ggacgcatca 37200
ggctggcagc gtcggggcct gtccatggct acgaggtgtc caccgggctg cgtttttcca 37260
ggggactctg gggaggatct gcttcctctt ccagctgctc caggtgccta ccttcctggg 37320
cttggggccc ctccctccat ctccagagcc ggtggggtgg ggtcaggatc acaccctgtc 37380
tctcctgctc cctctcccct gcggtaaccc tgtggcttcg tcccatctgc ctccccggct 37440
aatccaggcc gacttccctg gtttaaggtc agctgttggg cagcccccat ttcctctgct 37500
gcctggactc gcctctgcat gtgagcttct gcgttcacag attctgggga ctggggtgca 37560
ggcatcattg gggtccatcg ttctgccagc tgcaggtgga aggtcgctct ccggcctcgc 37620
gacatctggc tggaagcatc ccagaggctc ctcctagctc gtggtgctgt ggggtgggca 37680
atggtctttt ttatttattt tttttgagat ggagtctcac tctgtcaccc aggctggagt 37740
gcaatggcac gatctgggct cactgcaacc tccgcctcgc gggttcaagc gattctcccg 37800
cctcggcctc ccgagtagct gggattacag gcgcccacca tcatgcctgg ctaatttttg 37860
tgtttttgta gagacagggg ttttaccatg ttggccaggc tggtcttgaa ctcctgacct 37920
caggtgatct gcccacctcg gccgagacta caggcatgag ctaccgtgct tggctttttt 37980
tttttttttc gagtgggggt cttgcttggt tgcccaggct ggagagcagt ggcatgatca 38040
tggctcactg cagcctccac ctcctgggct caagcgatcc tcctgcctta gcctaccaaa 38100
gtgctgagat tacaggtgtg agtcactgtg cccagcgcag gcactgatct tggatcatgg 38160
gtagaattca ggggtgcaga gaggcatttt gggaggggcc cagtgcggcc gagtgctggg 38220
agtcgctggg gcccgaggcc caaacccctc caggatgcat ggctggggtg ggtgggcacc 38280
cccactcccg gtccctatcc tgggcctccc ctttgctctg tggagccggt tctgtctgtt 38340
cccaggcccc tggcgtttcg ccgtttgttc cgtaaatatt tcatgcccag ggcgcaattg 38400
gaaacacttt cctttaatca gcagtggggg aaggcaggcg cccagccagg ccaggggagg 38460
agctggggtg ggaagatttg gagaggaccc gggaggactt ccctgcctga gcctcgtcag 38520
aggcccttca gagacggaga tgctgcccag ttttccggga gggagagagg aaagtgtgag 38580
gcttgcccga gccgagtgcc cggggcttta tgatttgtgc agctgctggg cttggcgtgg 38640
ccctggtgga agctctgacg ccatctgagc cttggtcccc ttgtaggcgt cagcctgatc 38700
cttggggggc tggaggttga gctcagactg aacagggagg agaggggtag gggctggggc 38760
tggggcagag ggaacagacc ctggtgctcc aggcagggct gcaggcagag ccacaggggg 38820
tggctcccag agacctgctt gtcatttagg gactcagaag ccccatcctg ccttaggata 38880
aaacccacct ccaagactga ccctgctgtc tggagagaga tcacccccca cctcttacca 38940
tgccccgtgc agggaggccc tgccaccctc tccagcttca ctggtccccc ggctctgcca 39000
gccttgtgta gtctccatcc tctgtctcaa aaggcccctc tcgtggccct accccgcagc 39060
tcagccctag ctgtcgctgg gtgggcctca tggctcagcc tcaaggcacc ctgggtccct 39120
tggctggtcc catgcacacc ccatggatca ggttccaggg ggctcccatg cacaccccac 39180
ggatcagact cagggcaact ccacactccc cacagaacaa tcaggcccag cccttgtccg 39240
gcaggtgtgg ggatggtggc tatggaccac gcatcaggat gctgccgtgg tggggcccct 39300
cagcctttgc aggccgtgcc ggggtccaag ggctccggct ctgggggagg tccatgctct 39360
gtcaaccatc cggtctgcaa taccctgggg cctccccgcc ccttcctgtt tcctcctgag 39420
agccctgcaa gctggagggg gagccccggc cccttttttt tttttttttt ttgagacgga 39480
gtcttgttct gttgcccagg ctggagtgca gtggcgcgat ctcaactcac tgcaacctcc 39540
gcctcctggg tttaagtgaa agtgattctc ctgcctcagc ctcctgagta gctgagatta 39600
caggtgccca tcaccacgcc tggctaattt ttgtattttc agtagaaaca gggtttcacc 39660
atgttggcca ggctggtctc aaactcctga cctgaggtga tccacccacc tcggcctccc 39720
aaaggtgtga accaccacgc caggccccct gcaccttctt ctgggtgggc aagagccatg 39780
ctgagcccct cccctgccat ggataggggt ggcaagaata gtccattccc catgggctcc 39840
ctccggcagg cagcggatgg gttggggccc acacagtggt tcaggaaagg ctgaagggcg 39900
gttgccggcc agagctgggc gggtccctgg cctgagcctc ctctcactcc ctttcccagg 39960
atggaaaggc cactgtgagc tgggtgtgtc ctgccaggag ggagttggag tcgggggcag 40020
gagacccact gggtctcctg ggctcctgga agaggcagca gtgggtccct gcggaggtgg 40080
cctgatcccc ggctcagcct ggttttccca gctttgcatt tgggggtggg acctgcaggg 40140
ggagagtgac ggggtgggcg gggacagggg ctgcaggtgg aggcacgaga aagccacccg 40200
accccttgag gtcatgctgt ttgcgtcgga gaagagggcc ggtgtcaggg tgccccctcg 40260
gcctctgtgt gcacctcccc gctccccgcc ccgtgcaggt cagcagagcc tcgatccctc 40320
tgcacgttcc ggccccctcc catctccagc agcgtctctt cccggggtgc ccctcggact 40380
ctcagctccc tagtctgatc cagcccaggc agggagcggg cgtgccacgt ggccaggagt 40440
ggcctccagg cccagctgcg gccccttcga ccctgcggag ggatcatggc ccagctgttc 40500
taacatggcc agaccaggac actctggccg gcccgagaac tgaaccggga aggaggcagg 40560
gaaaggggag ggaggaagac aatggggaag cagtgacatc cgagatgtag ccagagacgg 40620
acatcctgga ctgtcgtgca gggcaaggcg ggtgggcggg agccaggtgg cctgagagcc 40680
cctccctgcc caggggtctc tggtcaggca gttccttccc gggctgctgg atcgtgtgtg 40740
cagggaaccc gtcagcctgg ctgcccaagg gcccagatgt cctctcagtg cccgggggtc 40800
cttgacagcc ccagcaggag ccccacgtgc ctgtggggca ggccccgcag gtccctctct 40860
gtaggactca gaataccttc tccaatgcca cgtgctctcc ctgagtgccc agtgccacag 40920
agggccccgc tggcgaggtt acttcaacgt caggctagag ggtgcagcga gcaggactca 40980
cagcccaggt tcccaggcag gtgtggcagg agcccattcc ctgggtcggt gttctcatgt 41040
caccccacgg tgaccctgct gtacagaggc gggggcgcgg ggcccctggc tggtgccctc 41100
ctgctgccag acttgtgctc tgctgaagag gggctggcgc ggcaggtatg agcccggcac 41160
ggaggtcgtg agcagtgaga agcctggcac ctatgggttc ggggcaggga ggccctggaa 41220
ggtcctgtcc tccgggagcc ctgcacagca ccccctggtg gtggctcctg ttcgtgtcgg 41280
ggctgcagcc tcccttcctg gacggttttc cattcctcct tcccactctc cctgctgctc 41340
acccctccca tcctccacag gtcagaggtc atagctgcag ggtcagcagg tcagggcctg 41400
gggcaaccct aggaaggtgt gagtgtgaga agctggtcca aacctgcctc ggctgcctgg 41460
tggtgcggac agggagtcct gggcatccgt gagggctgct tcacggtcag gcttagggat 41520
gtgcagggtg acttggacgt gggtcatgag tctttgctcc agaaagaggg ggctgagtgt 41580
ccaaggccaa tcccgagtct gtcacctaac accatttgtg ctcaaaaaac tgaacagagt 41640
ggacacaggc cctgagtttg cgccccgagg ccgagagagg gcagatgtgg tggtgacatt 41700
caccaccttg gacccagacc cagatgctac ctgtccctga gctccaggaa gttgtgagaa 41760
gggcctgagc tgttctgcac tttctcgtgg ccgggcgtgg ctggtggtgc aggagttgct 41820
gccccagggt gagggcccgg aagctcctgc cagcacgtgc cggggtggaa agggaagctg 41880
tccacagccc tgtcaggact cagaacccgg tgggtcaagg actttggtcc ggacccctgc 41940
tgaagggtga gctgtccaca tgtgcgccga gagcagaggt gaagccaggg ctcctgagtg 42000
cccccagcca cagggtgcgc ccgcccagcc cctgccctgc agccgaaggc ctccctgctg 42060
gggggctgag tccagtgggg ccacaggcag ctgggagcag gacaaggctg ccaggcaacc 42120
agatggtgct gccgcttcct gccaggtgtg ggtgcacaga gagagagagg atgccggtct 42180
ggggcctgac ctggtgcaca gcaggtgcct gaaatgccag ggtggccatg gggactgggt 42240
accatgcata ggccatgcat cgggatgcaa cttctccttg cagcccctca gccccaggga 42300
ggcagctgcc tgccccactt ttctccagag ccatcatggc cctgctccca ccccagccac 42360
ggctgctcag gggcgctccg catgctctgg tctccatcca cctgcagccc ccactggggt 42420
gaggtggagc ttcttgcctc tccttgtgtc tatttcctct gcttccacaa ctgaacggtg 42480
acaggtattt gctggatgag ggagcacacc ccaggtggtt tcctctgagc ctgggaggcc 42540
ttttcctgcc tgtgggcccc aggcccatcc tgctgccacc cccaggagga tgcccggctc 42600
cttgtgacaa gagtgaccct cgggaggcgt ggggagtggg gctggccggc ctgcctgatg 42660
gggtcctgag tccatggcgg gtttgcatct caggcctctg ggctctggcc gggctggggg 42720
ctattgtccg gctgagcggc ctgggctgcg gcccctcccc gtccccggga ccagcctcac 42780
ccactcgctc tgccgcaggt cacacaggcc gcctcctgcg ggcattgctg ggcctcagcc 42840
tgctcttcct ggtggcccat ctcgccctcc agatctgcct gcatattgtg ccccgcctgg 42900
accagctcct gggacccagc tgtgagtcgc tgagggggcg gggtagggat agccatcctg 42960
ggggtcaggg agagggccct gcagtgaccc cgagtctcct gggggggttg actcagcctg 43020
atttatgtct ggcctggatg gtccaggtga aacgctccag ggatgaccag gccacggtgc 43080
tggctgggca gagcctgacc tgggttcccc cgtctttctc tgcaggcagc cgctgggaga 43140
ccctctcgcg acacataggg gtcacaaggt aagaccattc ctcccacccc caaccagcaa 43200
gcctcccttg gggatttcag gccccaggaa gtggggggac ccaggaggga cagaggggga 43260
cctggagact catccacact cccacccaca cctggagacc catccacgct cccacccaca 43320
cctggagacc catccacact ctcacccgca cctggagacc catccacact cccacccgca 43380
cctggagacc catccacact cccacccgca cctgcagacc catccacact ctcacccgca 43440
cctggagacc catccacact cccacccgca cctggagacc catccacact cccacccgca 43500
cctggagacc catccacact cccacccgca cctggagacc catccacact cacacccaca 43560
cctgtcctct tggtctgacc gcggctgctc cctgctctcc gcaggctgga cctgaaggac 43620
atccccaacg ccatccggct ggtggcccct gacctgggca tcttggtggt ctcctctgtc 43680
tgcctcggca tctgcgggcg ccttgcaagg aacacccggc agagcccaca tccacgggag 43740
ctggtgaggg cagctgcgtc acccgtgtgt cagggaggtc attcgagagc tgtggtctca 43800
gccattttga gggttatttt aatcttttta aaacagatgt agacgttttg gttgtaagtt 43860
ggtgttaaag agaggaggaa gttccaaatc ccaccccggg gcccagcctg cagttccatc 43920
cgttcagacc tgtttctact cgggctctgc ctctagtcag aaacctccac gccccgacat 43980
ggcatctgtg cccttaggaa ctcttcacag gggaattatt tggggccacg cggtggtgga 44040
aacctgcagt gctgggcagt gggtctggct ggagagccac tgcagaaggg ctgagaaggg 44100
gcggccccag caggccccat gcacttacag gcaaacaggc tgtcggccca gagccccagc 44160
aggggcctgg accccaggag cgacgggcct gaagcagggc ctctgtcctc ggagtgggag 44220
gcagagtgaa ctttagctgc tacaagactt ggaggtccgg ccccgggaat ctctgagcta 44280
tggccccctc acacggacag ggcatgagct ggggcctgcg acacccaacg ttgactgctc 44340
agaccctctc gtccctgcct gggcccacac ttgccatccc caggctcagc caggatttat 44400
ggccacctgg gtgtcctggc ccacgaactc cctgccccgg gcacccagcc tcctcccacc 44460
tcaccctccc agtgcccact cgtcagatag ctgatgctcg ccacgcacat gggcctcaac 44520
ttctagagga gtcccgagag ggaaaggggt tccccaagcc acacggtagg tcgagtacac 44580
ctgctcagcc tgcagaggcg gcctgccctc ctgcctgtcc tgtcgccacc ccatggggca 44640
aggctggtgc ccgcatttca gaagtgggaa cggggacctg gaggtcaagt ggcttttccg 44700
ggcatttgag ggggtccagc gctcatgagg actgtgctgc tgcctgtcct ccaagagacc 44760
cgcccctccc tcgtcagccc ctccatgctg atgggggcat ggggcatgag cttcctagag 44820
tttggctgct gggaaggggc tgggtggctg gactctggtc atcttcatct tggtgtgatg 44880
ggagcctgag tgtgcagctg cgccctgggc ggccagcgtg gacagacttc agagtgagct 44940
gggggcacca ggcacctgca ggataccgtt ccgaaagatc tagaagcccc atgacccggc 45000
ctggcagggc ccccgggcga ccctcactcc cacatatggg caacacacac acgtgtttgc 45060
aggcatgcga cggagtgtgc cagccagccc gaggggtgct ggccgctaga ggagggtgag 45120
gggcgtctgc agcatggctg cggcacgtgg ggcccaagtc agggccgggc ctgcccctcg 45180
gtggcctcac accccaagtc agggccgggc ctgcccctcg gtggcctcat accccaagtc 45240
agggccgggc ctgcccctcg gtggcctcac acctgttctc tcacagcagc tgcctctgtt 45300
ctttccactc ccagaaatgc tcatttttca cggctctgct cagaagattt cccagggcca 45360
gggccagggc caggctgtgg gtggggtgag cgatggcgcc ctgcgttctg atccagcctc 45420
gcccccagct gctgtgtggt ctctgagagg ggtgggctca gggcctgggc ctctcctgcc 45480
ctgatctccc tgttaccctg gcctcggagc ctcccagcag cccctgcagc cctggaggcc 45540
tgtgaggaca ggactggtct ggttcatctg tcccgtcaag cccccatccc atttgacaga 45600
aggggaatag gctccgagag gctgtgactt gcctcggcct gcagagcacg gagactgtca 45660
gagctggggt ggggcctatc gtccagcccc acagcctgcg gtctcagccc gggcacctgg 45720
cgcctcagcc accaggagag cccccgagtc acagatgggg acactgggcc ggtggcagcc 45780
aggccagagc cagggcatct gacgacagcc gtgttctttc caccacacct ggctttccct 45840
ggtgtttggg aaatggctgt gttctgggaa atctttagtc aggtccaggg aaaacaggcc 45900
cggcaggtct ctctccccag ccccaggccg gcctgtcact tcttctaggc agctggccac 45960
ctctgtcccc ccagaggctt ggggagggca ggagtaccac ccctatcttc caggcagagc 46020
cacccagaag gctggcaggg gtacacagga gaccctggag cctggccatg tccctcaggc 46080
ccccttggtc tctagagacc ccccggggta tagacagggc cccgctgctc cctgggtgcg 46140
tggttcgggg agatgaggtg gtataggaca gtctgtggtc tgtctgtacc tggcaaggtc 46200
atcacgtgcc tgggcttggc aggacagacc ctgggtcttc ggccagggtg ggagctgcta 46260
ccaggaaggc ctgcaggaac tgtgagcttg agtgaggaag taggaaggtg tcaggcagac 46320
ctcagggacg gctggggcct gtgcccgggg aggctgtcct gtggccctca gaggagcagc 46380
tgtggatgtg gccgcctccc acgctcctgg ctgggcaggt gtgggctgga gaggtggcgt 46440
cagtgcgata cacctgacct tgcccctgtc cgtgaccttg gcaggatgat gatgagaggg 46500
atgtggatgc cagcccgacg gcagggctgc aggaagcagc aacgctggcc cctacacgga 46560
ggtcacggct ggccgctcgt ttccgagtca cggcccactg gctgctggtg gcggctgggc 46620
gggtcctggc cgtaacactg cttgcactgg caggtacgca ccgaggcagg gggcactggc 46680
agtcacactg ggaggggtct tgggagttcc ctgatgactg tggagacagc gggacacatg 46740
gcactggcca ggtaccaccc tgtgtgcccc tgccccgcag gcatcgccca cccctcggcc 46800
ctctccagtg tctacctgct gctcttcctg gccctctgca cctggtgggc ctgccacttt 46860
cccatcagca ctcggggctt cagcagactc tgcgtcgcgg tggggtgctt cggcgccggc 46920
catctcatct gcctctactg ctaccagatg cccttggcac aggctctgct cccgcctgcc 46980
ggcatctggg ctaggtaacg gcttgccaca cagccccttt ttcctgccac cctggtcccg 47040
cccacctggc tcgtctagcc cctgtggccc cactgcctct ggggtggtag gctgtgacgg 47100
gtcttctctg gacagggtgc tgggtctcaa ggacttcgtg ggtcccacca actgctccag 47160
cccccacgcg ctggtcctca acaccggcct ggactggcct gtgtatgcca gccccggcgt 47220
cctcctgctg ctgtgctacg ccacggcctc tctgcgcaag ctccgcgcgt accgcccctc 47280
cggccaggtg agcacctgcc acccatggtg ggtgggctga ggccaggcca tggggctggt 47340
ctcaggacct cctgcctctg ggtggggtgt ggagctggtt tgggctcaag acgctggtct 47400
ctgcagagga aggaggcggc aaaggggtat gaggctcggg agctggagct agcagagctg 47460
gaccagtggc cccaggaacg ggagtctgac caggtgagca gccaggcagg tggagacgcc 47520
agcgtggggg gcgcccggcc agcccgtgca tggctcagcg ctgcttgccc acagcacgtg 47580
gtgcccacag cacccgacac cgaggctgat aactgcatcg tgcacgagct gaccggccag 47640
agctccgtcc tgcggcggcc tggtgagtac cgcacactgc aaggtatggc tgggtgcggg 47700
gggcggggcg gaggccggtg ctgccccctg gtggccgcct ggcgctctcg catgctcgcg 47760
ccgcacctct gcctgccgcc ccctcggggg cccaggacat ccacgggtcg gtgtcagtga 47820
cccccgagac ccccagggca gccgagtggc catgtcactg accaaccccc aagaccccca 47880
gggcagctga gtggccgcgt cgttgatccc caagacccca tggggggcct ccaggtcccc 47940
caacccctcc ccagagaatg tggctatgct gtcttgtgct gttagctctg ggagctgctc 48000
caggtggccc agtggcccca ggaggccgct cgtccagggc aggggctggc ctgggaactc 48060
tgtgttggcc acgtcgcctt gggagggcct gggggctctt tctggctact ttctttcttt 48120
accctaaccc ttgattttcc attttgcaat gtgtttctga atgaagcaaa tgaagccacg 48180
gccctggggt gggggtcctg agagtcttca ggtgcgcaga gctggaaagg gggtcagggc 48240
cacctttccc accctttcaa ggaaagtgag gcccagagaa cggcaggtgc tggcagggcc 48300
atccctgacg ctcagggacg gtgtcagccc aattgccgga gccctcgtgt tctgcccata 48360
gcccaccggg ggcctgtctc tcctgctgtg tgcttgccca gggcccagat tttagggcat 48420
agtcagggtg gggaggcctg cagatcaacc tgccgaagct gaccgctgtc cccacctgca 48480
gtgcggccca agcgggctga gcccagggag gcgtctccgc tccacagcct gggccacctc 48540
atcatggacc agagctatgt gtgcgcgctc attgccatga tggtaggcgg ctgtgggggt 48600
tggggtgggc ggccccctct gccgcgcagg tgtggggcat cgcctgggtg gggtgcgctg 48660
ggcagctgtg cagccccctc tgccgcgcag gtgtggggca tcgcctgggt ggggtgcgct 48720
gggcagctgt gcagccccct ctgccgcgca ggtgtggggc atcgcctggg tggggtgcgc 48780
tgggcagctg tgcagccctc tctgccgcgc aggtatggag catcacctac cacagctggc 48840
tgaccttcgt actgctgctc tgggcctgcc tcatctggac ggtgcgcagc cgccaccaac 48900
tggccatgct gtgctcgccc tgcatcctgc tgtatgggat gacgctgtgc tgcctacgct 48960
acgtgtgggc catggacctg cgccctgagc tgcccaccac cctgggcccc gtcagcctgc 49020
gccagctggg gctggagcac acccgctacc cctgtctgga ccttggtgcc atggtgagtg 49080
tgcaccacca catccggggg tgcctgggtg cgcagaccca tcagggttgt cgtcctgttc 49140
aatgtccact tgcccggggg agtggcagcg ccaagaaggc agatgtgtct gtctgtcccc 49200
ttctgcccac ccagagccag cccagagtag cttctcagtg agcgtttgtt gactgaataa 49260
acagacaacc ttgtgttggc acgggcacca cccctgtgcc ctgacactgt gtgagcgtgg 49320
gctctgttgg cacgggcacc acccctgtgc cccgacactg tgtgtgagca tgggctatgc 49380
ccattggcac aggcaccacc cctgcgcccc tgacagtgtg tgtgagcgtg ggctctgccc 49440
attggcacca tgcacagccc tgggtctcag tgacaagctg tgcaggccat gtgttcacag 49500
ggtgcctgcg tgtccatgtg aaacgggtgc cagcatcgtg tctggacacc tgtttgcagg 49560
ccagtgggtc tcatcttgtg aaacttgtga gcctgtgtgc caacatatgc acctgtgagc 49620
ttgtgtgcat atgtgagcac gcatgtgggc aaacatgcac tccagcatgt ggacatgtgt 49680
gcaggtgcgt gcatggatct gtgcccacgt gaactagtga acccgtgtgt gactctgcgt 49740
gtgagcgcaa gtgaacccat gcactcatcc atggatgtga gagtgtgtgc tcgtgtgcct 49800
ctgagtgggt gtgagcgaga gggtgttcgg tgcctgtggg gaggctgcgg tggatgggct 49860
ggtgccagcc gcctgagagc tcttgccccc tgctatagga gggtgctggg tcccccggct 49920
gtgggagggg tgctgggccc cccggctgac tgtgacaccc tgcgcttgtc acagttgctc 49980
tacaccctga ccttctggct cctgctgcgc cagtttgtga aagagaagct gctgaagtgg 50040
gcagagtctc cagctgcgct gacggaggtc accgtggcag acacaggtga gtggtgggcc 50100
agaggcgggg gttgccctcc tgcctgcccg ccctgatgcc atcgcctgcc cctggcttgg 50160
cccacagagc ccacgcggac gcagacgctg ttgcagagcc tgggggagct ggtgaagggc 50220
gtgtacgcca agtactggat ctatgtgtgt gctggcatgt tcatcgtggt cagcttcgcc 50280
ggccgcctcg tggtctacaa gattgtctac atgttcctct tcctgctctg cctcaccctc 50340
ttccaggtgg ctggggggcc gggatggggg ctggggcacg gaccctcccc gcggtcctca 50400
ccacccccac ctcacccggc aggtctacta cagcctgtgg cggaagctgc tcaaggcctt 50460
ctggtggctc gtggtggcct acaccatgct ggtcctcatc gccgtctaca ccttccagtt 50520
ccaggacttc cctgcctact ggcgcaacct cactggcttc accgacgagc agtgagtcca 50580
ggctggggcg gtggggcagg ggcgccgaaa ccccgtgcac ttccccgggg ctgcagcggc 50640
tctgccgggg gccgggccgg tgctgatgct gcccctccac aggctggggg acctgggcct 50700
ggagcagttc agcgtgtccg agctcttctc cagcatcctg gtgcccggct tcttcctcct 50760
ggcctgcatc ctgcagctgc actacttcca caggcccttc atgcagctca ccgacatgga 50820
gcacgtgtcc ctgcctggca cgcgcctccc gcgctgggct cacaggtgcg gccccgccct 50880
ccctgtccgg ccctggagag gtgtagcctc ctgggccagg gagggagcca ggtgggagtt 50940
ggacaggagc cacatcttcc accttcagat cccaaggggc atttgctcat accaagggga 51000
tggcagtagc gtggaggtca cagggacagt gggcatgagt tgcgacacag ctgtgcacct 51060
gaactggcag ctgcagcaga agcggtgccg acagggcttc ttccagcccc aggaaatgag 51120
gggcaggaac ccagttggga gatgacattt tcggaccctc tcccaggcag gatgcagtga 51180
gtgggacccc actgctgcgg gaggagcagc aggagcatca gcagcagcag caggaggagg 51240
aggaggagga ggaggactcc agggacgagg ggctgggcgt ggccactccc caccaggcca 51300
cgcaggtgcc tgaaggtggg ttgggcgggc agagcacagc tgccacccag tctgctgtgc 51360
catgtcccag ctcggggggc gttggcagag tcccctctgg gctccagagc ctcttcctca 51420
caggggaccc gggaatcccc gtttgtgccc cgcactgacc ctcacaccat cacaggggca 51480
gccaagtggg gcctggtggc tgagcggctg ctggagctgg cagccggctt ctcggacgtc 51540
ctctcacgcg tgcaggtgtt cctgcggcgg ctgctggagc ttcacgtttt caagctggtg 51600
gccctgtaca ccgtctgggt ggccctgaag gaggtgagtg tggcaggcaa ctcagcttcc 51660
catctggggt ggggtcgctc tggcctgccc agctggcctc cccaagccca gccccacgtg 51720
cccactgccc tccccaagcc cagccccacg tgcccactgc cctcaggtgt cggtgatgaa 51780
cctgctgctg gtggtgctgt gggccttcgc cctgccctac ccacgcttcc ggcccatggc 51840
ctcctgcctg tccaccgtgt ggacctgcgt catcatcgtg tgtaagatgc tgtaccagct 51900
caaggttgtc aacccccagg agtattccag caactgcacc gaggtaccgg cccccgaggg 51960
ctgggacggg aggaagctcc aggcaactct gtattcgcag cccgaccctc ctggggcagc 52020
tgcctcagtg cagtggggcc agcaatggag atggaggact ctcccctggg ggcgccaagg 52080
gggcttcctg gaggcagcat ccttcgacct caactgtgga ccaggggcgc actccctgca 52140
cacaagggtg tccagtaggg gcggagtccc agggtctccg gcagtgagga cgggagggcc 52200
ccacccctgg acagggagag acagtcaggc atctctgcct gggaccttct cgcacatccc 52260
tccttctccc tggacctctc ttcactcccc cagcccctgc ccgtggtctc cctgtttctc 52320
aaacacctgg tccccttccc cgtgaaggtg gctccaaggc tggcagcccc cgtgtccctg 52380
gctggggagc agtggacctg ccccagagct gtggctgtgg tgggctccgg gcagggccag 52440
ggggcactgt ggcctgggag ggggcactga tgcctggcct cttgccagcc cttccccaac 52500
agcaccaact tgctgcccac ggagatcagc cagtccctgc tgtaccgggg gcccgtggac 52560
cctgccaact ggtttggggt gcggaaaggg ttccccaacc tgggctacat ccaggtgagt 52620
tgaagggctg gtgggcggct gggcgggcga gtacccggct gccccctgac ccttgccctc 52680
cgcagaacca cctgcaagtg ctgctgctgc tggtattcga ggccatcgtg taccggcgcc 52740
aggagcacta ccgccggcag caccagctgg ccccgctgcc tgcccaggcc gtgtttgcca 52800
gcggcacccg ccagcagctg gaccaggatc tgctcggctg cctcaagtac ttcatcaact 52860
tcttcttcta caaattcggg ctggaggtga ggcaaggaca ttgcctcccc ctggggcagg 52920
gcttggcctt cgggagggag ggacggctgc accgtgcagg caccgcaagc ctggccccac 52980
ctgggtttgc ctgggccaca gagggtgggg gactcagggc caggcacggc ttccctggac 53040
tcctgtggtg tgtcggtgct gacaacaggc agggggccaa gttagatctg ctctactgta 53100
cagcccacct cctggagcct cagtttcccc tgcacgatgg caactgccag ccactcctgc 53160
cctcttgaca gcgccgctgg ccctgtcctt gcttgatgcc cgcagcctcc aggcagggct 53220
gctgcaagcc tgaggcctgc tgggtgggac aagaaagtcc ctccccccag actcagtgca 53280
tccccacacc ccgccctctc ccctccccag atctgcttcc tgatggccgt gaacgtgatc 53340
gggcagcgca tgaactttct ggtgaccctg cacggttgct ggctggtggc catcctcacc 53400
cgcaggcacc gccaggccat tgcccgcctc tggcccaact actgcctctt cctggcgctg 53460
ttcctgctgt accagtacct gctgtgcctg gggatgcccc cggccctgtg cattggtgag 53520
gggcacgtgg cttgggtggg agtgggcttt gtggctttgt ggatgcccgt gggggtgttt 53580
cccgcctgcc ccagactcct gtccaccctc ctagacttag ccttggcctc ctccagtccc 53640
tcctctctgc tccacatcct acccaggcgc catcacctgc atcctgtctc tcgggggcgg 53700
cctggccccc tccaggctct gctgttctct tttccttttt tgcccagtat tctatcttga 53760
aatatttcaa accttcagga aagttgtgag tcacacaagg agcactgcgt cctctccggg 53820
ccccgtgcgg gtcggccgtg atgcctcaca cccaagtgct gcctcgagca tgcgtctcct 53880
gggtgagggt gtctgagccc acagccccac acccgtggtc ccgtctcctg gcagtgccat 53940
cgtcaaacgt gtcctctgca ttcaaacagc cccggcctca gcacccttct ttgtggccat 54000
ttggttttca gacgggatct ggtctgatgt ttgctctagt ctcttgtctt gggtctaagc 54060
cgcccccgcc tctcctgtct cttgggaagt tccggaggga ggccggtagc gttgctgacg 54120
ccgtgagact ggatttgcgt ggctgtcctg gtgctgcagg tctgctcaag gcacacagca 54180
ccctgcggtc tgagatgggg agtcacattt gtgcacgtgg ccggctcagg ggcgtcccac 54240
ctgccccaca gtggcaccca gcctgttggc actggtgggc tgtgtggggt cagccttgtg 54300
gttttacgaa acagactttc tctctgctgt ctctgtgtgt ctgtcagctg ggattcccat 54360
caaggacagc tgccatttgt tactggctgc tttccaagaa ttctgtcatc cgcagaccct 54420
gggcctcccc tctgctgagt gggtcctggc ccctccggcc acacactgtt acatcatctc 54480
cccgtatttg gctgggcatg gtggttcacg cctgtgatgc cagcactttg ggaggctgag 54540
gcaggagcat cccttgaggc caggagtttg aaaccactct ggtcaacata gcaagaaccc 54600
tttttttttt tttttttttt tttgagatgg agtcttgctc tgtcacccag gctggagtac 54660
actggcacaa tctcggctca ctgcagcctc cgcctcccgg gttcaagcaa ttctcctgtc 54720
tcagcctccc tcgtggctag gattacaggc aagcaccacc aggcccggct aatttttgta 54780
tttttagtag agacggggtt tcaccatctt ggccaggctg gtcttgaact cctgacctca 54840
ggtgatccac ccgcctccca aattacaggc ctccctcctg ggattacagg cgtgagctgc 54900
cacgcccggc cccgtcttgt tttctgctcc caggcgctgc tgcctcatct tctgctaccc 54960
aggcccagcc ttgtgctcac agccattgct ccagggagcc caatcgagtt ctaggagcgt 55020
gaggtttaga gcccggggtc tgggcgctgg gtgtgcctgt tgctacaggg ctgcctcagc 55080
ctctgggccc tccagctctt ccttgttgaa acatctgctt tcgagcatca ccgaggccag 55140
ctccccgtct cctgtccacc tcttccttgt tgaaatacct gctatcaagc gtcacctagg 55200
ccagctcccc ttcttctgcc tccttccacg cggctgcgcc atgcagtcgc catcctgtga 55260
gatcagcatg tcctgggttc cccaacatcg agggtaactt tgtttttgta tcgtgaggtt 55320
ccctctgtgg cagatggggc tgtgggttca gcatgtcctg ggttccccag catcgagggt 55380
cactttgttt ttgggtcgcg aggttccctc tgtggcagat ggggctgtgg gttcagcatg 55440
tcctgggttc cccagcatcg agggtcactt tgtttttgtg tcgcgaggtt ccctctgtgg 55500
cagatggggc tgtgggttca gcatgtcctg ggttccccag catcgagggt cactttgttt 55560
ttgggtcgcg aggttccctc tgtggcagat gggggctgtg ggttcagaat gtcctgggtt 55620
ccccagcatc gagggtcact ttgtttttgg gtcacgaggt tccctctgtg gcagatgggg 55680
ctgtgggttc agcatgtcct gggttcccca gcatcgaggg tcactttgtt tttgtgtcgc 55740
gaggttccct ctgtggcaga tggggctgtg agatcagcat gtcctgggtt ccccaacatc 55800
gagggtcact ttgtttttgg gtcgcgaggt tccctctgtg gcagatgggg ctgtgggttc 55860
agcatgtcct gggttcccca gcatcgaggg tcactttgtt tttgggtcgc gaggttccct 55920
ctgtggcaga tggggctgtg ggttcagcat gtcctgggtt ccccagcatc gagggtcact 55980
ttgtttttgg gtcgcgaggt tccctctgtg gcagatgggg ctgtgggttc agaatgtcct 56040
gggttcccca gcatcgaggg tcactttgtt tttgggtcgc gaggttccct ctgtggcaga 56100
tggggctgtg ggttcagcat gtcctgggtt ccccagcatc gagggtcact ttgtttttgg 56160
gtcacgaggt tccctctgtg gcagatgggg ctgtgggttc agcatgtcct gggttcccca 56220
acatcgaggg tcactttgtt tttgggtcgc gaggttccct ctgtggcaga tggggctgtg 56280
agttcagcat gtcctgggtt ccccagcatg gagggtcact ttgtttttgt gtcgcaaggt 56340
tccctctgtg gcagatgggg ctgtgagttc agcatgtcct gggttcccca gcatggaggg 56400
tcactttgtt tttgtgtcgc gaggttccct ctgtggcaga tggggctgtg agttcagcat 56460
gtcctgggtt ccccagcatg gagggtcact ttgtttttgt gtcgcgaggt tccctctgtg 56520
gcagatgggg ctgtgagttc agaatgtcct gggttcccca gcatcgaggg tcactttgtt 56580
tttgtgtcgc gaggttccct ctgtggcaga tggggctgtg agatcagcat gtcctgggtt 56640
ccccaacatc gagggtcact ttgtttttgg gtcgcgaggt tccctctgtg gcagatgggg 56700
ctgtgggttc agcatgtcct gggttcccca gcatcgaggg tcactttgct tttgggtcgc 56760
gaggttccct ctgtggcaga tggggctgtg agttcagcat gtcctgggtt ccccagcatg 56820
gagggtcact ttgtttttgt gtcgcgaggt tccctctgtg gcagatgggg ctgtgggttt 56880
cgcagatgcg tggagtcaca tccatgccct cagtccttag ggaccgaccc tccctgcctc 56940
acacgcctcc caggaagtgt ggccgggggc cggcagtgcc acggctccct ccccagcagg 57000
ccccggccgc tcccatcccc agcacgtggt cctatcagaa cgccacgtca gcaggactcc 57060
cagcaggtgg cctttaggtc tggcttcttt cacttggcag agcacactga ggtctgtcta 57120
ggctgtcgca tggatcccgg tcccacgtgc tgagcagcgc gttcccagct gtggttgctg 57180
caggttgaac ttttcctggc tgcaggcgtc cgtgcagctt ctggccgttg ttttcagagc 57240
tgtcctatca cacgcactgt cctatcatgg aatatgacgc cgtgtgggcc acaactcagg 57300
cccagcagcc cccacccccg tgctctctgg cctcctgctc agttcctttg cccccagggg 57360
cttggtgcag agttgaagga atctgtgtgt gtgaacacac aggacactag agctgtcagt 57420
tctcgagaca ccaggtgtgc gcgaggtgat tcccatggac cctgagggct ggtgatagac 57480
tcgggtcaac gggtggggac cgggtgtctc aggccccagg caggcccggc ccttcctgac 57540
atgacacccc ttcccccaga ttatccctgg cgctggagcc gggccgtccc catgaactcc 57600
gcactcatca agtggctgta cctgcctgat ttcttccggg cccccaactc caccaacctc 57660
atcagtgagt gccccccacc acccccgcct ctgcagagga ccctcagagt acattcacgc 57720
ccccaaatct gctcacaagt gtgcacacag gcgtgcacgg gcggaggtgt ggtcaggcac 57780
atggcggcct gcaggccctg acctcgcacg cacgcacgca gacctcagcc tgtgtgcacg 57840
gcagcccttg tgcagatgcc ctcacaccgg ggctccccca gggacacccg gccactcacc 57900
caggcagacg tgtgtccgct cccagcggct gcacgccgac aggcctgggg tgggaggtgg 57960
gatttatgcg ccgtgcccac ctcgtgtggg tccccgtgtg gcacagcggc ggctcctgtg 58020
tcctgcaggc gactttctcc tgctgctgtg cgcctcccag cagtggcagg tgttctcagc 58080
tgagcgcaca gaggagtggc agcgcatggc tggcgtcaac accgaccgcc tggagccgct 58140
gcggggggag cccaaccccg tgcccaactt tatccactgc aggtgggttc cacgtcaccc 58200
tccacgggga accttctggg aggggtggcc ggggcgcccg ccctgacgct ccggcctggc 58260
aggtcctacc ttgacatgct gaaggtggcc gtcttccgat acctgttctg gctggtgctg 58320
gtggtggtgt ttgtcacggg ggccacccgc atcagcatct tcgggctggg ctacctgctg 58380
gcctgcttct acctgctgct cttcggcacg gccctgctgc agagggacac acgggcccgc 58440
ctcgtgctgt gggactgcct cattctgtac aacgtcaccg tcatcatctc caagaacatg 58500
ctgtcggtga gcctccggcc cccccgcacc caccgccctg gggccccgct ggccccgctg 58560
accctgctct cccccagctc ctggcctgcg tcttcgtgga gcagatgcag accggcttct 58620
gctgggtcat ccagctcttc agccttgtat gcaccgtcaa gggctactat gaccgtgagt 58680
ggccaggacg gtggcggggg agggcgtggg gaagccccct gctcctgggc cctgggcctg 58740
acccttgccg gtgcctgcct tgcagccaag gagatgatgg acagagacca ggactgcctg 58800
ctgcctgtgg aggaggctgg catcatctgg gacagcgtct gcttcttctt cctgctgctg 58860
cagcgccgcg tcttccttag ccattactac ctgcacgtca gggccgacct ccaggccacc 58920
gccctgctag cctccaggca agcttgggcc cagacacagc ccagagctcc cgtcttgggg 58980
ctgggagggg gcaatgggag gttcctcact gtctcaggcc ccggcccgtg gagggcaggc 59040
tctgccactc tgtgacatgg gcgtgtcatc tagagggaga atgaaggccg gcagatcccc 59100
ggcaccatca cactctgccc cagtgctggg tctgtcagag accacaggct gcagtgctga 59160
cggtggctgg tgtctcaccc ccagccaact ttcccactaa gggctaagtt tctccaccag 59220
cgggagggcc actgtgtggt gtcacgactg ccccagggag gggttctggc ttggggccag 59280
ctttgccttc ttccctgcag ctgtggtggg gtgggtgcca ccagacgccc ctgcatctgt 59340
acggcagaag ggcctgtcct cgccgcagac agcacggagg gtgggggcag cagatgcctc 59400
ccccgtgggt gcctcttgtc cagcgtgggc agagaggagc aggctgagct gtcccgggct 59460
gagcggggag cggcggctgc ccatgttgct ggggtcgagt gcctggtgct cacaccccat 59520
ccccgcctcc ctacaggggc ttcgccctct acaacgctgc caacctcaag agcattgact 59580
ttcaccgcag gatagaggag aagtccctgg cccagctgaa aagacagtag gtgcctctgg 59640
ggcggggact ccccggctcc tccccccaat gctcagcata ccccaccttt ccccaccaca 59700
ggatggagcg tatccgtgcc aagcaggaga agcacaggca gggccgggtg gaccgcagtc 59760
gcccccagga caccctgggc cccaaggacc ccggcctgga gccaggtgag tgcagctgga 59820
gtcgggcacc cagggccccg tgtccagcat gtctgtgcct gctggcgtgt gctgcgtctg 59880
tgcccatgtg acgtcccaca gggctcccag cccgcctgtc ctgtccgcat gatcaccctc 59940
tgtctggcag gccccatggc cgccctgtga ctgtccgtcc acgcacatgg gctctgagcc 60000
ccatggcccc acacggcccc cgtcactgtg ggtgtccgtg tctgtctcca cctatcctgt 60060
ctccaagacg ggagcactca cagccccgac ccctcctggt ggcttgactg ctgcctcatg 60120
ctcaccctgc ccctccacag ggcccgacag tccagggggc tcctccccgc cacggaggca 60180
gtggtggcgg ccctggctgg accacgccac aggtaccccc aattaggccg cctgtggcca 60240
ccctctcagg ccctctgtgc ccccatctgt cctctgcctg gcctgctatc ttcccctccc 60300
ttcccccgac tcccaggccc tgagcgtcag gacgtgctca ggcctcctgg gtcggggggt 60360
gcctcactgg ctgcagaccc ctgggctgac tatgtcctct cctggctatg ccccagccct 60420
tccaacagtg ggagtctcgg agcttgcccc gatgacacat ggtggtcgag cagcgatctc 60480
acctgggacc cagcagcact gcgttattct gtttttgttt ctttttgaga tggagtctcg 60540
ctctgtcact gcaggctgga gtgcagtggc atgatctcag ctcactgcaa tctctacctc 60600
ccgggttcaa gtgatcctcc tgcctcagcc tcccaagtaa ctgagactac aagcatgtgc 60660
cccactccag gccttttttt tttttttttg gagacggtgt cttgccctgt cgcccaggct 60720
acagtgcaat ggcgtgattg cggctcacta caacccccac ctcccaggtt caaaggattc 60780
tcctgcctca gcctcccaag tagctgggat tacaggtgcc cgccaccacg cccagctaat 60840
tttcgtattt ttagtagaga tggggtttca ccatattggc caggctggtc tcgaacctct 60900
gacttcaggt gatccgcccg cctcagcctc ccacagtgct gggattacag gcgtcagcca 60960
ccgtgcccgg cctgttctgt ttttctaact ctcacacagc ctcctgggtt ttccccggtc 61020
ctctgcagtc ggcccactct gcaccccagc ccgcgctggc tctgctcctc agctgccctg 61080
cccacctctg tcttgtccca ccgcgctggc ctgtgtcttg tgcctgcact gctcccggct 61140
actccgcatg ggaagggtgg ctctcgggcc ttggcccatg caggcggagg gggtctggct 61200
gggagtctcc ctgcatggaa ggctggctct cagtgctgcc tgcccacagt catccactcc 61260
ggggactact tcctgtttga gtccgacagt gaggaagagg aggaggctgt tcctgaagac 61320
ccgaggccgt cggcacagag tgccttccag gtgaggtggg agagccccgt cggccccact 61380
ccaaccacag agcttgtggt cctggaccag ggcagcatag agggtgtcag atgcccccag 61440
ggcctgggag ccgagctcct ccacctccag ttagcccacc ccgccccatc caggcctccc 61500
aagtcccatg ggaaaccagg ctacagggac atgggtcatg tgtagcctgc tgccccacgg 61560
tcttggctct gaccacccag gttctggtgg ctgcccgtgg cctgacctgt gagaccggcc 61620
caacaccttt gtgctggccg cctggctgtc ctgggtccat ctttgggccc ctggctcttg 61680
gtgttagacc agcccaccca actcctgaat gggtgggagt cttcccccac agcccctcag 61740
ggtccccatc cgggaggggc tcagggacac ggaggtccct gggagacaca gagcagggat 61800
ctggatctgg cgcccggctt gcccaacccc agcttcccgc ctgggtctga tggctcggga 61860
ggccgggtcc taacccgggg gctggccgac agctggcgta ccaggcatgg gtgaccaacg 61920
cccaggcggt gctgaggcgg cggcagcagg agcaggagca ggcaaggcag gaacaggcag 61980
gacagctacc cacaggtgag ctggggggcg tggggactct gaggggaagc cgcgggactg 62040
ccagtcactc accagcatcc tgtgcccagg aggtggtccc agccaggagg tggagccagc 62100
agagggcccc gaggaggcag cggcaggtac gtgggcccgg ggctggggag tgggaggtct 62160
ctcttggccc cacaggctgc ccctccagcg ccccctcccg ccctcccgca ggccggagcc 62220
atgtggtgca gagggtgctg agcacggcgc agttcctgtg gatgctgggg caggcgctag 62280
tggatgagct gacacgctgg ctgcaggagt tcacccggca ccacggcacc atgagcgacg 62340
tgctgcgggc agagcgctac ctcctcacac aggagctcct gcaggtgagc ctgcccgtgc 62400
accacgctcg tccctgctct gcctgactac gcccctgcct gcttaacagc ctagtcccgc 62460
gcccactgca cgaaaccccg tgtggggaca agagctggac gcagccctga gccccctgct 62520
gtgccctgca gggcggcgaa gtgcacaggg gcgtgctgga tcagctgtac acaagccagg 62580
ccgaggccac gctgccaggc cccaccgagg cccccaatgc cccaagcacc gtgtccaggt 62640
aggtgcgggg gtgacccgag ccccagctgc tgcccctggt gtgtgggcat cgcctagcca 62700
tccccgaccc tcgccattcc cttgtacccc aaaggaccgt gggcactttc caccctgacc 62760
ctccctgtag cctggggtca ggccatagag caggattctc tgtgactcgg cttccctccc 62820
cagtgggctg ggcgcggagg agccactcag cagcatgaca gacgacatgg gcagccccct 62880
gagcaccggc taccacacgc gcagtggcag tgaggaggca gtcaccgacc ccggggagcg 62940
tgaggctggt gcctctctgt accagggact gatgcggacg gccagcgagc tgctcctgga 63000
caggtggggg cgggacgcgc acaacaccag cctcaccatg gccctcgggg agcagccgaa 63060
caggggcagg agactgactg tgaccggcaa cagatcgggc cgtcatgcct tcgggcagtc 63120
ccagactccc ccaaacacgc gggtctccct gtaggcgcct gcgcatccca gagctggagg 63180
aggcagagct gtttgcggag gggcagggcc gggcgctgcg gctgctgcgg gccgtgtacc 63240
agtgtgtggc cgcccactcg gagctgctct gctacttcat catcatcctc aaccacatgg 63300
tcacggcctc cgccggctcg ctggtgctgc ccgtgctcgt cttcctgtgg gccatgctgt 63360
cgatcccgag gcccagcaag cgcttctgga tgacggccat cgtcttcacc gaggtgggcc 63420
gaggccgcgg gggagggggc gcccggccca ccgcgccgtg accctccccg cgtgctgagc 63480
cccctccccc acagatcgcg gtggtcgtca agtacctgtt ccagtttggg ttcttcccct 63540
ggaacagcca cgtggtgctg cggcgctacg agaacaagcc ctacttcccg ccccgcatcc 63600
tgggcctgga gaagactgac ggctacatca agtacgacct ggtgcagctc atggcccttt 63660
tcttccaccg ctcccagctg ctggtgagtg tgagccttgg ctggcaatgc ggggctgggc 63720
aggccctctg ggcacctgtg ctctccacca gggaggcaag gccccctcac cacaccctcc 63780
cgcccctcag tgctatggcc tctgggacca tgaggaggac tcaccatcca aggagcatga 63840
caagagcggc gaggaggagc agggagccga ggaggggcca ggggtgcctg cggccaccac 63900
cgaagaccac attcaggtgg aagccagggt cggacccacg gacgggaccc cagaacccca 63960
agtggagctc aggccccgtg atacgaggcg catcagtcta cgttttagaa gaaggaagaa 64020
ggagggccca gcacggaaag gagcggcagc catcggtata agcgccctgc ctcacaacct 64080
cctgcctacc cagttttctg agtggggcta ctgcagggag ggtctttctc agatgagacg 64140
gccaagccca gtgcgaggcc cacctggatc ccaggaaggt gccacttctg agccacagct 64200
cccggctctg cctacagagc cgtccctgac tgctgccccc ggggatgctc cccacgtgta 64260
gggtgactgt tggcctgggc tggcccctca cagttgcccc agacagagga cacagcccca 64320
gctgtctcct tgccagtgac actgggagct ttcctgtgct ccgtctgctt gtctgtcaaa 64380
cagggagaat gccagcctct tagggtggtc aggagccatg agccaggccc agtccccagg 64440
gggcccaggc agaagtcagc ttttccctac agaagctgag gacagggagg aagaagaggg 64500
ggaggaagag aaagaggccc ccacggggag agagaagagg ccaagccgct ctggaggaag 64560
agtaagggcg gccgggcggc ggctgcaggg cttctgcctg tccctgtgag tgatggcggc 64620
cgggggcagc tggggagtgg gggtggggag gcgggtactg ggcccaggct gagcgccccc 64680
ttccgcaggg cccagggcac atatcggccg ctacggcgct tcttccacga catcctgcac 64740
accaagtacc gcgcagccac cgacgtctat gccctcatgt tcctggctga tgttgtcgac 64800
ttcatcatca tcatttttgg cttctgggcc tttggggtga gccaggcccg ggacccaaac 64860
ccagtgtacg cagagctcag cagccaccca catcccctgg gcttggctcc ccctgacctg 64920
tgctctcctg gccacagaag cactcggcgg ccacagacat cacgtcctcc ctatcagacg 64980
accaggtacc cgaggctttc ctggtcatgc tgctgatcca gttcagtacc atggtggttg 65040
accgcgccct ctacctgcgc aagaccgtgc tgggcaagct ggccttccag gtggcgctgg 65100
tgctggccat ccacctatgg atgttcttca tcctgcccgc cgtcactgag aggtgggccc 65160
acgcgtgggg gcgctcggtc tccaggggcg gggcagtgca ggctgggggc cctgcggggc 65220
tgtttctgat ggggtccttg acctggccat cccgccccag gatgttcaac cagaatgtgg 65280
tggcccagct ctggtacttc gtgaagtgca tctacttcgc cctgtccgcc taccagatcc 65340
gctgcggcta ccccacccgc atcctcggca acttcctcac caagaagtac aatcatctca 65400
acctcttcct cttccagggg tgagtgcagg tccgccgggg tgggggtcac ggcccgggca 65460
tgagggagcc cacctgacgg gaaccctggc tgtgggcagg ttccggctgg tgccgttcct 65520
ggtggagctg cgggcagtga tggactgggt gtggacggac accacgctgt ccctgtccag 65580
ctggatgtgt gtggaggaca tctatgccaa catcttcatc atcaaatgca gccgagagac 65640
agagaaggtg cctgggccca gggcgggggc cgggacaagg gccagggata tgccctctcc 65700
ctaagacaga ggcactgctg ccacgagaac ccgtggtgct ggaggccctc ccagggctcg 65760
gagcccatgg ggacatgagg cgagcccacc cactagctga tcacgaggcc agtgatcttg 65820
gcagctgcga gtgagtgctg ggcgcagaag tgggcagcgg agttggtcct gttccaggca 65880
ggctggcagc agagcagggc ctggtgcagg gaggaccgga cagccactgt ttgctgcatt 65940
cttgtttaat ggcctttctc agagagaatt cgtgcgtcag accactcccc cacgtaaaaa 66000
gtacaactca ggggtttcta gtggattcac agttgagcat ctgccttctc accacttcaa 66060
aaagaaaccc cgggccgggc acagcggctc acccctatca tcccagcact gtaagagacc 66120
caggagggag gtactgctca aggccaggag ttcaagatct gcacggccac aagcgagacc 66180
ctgcctcagc aaatgtaaaa ataaaacaat tagctggcaa tggcagctca tgcctatggt 66240
cccagcactt tgggaggcca aaggaggagg atcagttgag gccaggagtt ttaagaccag 66300
cctgggcaac atagtgagtg agactctctc tacaaaaaaa taaacgttag ctgggtgtga 66360
tggtgcacac ttgtgctccc agctactctg gaggctgagg tgggaggatg gcttgaggcc 66420
aggagtacag ggctgcatta agcctgatca caccactgca ctccagcttg ggcaacagag 66480
tgagaccctg tctctaaaaa agtaaaaaga agaaacccag tgcccattgg ctgtcactcg 66540
gtttcccctc ccctggcccc tagtaacccc ttgtctaggt cctggttcta tgagatttgc 66600
ctacagtgga tatttcatga aaacaggctc agacagcgtt tgtccttttg taatcagctt 66660
tccttgctca gcatggtgtc tctgaggtcc acccacgtgg cagtatggcc ttcctgttta 66720
tgggcaaatg atattctgtg gcatggatgg accacaacat gctcatctgt tgatgggctg 66780
ttgcccgtga tgctgccagg cacgccggtg tacacgtctg tgtgcccgtg cccctggtcc 66840
tgtggctgca cgccagggcc ggaagtgctg gtggtggttt ccatcatgag gagctgctgg 66900
ttttccatag cagctccacc atctaaggtt cccaccacca acacgaggtt gcggtttctc 66960
cacatcctca acaacctgtt actatgtctt ttttgttctg gccatgctgc tgaacgggtg 67020
gcttgctgtg ggctcttctc agttccctgt tgaccgacgc tgagcgtctt ttcatgtgct 67080
tggccatttg tgtatcttct ctggggaaat gtctattcaa atcctttctc catagtttag 67140
ttgggctttt gagataggat ctcaggctga agtgcagtgg catgaccttc actcactgta 67200
gcctctgcct cccaggttca agcgattctc ccacctcagc ctcccgagta gctgggacta 67260
caggtgtgca ccaccaggcc tggctagtct tttgtatttt tggccaggtt cgtctcaaac 67320
tcctgacctc aaagtgctgg gatgacaagt gtgagccgcc acacccagca gttgggttgt 67380
tttttattag agttttttct gtttttctgc agatacattg gctagaaatg actgaattgg 67440
aagaattctc tgtattctct ggttgctaga accttatcaa ttaaaatttg cagaaaattt 67500
ctccaattct atggactgtc tcttaaattt tcttggtgtc tttggaagca caaagtattt 67560
attttggtaa tatctggttt actttgtttc cttcgccaaa tccaggttca tgaagatttg 67620
cccgttttct tctaaaagtt ctatagtttt agctctgaag tttcgctctt tgatccactt 67680
tgaggtaaat tttggcacat ggtatgaggc aggagttgcg tttcattctc ctgcctgggg 67740
cggtgcctgc accgtgttga aaaaggttgt ccgttcccac tgaacggtca cagctccctt 67800
gtctaagatc aacgacccct gaacatgagg gttccaactg gactcttagt tctactccac 67860
tggcctgtgt ctgcccacca ttactaccgc tgtgccatac tgaggtcagg ctggggcttt 67920
tctgggctgc tgggtgagct ggagaatgcg gttgtgtgac ccgcaggaag ggcagagctg 67980
agcgtatgac ctgtgtcgtt cccctccaga aatacccgca gcccaaaggg cagaagaaga 68040
agaagatcgt caagtacggc atgggtggcc tcatcatcct cttcctcatc gccatcatct 68100
ggttcccact gctcttcatg tcgctggtgc gctccgtggt tggggttgtc aaccagccca 68160
tcgatgtcac cgtcaccctg aagctgggcg gctatgaggt gagcatgtgt gggtccgcct 68220
gtccattccc atcccctggg ggttctggcc aaggtggtgc accaccccca gccgctcctc 68280
cacgctcatc ttcgtggccc cgtgtccccg tgcctgcccc agccgctgtt caccatgagc 68340
gcccagcagc cgtccatcat ccccttcacg gcccaggcct atgaggagct gtcccggcag 68400
tttgaccccc agccggtaag tggcctctgc cctgtgaaag ctggtgtggg gaggcggctg 68460
cagtcactga gggtgtcact tgtacccagc tggccatgca gttcatcagc cagtacagcc 68520
ctgaggacat cgtcacggcg cagattgagg gcagctccgg ggcgctgtgg cgcatcagtc 68580
cccccagccg tgcccagatg aagcgggagc tctacaacgg cacggccgac atcaccctgc 68640
gcttcacctg gaacttccag aggttcgtcc tggacttggg gcagtgcctg ggtgggtgga 68700
cccactacag tgggtcacgc tgtgttccca cccccaggga cctggcgaag ggaggcactg 68760
tggagtatgc caacgagaag cacatgctgg ccctggcccc caacagcact gcacggcggc 68820
agctggccag cctgctcgag ggcacctcgg accagtctgt gtgagtgaag ggcccgggtg 68880
gtgggcagga gggctgtgcc aggttggctg ggccaggcct gacctgccag cacctccctg 68940
cagggtcatc cctaatctct tccccaagta catccgtgcc cccaacgggc ccgaagccaa 69000
ccctgtgaag cagctgcagc ccagtgagta tgggcgtggg ggttggggga ggctagagag 69060
gggtgacctg cggcctcaac gatcttctcc ctccatccca gatgaggagg ccgactacct 69120
cggcgtgcgt atccagctgc ggagggagca gggtgcgggg gccaccggct tcctcgaatg 69180
gtgggtcatc gagctgcagg agtgccggac cgactgcaac ctgctgccca tggtcatttt 69240
cagtgacaag gtcagcccac cgagcctcgg cttcctggct ggctacgggt gagtgagtgg 69300
ctgggggggc accccgcagc tcggggggct ccgggcggcc ccaggactca ccagcttccc 69360
ccgcagcatc atggggctgt acgtgtccat cgtgctggtc atcggcaagt tcgtgcgcgg 69420
attcttcagc gagatctcgc actccattat gttcgaggag ctgccgtgcg tggaccgcat 69480
cctcaagctc tgccaggaca tcttcctggt gcgggagact cgggagctgg agctggagga 69540
ggagttgtac gccaagctca tcttcctcta ccgctcaccg gagaccatga tcaagtggac 69600
tcgtgagaag gagtaggagc tgctgctggc gcccgagagg gaaggagccg gcctgctggg 69660
cagcgtggcc acaaggggcg gcactcctca ggccggggga gccactgccc cgtccaaggc 69720
cgccagctgt gatgcatcct cccggcctgc ctgagccctg atgctgctgt cagagaagga 69780
cactgcgtcc ccacggcctg cgtggcgctg ccgtccccca cgtgtactgt agagtttttt 69840
ttttaattaa aaaatgtttt atttatacaa atggacaatc aga 69883
<210> 2
<211> 8089
<212> ДНК
<213> homo sapien
<400> 2
gggagccgcc guccggccca gcucggcccc agugagccga gcgcugcgcu ccgccgaggg 60
gcagggcggu cgccugagcg agcgcgggcc cgggacgucg gcaccggcgg ggcggccgaa 120
ggagaaggag gaagaggaga aggcggcgcg cggguccccg cgggucagcc auggcgcgcc 180
ggccccgggg cccccgcacc gccccauagc gccgcggcgu ccgcucgguc ugggccgggc 240
ccugggcccu ccagccaugg agccgcacgu gcucggcgcg guccuguacu ggcugcugcu 300
gcccugcgcg cugcuggcug ccugccugcu ccgcuucagc ggacucucgc uggucuaccu 360
gcucuuccug cugcugcugc ccugguuccc cggccccacc cgaugcggcc uccaagguca 420
cacaggccgc cuccugcggg cauugcuggg ccucagccug cucuuccugg uggcccaucu 480
cgcccuccag aucugccugc auauugugcc ccgccuggac cagcuccugg gacccagcug 540
cagccgcugg gagacccucu cgcgacacau aggggucaca aggcuggacc ugaaggacau 600
ccccaacgcc auccggcugg uggccccuga ccugggcauc uugguggucu ccucugucug 660
ccucggcauc ugcgggcgcc uugcaaggaa cacccggcag agcccacauc cacgggagcu 720
ggaugaugau gagagggaug uggaugccag cccgacggca gggcugcagg aagcagcaac 780
gcuggccccu acacggaggu cacggcuggc cgcucguuuc cgagucacgg cccacuggcu 840
gcugguggcg gcugggcggg uccuggccgu aacacugcuu gcacuggcag gcaucgccca 900
ccccucggcc cucuccagug ucuaccugcu gcucuuccug gcccucugca ccuggugggc 960
cugccacuuu cccaucagca cucggggcuu cagcagacuc ugcgucgcgg uggggugcuu 1020
cggcgccggc caucucaucu gccucuacug cuaccagaug cccuuggcac aggcucugcu 1080
cccgccugcc ggcaucuggg cuagggugcu gggucucaag gacuucgugg gucccaccaa 1140
cugcuccagc ccccacgcgc ugguccucaa caccggccug gacuggccug uguaugccag 1200
ccccggcguc cuccugcugc ugugcuacgc cacggccucu cugcgcaagc uccgcgcgua 1260
ccgccccucc ggccagagga aggaggcggc aaagggguau gaggcucggg agcuggagcu 1320
agcagagcug gaccaguggc cccaggaacg ggagucugac cagcacgugg ugcccacagc 1380
acccgacacc gaggcugaua acugcaucgu gcacgagcug accggccaga gcuccguccu 1440
gcggcggccu gugcggccca agcgggcuga gcccagggag gcgucuccgc uccacagccu 1500
gggccaccuc aucauggacc agagcuaugu gugcgcgcuc auugccauga ugguauggag 1560
caucaccuac cacagcuggc ugaccuucgu acugcugcuc ugggccugcc ucaucuggac 1620
ggugcgcagc cgccaccaac uggccaugcu gugcucgccc ugcauccugc uguaugggau 1680
gacgcugugc ugccuacgcu acgugugggc cauggaccug cgcccugagc ugcccaccac 1740
ccugggcccc gucagccugc gccagcuggg gcuggagcac acccgcuacc ccugucugga 1800
ccuuggugcc auguugcucu acacccugac cuucuggcuc cugcugcgcc aguuugugaa 1860
agagaagcug cugaaguggg cagagucucc agcugcgcug acggagguca ccguggcaga 1920
cacagagccc acgcggacgc agacgcuguu gcagagccug ggggagcugg ugaagggcgu 1980
guacgccaag uacuggaucu augugugugc uggcauguuc aucgugguca gcuucgccgg 2040
ccgccucgug gucuacaaga uugucuacau guuccucuuc cugcucugcc ucacccucuu 2100
ccaggucuac uacagccugu ggcggaagcu gcucaaggcc uucugguggc ucgugguggc 2160
cuacaccaug cugguccuca ucgccgucua caccuuccag uuccaggacu ucccugccua 2220
cuggcgcaac cucacuggcu ucaccgacga gcagcugggg gaccugggcc uggagcaguu 2280
cagcgugucc gagcucuucu ccagcauccu ggugcccggc uucuuccucc uggccugcau 2340
ccugcagcug cacuacuucc acaggcccuu caugcagcuc accgacaugg agcacguguc 2400
ccugccuggc acgcgccucc cgcgcugggc ucacaggcag gaugcaguga gugggacccc 2460
acugcugcgg gaggagcagc aggagcauca gcagcagcag caggaggagg aggaggagga 2520
ggaggacucc agggacgagg ggcugggcgu ggccacuccc caccaggcca cgcaggugcc 2580
ugaaggggca gccaaguggg gccugguggc ugagcggcug cuggagcugg cagccggcuu 2640
cucggacguc cucucacgcg ugcagguguu ccugcggcgg cugcuggagc uucacguuuu 2700
caagcuggug gcccuguaca ccgucugggu ggcccugaag gaggugucgg ugaugaaccu 2760
gcugcuggug gugcuguggg ccuucgcccu gcccuaccca cgcuuccggc ccauggccuc 2820
cugccugucc accgugugga ccugcgucau caucgugugu aagaugcugu accagcucaa 2880
gguugucaac ccccaggagu auuccagcaa cugcaccgag cccuucccca acagcaccaa 2940
cuugcugccc acggagauca gccagucccu gcuguaccgg gggcccgugg acccugccaa 3000
cugguuuggg gugcggaaag gguuccccaa ccugggcuac auccagaacc accugcaagu 3060
gcugcugcug cugguauucg aggccaucgu guaccggcgc caggagcacu accgccggca 3120
gcaccagcug gccccgcugc cugcccaggc cguguuugcc agcggcaccc gccagcagcu 3180
ggaccaggau cugcucggcu gccucaagua cuucaucaac uucuucuucu acaaauucgg 3240
gcuggagauc ugcuuccuga uggccgugaa cgugaucggg cagcgcauga acuuucuggu 3300
gacccugcac gguugcuggc ugguggccau ccucacccgc aggcaccgcc aggccauugc 3360
ccgccucugg cccaacuacu gccucuuccu ggcgcuguuc cugcuguacc aguaccugcu 3420
gugccugggg augcccccgg cccugugcau ugauuauccc uggcgcugga gccgggccgu 3480
ccccaugaac uccgcacuca ucaaguggcu guaccugccu gauuucuucc gggcccccaa 3540
cuccaccaac cucaucagcg acuuucuccu gcugcugugc gccucccagc aguggcaggu 3600
guucucagcu gagcgcacag aggaguggca gcgcauggcu ggcgucaaca ccgaccgccu 3660
ggagccgcug cggggggagc ccaaccccgu gcccaacuuu auccacugca gguccuaccu 3720
ugacaugcug aagguggccg ucuuccgaua ccuguucugg cuggugcugg uggugguguu 3780
ugucacgggg gccacccgca ucagcaucuu cgggcugggc uaccugcugg ccugcuucua 3840
ccugcugcuc uucggcacgg cccugcugca gagggacaca cgggcccgcc ucgugcugug 3900
ggacugccuc auucuguaca acgucaccgu caucaucucc aagaacaugc ugucgcuccu 3960
ggccugcguc uucguggagc agaugcagac cggcuucugc ugggucaucc agcucuucag 4020
ccuuguaugc accgucaagg gcuacuauga ccccaaggag augauggaca gagaccagga 4080
cugccugcug ccuguggagg aggcuggcau caucugggac agcgucugcu ucuucuuccu 4140
gcugcugcag cgccgcgucu uccuuagcca uuacuaccug cacgucaggg ccgaccucca 4200
ggccaccgcc cugcuagccu ccaggggcuu cgcccucuac aacgcugcca accucaagag 4260
cauugacuuu caccgcagga uagaggagaa gucccuggcc cagcugaaaa gacagaugga 4320
gcguauccgu gccaagcagg agaagcacag gcagggccgg guggaccgca gucgccccca 4380
ggacacccug ggccccaagg accccggccu ggagccaggg cccgacaguc cagggggcuc 4440
cuccccgcca cggaggcagu gguggcggcc cuggcuggac cacgccacag ucauccacuc 4500
cggggacuac uuccuguuug aguccgacag ugaggaagag gaggaggcug uuccugaaga 4560
cccgaggccg ucggcacaga gugccuucca gcuggcguac caggcauggg ugaccaacgc 4620
ccaggcggug cugaggcggc ggcagcagga gcaggagcag gcaaggcagg aacaggcagg 4680
acagcuaccc acaggaggug gucccagcca ggagguggag ccagcagagg gccccgagga 4740
ggcagcggca ggccggagcc auguggugca gagggugcug agcacggcgc aguuccugug 4800
gaugcugggg caggcgcuag uggaugagcu gacacgcugg cugcaggagu ucacccggca 4860
ccacggcacc augagcgacg ugcugcgggc agagcgcuac cuccucacac aggagcuccu 4920
gcagggcggc gaagugcaca ggggcgugcu ggaucagcug uacacaagcc aggccgaggc 4980
cacgcugcca ggccccaccg aggcccccaa ugccccaagc accgugucca gugggcuggg 5040
cgcggaggag ccacucagca gcaugacaga cgacaugggc agcccccuga gcaccggcua 5100
ccacacgcgc aguggcagug aggaggcagu caccgacccc ggggagcgug aggcuggugc 5160
cucucuguac cagggacuga ugcggacggc cagcgagcug cuccuggaca ggcgccugcg 5220
caucccagag cuggaggagg cagagcuguu ugcggagggg cagggccggg cgcugcggcu 5280
gcugcgggcc guguaccagu guguggccgc ccacucggag cugcucugcu acuucaucau 5340
cauccucaac cacaugguca cggccuccgc cggcucgcug gugcugcccg ugcucgucuu 5400
ccugugggcc augcugucga ucccgaggcc cagcaagcgc uucuggauga cggccaucgu 5460
cuucaccgag aucgcggugg ucgucaagua ccuguuccag uuuggguucu uccccuggaa 5520
cagccacgug gugcugcggc gcuacgagaa caagcccuac uucccgcccc gcauccuggg 5580
ccuggagaag acugacggcu acaucaagua cgaccuggug cagcucaugg cccuuuucuu 5640
ccaccgcucc cagcugcugu gcuauggccu cugggaccau gaggaggacu caccauccaa 5700
ggagcaugac aagagcggcg aggaggagca gggagccgag gaggggccag gggugccugc 5760
ggccaccacc gaagaccaca uucaggugga agccaggguc ggacccacgg acgggacccc 5820
agaaccccaa guggagcuca ggccccguga uacgaggcgc aucagucuac guuuuagaag 5880
aaggaagaag gagggcccag cacggaaagg agcggcagcc aucgaagcug aggacaggga 5940
ggaagaagag ggggaggaag agaaagaggc ccccacgggg agagagaaga ggccaagccg 6000
cucuggagga agaguaaggg cggccgggcg gcggcugcag ggcuucugcc ugucccuggc 6060
ccagggcaca uaucggccgc uacggcgcuu cuuccacgac auccugcaca ccaaguaccg 6120
cgcagccacc gacgucuaug cccucauguu ccuggcugau guugucgacu ucaucaucau 6180
cauuuuuggc uucugggccu uugggaagca cucggcggcc acagacauca cguccucccu 6240
aucagacgac cagguacccg aggcuuuccu ggucaugcug cugauccagu ucaguaccau 6300
ggugguugac cgcgcccucu accugcgcaa gaccgugcug ggcaagcugg ccuuccaggu 6360
ggcgcuggug cuggccaucc accuauggau guucuucauc cugcccgccg ucacugagag 6420
gauguucaac cagaaugugg uggcccagcu cugguacuuc gugaagugca ucuacuucgc 6480
ccuguccgcc uaccagaucc gcugcggcua ccccacccgc auccucggca acuuccucac 6540
caagaaguac aaucaucuca accucuuccu cuuccagggg uuccggcugg ugccguuccu 6600
gguggagcug cgggcaguga uggacugggu guggacggac accacgcugu cccuguccag 6660
cuggaugugu guggaggaca ucuaugccaa caucuucauc aucaaaugca gccgagagac 6720
agagaagaaa uacccgcagc ccaaagggca gaagaagaag aagaucguca aguacggcau 6780
ggguggccuc aucauccucu uccucaucgc caucaucugg uucccacugc ucuucauguc 6840
gcuggugcgc uccgugguug ggguugucaa ccagcccauc gaugucaccg ucacccugaa 6900
gcugggcggc uaugagccgc uguucaccau gagcgcccag cagccgucca ucauccccuu 6960
cacggcccag gccuaugagg agcugucccg gcaguuugac ccccagccgc uggccaugca 7020
guucaucagc caguacagcc cugaggacau cgucacggcg cagauugagg gcagcuccgg 7080
ggcgcugugg cgcaucaguc cccccagccg ugcccagaug aagcgggagc ucuacaacgg 7140
cacggccgac aucacccugc gcuucaccug gaacuuccag agggaccugg cgaagggagg 7200
cacuguggag uaugccaacg agaagcacau gcuggcccug gcccccaaca gcacugcacg 7260
gcggcagcug gccagccugc ucgagggcac cucggaccag ucugugguca ucccuaaucu 7320
cuuccccaag uacauccgug cccccaacgg gcccgaagcc aacccuguga agcagcugca 7380
gcccaaugag gaggccgacu accucggcgu gcguauccag cugcggaggg agcagggugc 7440
gggggccacc ggcuuccucg aauggugggu caucgagcug caggagugcc ggaccgacug 7500
caaccugcug cccaugguca uuuucaguga caaggucagc ccaccgagcc ucggcuuccu 7560
ggcuggcuac ggcaucaugg ggcuguacgu guccaucgug cuggucaucg gcaaguucgu 7620
gcgcggauuc uucagcgaga ucucgcacuc cauuauguuc gaggagcugc cgugcgugga 7680
ccgcauccuc aagcucugcc aggacaucuu ccuggugcgg gagacucggg agcuggagcu 7740
ggaggaggag uuguacgcca agcucaucuu ccucuaccgc ucaccggaga ccaugaucaa 7800
guggacucgu gagaaggagu aggagcugcu gcuggcgccc gagagggaag gagccggccu 7860
gcugggcagc guggccacaa ggggcggcac uccucaggcc gggggagcca cugccccguc 7920
caaggccgcc agcugugaug cauccucccg gccugccuga gcccugaugc ugcugucaga 7980
gaaggacacu gcguccccac ggccugcgug gcgcugccgu cccccacgug uacuguagag 8040
uuuuuuuuuu aauuaaaaaa uguuuuauuu auacaaaugg acaaucaga 8089
<210> 3
<211> 8089
<212> ДНК
<213> homo sapien
<400> 3
gggagccgcc gtccggccca gctcggcccc agtgagccga gcgctgcgct ccgccgaggg 60
gcagggcggt cgcctgagcg agcgcgggcc cgggacgtcg gcaccggcgg ggcggccgaa 120
ggagaaggag gaagaggaga aggcggcgcg cgggtccccg cgggtcagcc atggcgcgcc 180
ggccccgggg cccccgcacc gccccatagc gccgcggcgt ccgctcggtc tgggccgggc 240
cctgggccct ccagccatgg agccgcacgt gctcggcgcg gtcctgtact ggctgctgct 300
gccctgcgcg ctgctggctg cctgcctgct ccgcttcagc ggactctcgc tggtctacct 360
gctcttcctg ctgctgctgc cctggttccc cggccccacc cgatgcggcc tccaaggtca 420
cacaggccgc ctcctgcggg cattgctggg cctcagcctg ctcttcctgg tggcccatct 480
cgccctccag atctgcctgc atattgtgcc ccgcctggac cagctcctgg gacccagctg 540
cagccgctgg gagaccctct cgcgacacat aggggtcaca aggctggacc tgaaggacat 600
ccccaacgcc atccggctgg tggcccctga cctgggcatc ttggtggtct cctctgtctg 660
cctcggcatc tgcgggcgcc ttgcaaggaa cacccggcag agcccacatc cacgggagct 720
ggatgatgat gagagggatg tggatgccag cccgacggca gggctgcagg aagcagcaac 780
gctggcccct acacggaggt cacggctggc cgctcgtttc cgagtcacgg cccactggct 840
gctggtggcg gctgggcggg tcctggccgt aacactgctt gcactggcag gcatcgccca 900
cccctcggcc ctctccagtg tctacctgct gctcttcctg gccctctgca cctggtgggc 960
ctgccacttt cccatcagca ctcggggctt cagcagactc tgcgtcgcgg tggggtgctt 1020
cggcgccggc catctcatct gcctctactg ctaccagatg cccttggcac aggctctgct 1080
cccgcctgcc ggcatctggg ctagggtgct gggtctcaag gacttcgtgg gtcccaccaa 1140
ctgctccagc ccccacgcgc tggtcctcaa caccggcctg gactggcctg tgtatgccag 1200
ccccggcgtc ctcctgctgc tgtgctacgc cacggcctct ctgcgcaagc tccgcgcgta 1260
ccgcccctcc ggccagagga aggaggcggc aaaggggtat gaggctcggg agctggagct 1320
agcagagctg gaccagtggc cccaggaacg ggagtctgac cagcacgtgg tgcccacagc 1380
acccgacacc gaggctgata actgcatcgt gcacgagctg accggccaga gctccgtcct 1440
gcggcggcct gtgcggccca agcgggctga gcccagggag gcgtctccgc tccacagcct 1500
gggccacctc atcatggacc agagctatgt gtgcgcgctc attgccatga tggtatggag 1560
catcacctac cacagctggc tgaccttcgt actgctgctc tgggcctgcc tcatctggac 1620
ggtgcgcagc cgccaccaac tggccatgct gtgctcgccc tgcatcctgc tgtatgggat 1680
gacgctgtgc tgcctacgct acgtgtgggc catggacctg cgccctgagc tgcccaccac 1740
cctgggcccc gtcagcctgc gccagctggg gctggagcac acccgctacc cctgtctgga 1800
ccttggtgcc atgttgctct acaccctgac cttctggctc ctgctgcgcc agtttgtgaa 1860
agagaagctg ctgaagtggg cagagtctcc agctgcgctg acggaggtca ccgtggcaga 1920
cacagagccc acgcggacgc agacgctgtt gcagagcctg ggggagctgg tgaagggcgt 1980
gtacgccaag tactggatct atgtgtgtgc tggcatgttc atcgtggtca gcttcgccgg 2040
ccgcctcgtg gtctacaaga ttgtctacat gttcctcttc ctgctctgcc tcaccctctt 2100
ccaggtctac tacagcctgt ggcggaagct gctcaaggcc ttctggtggc tcgtggtggc 2160
ctacaccatg ctggtcctca tcgccgtcta caccttccag ttccaggact tccctgccta 2220
ctggcgcaac ctcactggct tcaccgacga gcagctgggg gacctgggcc tggagcagtt 2280
cagcgtgtcc gagctcttct ccagcatcct ggtgcccggc ttcttcctcc tggcctgcat 2340
cctgcagctg cactacttcc acaggccctt catgcagctc accgacatgg agcacgtgtc 2400
cctgcctggc acgcgcctcc cgcgctgggc tcacaggcag gatgcagtga gtgggacccc 2460
actgctgcgg gaggagcagc aggagcatca gcagcagcag caggaggagg aggaggagga 2520
ggaggactcc agggacgagg ggctgggcgt ggccactccc caccaggcca cgcaggtgcc 2580
tgaaggggca gccaagtggg gcctggtggc tgagcggctg ctggagctgg cagccggctt 2640
ctcggacgtc ctctcacgcg tgcaggtgtt cctgcggcgg ctgctggagc ttcacgtttt 2700
caagctggtg gccctgtaca ccgtctgggt ggccctgaag gaggtgtcgg tgatgaacct 2760
gctgctggtg gtgctgtggg ccttcgccct gccctaccca cgcttccggc ccatggcctc 2820
ctgcctgtcc accgtgtgga cctgcgtcat catcgtgtgt aagatgctgt accagctcaa 2880
ggttgtcaac ccccaggagt attccagcaa ctgcaccgag cccttcccca acagcaccaa 2940
cttgctgccc acggagatca gccagtccct gctgtaccgg gggcccgtgg accctgccaa 3000
ctggtttggg gtgcggaaag ggttccccaa cctgggctac atccagaacc acctgcaagt 3060
gctgctgctg ctggtattcg aggccatcgt gtaccggcgc caggagcact accgccggca 3120
gcaccagctg gccccgctgc ctgcccaggc cgtgtttgcc agcggcaccc gccagcagct 3180
ggaccaggat ctgctcggct gcctcaagta cttcatcaac ttcttcttct acaaattcgg 3240
gctggagatc tgcttcctga tggccgtgaa cgtgatcggg cagcgcatga actttctggt 3300
gaccctgcac ggttgctggc tggtggccat cctcacccgc aggcaccgcc aggccattgc 3360
ccgcctctgg cccaactact gcctcttcct ggcgctgttc ctgctgtacc agtacctgct 3420
gtgcctgggg atgcccccgg ccctgtgcat tgattatccc tggcgctgga gccgggccgt 3480
ccccatgaac tccgcactca tcaagtggct gtacctgcct gatttcttcc gggcccccaa 3540
ctccaccaac ctcatcagcg actttctcct gctgctgtgc gcctcccagc agtggcaggt 3600
gttctcagct gagcgcacag aggagtggca gcgcatggct ggcgtcaaca ccgaccgcct 3660
ggagccgctg cggggggagc ccaaccccgt gcccaacttt atccactgca ggtcctacct 3720
tgacatgctg aaggtggccg tcttccgata cctgttctgg ctggtgctgg tggtggtgtt 3780
tgtcacgggg gccacccgca tcagcatctt cgggctgggc tacctgctgg cctgcttcta 3840
cctgctgctc ttcggcacgg ccctgctgca gagggacaca cgggcccgcc tcgtgctgtg 3900
ggactgcctc attctgtaca acgtcaccgt catcatctcc aagaacatgc tgtcgctcct 3960
ggcctgcgtc ttcgtggagc agatgcagac cggcttctgc tgggtcatcc agctcttcag 4020
ccttgtatgc accgtcaagg gctactatga ccccaaggag atgatggaca gagaccagga 4080
ctgcctgctg cctgtggagg aggctggcat catctgggac agcgtctgct tcttcttcct 4140
gctgctgcag cgccgcgtct tccttagcca ttactacctg cacgtcaggg ccgacctcca 4200
ggccaccgcc ctgctagcct ccaggggctt cgccctctac aacgctgcca acctcaagag 4260
cattgacttt caccgcagga tagaggagaa gtccctggcc cagctgaaaa gacagatgga 4320
gcgtatccgt gccaagcagg agaagcacag gcagggccgg gtggaccgca gtcgccccca 4380
ggacaccctg ggccccaagg accccggcct ggagccaggg cccgacagtc cagggggctc 4440
ctccccgcca cggaggcagt ggtggcggcc ctggctggac cacgccacag tcatccactc 4500
cggggactac ttcctgtttg agtccgacag tgaggaagag gaggaggctg ttcctgaaga 4560
cccgaggccg tcggcacaga gtgccttcca gctggcgtac caggcatggg tgaccaacgc 4620
ccaggcggtg ctgaggcggc ggcagcagga gcaggagcag gcaaggcagg aacaggcagg 4680
acagctaccc acaggaggtg gtcccagcca ggaggtggag ccagcagagg gccccgagga 4740
ggcagcggca ggccggagcc atgtggtgca gagggtgctg agcacggcgc agttcctgtg 4800
gatgctgggg caggcgctag tggatgagct gacacgctgg ctgcaggagt tcacccggca 4860
ccacggcacc atgagcgacg tgctgcgggc agagcgctac ctcctcacac aggagctcct 4920
gcagggcggc gaagtgcaca ggggcgtgct ggatcagctg tacacaagcc aggccgaggc 4980
cacgctgcca ggccccaccg aggcccccaa tgccccaagc accgtgtcca gtgggctggg 5040
cgcggaggag ccactcagca gcatgacaga cgacatgggc agccccctga gcaccggcta 5100
ccacacgcgc agtggcagtg aggaggcagt caccgacccc ggggagcgtg aggctggtgc 5160
ctctctgtac cagggactga tgcggacggc cagcgagctg ctcctggaca ggcgcctgcg 5220
catcccagag ctggaggagg cagagctgtt tgcggagggg cagggccggg cgctgcggct 5280
gctgcgggcc gtgtaccagt gtgtggccgc ccactcggag ctgctctgct acttcatcat 5340
catcctcaac cacatggtca cggcctccgc cggctcgctg gtgctgcccg tgctcgtctt 5400
cctgtgggcc atgctgtcga tcccgaggcc cagcaagcgc ttctggatga cggccatcgt 5460
cttcaccgag atcgcggtgg tcgtcaagta cctgttccag tttgggttct tcccctggaa 5520
cagccacgtg gtgctgcggc gctacgagaa caagccctac ttcccgcccc gcatcctggg 5580
cctggagaag actgacggct acatcaagta cgacctggtg cagctcatgg cccttttctt 5640
ccaccgctcc cagctgctgt gctatggcct ctgggaccat gaggaggact caccatccaa 5700
ggagcatgac aagagcggcg aggaggagca gggagccgag gaggggccag gggtgcctgc 5760
ggccaccacc gaagaccaca ttcaggtgga agccagggtc ggacccacgg acgggacccc 5820
agaaccccaa gtggagctca ggccccgtga tacgaggcgc atcagtctac gttttagaag 5880
aaggaagaag gagggcccag cacggaaagg agcggcagcc atcgaagctg aggacaggga 5940
ggaagaagag ggggaggaag agaaagaggc ccccacgggg agagagaaga ggccaagccg 6000
ctctggagga agagtaaggg cggccgggcg gcggctgcag ggcttctgcc tgtccctggc 6060
ccagggcaca tatcggccgc tacggcgctt cttccacgac atcctgcaca ccaagtaccg 6120
cgcagccacc gacgtctatg ccctcatgtt cctggctgat gttgtcgact tcatcatcat 6180
catttttggc ttctgggcct ttgggaagca ctcggcggcc acagacatca cgtcctccct 6240
atcagacgac caggtacccg aggctttcct ggtcatgctg ctgatccagt tcagtaccat 6300
ggtggttgac cgcgccctct acctgcgcaa gaccgtgctg ggcaagctgg ccttccaggt 6360
ggcgctggtg ctggccatcc acctatggat gttcttcatc ctgcccgccg tcactgagag 6420
gatgttcaac cagaatgtgg tggcccagct ctggtacttc gtgaagtgca tctacttcgc 6480
cctgtccgcc taccagatcc gctgcggcta ccccacccgc atcctcggca acttcctcac 6540
caagaagtac aatcatctca acctcttcct cttccagggg ttccggctgg tgccgttcct 6600
ggtggagctg cgggcagtga tggactgggt gtggacggac accacgctgt ccctgtccag 6660
ctggatgtgt gtggaggaca tctatgccaa catcttcatc atcaaatgca gccgagagac 6720
agagaagaaa tacccgcagc ccaaagggca gaagaagaag aagatcgtca agtacggcat 6780
gggtggcctc atcatcctct tcctcatcgc catcatctgg ttcccactgc tcttcatgtc 6840
gctggtgcgc tccgtggttg gggttgtcaa ccagcccatc gatgtcaccg tcaccctgaa 6900
gctgggcggc tatgagccgc tgttcaccat gagcgcccag cagccgtcca tcatcccctt 6960
cacggcccag gcctatgagg agctgtcccg gcagtttgac ccccagccgc tggccatgca 7020
gttcatcagc cagtacagcc ctgaggacat cgtcacggcg cagattgagg gcagctccgg 7080
ggcgctgtgg cgcatcagtc cccccagccg tgcccagatg aagcgggagc tctacaacgg 7140
cacggccgac atcaccctgc gcttcacctg gaacttccag agggacctgg cgaagggagg 7200
cactgtggag tatgccaacg agaagcacat gctggccctg gcccccaaca gcactgcacg 7260
gcggcagctg gccagcctgc tcgagggcac ctcggaccag tctgtggtca tccctaatct 7320
cttccccaag tacatccgtg cccccaacgg gcccgaagcc aaccctgtga agcagctgca 7380
gcccaatgag gaggccgact acctcggcgt gcgtatccag ctgcggaggg agcagggtgc 7440
gggggccacc ggcttcctcg aatggtgggt catcgagctg caggagtgcc ggaccgactg 7500
caacctgctg cccatggtca ttttcagtga caaggtcagc ccaccgagcc tcggcttcct 7560
ggctggctac ggcatcatgg ggctgtacgt gtccatcgtg ctggtcatcg gcaagttcgt 7620
gcgcggattc ttcagcgaga tctcgcactc cattatgttc gaggagctgc cgtgcgtgga 7680
ccgcatcctc aagctctgcc aggacatctt cctggtgcgg gagactcggg agctggagct 7740
ggaggaggag ttgtacgcca agctcatctt cctctaccgc tcaccggaga ccatgatcaa 7800
gtggactcgt gagaaggagt aggagctgct gctggcgccc gagagggaag gagccggcct 7860
gctgggcagc gtggccacaa ggggcggcac tcctcaggcc gggggagcca ctgccccgtc 7920
caaggccgcc agctgtgatg catcctcccg gcctgcctga gccctgatgc tgctgtcaga 7980
gaaggacact gcgtccccac ggcctgcgtg gcgctgccgt cccccacgtg tactgtagag 8040
tttttttttt aattaaaaaa tgttttattt atacaaatgg acaatcaga 8089
<210> 4
<211> 2521
<212> Белок
<213> homo sapien
<400> 4
Met Glu Pro His Val Leu Gly Ala Val Leu Tyr Trp Leu Leu Leu Pro
1 5 10 15
Cys Ala Leu Leu Ala Ala Cys Leu Leu Arg Phe Ser Gly Leu Ser Leu
20 25 30
Val Tyr Leu Leu Phe Leu Leu Leu Leu Pro Trp Phe Pro Gly Pro Thr
35 40 45
Arg Cys Gly Leu Gln Gly His Thr Gly Arg Leu Leu Arg Ala Leu Leu
50 55 60
Gly Leu Ser Leu Leu Phe Leu Val Ala His Leu Ala Leu Gln Ile Cys
65 70 75 80
Leu His Ile Val Pro Arg Leu Asp Gln Leu Leu Gly Pro Ser Cys Ser
85 90 95
Arg Trp Glu Thr Leu Ser Arg His Ile Gly Val Thr Arg Leu Asp Leu
100 105 110
Lys Asp Ile Pro Asn Ala Ile Arg Leu Val Ala Pro Asp Leu Gly Ile
115 120 125
Leu Val Val Ser Ser Val Cys Leu Gly Ile Cys Gly Arg Leu Ala Arg
130 135 140
Asn Thr Arg Gln Ser Pro His Pro Arg Glu Leu Asp Asp Asp Glu Arg
145 150 155 160
Asp Val Asp Ala Ser Pro Thr Ala Gly Leu Gln Glu Ala Ala Thr Leu
165 170 175
Ala Pro Thr Arg Arg Ser Arg Leu Ala Ala Arg Phe Arg Val Thr Ala
180 185 190
His Trp Leu Leu Val Ala Ala Gly Arg Val Leu Ala Val Thr Leu Leu
195 200 205
Ala Leu Ala Gly Ile Ala His Pro Ser Ala Leu Ser Ser Val Tyr Leu
210 215 220
Leu Leu Phe Leu Ala Leu Cys Thr Trp Trp Ala Cys His Phe Pro Ile
225 230 235 240
Ser Thr Arg Gly Phe Ser Arg Leu Cys Val Ala Val Gly Cys Phe Gly
245 250 255
Ala Gly His Leu Ile Cys Leu Tyr Cys Tyr Gln Met Pro Leu Ala Gln
260 265 270
Ala Leu Leu Pro Pro Ala Gly Ile Trp Ala Arg Val Leu Gly Leu Lys
275 280 285
Asp Phe Val Gly Pro Thr Asn Cys Ser Ser Pro His Ala Leu Val Leu
290 295 300
Asn Thr Gly Leu Asp Trp Pro Val Tyr Ala Ser Pro Gly Val Leu Leu
305 310 315 320
Leu Leu Cys Tyr Ala Thr Ala Ser Leu Arg Lys Leu Arg Ala Tyr Arg
325 330 335
Pro Ser Gly Gln Arg Lys Glu Ala Ala Lys Gly Tyr Glu Ala Arg Glu
340 345 350
Leu Glu Leu Ala Glu Leu Asp Gln Trp Pro Gln Glu Arg Glu Ser Asp
355 360 365
Gln His Val Val Pro Thr Ala Pro Asp Thr Glu Ala Asp Asn Cys Ile
370 375 380
Val His Glu Leu Thr Gly Gln Ser Ser Val Leu Arg Arg Pro Val Arg
385 390 395 400
Pro Lys Arg Ala Glu Pro Arg Glu Ala Ser Pro Leu His Ser Leu Gly
405 410 415
His Leu Ile Met Asp Gln Ser Tyr Val Cys Ala Leu Ile Ala Met Met
420 425 430
Val Trp Ser Ile Thr Tyr His Ser Trp Leu Thr Phe Val Leu Leu Leu
435 440 445
Trp Ala Cys Leu Ile Trp Thr Val Arg Ser Arg His Gln Leu Ala Met
450 455 460
Leu Cys Ser Pro Cys Ile Leu Leu Tyr Gly Met Thr Leu Cys Cys Leu
465 470 475 480
Arg Tyr Val Trp Ala Met Asp Leu Arg Pro Glu Leu Pro Thr Thr Leu
485 490 495
Gly Pro Val Ser Leu Arg Gln Leu Gly Leu Glu His Thr Arg Tyr Pro
500 505 510
Cys Leu Asp Leu Gly Ala Met Leu Leu Tyr Thr Leu Thr Phe Trp Leu
515 520 525
Leu Leu Arg Gln Phe Val Lys Glu Lys Leu Leu Lys Trp Ala Glu Ser
530 535 540
Pro Ala Ala Leu Thr Glu Val Thr Val Ala Asp Thr Glu Pro Thr Arg
545 550 555 560
Thr Gln Thr Leu Leu Gln Ser Leu Gly Glu Leu Val Lys Gly Val Tyr
565 570 575
Ala Lys Tyr Trp Ile Tyr Val Cys Ala Gly Met Phe Ile Val Val Ser
580 585 590
Phe Ala Gly Arg Leu Val Val Tyr Lys Ile Val Tyr Met Phe Leu Phe
595 600 605
Leu Leu Cys Leu Thr Leu Phe Gln Val Tyr Tyr Ser Leu Trp Arg Lys
610 615 620
Leu Leu Lys Ala Phe Trp Trp Leu Val Val Ala Tyr Thr Met Leu Val
625 630 635 640
Leu Ile Ala Val Tyr Thr Phe Gln Phe Gln Asp Phe Pro Ala Tyr Trp
645 650 655
Arg Asn Leu Thr Gly Phe Thr Asp Glu Gln Leu Gly Asp Leu Gly Leu
660 665 670
Glu Gln Phe Ser Val Ser Glu Leu Phe Ser Ser Ile Leu Val Pro Gly
675 680 685
Phe Phe Leu Leu Ala Cys Ile Leu Gln Leu His Tyr Phe His Arg Pro
690 695 700
Phe Met Gln Leu Thr Asp Met Glu His Val Ser Leu Pro Gly Thr Arg
705 710 715 720
Leu Pro Arg Trp Ala His Arg Gln Asp Ala Val Ser Gly Thr Pro Leu
725 730 735
Leu Arg Glu Glu Gln Gln Glu His Gln Gln Gln Gln Gln Glu Glu Glu
740 745 750
Glu Glu Glu Glu Asp Ser Arg Asp Glu Gly Leu Gly Val Ala Thr Pro
755 760 765
His Gln Ala Thr Gln Val Pro Glu Gly Ala Ala Lys Trp Gly Leu Val
770 775 780
Ala Glu Arg Leu Leu Glu Leu Ala Ala Gly Phe Ser Asp Val Leu Ser
785 790 795 800
Arg Val Gln Val Phe Leu Arg Arg Leu Leu Glu Leu His Val Phe Lys
805 810 815
Leu Val Ala Leu Tyr Thr Val Trp Val Ala Leu Lys Glu Val Ser Val
820 825 830
Met Asn Leu Leu Leu Val Val Leu Trp Ala Phe Ala Leu Pro Tyr Pro
835 840 845
Arg Phe Arg Pro Met Ala Ser Cys Leu Ser Thr Val Trp Thr Cys Val
850 855 860
Ile Ile Val Cys Lys Met Leu Tyr Gln Leu Lys Val Val Asn Pro Gln
865 870 875 880
Glu Tyr Ser Ser Asn Cys Thr Glu Pro Phe Pro Asn Ser Thr Asn Leu
885 890 895
Leu Pro Thr Glu Ile Ser Gln Ser Leu Leu Tyr Arg Gly Pro Val Asp
900 905 910
Pro Ala Asn Trp Phe Gly Val Arg Lys Gly Phe Pro Asn Leu Gly Tyr
915 920 925
Ile Gln Asn His Leu Gln Val Leu Leu Leu Leu Val Phe Glu Ala Ile
930 935 940
Val Tyr Arg Arg Gln Glu His Tyr Arg Arg Gln His Gln Leu Ala Pro
945 950 955 960
Leu Pro Ala Gln Ala Val Phe Ala Ser Gly Thr Arg Gln Gln Leu Asp
965 970 975
Gln Asp Leu Leu Gly Cys Leu Lys Tyr Phe Ile Asn Phe Phe Phe Tyr
980 985 990
Lys Phe Gly Leu Glu Ile Cys Phe Leu Met Ala Val Asn Val Ile Gly
995 1000 1005
Gln Arg Met Asn Phe Leu Val Thr Leu His Gly Cys Trp Leu Val
1010 1015 1020
Ala Ile Leu Thr Arg Arg His Arg Gln Ala Ile Ala Arg Leu Trp
1025 1030 1035
Pro Asn Tyr Cys Leu Phe Leu Ala Leu Phe Leu Leu Tyr Gln Tyr
1040 1045 1050
Leu Leu Cys Leu Gly Met Pro Pro Ala Leu Cys Ile Asp Tyr Pro
1055 1060 1065
Trp Arg Trp Ser Arg Ala Val Pro Met Asn Ser Ala Leu Ile Lys
1070 1075 1080
Trp Leu Tyr Leu Pro Asp Phe Phe Arg Ala Pro Asn Ser Thr Asn
1085 1090 1095
Leu Ile Ser Asp Phe Leu Leu Leu Leu Cys Ala Ser Gln Gln Trp
1100 1105 1110
Gln Val Phe Ser Ala Glu Arg Thr Glu Glu Trp Gln Arg Met Ala
1115 1120 1125
Gly Val Asn Thr Asp Arg Leu Glu Pro Leu Arg Gly Glu Pro Asn
1130 1135 1140
Pro Val Pro Asn Phe Ile His Cys Arg Ser Tyr Leu Asp Met Leu
1145 1150 1155
Lys Val Ala Val Phe Arg Tyr Leu Phe Trp Leu Val Leu Val Val
1160 1165 1170
Val Phe Val Thr Gly Ala Thr Arg Ile Ser Ile Phe Gly Leu Gly
1175 1180 1185
Tyr Leu Leu Ala Cys Phe Tyr Leu Leu Leu Phe Gly Thr Ala Leu
1190 1195 1200
Leu Gln Arg Asp Thr Arg Ala Arg Leu Val Leu Trp Asp Cys Leu
1205 1210 1215
Ile Leu Tyr Asn Val Thr Val Ile Ile Ser Lys Asn Met Leu Ser
1220 1225 1230
Leu Leu Ala Cys Val Phe Val Glu Gln Met Gln Thr Gly Phe Cys
1235 1240 1245
Trp Val Ile Gln Leu Phe Ser Leu Val Cys Thr Val Lys Gly Tyr
1250 1255 1260
Tyr Asp Pro Lys Glu Met Met Asp Arg Asp Gln Asp Cys Leu Leu
1265 1270 1275
Pro Val Glu Glu Ala Gly Ile Ile Trp Asp Ser Val Cys Phe Phe
1280 1285 1290
Phe Leu Leu Leu Gln Arg Arg Val Phe Leu Ser His Tyr Tyr Leu
1295 1300 1305
His Val Arg Ala Asp Leu Gln Ala Thr Ala Leu Leu Ala Ser Arg
1310 1315 1320
Gly Phe Ala Leu Tyr Asn Ala Ala Asn Leu Lys Ser Ile Asp Phe
1325 1330 1335
His Arg Arg Ile Glu Glu Lys Ser Leu Ala Gln Leu Lys Arg Gln
1340 1345 1350
Met Glu Arg Ile Arg Ala Lys Gln Glu Lys His Arg Gln Gly Arg
1355 1360 1365
Val Asp Arg Ser Arg Pro Gln Asp Thr Leu Gly Pro Lys Asp Pro
1370 1375 1380
Gly Leu Glu Pro Gly Pro Asp Ser Pro Gly Gly Ser Ser Pro Pro
1385 1390 1395
Arg Arg Gln Trp Trp Arg Pro Trp Leu Asp His Ala Thr Val Ile
1400 1405 1410
His Ser Gly Asp Tyr Phe Leu Phe Glu Ser Asp Ser Glu Glu Glu
1415 1420 1425
Glu Glu Ala Val Pro Glu Asp Pro Arg Pro Ser Ala Gln Ser Ala
1430 1435 1440
Phe Gln Leu Ala Tyr Gln Ala Trp Val Thr Asn Ala Gln Ala Val
1445 1450 1455
Leu Arg Arg Arg Gln Gln Glu Gln Glu Gln Ala Arg Gln Glu Gln
1460 1465 1470
Ala Gly Gln Leu Pro Thr Gly Gly Gly Pro Ser Gln Glu Val Glu
1475 1480 1485
Pro Ala Glu Gly Pro Glu Glu Ala Ala Ala Gly Arg Ser His Val
1490 1495 1500
Val Gln Arg Val Leu Ser Thr Ala Gln Phe Leu Trp Met Leu Gly
1505 1510 1515
Gln Ala Leu Val Asp Glu Leu Thr Arg Trp Leu Gln Glu Phe Thr
1520 1525 1530
Arg His His Gly Thr Met Ser Asp Val Leu Arg Ala Glu Arg Tyr
1535 1540 1545
Leu Leu Thr Gln Glu Leu Leu Gln Gly Gly Glu Val His Arg Gly
1550 1555 1560
Val Leu Asp Gln Leu Tyr Thr Ser Gln Ala Glu Ala Thr Leu Pro
1565 1570 1575
Gly Pro Thr Glu Ala Pro Asn Ala Pro Ser Thr Val Ser Ser Gly
1580 1585 1590
Leu Gly Ala Glu Glu Pro Leu Ser Ser Met Thr Asp Asp Met Gly
1595 1600 1605
Ser Pro Leu Ser Thr Gly Tyr His Thr Arg Ser Gly Ser Glu Glu
1610 1615 1620
Ala Val Thr Asp Pro Gly Glu Arg Glu Ala Gly Ala Ser Leu Tyr
1625 1630 1635
Gln Gly Leu Met Arg Thr Ala Ser Glu Leu Leu Leu Asp Arg Arg
1640 1645 1650
Leu Arg Ile Pro Glu Leu Glu Glu Ala Glu Leu Phe Ala Glu Gly
1655 1660 1665
Gln Gly Arg Ala Leu Arg Leu Leu Arg Ala Val Tyr Gln Cys Val
1670 1675 1680
Ala Ala His Ser Glu Leu Leu Cys Tyr Phe Ile Ile Ile Leu Asn
1685 1690 1695
His Met Val Thr Ala Ser Ala Gly Ser Leu Val Leu Pro Val Leu
1700 1705 1710
Val Phe Leu Trp Ala Met Leu Ser Ile Pro Arg Pro Ser Lys Arg
1715 1720 1725
Phe Trp Met Thr Ala Ile Val Phe Thr Glu Ile Ala Val Val Val
1730 1735 1740
Lys Tyr Leu Phe Gln Phe Gly Phe Phe Pro Trp Asn Ser His Val
1745 1750 1755
Val Leu Arg Arg Tyr Glu Asn Lys Pro Tyr Phe Pro Pro Arg Ile
1760 1765 1770
Leu Gly Leu Glu Lys Thr Asp Gly Tyr Ile Lys Tyr Asp Leu Val
1775 1780 1785
Gln Leu Met Ala Leu Phe Phe His Arg Ser Gln Leu Leu Cys Tyr
1790 1795 1800
Gly Leu Trp Asp His Glu Glu Asp Ser Pro Ser Lys Glu His Asp
1805 1810 1815
Lys Ser Gly Glu Glu Glu Gln Gly Ala Glu Glu Gly Pro Gly Val
1820 1825 1830
Pro Ala Ala Thr Thr Glu Asp His Ile Gln Val Glu Ala Arg Val
1835 1840 1845
Gly Pro Thr Asp Gly Thr Pro Glu Pro Gln Val Glu Leu Arg Pro
1850 1855 1860
Arg Asp Thr Arg Arg Ile Ser Leu Arg Phe Arg Arg Arg Lys Lys
1865 1870 1875
Glu Gly Pro Ala Arg Lys Gly Ala Ala Ala Ile Glu Ala Glu Asp
1880 1885 1890
Arg Glu Glu Glu Glu Gly Glu Glu Glu Lys Glu Ala Pro Thr Gly
1895 1900 1905
Arg Glu Lys Arg Pro Ser Arg Ser Gly Gly Arg Val Arg Ala Ala
1910 1915 1920
Gly Arg Arg Leu Gln Gly Phe Cys Leu Ser Leu Ala Gln Gly Thr
1925 1930 1935
Tyr Arg Pro Leu Arg Arg Phe Phe His Asp Ile Leu His Thr Lys
1940 1945 1950
Tyr Arg Ala Ala Thr Asp Val Tyr Ala Leu Met Phe Leu Ala Asp
1955 1960 1965
Val Val Asp Phe Ile Ile Ile Ile Phe Gly Phe Trp Ala Phe Gly
1970 1975 1980
Lys His Ser Ala Ala Thr Asp Ile Thr Ser Ser Leu Ser Asp Asp
1985 1990 1995
Gln Val Pro Glu Ala Phe Leu Val Met Leu Leu Ile Gln Phe Ser
2000 2005 2010
Thr Met Val Val Asp Arg Ala Leu Tyr Leu Arg Lys Thr Val Leu
2015 2020 2025
Gly Lys Leu Ala Phe Gln Val Ala Leu Val Leu Ala Ile His Leu
2030 2035 2040
Trp Met Phe Phe Ile Leu Pro Ala Val Thr Glu Arg Met Phe Asn
2045 2050 2055
Gln Asn Val Val Ala Gln Leu Trp Tyr Phe Val Lys Cys Ile Tyr
2060 2065 2070
Phe Ala Leu Ser Ala Tyr Gln Ile Arg Cys Gly Tyr Pro Thr Arg
2075 2080 2085
Ile Leu Gly Asn Phe Leu Thr Lys Lys Tyr Asn His Leu Asn Leu
2090 2095 2100
Phe Leu Phe Gln Gly Phe Arg Leu Val Pro Phe Leu Val Glu Leu
2105 2110 2115
Arg Ala Val Met Asp Trp Val Trp Thr Asp Thr Thr Leu Ser Leu
2120 2125 2130
Ser Ser Trp Met Cys Val Glu Asp Ile Tyr Ala Asn Ile Phe Ile
2135 2140 2145
Ile Lys Cys Ser Arg Glu Thr Glu Lys Lys Tyr Pro Gln Pro Lys
2150 2155 2160
Gly Gln Lys Lys Lys Lys Ile Val Lys Tyr Gly Met Gly Gly Leu
2165 2170 2175
Ile Ile Leu Phe Leu Ile Ala Ile Ile Trp Phe Pro Leu Leu Phe
2180 2185 2190
Met Ser Leu Val Arg Ser Val Val Gly Val Val Asn Gln Pro Ile
2195 2200 2205
Asp Val Thr Val Thr Leu Lys Leu Gly Gly Tyr Glu Pro Leu Phe
2210 2215 2220
Thr Met Ser Ala Gln Gln Pro Ser Ile Ile Pro Phe Thr Ala Gln
2225 2230 2235
Ala Tyr Glu Glu Leu Ser Arg Gln Phe Asp Pro Gln Pro Leu Ala
2240 2245 2250
Met Gln Phe Ile Ser Gln Tyr Ser Pro Glu Asp Ile Val Thr Ala
2255 2260 2265
Gln Ile Glu Gly Ser Ser Gly Ala Leu Trp Arg Ile Ser Pro Pro
2270 2275 2280
Ser Arg Ala Gln Met Lys Arg Glu Leu Tyr Asn Gly Thr Ala Asp
2285 2290 2295
Ile Thr Leu Arg Phe Thr Trp Asn Phe Gln Arg Asp Leu Ala Lys
2300 2305 2310
Gly Gly Thr Val Glu Tyr Ala Asn Glu Lys His Met Leu Ala Leu
2315 2320 2325
Ala Pro Asn Ser Thr Ala Arg Arg Gln Leu Ala Ser Leu Leu Glu
2330 2335 2340
Gly Thr Ser Asp Gln Ser Val Val Ile Pro Asn Leu Phe Pro Lys
2345 2350 2355
Tyr Ile Arg Ala Pro Asn Gly Pro Glu Ala Asn Pro Val Lys Gln
2360 2365 2370
Leu Gln Pro Asn Glu Glu Ala Asp Tyr Leu Gly Val Arg Ile Gln
2375 2380 2385
Leu Arg Arg Glu Gln Gly Ala Gly Ala Thr Gly Phe Leu Glu Trp
2390 2395 2400
Trp Val Ile Glu Leu Gln Glu Cys Arg Thr Asp Cys Asn Leu Leu
2405 2410 2415
Pro Met Val Ile Phe Ser Asp Lys Val Ser Pro Pro Ser Leu Gly
2420 2425 2430
Phe Leu Ala Gly Tyr Gly Ile Met Gly Leu Tyr Val Ser Ile Val
2435 2440 2445
Leu Val Ile Gly Lys Phe Val Arg Gly Phe Phe Ser Glu Ile Ser
2450 2455 2460
His Ser Ile Met Phe Glu Glu Leu Pro Cys Val Asp Arg Ile Leu
2465 2470 2475
Lys Leu Cys Gln Asp Ile Phe Leu Val Arg Glu Thr Arg Glu Leu
2480 2485 2490
Glu Leu Glu Glu Glu Leu Tyr Ala Lys Leu Ile Phe Leu Tyr Arg
2495 2500 2505
Ser Pro Glu Thr Met Ile Lys Trp Thr Arg Glu Lys Glu
2510 2515 2520
<---
название | год | авторы | номер документа |
---|---|---|---|
Выделенная нуклеиновая кислота, которая кодирует слитый белок на основе FVIII-BDD и гетерологичного сигнального пептида, и ее применение | 2022 |
|
RU2818229C2 |
КОНСТРУКЦИИ ДНК-АНТИТЕЛ ДЛЯ ПРИМЕНЕНИЯ ПРОТИВ БОЛЕЗНИ ЛАЙМА | 2017 |
|
RU2813829C2 |
ЛЕЧЕНИЕ ЗАБОЛЕВАНИЙ ПОСРЕДСТВОМ ЭКСПРЕССИИ ФЕРМЕНТА, ОБЛАДАЮЩЕГО ДЕЗОКСИРИБОНУКЛЕАЗНОЙ (ДНКазной) АКТИВНОСТЬЮ, В ПЕЧЕНИ | 2019 |
|
RU2773691C2 |
ДОСТАВКА ТЕРАПЕВТИЧЕСКИХ ПОЛИПЕПТИДОВ ПОСРЕДСТВОМ ПСЕВДОТИПИРОВАННЫХ ОНКОЛИТИЧЕСКИХ ВИРУСОВ | 2017 |
|
RU2758007C2 |
Выделенный модифицированный белок VP1 капсида аденоассоциированного вируса 5 серотипа (AAV5), капсид и вектор на его основе | 2019 |
|
RU2751592C2 |
КОМПОЗИЦИИ И СПОСОБЫ ИММУНОТЕРАПИИ ПРОТИВ CD20 | 2017 |
|
RU2782699C2 |
АНТИТЕЛА ПРОТИВ E-СЕЛЕКТИНА, КОМПОЗИЦИИ И СПОСОБЫ ПРИМЕНЕНИЯ | 2021 |
|
RU2805176C1 |
КОМПОЗИЦИИ И СПОСОБЫ ДЛЯ МОДУЛЯЦИИ ПЕРЕДАЧИ СИГНАЛА LAIR | 2017 |
|
RU2757394C2 |
ХИМЕРНЫЙ ЦИТОКИНОВЫЙ РЕЦЕПТОР | 2016 |
|
RU2826122C1 |
СПОСОБЫ ПОЛУЧЕНИЯ ЭКСПРЕССИРУЮЩИХ ХИМЕРНЫЙ АНТИГЕННЫЙ РЕЦЕПТОР КЛЕТОК | 2015 |
|
RU2751362C2 |
Изобретение относится к области молекулярной биологии. В данном документе предложены способы лечения пациентов с варикозным расширением вен, способы выявления субъектов с повышенным риском развития варикозного расширения вен и способы диагностики варикозного расширения вен у субъекта-человека, включающие обнаружение присутствия молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции в биологическом образце пациента или субъекта. Техническим результатом является расширение арсенала средств диагностики варикозного расширения вен. 3 н. и 9 з.п. ф-лы, 5 ил., 3 табл., 5 пр.
1. Способ идентификации субъекта-человека, имеющего повышенный риск развития варикозного расширения вен, где способ включает определение, запланированное или уже осуществленное, в биологическом образце, полученном от субъекта, наличия или отсутствия:
молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции;
молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции;
молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или
полипептида варианта PIEZO1 с прогнозируемой потерей функции;
где:
отсутствие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект не имеет повышенного риска развития варикозного расширения вен; и
наличие молекулы геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулы мРНК, молекулы кДНК или полипептида указывает на то, что субъект имеет повышенный риск развития варикозного расширения вен.
2. Способ диагностирования варикозного расширения вен у субъекта-человека, включающий обнаружение в образце, полученном от субъекта, наличия или отсутствия:
молекулы геномной нуклеиновой кислоты варианта компонента 1 механочувствительного ионного канала пьезотипа (PIEZO1) с прогнозируемой потерей функции;
молекулы мРНК варианта PIEZO1 с прогнозируемой потерей функции;
молекулы кДНК варианта PIEZO1 с прогнозируемой потерей функции, полученной из молекулы мРНК; или
полипептида варианта PIEZO1 с прогнозируемой потерей функции;
где, если субъект имеет молекулу геномной нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, молекулу мРНК, молекулу кДНК или полипептид и имеет один или более симптомов варикозного расширения вен, то субъекта диагностируют как имеющего варикозное расширение вен.
3. Способ по п. 1 или 2, где способ дополнительно включает лечение субъекта с варикозным расширением вен или повышенным риском развития варикозного расширения вен средством, эффективным для лечения варикозного расширения вен.
4. Способ лечения пациента с помощью терапевтического агента, который лечит или ингибирует варикозное расширение вен, где указанный пациент страдает варикозным расширением вен, включающий этапы:
определения того, имеет ли пациент молекулу нуклеиновой кислоты компонента механочувствительного ионного канала 1 пьезотипа (PIEZO1) с прогнозируемой потерей функции, кодирующую полипептид PIEZO1 человека, путем:
получения, запланированного или уже осуществленного, биологического образца от пациента; и
проведения запланированного или уже осуществленного, анализа генотипирования биологического образца, чтобы определить, имеет ли пациент генотип, включающий молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции; и,
введение или продолжение введения пациенту, соответствующему стандарту PIEZO1, терапевтического агента, который лечит или ингибирует варикозное расширение вен, в стандартной дозе; или,
введение или продолжение введения пациенту, который является гетерозиготным или гомозиготным в отношении молекулы нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, терапевтического агента, который лечит или ингибирует варикозное расширение вен, в количестве, которое равно или превышает стандартную дозу;
при этом наличие генотипа, включающего молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции, кодирующую человеческий полипептид PIEZO1, указывает на то, что пациент имеет повышенный риск развития варикозного расширения вен.
5. Способ по любому из пп. 1-4, где этап определения, этап обнаружения или анализ генотипирования проводят in vitro.
6. Способ по любому из пп. 1-5, где этап определения, этап обнаружения или анализ генотипирования включает секвенирование по меньшей мере части нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1 в биологическом образце, при этом секвенированная часть содержит позицию, соответствующую позиции варианта с прогнозируемой потерей функции, где в случае обнаружения вариантного нуклеотида в позиции варианта с прогнозируемой потерей функции молекула нуклеиновой кислоты PIEZO1 в биологическом образце представляет собой молекулу нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции.
7. Способ по любому из пп. 1-6, где этап определения, этап обнаружения или анализ генотипирования включает:
a) приведение биологического образца в контакт с праймером, гибридизирующимся с частью нуклеотидной последовательности молекулы нуклеиновой кислоты PIEZO1, которая находится вблизи позиции варианта с прогнозируемой потерей функции;
b) удлинение праймера по меньшей мере через позицию варианта с прогнозируемой потерей функции; и
c) определение, содержит ли продукт удлинения праймера вариантный нуклеотид в позиции варианта с прогнозируемой потерей функции.
8. Способ по п. 6 или 7, где этап определения, этап обнаружения или анализ генотипирования включает секвенирование всей молекулы нуклеиновой кислоты.
9. Способ по любому из пп. 1-5, где этап определения, этап обнаружения или анализ генотипирования включает:
а) амплификацию по меньшей мере части молекулы нуклеиновой кислоты PIEZO1, которая кодирует человеческий полипептид PIEZO1, при этом часть содержит позицию варианта с прогнозируемой потерей функции;
b) мечение амплифицированной молекулы нуклеиновой кислоты обнаруживаемой меткой;
c) приведение меченой молекулы нуклеиновой кислоты в контакт с подложкой, содержащей специфический в отношении изменения зонд, где специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и
d) обнаружение обнаруживаемой метки.
10. Способ по п. 9, где молекула нуклеиновой кислоты в образце представляет собой мРНК, и эту мРНК обратно транскрибируют в кДНК перед этапом амплификации.
11. Способ по п. 9 или 10, где этап определения, этап обнаружения или анализ генотипирования включает:
приведение молекулы нуклеиновой кислоты в биологическом образце в контакт со специфическим в отношении изменения зондом, содержащим обнаруживаемую метку, при этом специфический в отношении изменения зонд содержит нуклеотидную последовательность, которая в жестких условиях гибридизируется с позицией варианта с прогнозируемой потерей функции; и
обнаружение обнаруживаемой метки.
12. Способ по любому из пп. 1-11, где молекула нуклеиновой кислоты варианта PIEZO1 с прогнозируемой потерей функции представляет собой 16:88715629:G:A, 16:88715728:G:T, 16:88715767:G:A, 16:88715802:C:A, 16:88715822:D:4, 16:88715987:I:1, 16:88716359:A:G, 16:88716570:C:T, 16:88716874:G:A, 16:88717213:T:A, 16:88719588:G:A, 16:88719722:C:G, 16:88719870:G:T, 16:88720068:D:2, 16:88720229:C:A, 16:88720248:D:4, 16:88720394:C:T, 16:88720644:D:1, 16:88720698:D:1, 16:88720698:I:1, 16:88721165:C:A, 16:88721268:D:1, 16:88721307:G:A, 16:88721586:G:C, 16:88721652:G:C, 16:88722217:C:T, 16:88722605:I:1, 16:88723005:I:7, 16:88723253:G:A, 16:88723311:C:T, 16:88725081:C:A, 16:88726282:G:A, 16:88726546:C:T, 16:88726619:G:A, 16:88726924:G:A, 16:88727038:C:T, 16:88727072:D:1, 16:88727163:G:A, 16:88731768:D:1, 16:88732334:C:G, 16:88732411:D:1, 16:88732720:D:1, 16:88733326:G:C, 16:88733337:D:4, 16:88733587:C:A, 16:88733965:D:1, 16:88734017:C:A, 16:88734042:I:1, 16:88734679:C:T, 16:88734909:I:1, 16:88736167:D:2, 16:88736324:G:A, 16:88736391:G:T, 16:88736409:C:T, 16:88736671:G:A, 16:88737557:A:C, 16:88737727:C:G, 16:88737815:C:T, 16:88738283:G:C, 16:88738637:G:A, 16:88738735:D:1, 16:88741477:C:T, 16:88742306:D:1, 16:88749399:G:A или 16:88784929:C:T, или полученную из нее молекулу мРНК, или молекулу кДНК, полученную из молекулы мРНК.
Varicose veins of lower extremities: insights from the first large-scale genetic study, Alexandra S | |||
Shadrina, Sodbo Z | |||
Sharapov, Tatiana I | |||
Shashkova, Yakov A | |||
СПОСОБ ПОЛУЧЕНИЯ ЦЕЛЛЮЛОЗЫ-^ЙСЕООЮЗНАЯ j .i>& -••;^V«i')_tJ;Yii"vF''--'^3J>&!;•% i Lei-'UU :->&.-••->&'.':' гЗ_...- • -.| | 0 |
|
SU368365A1 |
Fukaya E | |||
et al | |||
Clinical and genetic determinants of varicose veins: prospective, community-based study of≈ 500 |
Авторы
Даты
2024-01-30—Публикация
2020-02-07—Подача