СПОСОБЫ И УСТРОЙСТВА ДЛЯ ОПРЕДЕЛЕНИЯ ПАТОЛОГИЧЕСКИХ СОСТОЯНИЙ В РЕАЛЬНОМ ВРЕМЕНИ С ИСПОЛЬЗОВАНИЕМ НУКЛЕИНОВЫХ КИСЛОТ Российский патент 2022 года по МПК C12Q1/689 G16B30/00 

Описание патента на изобретение RU2763969C2

По настоящей заявке испрашивается приоритет по европейской патентной заявке № 17 182 104.4, поданной 19 июля 2017 года, содержание которой включено в настоящее описание в качестве ссылки в полном объеме.

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к способам и устройствам для определения патологического состояния, такого как инфекция, у индивидуума, а также идентификации причинного фактора патологического состояния, где способы основаны на определении у индивидуума количества нуклеиновой кислоты, которая не картируется к индивидууму, во временной динамике по сравнению с нуклеиновыми кислотами, которые картируются к индивидууму.

УРОВЕНЬ ТЕХНИКИ

Способы диагностики инфекционных заболеваний в настоящее время можно разделить на две обширные категории. Одна категория относится к диагностике инфекции относительно организма-хозяина (возможно инфицированного). В этой категории диагностика имеет форму ответа "да" или "нет" на вопрос о том, страдает ли организм-хозяин от инфекции; "да" - инфекция присутствует, или "нет" - инфекция отсутствует. Другим путем диагностики инфекционных заболеваний является диагностика микроорганизма-возбудителя инфекции. В этом случае также диагностические способы приводят к получению ответа "да"/"нет"; "да" - пациент X заражен микроорганизмом Y, или "нет" - не заражен.

В настоящее время диагностика, сфокусированная на идентификации микроорганизма-возбудителя заболевания, основана на посеве крови или способах ПЦР. Помимо чисто качественного результата (ответа "да"/"нет"), с помощью этих диагностических подходов можно определять лишь определенный набор микроорганизмов. В случае посева крови это является результатом того, что не все микроорганизмы могут расти в бутыли при посеве крови (например, вирусы или грибы). В случае диагностики с использованием ПЦР необходимо определять наборы пар праймеров, что ограничивает специфичность для слишком больших наборов мишеней, например, по причине сложности. Эти диагностические тесты не позволяют осуществлять объективное, высокоспецифическое, высокочувствительное тестирование на все классы возможных микроорганизмов, например, бактерий, грибов, вирусы и паразитов. Кроме того, хотя подходы на основе ПЦР являются более быстрыми, чем посев крови, он остается диагностическим тестом первой линии в случае инфекционных заболеваний.

Кроме того, оба подхода не позволяют разделять симбиотические микроорганизмы, контаминацию и настоящий возбудитель инфекции, которой страдает пациент. В конечном итоге это приводит ко множеству ложноположительных результатов.

Общепринятый посев крови занимает от двух до семи дней. В течение этого времени, до того как станет известным микроорганизм-возбудитель, пациентов лечат антибиотиками широкого спектра по решению лечащего врача, следующего новейшим руководствам по лечению. В результате микроорганизмы могут становиться мультирезистентными по причине бессистемного злоупотребления антибиотиками широкого спектра из-за недостаточно эффективных диагностических способов. Таким образом, для обеспечения быстрого и эффективного лечения пациентов с использованием подходящих противоинфекционных средств необходимо как можно быстрее идентифицировать возбудителя инфекции, и крайне важно иметь возможность различать возбудителя инфекции и симбиотические микроорганизмы/контаминацию во время диагностики.

В литературе есть примеры секвенирования образцов, полученных от пациентов, для идентификации содержащихся в них микроорганизмов, такие как Hasman et al., 2014, Journal of Clinical Microbiology 52:139-146, где описано полногеномное секвенирование с использованием образцов мочи для идентификации содержащихся в них микроорганизмов, результаты которого сравнивали с общепринятым культивированием и идентификацией. Другие примеры включают Grumaz et al., 2016, Genome Medicine 8:73, где описывают секвенирование нового поколения образцов, полученных от пациентов с сепсисом; Andersson et al., 2013, Clin Microbiol Infect 19:E405-E408, где описывают ультраглубокое секвенирование ДНК, полученной из образцов вагинальных мазков; и Turnbaugh et al., 2009, Nature 457:480-484, где описывают секвенирование способом дробовика тотальной ДНК кала для идентификации генов, как правило, обогащенных в микробиоме кишечника индивидуумов с ожирением или без него. Этими способами просто секвенируют нуклеиновые кислоты, непринадлежащие организму-хозяину, и сравнивают их с базами данных для идентификации любых микроорганизмов в образце.

Однако в этой области сохраняется потребность в более эффективной обработке данных секвенирования для получения более точных результатов и/или осуществления более быстрой идентификации микроорганизма-возбудителя заболевания таким образом, чтобы можно было раньше начинать эффективное лечение.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение по меньшей мере частично основано на открытии авторами изобретения того, что можно определять вероятность наличия у индивидуума патологического состояния с учетом количества нуклеиновой кислоты, присутствующей в биологическом образце, полученном от индивидуума, но в норме не присутствующей у здорового индивидуума. Например, определяя количество нуклеиновых кислот, картируемых к микроорганизмам, в биологическом образце, полученном от индивидуума, можно определять вероятность того, что индивидуум страдает заболеванием, таким как инфекция, вызванная микроорганизмами. Кроме того, это открытие делает возможным определение вероятности того, что индивидуум имеет злокачественное новообразование, и особенно подходит для мониторинга лечения злокачественных новообразований. В одном из вариантов осуществления эту вероятность определяют посредством вычисления баллов значимости для вероятности обнаружения у индивидуума последовательности нуклеиновой кислоты, картируемой к конкретному микроорганизму, с учетом общего количества ридов последовательности, картированных (приписанных) к конкретному микроорганизму, и общего количества всех ридов последовательности, которые можно картировать (приписать) к биологическому виду, включая количество ридов, картированных к тому же виду, к которому принадлежит индивидуум, и количество ридов, картированных к любым микроорганизмам в образце. Эти баллы значимости, основанные, по существу, на соотношении количества ридов последовательности, картированных к конкретному микроорганизму, и общего количества ридов последовательности, картированных к биологическому виду, присутствующих в биологическом образце, полученном от индивидуума, можно вычислять во временной динамике, т.е. вычислять в реальном времени, с повышением общего количества картированных ридов (т.к. получают все больше ридов последовательности и картируют их к биологическому виду).

В варианте осуществления настоящее изобретение относится к способу определения наличия микроорганизмов у индивидуума, который в одном из вариантов осуществления включает определение количества ридов последовательности, картируемых к геному конкретного микроорганизма, и количества ридов последовательности, картируемых к геному биологического вида, включая тот же вид, к которому принадлежит индивидуум. Риды последовательности, полученные при секвенировании нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, можно сравнивать с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов. Из этого следует, что можно определять количество ридов последовательности, картируемых к биологическому виду, включая вид организма-хозяина и любые микроорганизмы, и количество ридов последовательности, картируемых к конкретному микроорганизму. В варианте осуществления способ дополнительно включает вычисление баллов значимости для конкретного микроорганизма, основанных на количестве ридов последовательности, картируемых к этому конкретному микроорганизму, и общем количестве ридов, картируемых к биологическому виду. Т.к. стадию определения можно осуществлять во временной динамике, это вычисление баллов значимости также можно осуществлять во временной динамике при получении и картировании ридов последовательности. Кроме того, это вычисление можно осуществлять во временной динамике при сравнении ридов последовательности с генетической информацией в одной или более базах данных в вариантах осуществления, в которых риды последовательности уже получены, но еще не сравнены и не картированы к биологическому виду.

Настоящее изобретение относится к способу определения наличия микроорганизмов у индивидуума, включающему стадии (a) секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты; (b) сравнения ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду; и (c) определения количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике.

Настоящее изобретение также относится к способу определения наличия микроорганизмов у индивидуума, включающему (a) сравнение ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума; и (b) определение количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике.

Настоящее изобретение также относится к способу определения наличия микроорганизмов у индивидуума, включающему стадию определения количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике, где сравниваемые риды последовательности получают посредством сравнения полученных ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

В варианте осуществления изобретения способ дополнительно включает вычисление баллов значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду.

Настоящее изобретение также относится к способу определения наличия микроорганизмов у индивидуума, включающему стадию вычисления баллов значимости для вероятности обнаружения у индивидуума рида последовательности, картируемого к конкретному микроорганизму, во временной динамике с учетом количества ридов последовательности, картируемых к конкретному микроорганизму, и количества ридов последовательности, картируемых к биологическому виду, где риды последовательности, картируемые к конкретному микроорганизму, и риды последовательности, картируемые к биологическому виду, получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

Настоящее изобретение также относится к способу определения наличия микроорганизмов у индивидуума, включающему (a) стадию определения количества ридов последовательности, картируемых к конкретному микроорганизму, и количества ридов последовательности, картируемых к биологическому виду, во временной динамике, где риды последовательности получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума; и (b) вычисления баллов значимости для вероятности обнаружения у индивидуума рида последовательности, картируемого к конкретному микроорганизму, с учетом количества ридов последовательности, картируемых к конкретному микроорганизму, и количества ридов последовательности, картируемых к биологическому виду.

Во многих вариантах осуществления настоящего изобретения, можно осуществлять способ, в котором после секвенирования нуклеиновых кислот незамедлительно следует, т.е. осуществляют, по существу, одновременно, сравнение ридов последовательности для картирования ридов к биологическому виду и вычисления баллов значимости, или секвенирование можно осуществлять в любой момент до стадий сравнения/определения/вычисления таким образом, что результаты секвенирования хранят, и затем хранящиеся результаты секвенирования можно использовать для сравнения секвенированных ридов с одной или более базами данных и, например, для вычисления баллов значимости.

В варианте осуществления стадия определения количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике означает, что подсчитывают количество сравниваемых ридов, которые можно картировать к конкретному микроорганизму, и количество сравниваемых ридов, которые можно картировать к биологическому виду, т.е. ридов, не только картируемых к конкретному микроорганизму, но также ридов, картируемых к индивидууму, а также картируемых к любому другому микроорганизму, присутствующему в образце. В настоящем изобретении не используют эти риды последовательности, которые нельзя картировать к биологическому виду, вероятно, по причине деградации, которые слишком коротки или происходят из микроорганизма, отсутствующего в одной или более базах данных. Предпочтительно, в настоящем изобретении используют не все риды последовательности, а только те, которые можно картировать к биологическому виду.

В одном из вариантов осуществления, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как присутствующий у индивидуума, или, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как относящийся к причине заболевания у индивидуума. В других вариантах осуществления чем больше баллы значимости превышают пороговое значение, тем больше нагрузка микроорганизма у индивидуума, что может отражать более тяжелое состояние инфекции. В варианте осуществления пороговое значение устанавливают для минимизации количества ложноположительных и ложноотрицательных результатов с учетом значимости конкретного микроорганизма для вызывания заболевания у индивидуума.

В другом варианте осуществления, если баллы значимости для конкретного микроорганизма превышают пороговое значение на несколько ридов последовательности, картируемых к биологическому виду, заболевание по причине наличия микроорганизма можно считать тяжелым. Что касается этого варианта осуществления, термин "несколько" относится к тому, что не все, т.е. часть, риды секвенирования, полученные посредством секвенирования нуклеиновых кислот в образце, подвергнуты сравнению и картированию, но пороговое значение уже достигнуто или превышено. Часть сравниваемых и картированных ридов может составлять 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% или 95% от всех сравниваемых и картированных ридов. Предпочтительно, термин "несколько" относится к менее чем 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 2%, 1% от всех сравниваемых и картированных ридов. "Несколько" также может представлять собой фиксированное количество ридов, такое как менее 100, 1000, 10000 или 100000 ридов.

В варианте осуществления способ по настоящему изобретению можно осуществлять во временной динамике до момента, когда получают информацию, такую как количество ридов, картируемых к индивидууму/конкретному микроорганизму, или другой параметр, включая описанные ниже, что делает возможным определение с некоторым уровнем точности того, что индивидуум имеет или не имеет патологическое состояние или инфицирован или не инфицирован одним или более микроорганизмам, а также определение идентичности одного или более микроорганизмов или типов злокачественных новообразований. При достижении этого момента времени способ можно останавливать, т.к. больше не требуется дополнительная информация для определения наличия микроорганизмов или патологического состояния у индивидуума.

Количество ридов, картируемых к конкретному микроорганизму, и количество ридов, картируемых к биологическому виду, во временной динамике можно использовать для получения параметра во временной динамике, который можно использовать не только для определения, например, того, что конкретный микроорганизм важен для патологического состояния у индивидуума, но также и для сравнения состояний заболевания (с одной и той же причиной) между двумя или более пациентами. Другими словами, если есть одинаковое количество ридов, картируемых к биологическому виду, между двумя пациентами, но разное (большее или меньшее) количество ридов, картируемых к конкретному микроорганизму, это различие может свидетельствовать о различии нагрузки/количества конкретного микроорганизма между двумя пациентами. Например, если индивидуум имеет 1 рид конкретного микроорганизма на 106 ридов, картируемых к биологическому виду, а второй индивидуум имеет 1 рид того же конкретного микроорганизма на 5×105 ридов, картируемых к биологическому виду, можно сделать вывод о том, что микроорганизм не только присутствует у второго индивидуума, но второй индивидуум также имеет более высокую нагрузку/уровень инфекции.

Кроме того, этот параметр можно получать в реальном времени в любой момент (во временной динамике) во время осуществления способа, а не только в конечный момент времени, когда все риды последовательности подвергнуты сравнению и все сравненные риды картированы. Таким образом, если у одного индивидуума наблюдают 5-кратное количество ридов, картируемых к конкретному микроорганизму, относительно того же количества ридов, картируемых к биологическому виду, определенного в контрольном образце в один момент времени, в который только часть всех ридов сравнена и картирована, способ можно останавливать в этот более ранний момент времени перед сравнением и картированием всех секвенированных ридов, т.к. очевидно, что пациент с в 5 раз большим количеством ридов, вероятно, имеет патологическое состояние (инфекцию), вызванную конкретным микроорганизмом.

Возможность получать этот параметр во временной динамике на стадиях секвенирования, сравнения и картирования таким образом, что способ можно останавливать до конца анализа, т.е. до того, как все нуклеиновые кислоты в образце секвенированы и все риды сравнены и картированы, успешно позволяет сохранять время и ресурсы по сравнению со способами, которые нельзя останавливать подобным образом. Например, как правило, стадии секвенирования, сравнения и картирования всех нуклеиновых кислот в образце могут занимать до 30 часов или более. Однако настоящее изобретение позволяет значительно уменьшать это время, например, в некоторых случаях на 10 часов или более, таким образом, что можно сэкономить 10 часов секвенирования и/или машинного времени. Кроме того, т.к. индивидуума можно быстрее подвергать диагностике, соответствующее лечение также можно начинать быстрее, что приводит к большей вероятности выживания индивидуума. Это также позволяет не тратить фармацевтические средства, которые не подходят для лечения инфекции или патологического состояния, например, не вводить антибиотик при вирусной инфекции или не вводить антибиотик, к которому микроорганизм резистентен.

Настоящее изобретение также относится к способу определения наличия патологического состояния у индивидуума, включающему (a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты; (b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида, для определения того, картируется ли сравниваемый рид последовательности к контрольному индивидууму; и (c) определение количества сравниваемых ридов последовательности, картируемых и некартируемых к контрольному индивидууму, во временной динамике. Настоящее изобретение также относится к способу определения наличия патологического состояния у индивидуума, включающему (a) сравнение ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида, для определения того, картируется ли сравниваемый рид последовательности к контрольному индивидууму, где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума; и (b) определение количества сравниваемых ридов последовательности, картируемых и некартируемых к контрольному индивидууму, во временной динамике. Настоящее изобретение также относится к способу определения наличия патологического состояния у индивидуума, включающему стадию определения количества сравниваемых ридов последовательности, картируемых и некартируемых к контрольному индивидууму, во временной динамике, где сравниваемые риды последовательности получают посредством сравнения полученных ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида, для определения того, картируется ли сравниваемый рид последовательности к контрольному индивидууму, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

В одном из вариантов осуществления способ дополнительно включает вычисление баллов значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, некартируемого к контрольному индивидууму, с учетом количества сравниваемых ридов последовательности, некартируемых к контрольному индивидууму, и количества сравниваемых ридов последовательности, которые можно картировать, например, картируемых к контрольному индивидууму.

Настоящее изобретение также относится к способу определения наличия патологического состояния у индивидуума, включающему стадию вычисления баллов значимости для вероятности обнаружения у индивидуума рида последовательности, некартируемого к контрольному индивидууму, во временной динамике с учетом количества ридов последовательности, некартируемых к контрольному индивидууму, и количества ридов последовательности, картируемых к контрольному индивидууму, где риды последовательности, картируемые к контрольному индивидууму, и риды последовательности, некартируемые к контрольному индивидууму, получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида, для определения того картируется ли сравниваемый рид последовательности к контрольному индивидууму, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

В варианте осуществления, если баллы значимости соответствуют пороговому значению или превышают его, определяют, что индивидуум имеет патологическое состояние. В рамках изобретения термин "сравниваемый рид последовательности, некартируемый к контрольному индивидууму" не всегда означает, что последовательность не является очень схожей или не является практически той же, что и последовательность контрольного индивидуума, но зачастую так может быть. Например, в варианте осуществления, в котором патологическое состояние является заболеванием, вызванным точечной мутацией в последовательности нуклеиновой кислоты индивидуума, рид последовательности, содержащий такую точечную мутацию, считают некартируемым к контрольному индивидууму, даже если все другие нуклеотиды рида являются идентичными риду контрольного индивидуума. Кроме того, в варианте осуществления при сравнении ридов последовательности можно ссылаться на известные геномные полиморфизмы, например, однонуклеотидные полиморфизмы, таким образом, что эти различия не считают мутациями в секвенированных ридах индивидуума.

В варианте осуществления изобретения патологическое состояние представляет собой злокачественное новообразование, предпочтительно, злокачественное новообразование, вызванное генетической аномалией, например, точечной мутацией, делецией, инсерцией или инсерцией/делецией. В другом варианте осуществления патологическое состояние является инфекцией, вызванной микроорганизмом, предпочтительно, где микроорганизм является вирусом, бактерией, грибом или паразитом.

В варианте осуществления, в котором патологическое состояние является злокачественным новообразованием, способы по изобретению также можно использовать для мониторинга лечения злокачественного новообразования, а также мониторинга рецидивирования злокачественного новообразования после раунда лечения. Например, индивидуум, у которого диагностировали злокачественное новообразование, является индивидуумом, подлежащим лечению, такому как хирургическое удаление опухоли. Можно создавать базу данных генетической информации об опухоли, можно секвенировать нуклеиновые кислоты, полученные от индивидуума, и можно сравнивать риды с одной или более базами данных, содержащими генетическую информация контрольного индивидуума того же вида и генетическую информацию об опухоли. Затем сравниваемые риды картируют к контрольному индивидууму или базе данных об опухоли, таким образом, что вычисляют баллы значимости по изобретению с учетом количества ридов, картируемых к геному злокачественного новообразования, и количества ридов, картируемых к геному злокачественного новообразования и контрольному геному, что, таким образом, позволяет определять наличие злокачественного новообразования, т.е. рецидивирование злокачественного новообразования. Аналогично, во время лечения можно получать образцы и вычислять баллы для определения того, имеет ли лечение эффект.

В варианте осуществления, в котором патологическое состояние является инфекцией, вызванной микроорганизмом, способ по изобретению также можно использовать для мониторинга лечения инфекции и/или мониторинга рецидивирования инфекции. В таких вариантах осуществления биологические образцы получают от индивидуума во время и/или после лечения и следуют способу, описанному выше, таким образом, что баллы значимости вычисляют с учетом количества ридов, картируемых к микроорганизму, и количества ридов, картируемых к биологическому виду.

В некоторых вариантах осуществления биологический образец можно выбирать из группы, состоящей из цельной крови, сыворотки, плазмы крови, амниотической жидкости, синовиальной жидкости, ликвора, мазка ткани или клеток, смыва ткани или клеток, мочи, ткани, мокроты, кала, желудочно-кишечных секретов, лимфы и лаважа.

В некоторых вариантах осуществления индивидуум является позвоночным, предпочтительно, млекопитающим, например, человеком, собакой, кошкой, свиньей, лошадью, крупным рогатым скотом, овцой, козой, мышью или крысой, предпочтительно, индивидуум является человеком.

В варианте осуществления секвенирование осуществляют с использованием способов ультраглубокого или высокопроизводительного секвенирования. В предпочтительных вариантах осуществления изобретения секвенирование осуществляют посредством молекулярного высокопроизводительного анализа последовательности, т.е. секвенирования нового поколения или третьего поколения, такого как Illumina/Solexa или методология Oxford Nanopore.

В варианте осуществления настоящего изобретения, если определяют, что конкретный микроорганизм или патологическое состояние присутствует у индивидуума, способ дополнительно включает введение индивидууму фармацевтически активного соединения, о котором известно, что с помощью него можно лечить заболевание, вызванное конкретным микроорганизмом или патологическим состоянием. Кроме того, после идентификации микроорганизма, вызывающего инфекционное заболевание, можно определять, резистентен ли он к какому-либо типу антибиотиков/противоинфекционных средств, таким образом, чтобы лечение было эффективным. В варианте осуществления, нуклеиновые кислоты индивидуума в образце можно истощать перед определением того, резистентен ли микроорганизм к какому-либо типу антибиотиков/противоинфекционных средств.

В одном конкретном варианте осуществления способ диагностики инфекционного заболевания, вызванного микроорганизмами, у индивидуума включает вычисление баллов значимости для вероятности обнаружения у индивидуума рида последовательности, картируемого к конкретному микроорганизму, во временной динамике с учетом количества ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, где, если баллы для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как вызывающий инфекционное заболевание, и где риды последовательности, картируемые к конкретному микроорганизму, и риды последовательности, картируемые к биологическому виду, получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

В одном конкретном варианте осуществления способ диагностики инфекционного заболевания, вызванного микроорганизмами, у индивидуума включает (a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты; (b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных; (c) определение количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике; и (d) вычисление баллов значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, где, если баллы для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как вызывающий инфекционное заболевание.

Настоящее изобретение относится к способу лечения заболевания или инфекции, вызванной микроорганизмом, у индивидуума, включающему (a) определение баллов значимости для конкретного микроорганизма у индивидуума любым из описанных выше способов определения наличия микроорганизмов у индивидуума, и (b), если значимость для конкретного микроорганизма соответствует пороговому значению или превышает его, введение индивидууму соединения, ингибирующего рост конкретного микроорганизма. Настоящее изобретение также относится к способу лечения заболевания или инфекции, вызванной микроорганизмом, у индивидуума, включающему введение индивидууму соединения, ингибирующего рост микроорганизма, баллы значимости для которого соответствуют пороговому значению или превышают его, где баллы значимости вычисляют любым из описанных выше способов определения наличия микроорганизмов у индивидуума, представленных в настоящем описании.

Настоящее изобретение также включает машиночитаемый носитель данных, на котором хранят программный код, содержащий команды, посредством выполнения которых процессором осуществляют способы по изобретению, а также компьютерную систему, содержащую процессор, например, программируемую пользователем вентильную матрицу, сконфигурированную для осуществления способов по изобретению.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Хотя настоящее изобретение подробно описано ниже, следует понимать, что настоящее изобретение не ограничено конкретными способами и реагентами, представленными в настоящем описании, т.к. их можно варьировать. Также следует понимать, что терминология, используемая в настоящем описании, предназначена исключительно для описания конкретных вариантов осуществления, а не для ограничения объема настоящего изобретения, который будет ограничен исключительно формулой изобретения. Если не указано иначе, все технические и научные термины, используемые в настоящем описании, обладают значением, общепринято понятным специалисту в этой области.

Далее будут описаны элементы настоящего изобретения. Эти элементы указаны вместе с конкретными вариантами осуществления, однако, следует понимать, что их можно комбинировать любым образом и в любом количестве для получения дополнительных вариантов осуществления. Различные описанные примеры и предпочтительные варианты осуществления не следует считать ограничивающими настоящее изобретение только конкретно описанными вариантами осуществления. Настоящее описание следует считать поддерживающим и включающим варианты осуществления, в которых комбинируют конкретно описанные варианты осуществления с любым количеством описанных и/или предпочтительных элементов. Кроме того, любые пермутации и комбинации всех описанных элементов в настоящей заявке следует считать представленными в описании настоящей заявки, если контекст четко не указывает на иное.

Предпочтительно, термины, используемые в настоящем описании, определены, как описано в "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", H.G.W. Leuenberger, B. Nagel, and H. Kölbl, Eds., (1995) Helvetica Chimica Acta, CH-4010 Basel, Switzerland.

Если не указано иначе, в практическом осуществлении настоящего изобретения используют общепринятые способы биохимии, клеточной биологии, иммунологии и способы рекомбинантной ДНК, описанные в литературе, известной в этой области (см., например, Molecular Cloning: A Laboratory Manual, 2nd Edition, J. Sambrook et al. eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989).

Если контекст не требует иного, на всем протяжении настоящего описания и формулы изобретения термин "содержат" и его варианты, такие как "содержит" и "содержащий", следует понимать как подразумевающие включение указанного члена, целого числа или стадии или группы членов, целых чисел или стадий, но не исключение любого другого члена, целого числа или стадии или группы членов, целых чисел или стадий, хотя в некоторых вариантах осуществления можно исключать такой другой член, целое число или стадию или группу членов, целых чисел или стадий, т.е. объект изобретения состоит из включения указанного члена, целого числа или стадии или группы членов, целых чисел или стадий. Термины в единственном числе, используемые в контексте описания изобретения (особенно в контексте формулы изобретения), следует считать охватывающими единственное и множественное число, если в настоящем описании не указано иначе или это четко не противоречит контексту. Перечисление диапазонов значений в настоящем описании предназначено исключительно для краткой записи каждого отдельного значения, попадающего в диапазон. Если в настоящем описании не указано иначе, каждое отдельное значение включено в настоящее описание так, как если бы оно было отдельно указано в настоящем описании.

Все способы, представленные в настоящем описании, можно осуществлять в любом подходящем порядке, если в настоящем описании не указано иначе или иное четко не противоречит контексту. Использование любого и всех примеров или выражений примеров (например, "такой как"), представленных в настоящем описании, предназначено исключительно для лучшего иллюстрирования настоящего изобретения и не накладывает ограничения на объем изобретения, приведенный в формуле изобретения. Ни одно из выражений в настоящем описании не следует истолковывать как указывающее на любой незаявленный, необходимый для практического осуществления изобретения.

На всем протяжении настоящего описания процитировано несколько документов. Каждый из документов, процитированных выше или ниже в настоящем описании (включая все патенты, патентные заявки, научные публикации, рекомендации производителей, инструкции и т.д.), включены в него, таким образом, в качестве ссылки в полном объеме. Ничто в настоящем описании не следует истолковывать как признание того, что изобретение не имеет права предшествовать такому раскрытию в силу предшествующего изобретения.

Как описано выше, настоящее изобретение основано на количестве ридов последовательности, картируемых, например, к конкретному микроорганизму или геному злокачественного новообразования, относительно общего количества ридов, которые можно картировать, например, к биологическому виду/нормальному геному. Таким образом, настоящее изобретение относится к обоснованию диагностики и различения симбиотических микроорганизмов/контаминации и наиболее вероятного причинного фактора инфекции. Преимущественно, настоящее изобретение относится по меньшей мере к следующему:

a) объективному способу, в рамках которого не делают каких-либо предположений о полученном биологическом образце,

b) способу, с помощью которого можно различать симбиотические микроорганизмы/контаминацию и возбудителя инфекции,

c) способу, с помощью которого получают результаты в реальном времени для всех микроорганизмов, идентифицированных в образце в указанное время,

d) способу получения данных в реальном времени в течение секвенирования,

e) способу, с помощью которого получают информацию в реальном времени, обрабатывая данные,

f) способу, который можно останавливать после анализа небольшой части всего массива данных после определения того, что микроорганизм важен для патологического состояния,

g) способу, с помощью которого получают параметр, позволяющий сравнивать два или более биологических образца одного и того же патологического состояния, и

h) способу, позволяющему клиницистам и исследователям сравнивать степень тяжести инфекции, вызванной микроорганизмом, среди пациентов, инфицированных одним и тем же микроорганизмом.

Другим преимуществом настоящего изобретения является возможность детекции инфекций, вызванных множеством микроорганизмов, и возможность определения того, какой микроорганизм является основным причинным фактором, а какие микроорганизмы являются сопутствующими, даже притом, что все они могут вносить значительный вклад в состояние инфекции/патологическое состояние.

Термины "индивидуум", "организм" или "пациент" используют взаимозаменяемо, и они относятся к позвоночным, предпочтительно, млекопитающим. Например, млекопитающие в контексте настоящего изобретения являются людьми, не являющимися человеком приматами, одомашненными животными, такими как собаки, кошки, овцы, крупный рогатый скот, козы, свиньи, лошади и т.д., лабораторными животными, такими как мыши, крысы, кролики, рыбы, морские свинки и т.д., а также животные, содержащиеся в неволе, такие как животные в зоопарках. Термин "животное" также включает людей. Предпочтительно, термины "индивидуум", "организм" или "пациент" относятся к млекопитающим мужского и женского пола, в частности, мужчинам и женщинам. Индивидуум может быть любого возраста, включая новорожденных (например, от рождения до приблизительно 6 месяцев), младенцев (например, от приблизительно 6 месяцев до приблизительно 2 лет), детей (например, от приблизительно 2 лет до приблизительно 10 лет), подростков (например, от приблизительно 10 лет до приблизительно 21 года) и взрослых (например, приблизительно 21 год и старше).

В некоторых вариантах осуществления индивидуум может являться иммунокомпрометированным, например, по причине иммуносупрессорных лекарственных средств, или подвергаться трансплантации, при которой требуется супрессия или деструкция нативной иммунной системы/функции. Другие индивидуумы могут иметь хронические или системные инфекции. В конкретных вариантах осуществления индивидуум может страдать, или предполагают, что он может страдать, сепсисом, эндокардитом, инфекцией суставов, включая искусственные суставы, или инфекцией мягких тканей. В варианте осуществления индивидуум является новорожденным, страдающим или, как предполагают, страдающим, сепсисом. В другом варианте осуществления предполагаемая инфекция развивается в матке, например, внутриамниотическая инфекция (хориоамнионит), во время беременности.

В контексте настоящего изобретения термин "контроль" или "контрольная группа" относится к биологическому образцу от индивидуума или образцам от группы индивидуумов, соответственно, являющихся здоровыми или считающихся здоровыми, т.е. нестрадающими заболеванием или по меньшей мере нестрадающими тем же заболеванием, что и тестируемый индивидуум. Предпочтительно, контроль или контрольная группа содержит образцы от здоровых индивидуумов, соответствующих индивидууму по различным параметрам, например, схожий возраст, один и тот же пол, один и тот социальный класс или одна и та же этническая группа, или живущих, по существу, в одной и той же области страны или города.

В контексте настоящего изобретения термин "здоровый" предназначен для обозначения индивидуумов, у которых не наблюдают каких-либо признаков конкретного заболевания и, предпочтительно, у которых в настоящее время не развивается заболевание. Например, у здорового индивидуума не наблюдают признаков инфекции или заболевания, тем не менее, он является носителем множества симбиотических видов микроорганизмов. Предпочтительно, индивидуум не является инфицированным, но может находиться на стадии инфекции, когда инфекция не очевидна.

В рамках изобретения термин "биологический образец" включает любой биологический образец, полученный от индивидуума, например, из организма индивидуума. Примеры таких биологических образцов включают цельную крови, фракции крови, такие как плазма, сыворотка, мазки или смывы ткани, мокроту, бронхиальный аспират, мочу, сперму, кал, желчь, желудочно-кишечные секреты, секреты половой системы, амниотическую жидкость, синовиальную жидкость, лимфу, ликвор, костный мозг, аспираты органов и биоптаты ткани, включая щипковые биоптаты. Необязательно, биологический образец можно получать из слизистой оболочки пациента. Термин "биологический образец" также может включать обработанные биологические образцы, такие как фракции или изоляты, например, нуклеиновые кислоты или выделенные клетки. Предпочтительно, биологический образец содержит нуклеиновые кислоты, например, геномную ДНК или мРНК, таким образом, что можно определять последовательность нуклеиновых кислот. В варианте осуществления биологический образец может являться образцом, полученным из ткани, в которой наблюдают признаки патологического состояния, например, признаки инфекции. В предпочтительном варианте осуществления биологический образец является кровью или плазмой крови, полученной от индивидуума. Образец анализируют способами по изобретению, и во время осуществления способа или впоследствии, как правило, не возвращают в организм. В большинстве вариантов осуществления присутствие организма индивидуума не является обязательным для осуществления способов по изобретению.

В одном из вариантов осуществления биологический образец является плазмой крови, предпочтительно, полученной непосредственно из индивидуума. Плазма крови, предпочтительно, является бесклеточной, предпочтительно, в основном/главным образом, бесклеточной, например, содержащей менее 10000, 1000, 100 или 10 клеток на мл. Биологический образец, например, плазма крови, может содержать свободные циркулирующие нуклеиновые кислоты, включающие нуклеиновые кислоты индивидуума и нуклеиновые кислоты, не принадлежащие индивидууму, например, нуклеиновые кислоты микроорганизма. В одном из вариантов осуществления биологический образец можно разводить или концентрировать. В другом варианте осуществления образец обрабатывают перед секвенированием, предпочтительно, перед секвенированием образец очищают для удаления клеточных компонентов, таких как липиды и белки. В одном из вариантов осуществления биологический образец обрабатывают перед секвенированием таким образом, что секвенируют только бесклеточные нуклеиновые кислоты.

Ткани пациента, из которого можно получать биологический образец, включают, в качестве неограничивающих примеров, ткани горла, рта, носа, желудка, кишечника, кожи, суставов, печени, поджелудочной железы, легкого, нервную ткань, ткани шейки матки, влагалища, матки, уретры, прямой кишки, полового члена и мышечную ткань. В настоящем изобретении можно использовать любой подходящий способ получения биологического образца из пациента и/или соответствующей ткани.

Термин "in vivo" относится к расположению в организме индивидуума.

Термин "геном" относится к общему количеству генетической информации в хромосомах организма или клетки.

Термин "экзом" относится к части генома организма, образованной экзонами, кодирующими части экспрессируемых генов. Экзом представляет собой генетическую программу, используемых при синтезе белков и других функциональных продуктов генов. Он является наиболее функционально важной частью генома и, таким образом, вероятнее всего, вносит вклад в фенотип организма. По оценкам, экзом генома человека составляет 1,5% всего генома (Nget al., 2008, PLoS Gen 4(8):1-15).

Термин "транскриптом" относится к набору всех молекул РНК, включая мРНК, рРНК, тРНК и другие некодирующие РНК, продуцируемые в одной клетке или популяции клеток. В контексте настоящего изобретения термин "транскриптом" означает набор всех молекул РНК, продуцируемых в одной клетке, популяции клеток или всех клетках указанного индивидуума в некоторый момент времени.

Термин "генетический материал" включает выделенную нуклеиновую кислоту, ДНК или РНК, часть двойной цепи, часть хромосомы или целый геном организма или клетки, в частности, его экзом или транскриптом.

В рамках изобретения "нуклеиновая кислота", предпочтительно, является дезоксирибонуклеиновой кислотой (ДНК) или рибонуклеиновой кислотой (РНК). Нуклеиновые кислоты включают геномную ДНК, кДНК, мРНК, рекомбинантно получаемые и химически синтезированные молекулы. Нуклеиновая кислота может являться одноцепочечной или двухцепочечной и линейной или ковалентно закольцованной молекулой, а также их смесями. Нуклеиновая кислота может быть выделенной. Предпочтительно, нуклеиновая кислота является свободной циркулирующей молекулой ДНК и/или РНК. В одном из вариантов осуществления термин "нуклеиновая кислота" следует понимать как означающий "последовательность нуклеиновой кислоты". Кроме того, перед секвенированием нуклеиновые кислоты можно обрабатывать, например, обогащать или амплифицировать. В случаях, когда нуклеиновая кислота, полученная из образца, является РНК, РНК можно подвергать обратной транскрипции в ДНК для секвенирования или можно секвенировать саму РНК.

Термин "мутация" относится к изменению или различию в последовательности нуклеиновой кислоты (замене, добавлению или делеции нуклеотида) по сравнению с референсом. "Соматическая мутация" может возникать в любой из клеток организма, за исключением половых клеток (сперматозоидов и яйцеклеток), и, таким образом, не передается детям. Эти изменения могут (но не всегда) вызывать злокачественные новообразования или другие заболевания. Предпочтительно, мутация является несинонимичной мутацией. Термин "несинонимичная мутация" относится к мутации, предпочтительно, замене нуклеотида, приводящей к замене аминокислоты, такой как замена аминокислоты в продукте трансляции.

В рамках изобретения термин "мутация" включает точечные мутации, инсерции/делеции, слияния, хромотрипсис и редактирование РНК.

В рамках изобретения термин "инсерция/делеция" относится к особому классу мутаций, определяемых как мутации, приводящие к колокализованной инсерции и делеции и общему приобретению или потере нуклеотидов. В кодирующих областях генома, если длина инсерции/делеции не кратна 3, она приводит к мутации со сдвигом рамки считывания. Инсерции/делеции могут отличаться от точечной мутации; если при инсерции/делеции нуклеотиды добавляются или удаляются из последовательности, точечная мутация является формой замены, при которой заменяется один из нуклеотидов.

В рамках изобретения термин "хромотрипсис" относится к генетическому явлению, при котором конкретные области генома разрушаются, а затем соединяются в результате одного разрушительного события.

Слияние может приводить к образованию гибридных генов, образующихся из двух ранее отдельных генов. Оно может происходить в результате транслокации, интерстициальной делеции или хромосомной инверсии. Зачастую слитые гены являются онкогенами. Онкогенные слитые гены могут приводить к образованию продукта гена с новой или иной функцией относительно двух партнеров по слиянию. Альтернативно, протоонкоген подвергается слиянию с сильным промотором, и, таким образом, онкогенная функция начинает выполняться в результате положительной регуляции, вызванной сильным промотором вышележащего партнера по слиянию. Онкогенные слитые транскрипты также могут образовываться в результате альтернативного сплайсинга или сквозного прочитывания.

В контексте настоящего изобретения термин "секвенирование" означает определение последовательности по меньшей мере одной нуклеиновой кислоты и включает любой способ, используемый для определения порядка оснований в цепи по меньшей мере одной нуклеиновой кислоты. Предпочтительным способом секвенирования является высокопроизводительное секвенирование, такое как секвенирование нового поколения или секвенирование третьего поколения.

Для уточнения: термины "секвенирование нового поколения" или "NGS" в контексте настоящего изобретения означают все технологии высокопроизводительного секвенирования, которые, в отличие от "общепринятой" методологии секвенирования, известной как способ Сэнгера, позволяют прочитывать матрицы нуклеиновых кислот случайным образом параллельно по всей длине генома посредством фрагментации всего генома на небольшие части. С помощью таких технологий NGS (также известных как технологии массового параллельного секвенирования) можно получать информацию о последовательности нуклеиновой кислоты всего генома, экзома, транскриптома (всех транскрибированных последовательностей генома) или метилома (всех метилированных последовательностей генома) за очень небольшие периоды времени, например, в пределах 1-2 недель, предпочтительно - в пределах 1-7 дней, или наиболее предпочтительно - в пределах менее чем 24 часов, и они, в принципе, делают возможными подходы секвенирования отдельных клеток. В контексте настоящего изобретения можно использовать множество платформ NGS, являющихся коммерчески доступными или упоминаемых в литературе, например, подробно описанных в Zhang et al., 2011, The impact of next-generation sequencing on genomics. J. Genet Genomics 38:95-109; или Voelkerding et al., 2009, Next generation sequencing: From basic research to diagnostics, Clinical chemistry 55:641-658. Неограничивающими примерами таких технологий/платформ NGS являются

1) Технология секвенирования посредством синтеза, известная как пиросеквенирование, воплощенная, например, в GS-FLX 454 Genome SequencerTM от дочерней компании Roche, 454 Life Sciences (Branford, Connecticut), впервые описанная в Ronaghi et al., 1998, A sequencing method based on real-time pyrophosphate, Science 281:363-365. В этой технологии используют эмульсионную ПЦР, при которой связывающие одноцепочечную ДНК частицы инкапсулируют посредством интенсивного встряхивания в водных мицеллах, содержащих реагенты для ПЦР, окруженные маслом для эмульсионной ПЦР. Во время пиросеквенирования регистрируют свет, испускаемый молекулами фосфата при встраивании нуклеотидов, в то время как полимераза синтезирует цепь ДНК.

2) Подходы секвенирования посредством синтеза, разработанные Solexa (сейчас являющейся частью Illumina Inc., San Diego, California), основанные на использовании обратимых красителей-терминаторов и воплощенные, например, в Illumina/Solexa Genome AnalyzerTM и Illumina HiSeq 2000 Genome AnalyzerTM. В этой технологии все четыре нуклеотида добавляют одновременно к олиго-примированным фрагментам кластера в каналах ячейки вместе с ДНК-полимеразой. С помощью мостиковой амплификации удлиняют цепи кластера с использованием всех четырех флуоресцентно меченых нуклеотидов для секвенирования.

3) Подходы секвенирования посредством лигирования, например, воплощенные в платформе SOLidTM от Applied Biosystems (в настоящее время Life Technologies Corporation, Carlsbad, California). В этой технологии совокупность всех возможных олигонуклеотидов фиксированной длины метят в соответствии с положением секвенирования. Олигонуклеотиды отжигают и лигируют; предпочтительное лигирование с помощью ДНК-лигазы в случае совпадающих последовательностей приводит к получению сигнала, дающего представление о нуклеотиде в этом положении. Перед секвенированием ДНК амплифицируют посредством эмульсионной ПЦР. Полученные частицы, каждая из которых содержит лишь копии одной и той же молекулы ДНК, осаждают на предметное стекло. В качестве второго примере, в платформе PolonatorTM G.007 от Dover Systems (Salem, New Hampshire) также используют подход секвенирования посредством лигирования с помощью произвольной эмульсионной ПЦР с частицами для амплификации фрагментов ДНК для параллельного секвенирования.

4) Технологии одномолекулярного секвенирования, например, воплощенные в системе PacBio RS от Pacific Biosciences (Menlo Park, California) или платформе HeliScopeTM от Helicos Biosciences (Cambridge, Massachusetts). Отличительной характеристикой этой технологии является возможность секвенирования отдельных молекул ДНК или РНК без амплификации, определяемая как одномолекулярное секвенирование ДНК в реальном времени (SMRT). Например, в HeliScope используют высокочувствительную систему детекции флуоресценции для прямой детекции каждого нуклеотида при синтезе. Схожий подход, основанный на резонансном переносе энергии флуоресценции (FRET), разработан Visigen Biotechnology (Houston, Texas). Другие одномолекулярные способы на основе флуоресценции разработаны U.S. Genomics (GeneEngineTM) и Genovoxx (AnyGeneTM).

5) Нанотехнологии для одномолекулярного секвенирования, в которых используют различные наноструктуры, например, расположенные на чипе для мониторинга движения молекулы полимеразы на одной цепи во время репликации. Неограничивающими примерами подходов на основе нанотехнологий являются платформа GridONTM от Oxford Nanopore Technologies (Oxford, UK), платформы для нанопорового секвенирования с гибридизацией (HANSTM), разработанные Nabsys (Providence, Rhode Island), и запатентованная платформа для секвенирования ДНК с использованием лигазы с технологией наносфер ДНК (DNB), названная комбинаторное лигирование зонд-якорь (cPALTM).

6) Технологии на основе электронной микроскопии для одномолекулярного секвенирования, например, технологии, разработанные LightSpeed Genomics (Sunnyvale, California) и Halcyon Molecular (Redwood City, California)

7) Ионное полупроводниковое секвенирование, основанное на детекции ионов водорода, высвобождаемых во время полимеризации ДНК. Например, Ion Torrent Systems (San Francisco, California) используют высокоплотный массив микролунок для массового параллельного осуществления этого биохимического способа. Каждая лунка содержит разные матрицы ДНК. Под лунками находится ионно-чувствительный слой, а под ним запатентованный ионный датчик.

Другие способы секвенирования, которые можно использовать в контексте изобретения, включают секвенирование с использованием туннельных токов (Xuet al., 2007, The electronic properties of DNA bases, Small 3:1539-1543, Di Ventra, 2013, Fast DNA sequencing by electrical means inches closer, Nanotechnology 24:342501). Особенно предпочтительные способы секвенирования нового поколения (NGS) включают способы секвенирования Illumina, IONTorrent и NanoPore.

Предпочтительно, в качестве исходного материала для NGS служат препараты ДНК и РНК. Такие нуклеиновые кислоты легко можно получать из биологических образцов, например, из крови, или свежих, быстрозамороженных или фиксированных формалином образцов ткани, или свежевыделенных клеток, или циркулирующих опухолевых клеток (CTC), присутствующих в периферической крови пациентов. Нормальную (немутантную) геномную ДНК или РНК можно выделять из нормальной соматической ткани, однако предпочтительными являются зародышевые клетки. ДНК или РНК зародышевой линии можно выделять из мононуклеарных клеток периферической крови (PBMC) у пациентов с негематологическими злокачественными новообразованиями. Хотя выделенные нуклеиновые кислоты могут являться сильно фрагментированными, они все равно подходят для NGS.

В литературе описано несколько специальных способов NGS для секвенирования экзома (см. обзор, например, в Teer and Mullikin, 2010, Human Mol Genet 19:R145-51), все из которых можно использовать в комбинации с настоящим изобретением. Во многих из этих способов (описанных, например, как фиксация генома, разбиение генома, обогащение генома и т.д.) используют способы гибридизации, и они включают подходы гибридизации с использованием чипов (например, Hodges et al., 2007, Nat Genet 39:1522-1527) и жидкостные подходы (например, Choi et al., 2009, Proc Natl Acad Sci USA 106:19096-19101). Также доступны коммерческие наборы для подготовки образцов ДНК и последующей фиксации экзома: например, Illumina Inc. (San Diego, California) предлагают набор для подготовки образцов ДНК TruSeqTM и набор для обогащения экзома Exome Enrichment Kit TruSeqTM.

После секвенирования нуклеиновых кислот полученные последовательности (секвенированные риды) можно сравнивать с одной или более базами данных, содержащими генетическую информацию, предпочтительно, о множестве видов, таким образом, что можно определять, что секвенированные риды происходят из конкретного биологического вида, например, индивидуума и/или конкретного микроорганизма, что делает возможным определение количества секвенированных ридов, картируемых к конкретному микроорганизму, и количества секвенированных ридов, картируемых к биологическому виду, т.е. картируемых к индивидууму, а также картируемых к любому микроорганизму. Как описано выше, в настоящем изобретении не используют секвенированные риды, которые нельзя картировать к какому-либо виду. Способы картирования секвенированных ридов для получения информации о видах их происхождения, хорошо известны в этой области, и в настоящем изобретении можно использовать любой такой подходящий способ. Например, можно использовать ультрабыстрый метагеномный способ классификации последовательностей Kraken, описанный в Wood and Salzberg, 2014, Genome Biol 15:R46. Другим примером способа является NextGenMap, описанный в Sedlazeck et al., 2013, Bioinformatics 29:2790-2791. Еще одним примером способа является облачный биоинформатический конвейер для ультрабыстрой идентификации патогенов при секвенировании нового поколения клинических образцов, как описано в Naccache et al., 2014, Genome Res 24:1180-1192. Дополнительные известные в этой области способы, которые можно использовать в настоящем изобретении, включают, в качестве неограничивающих примеров, способы, описанные в Huson et al., 2007, Genome Res 17:377-386; Freitas et al., 2015, Nucl Acids Res 43:e69; и Kim et al., 2016, Genome Res 26:1721-1729.

В некоторых вариантах осуществления для уменьшения количества ложноположительных результатов при детекции и сравнении последовательностей предпочтительным является определение/сравнение последовательностей в параллелях. Таким образом, предпочтительно определять последовательности нуклеиновой кислоты в биологическом образце два раза, три раза или более. В одном из вариантов осуществления последовательности нуклеиновой кислоты из образца опухоли определяют два раза, три раза или более. Также можно определять последовательность несколько раз посредством по меньшей мере однократного определения последовательности в геномной ДНК и по меньшей мере однократного определения последовательности в РНК указанного образца. Например, посредством определения разброса между параллелями образца можно оценивать ожидаемую долю ложноположительных (FDR) мутаций. Технические повторы образца должны приводить к получению идентичных результатов, и любая определенная мутация при таком сравнении повторов является ложноположительной. Кроме того, различные качественные показатели (например, перекрытие или качество SNP) можно комбинировать в одних качественных баллах с использованием подхода машинного обучения. В случае указанной соматической вариации можно подсчитывать все другие вариации с превосходящими качественными баллами, что делает возможным ранжирование всех вариаций в массиве данных.

В контексте настоящего изобретения термин "база данных" может относиться к организованному набору данных, предпочтительно, в виде системы электронного архивирования, а также к неструктурированному набору данных, такому как озеро данных, являющееся системой или хранилищем данных, хранящихся в своем естественном формате. Озеро данных может являться единственным хранилищем всех корпоративных данных, включая необработанные копии исходных системных данных и преобразованные данные для задач, таких как предоставление отчетности, визуализация, аналитика и машинное обучение. В некоторых вариантах осуществления озеро данных может включать структурированные данные из реляционных баз данных (строки и колонки), полуструктурированные данные (CSV, журналы, XML, JSON), неструктурированные данные (электронная почта, документы, PDF) и/или двоичные данные (изображения, аудио, видео). В варианте осуществления база данных последовательностей представляет собой тип базы данных, состоящий из набора обработанных с помощью компьютера ("цифровых") последовательностей нуклеиновой кислоты, последовательностей белков или другие полимерных последовательностей, хранящихся в памяти компьютера. Предпочтительно, база данных является набором последовательностей нуклеиновой кислоты, т.е. генетической информации, ряда биологических видов. Генетическую информацию можно получать из генома, и/или экзома, и/или транскриптома биологического вида. Примеры баз данных нуклеиновых кислот, которые можно использовать в настоящем изобретении, включают, в качестве неограничивающих примеров, International Nucleotide Sequence Database (INSD), DNA Data Bank of Japan (National Institute of Genetics), EMBL (European Bioinformatics Institute), GenBank (National Center for Biotechnology Information), Bioinformatic Harvester, Gene Disease Database, SNPedia, CAMERA Resource for microbial genomics and metagenomics, EcoCyc (базу данных о геноме и биохимическом аппарате модельного организма E. coli K-12), Ensembl (в которой представлены автоматические базы данных аннотаций для геномов человека, мыши, других позвоночных и эукариот), Ensembl Genomes (в которой геномные данные о бактериях, простейших, грибах, растениях и беспозвоночных многоклеточных представлены посредством унифицированного набора интерактивных и программных интерфейсов (с использованием программной платформы Ensembl)), Exome Aggregation Consortium (ExAC) (данные секвенирования экзома из широкого спектра крупномасштабных проектов по секвенированию (Broad Institute)), PATRIC (PathoSystems Resource Integration Center), MGI Mouse Genome (Jackson Laboratory), JGI Genomes of the DOE-Joint Genome Institute (где представлены базы данных о геномах многих эукариот и микроорганизмов), National Microbial Pathogen Data Resource (организованную вручную базу аннотированных данных о геномах патогенов Campylobacter, Chlamydia, Chlamydophila, Haemophilus, Listeria, Mycoplasma, Neisseria, Staphylococcus, Streptococcus, Treponema, Ureaplasma и Vibrio), RegulonDB (модель комплексной регуляции инициации транскрипции или регуляторной сети клетки E. coli K-12), Saccharomyces Genome Database (геном модельного организма дрожжей), Viral Bioinformatics Resource Center (организованную базу данных, содержащую аннотированные данные о геноме одиннадцати семейств вирусов), платформу SEED (включает все полные геномы микроорганизмов и большинство частичных геномов, платформу используют для аннотирования геномов микроорганизмов с использованием подсистем), WormBase ParaSite (паразитарные виды), UCSC Malaria Genome Browser (геномы видов, вызывающих малярию (Plasmodium falciparum и др.)), Rat Genome Database (геномные и фенотипические данные о Rattus norvegicus), INTEGRALL (базу данных, посвященную интегронам, бактериальным генетическим элементам, вносящим вклад в резистентность к антибиотикам), VectorBase (NIAID Bioinformatics Resource Center for Invertebrate Vectors of Human Pathogens), EzGenome (исчерпывающая информация об организованных вручную геномных проектах по прокариотам (археям и бактериям)), GeneDB (апикомплексные простейшие, кинетопластиды, паразитические гельминты, паразитарные векторы, а также некоторые бактерии и вирусы), EuPathDB (базу данных о эукариотических патогенах, включая амеб, грибы, плазмодии, трипаносоматиды и т.д.); проект "1000 геномов" (где представлены геномы более тысячи анонимных участников из различных этнических групп), проект "Персональный геном" (где представлены геномы человека).

Другие базы данных могут включать персонализированные базы данных, такие как базы данных, содержащие генетическую информацию о здоровых и пораженных тканях одного и того же индивидуума. Такие базы данных можно использовать, например, в способах скрининга на рецидивирование злокачественного новообразования после лечения или способах мониторинга эффективности лечения индивидуума.

В контексте настоящего изобретения термины "рид последовательности" или "рид" используют взаимозаменяемо, и они относятся к конкретной нуклеиновой кислоте любого размера, для которой нуклеотидную последовательность определяют посредством секвенирования, и которую, предпочтительно, приписывают биологическому виду, предпочтительно, картируют к геному соответствующего биологического вида. В предпочтительном варианте осуществления риды классифицируют по конкретным биологическим видам, таким как индивидуум и/или микроорганизмы, предпочтительно, классифицируют по конкретным микроорганизмам. В варианте осуществления риды можно нормализовать по их относительному количеству.

В дополнительном варианте осуществления настоящее изобретение относится к способу диагностики патологического состояния или заболевания, например, инфекционного заболевания, у индивидуума, где осуществляют способ определения патологического состояния или заболевания у указанного индивидуума по настоящему изобретению.

В варианте осуществления изобретение относится к способу мониторинга инфекционного статуса индивидуума, предпочтительно, мониторинга индивидуума во время лечения и мониторинга ответа на терапию, где осуществляют способ определения инфекционного статуса у указанного индивидуума по настоящему изобретению.

Такие способы, предпочтительно, относятся к идентификации индивидуума, страдающего заболеванием, предпочтительно, к скринингу на заболевание, предпочтительно, к профилактическому медицинскому анализу. В предпочтительном варианте осуществления с помощью таких способов определяют корреляцию наличия микроорганизма и развития заболевания у индивидуума.

Настоящее изобретение, предпочтительно, относится к способу, где патогенное состояние отличается аномальными, особенно патогенными количествами нуклеиновых кислот по меньшей мере одного микроорганизма, например, по меньшей мере одного вирусного, бактериального, грибкового или паразитического организма.

Можно определять наличие любого микроорганизма, предпочтительно, микроорганизма, последовательность нуклеиновой кислоты которого известна, у индивидуума, а также его можно определять в качестве причинного фактора заболевания у индивидуума. Примеры микроорганизмов, наличие которых можно определять у индивидуума, включают вирусы, бактерии, грибы и паразиты. Неограничивающие примеры бактерий включают Neisseria meningitis, Streptococcus pneumoniae, Streptococcus pyogenes, Moraxella catarrhalis, Bordetella pertussis, Staphylococcus aureus, Clostridium tetani, Corynebacterium diphtheria, Haemophilus influenza, Pseudomonas aeruginosa, Streptococcus agalactiae, Chlamydia trachomatis, Chlamydia pneumoniae, Helicobacter pylori, Escherichia coli, Bacillus anthracis, Yersinia pestis, Staphylococcus epidermis, Clostridium perfringens, Clostridium botulinum, Legionella pneumophila, Coxiella burnetii, Brucella spp., такие как B. abortus, B. canis, B. melitensis, B. neotomae, B. ovis, B. suis, B. pinnipediae, Francisella spp., такие как F. novicida, F. philomiragia, F. tularensis, Neisseria gonorrhoeae, Treponema pallidum, Haemophilus ducreyi, Enterococcus faecalis, Enterococcus faecium, Staphylococcus saprophyticus, Yersinia enterocolitica, Mycobacterium tuberculosis, Rickettsia spp., Listeria monocytogenes, Vibrio cholera, Salmonella typhi, Borrelia burgdorferi, Porphyromonas gingivalis, Klebsiella spp., Klebsiella pneumoniae.

Неограничивающие примеры вирусов включают Orthomyxoviridae, такие как вирусы гриппа A, B или C; вирусы Paramyxoviridae, такие как пневмовирусы (например, респираторно-синцитиальный вирус, RSV), рубулавирусы (например, вирус эпидемического паротита), парамиксовирусы (например, вирус парагриппа), метапневмовирусы и морбилливирусы (например, корь); Poxviridae, такие как ортопоксвирус (например, Variola vera, включая Variola major и Variola minor); Picornaviridae, такие как энтеровирусы (например, полиовирус, например, полиовирус типа 1, типа 2 и/или типа 3, энтеровирус EV71, вирус коксаки A или B), риновирусы, гепарнавирусы, кардиовирусы и афтовирусы; буньявирусы, такие как ортобуньявирус (например, вирус California encephalitis), флебовирус (например, вирус лихорадки Рифт-Валли) или нейровирус (например, вирус Конго-крымской геморрагической лихорадки); гепарнавирусы (например, вирус гепатита A (HAV), B и C); Filoviridae (например, вирус Эбола (включая эболавирус Заир, эболавирус Берега слоновой кости, эболавирус Рестон или эболавирус Судан) или вирус Марбург); тогавирусы (например, рубивирус, альфавирус и артеривирус, включая вирус краснухи); флавивирусы (например, вирус клещевого энцефалита (TBE), вирус денге (типов 1, 2, 3 или 4), вирус желтой лихорадки, вирус японского энцефалита, вирус болезни леса Киассанур, вирус лихорадки Западного Нила, вирус энцефалита Сент-Луис, вирус таежного весенне-летнего энцефалита и вирус Повассан); пестивирусы (например, вирус диареи крупного рогатого скота (BVDV), вирус классической чумы свиней (CSFV) и вирус пограничной болезни овец (BDV)); гепаднавирус (например, вирус гепатита B, вирус гепатита C, вирус гепатита дельта, вирус гепатита E или вирус гепатита G); рабдовирусы (например, лиссавирус, вирус бешенства и везикуловирус (VSV)); Caliciviridae (например, вирус Норуолк (норовирус) и Норуолк-подобные вирусы, такие как вирус Гавайи и вирус Снежных гор); коронавирус (например, коронавирус SARS, вирус инфекционного бронхита птиц (IBV), вирус гепатита мышей (MHV) и вирус инфекционного гастроэнтерита свиней (TGEV)); ретровирусы (например, онковирус, лентивирус (например, ВИЧ-1 или ВИЧ-2) или спумавирус); реовирусы (например, ортореовирус, ротавирус, орбивирус и колтивирус); парвовирусы (например, парвовирус B19); герпесвирусы (например, герпесвирус человека, такой как вирус простого герпеса (HSV), например, HSV типов 1 и 2, вирус ветряной оспы (VZV), вирус Эпштейна-Барр (EBV), цитомегаловирус (CMV), герпесвирус человека 6 (HHV6), герпесвирус человека 7 (HHV7) и герпесвирус человека 8 (HHV8)); Papovaviridae (например, папилломавирусы и полиoмавирусы, например, серотипов 1, 2, 4, 5, 6, 8, 11, 13, 16, 18, 31, 33, 35, 39, 41, 42, 47, 51, 57, 58, 63 или 65, предпочтительно, одного или более из серотипов 6, 11, 16 и/или 18); аденовирусы, такие как аденовирус серотипа 36 (Ad-36).

Неограничивающие примеры грибов включают дерматофиты, включая Epidermophyton floccusum, Microsporum audouini, Microsporum canis, Microsporum distortum, Microsporum equinum, Microsporum gypsum, Microsporum nanum, Trichophyton concentricum, Trichophyton equinum, Trichophyton gallinae, Trichophyton gypseum, Trichophyton naegnini, Trichophyton mentagrophytes, Trichophyton quinckeanum, Trichophyton rubrum, Trichophyton schoenleini, Trichophyton tonsurans, Trichophyton verrucosum, T. verrucosum var. album, var. discoides, var. ochraceum, Trichophyton violaceum и/или Trichophyton faviforme; Aspergillus fumigatus, Aspergillus flavus, Aspergillus niger, Aspergillus nidulans, Aspergillus terreus, Aspergillus sydowi, Aspergillus flavatus, Aspergillus glaucus, Blastoschizomyces capitatus, Candida albicans, Candida enolase, Candida tropicalis, Candida glabrata, Candida krusei, Candida parapsilosis, Candida stellatoidea, Candida kusei, Candida parakwsei, Candida lusitaniae, Candida pseudotropicalis, Candida guilliermondi, Cladosporium carrionii, Coccidioides immitis, Blastomyces dermatidis, Cryptococcus neoformans, Geotrichum clavatum, Histoplasma capsulatum, Microsporidia, Encephalitozoon spp., Septata intestinalis и Enterocytozoon bieneusi; Brachiola spp., Microsporidium spp., Nosema spp., Pleistophora spp., Trachipleistophora spp., Vittaforma spp., Paracoccidioides brasiliensis, Pneumocystis carinii, Pythiumn insidiosum, Pityrosporum ovale, Sacharomyces cerevisae, Saccharomyces boulardii, Saccharomyces pombe, Scedosporium apiosperum, Sporothrix schenckii, Trichosporon beigelii, Toxoplasma gondii, Penicillium marneffei, Malassezia spp., Fonsecaea spp., Wangiella spp., Sporothrix spp., Basidiobolus spp., Conidiobolus spp., Rhizopus spp., Mucor spp., Absidia spp., Mortierella spp., Cunninghamella spp., Saksenaea spp., Alternaria spp., Curvularia spp., Helminthosporium spp., Fusarium spp., Aspergillus spp., Penicillium spp., Monolinia spp., Rhizoctonia spp., Paecilomyces spp., Pithomyces spp. и Cladosporium spp.

Неограничивающие примеры паразитов включают плазмодии, такие как P. falciparum, P. vivax, P. malariae и P. ovale, а также паразитов семейства Caligidae, в частности, из родов Lepeophtheirus и Caligus, например, морских вшей, таких как Lepeophtheirus salmonis и Caligus rogercresseyi.

В контексте настоящего изобретения термин "резистентность к антибиотикам" означает утрату восприимчивости бактерий к уничтожению или ингибирующим рост свойствам антибиотика. Он также относится к резистентности микроорганизма к противомикробному лекарственному средству, которое исходно было эффективным при лечении инфекций, вызванных этим микроорганизмом. Резистентные микроорганизмы, включая бактерии, грибы, вирусы и паразитов, способны противостоять воздействию противомикробных лекарственных средств, таких как антибактериальные лекарственные средства, противогрибковые средства, противовирусные средства и противомалярийные средства, таким образом, что стандартное лечение становится неэффективным, и инфекции персистируют.

В рамках изобретения термин "опухоль" или "опухолевое заболевание" относится к аномальному росту клеток (называемых неопластическими клетками, онкогенными клетками или опухолевыми клетками), предпочтительно, образующих узел или очаг. Термин "опухолевая клетка" означает аномальную клетку, растущую посредством быстрой, неконтролируемой клеточной пролиферации и продолжающей расти после исчезновения стимулов, инициировавших рост. Опухоли демонстрируют частичное или полное отсутствие структурной организации и функциональной координации с нормальной тканью и, как правило, образуют отдельную массу ткани, которая может являться доброкачественной, предзлокачественной или злокачественной.

Злокачественные новообразования (медицинский термин: злокачественная неоплазия) являются классом заболеваний, при которых группа клеток демонстрирует неконтролируемый рост (деление за пределами нормы), инвазию (проникновение в смежные ткани и их деструкцию) и иногда метастазирование (распространение в другие части организма с лимфой или кровью). Эти три свойства злокачественных новообразований отличают их от доброкачественных опухолей, являющихся самоограничивающимися и неинвазирующими или неметастазирующими. Большинство злокачественных новообразований образуют опухоль, но некоторые, подобные лейкозу, не образуют. Термины "злокачественная неоплазия" и "злокачественная опухоль", по существу, являются синонимами термина "злокачественное новообразование".

Новообразование представляет собой аномальную массу ткани, являющуюся результатом неоплазии. Неоплазия ("новообразование" в переводе с греческого) представляет собой аномальную пролиферацию клеток. Рост клеток превышает рост нормальных тканей вокруг них и не координируется с ним. Рост сохраняется в том же избыточном объеме даже после исчезновения стимулов. Как правило, он вызывает образование узла или опухоли. Неоплазии могут являться доброкачественными, предзлокачественными или злокачественными.

В рамках изобретения термин "рост опухоли" относится к склонности опухоли к увеличению в размере и/или склонности опухолевых клеток к пролиферации.

В целях по настоящему изобретению термины "злокачественное новообразование" и "злокачественное заболевание" используют взаимозаменяемо с терминами "опухоль" и "опухолевое заболевание".

Злокачественные новообразования классифицируют по типу клеток, напоминающих опухоль и, таким образом, ткань, предположительно, являющуюся источником опухоли. Это является классификацией по гистологии и локализации, соответственно.

В рамках изобретения термин "злокачественное новообразование" включает карциномы, аденокарциномы, бластомы, лейкозы, семиномы, меланомы, тератомы, лимфомы, нейробластомы, глиомы, рак прямой кишки, рак эндометрия, рак почки, рак надпочечников, рак щитовидной железы, гемобластоз, рак кожи, злокачественное новообразование головного мозга, рак шейки матки, рак кишечника, рак печени, рак толстого кишечника, рак желудка, рак тонкого кишечника, рак головы и шеи, рак желудочно-кишечного тракта, рак лимфоузлов, рак пищевода, колоректальный рак, рак поджелудочной железы, рак ушей, носа и горла (ЛОР-органов), рак молочной железы, рак предстательной железы, рак матки, рак яичников и рак легких и их метастазы. Их примерами являются карциномы легких, карциномы молочной железы, карциномы предстательной железы, карциномы толстого кишечника, почечноклеточные карциномы, карциномы шейки матки или метастазы типов злокачественных новообразований или опухолей, описанных выше. В рамках изобретения термин "злокачественное новообразование" также включает метастазы злокачественного новообразования и рецидив злокачественного новообразования.

В рамках изобретения "карцинома" является злокачественной опухолью, возникающей из эпителиальных клеток. Эта группа представляет собой наиболее распространенные злокачественные новообразования, включая распространенные формы рака молочной железы, предстательной железы, легких и толстого кишечника. "Аденокарцинома" представляет собой злокачественное новообразование, возникающее в железистой ткани. Эта ткань также является частью более крупной категории тканей, известной как эпителиальная ткань. Эпителиальная ткань включает кожу, железы и различные другие ткани, выстилающие полости и органы тела. Эмбриологически эпителий происходит из эктодермы, эндодермы и мезодермы. Для классификации в качестве аденокарциномы клетки не обязательно должны быть частью железы, при условии, что они обладают секреторными свойствами. Эта форма карциномы может возникать у некоторых высших млекопитающих, включая людей. Хорошо дифференцированные аденокарциномы напоминают железистую ткань, из которой они происходят, в то время как плохо дифференцированные могут не напоминать ее. Посредством окрашивания клеток из биоптата патолог определяет, является ли опухоль аденокарциномой или некоторым другим типом злокачественного новообразования. Аденокарциномы могут возникать во многих тканях организма по причине повсеместного расположения желез в нем. Хотя каждая железа может не секретировать одно и то же вещество, пока клетка выполняет экзокринную функцию, ее считают железистой, и, таким образом, ее злокачественную форму называют аденокарциномой. Злокачественные аденокарциномы осуществляют инвазию в другие ткани и зачастую метастазируют, если для этого достаточно времени. Аденокарцинома яичника является наиболее распространенным типом карциномы яичника. Она включает серозные и муцинозные аденокарциномы, светлоклеточную аденокарциному и эндометриоидную аденокарциному.

Термин "метастазирование" означает распространение злокачественных клеток из исходного участка в другую часть организма. Образование метастаза является очень сложным процессом и зависит от отщепления злокачественных клеток от первичной опухоли, инвазии во внеклеточный матрикс, пенетрации через эндотелиальные базальные мембраны для проникновения в полости и сосуды тела, а затем, после транспорта с кровью, инфильтрации целевых органов. И наконец, рост новой опухоли, т.е. вторичной опухоли или метастатической опухоли, в целевом участке зависит от ангиогенеза. Метастазирование опухоли зачастую происходит даже после удаления первичной опухоли, т.к. опухолевые клетки или компоненты могут оставаться в организме и развивать метастатический потенциал. В одном из вариантов осуществления термин "метастаз" в рамках изобретения относится к "отдаленному метастазу", термину, относящемуся к метастазу, находящемуся на значительном расстоянии от первичной опухоли и системы регионарных лимфоузлов.

Клетки вторичной или метастатической опухоли подобны клеткам в исходной опухоли. Это означает, например, то, что, если рак молочной железы метастазирует в печень, вторичная опухоль состоит из аномальных клеток молочной железы, а не аномальных клеток печени. В этом случае опухоль в печени называют метастатическим раком молочной железы, а не раком печени.

Термин "циркулирующие опухолевые клетки" или "CTC" относится к клеткам, отщепившимся от первичной опухоли или метастазов опухоли и циркулирующим в кровотоке. CTC могут представлять собой основу для последующего роста дополнительных опухолей (метастазирования) в других тканях. Циркулирующие опухолевые клетки обнаруживают в количестве порядка 1-10 CTC на мл цельной крови у пациентов с метастатическим заболеванием. Разработаны исследовательские способы выделения CTC. В этой области описано несколько исследовательских способов выделения CTC, например, способы, в которых используют то, что эпителиальные клетки, как правило, экспрессируют молекулу клеточной адгезии EpCAM, отсутствующую в нормальных клетках крови. Захват с помощью иммуномагнитных частиц включает обработку образцов крови антителом против EpCAM, конъюгированным с магнитными частицами, с последующим разделением меченых клеток в магнитном поле. Затем выделенные клетки окрашивают с помощью антитела против другого эпителиального маркера, цитокератина, а также общего лейкоцитарного маркера CD45 так, чтобы различать редкие CTC и примеси лейкоцитов. С помощью этого надежного и полуавтоматизированного подхода идентифицируют CTC со средним выходом приблизительно 1 CTC/мл и чистотой 0,1% (Allard et al., 2004, Clin Cancer Res 10:6897-6904). Во втором способе выделения CTC используют микрофлюидное устройство для захвата CTC, в котором цельную кровь пропускают через камеру, покрытую 80000 микростолбиков, которые делали функциональными, покрывая антителом против EpCAM. Затем CTC окрашивают с помощью вторичных антител против цитокератина или тканеспецифических маркеров, таких как PSA при раке предстательной железы или HER2 при раке молочной железы, и визуализируют посредством автоматизированного сканирования микростолбиков в нескольких плоскостях в трехмерных координатах. С помощью CTC-чипов можно идентифицировать у пациентов цитокератин-положительные циркулирующие опухолевые клетки с медианой выхода 50 клеток/мл и чистотой в диапазоне 1-80% (Nagrath et al., 2007, Nature 450:1235-1239). Другим способом выделения CTC является использование анализа циркулирующих опухолевых клеток (CTC) CellSearchTM от Veridex, LLC (Raritan, NJ), с помощью которого захватывают, идентифицируют и подсчитывают CTC в пробирке с кровью. Система CellSearchTM представляет собой одобренную Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) США методологию для подсчета CTC в цельной крови, основанную на комбинации иммуномагнитного мечения и автоматизированной цифровой микроскопии. Существуют другие способы выделения CTC, описанные в литературе, все из которых можно использовать в комбинации с настоящим изобретением.

Рецидив происходит, когда у индивидуума снова возникает состояние, которым он страдал в прошлом. Например, если пациент страдал опухолевым заболеванием, его подвергли успешному лечению указанного заболевания, но у него снова развилось указанное заболевание, то указанное вновь развившееся заболевание можно считать рецидивом. Однако, в рамках изобретение рецидив опухолевого заболевания, необязательно, может возникать в очаге исходного опухолевого заболевания. Таким образом, например, если пациент страдал раком молочной железы, и его подвергли успешному лечению, рецидив может представлять собой возникновение рака молочной железы или возникновение опухоли в ином очаге, чем молочная железа. Рецидив опухоли также включает ситуации, когда опухоль возникает в ином очаге, чем очаг исходной опухоли, а также в очаге исходной опухоли. Предпочтительно, исходная опухоль, по причине наличия которой пациента подвергали лечению, является первичной опухолью, а опухоль в ином очаге, чем очаг исходной опухоли, является вторичной или метастатической опухолью.

Термин "лечение" означает введение соединения или композиции, как представлено в настоящем описании, индивидууму для профилактики или устранения заболевания, такого как инфекционное заболевание, а также включает уменьшение размера опухоли или количества опухолей у индивидуума; прекращение или замедление развития заболевания у индивидуума; ингибирование или замедление развития нового заболевания у индивидуума; снижение частоты или тяжести симптомов и/или рецидивирования у индивидуума, который страдает или страдал заболеванием; и/или пролонгирование, т.е. увеличение, продолжительности жизни индивидуума. В частности, термин "лечение заболевания" включает излечение, уменьшение продолжительности, улучшение, профилактику, замедление или ингибирование прогрессирования или ухудшения или профилактику или задержку дебюта заболевания или его симптомов.

Термин "иметь риск" относится к индивидууму, т.е. пациенту, определенному в качестве имеющего более высокую, чем в норме, вероятность развития заболевания, в частности, злокачественного новообразования, по сравнению с общей популяцией. Кроме того, индивидуум, страдавший или страдающий заболеванием, в частности, злокачественным новообразованием, является индивидуумом, имеющим повышенный риск развития заболевания, в связи с этим у индивидуума может продолжиться развиваться заболевание. Индивидуумы, имеющие или имевшие злокачественное новообразование, также имеют повышенный риск его метастазирования.

В контексте настоящего изобретения такие термины, как "защищает", "предотвращает", "профилактический" или "протективный" относятся к профилактике и/или лечению возникновения и/или распространения заболевания у индивидуума и, в частности, к минимизации вероятности того, что у индивидуума разовьется заболевание, или задержке развития заболевания. Например, индивидуум, имеющий риск развития опухоли, как описано выше, будет кандидатом для терапии для профилактики развития опухоли.

В варианте осуществления настоящего изобретения, если определяют, что индивидуум имеет инфекционное заболевание или другое патологическое состояние, индивидууму можно вводить соответствующее терапевтическое средство для лечения инфекционного заболевания или другого патологического состояния. Эти терапевтические средства, включая антибиотики и противоопухолевые средства, хорошо известны в этой области, и лечащий врач будет определять то, какое терапевтическое средство в конечном итоге будут вводить индивидууму.

В варианте осуществления настоящее изобретение также относится к устройству для осуществления способа по настоящему изобретению, где сравнение ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, осуществляют с помощью центрального процессора устройства. В варианте осуществления настоящее изобретение также относится к устройству для осуществления способа по настоящему изобретению, где определение количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике осуществляют с помощью центрального процессора устройства. В варианте осуществления настоящее изобретение также относится к устройству для осуществления способа по настоящему изобретению, где баллы значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, осуществляют с помощью центрального процессора устройства. В варианте осуществления центральный процессор представляет собой программируемую пользователем вентильную матрицу (FPGA). В предпочтительном варианте осуществления с помощью устройства осуществляют одно, или несколько, или все из указанных выше вычислений. В варианте осуществления, настоящее изобретение также относится к устройству, с помощью которого осуществляют одно, или несколько, или все из вычислений, связанных с определением наличия патологического состояния у индивидуума.

Таким образом, настоящее изобретение относится к полному диагностическому рабочему потоку для определения наличия микроорганизмов или патологического состояния с использованием биологического образца, основанному на объективном анализе последовательности нуклеиновых кислот, например, свободной циркулирующей ДНК. С помощью способа преимущественно получают определяемый данными диагноз, не зная предполагаемый микроорганизм или патологическое состояние, для него не требуется дизайн специфических праймеров и он обеспечивает возможность детекции множества вирусных, бактериальных, грибковых и паразитических микроорганизмов в одном анализе.

Способ по настоящему изобретению, предпочтительно, не ограничен определением конкретного микроорганизма. В одном из вариантов осуществления способом по настоящему изобретению определяют наличие всех микроорганизмов, предпочтительно, всех микроорганизмов, имеющих значение для патологического состояния у индивидуума, такого как инфекция. Способ по настоящему изобретению, предпочтительно, также не ограничен определением конкретного типа злокачественного новообразования у индивидуума, скорее с помощью него можно определять наличие нескольких типов злокачественных новообразований, а также подтипов злокачественных новообразований. В предпочтительном варианте осуществления различные типы и/или подтипы злокачественных новообразований содержат разные мутации в своем генетическом материале, таким образом, что наличие у индивидуума одного или более типов и/или подтипов злокачественных новообразований можно определять способами по настоящему изобретению.

Таким образом, настоящее изобретение относится к полезному способу идентификации причины инфекции или другого патологического состояния у индивидуума за короткий период времени, таким образом, что можно быстро выбирать соответствующее терапевтическое средство для идентифицированной инфекции или другого патологического состояния.

Таким образом, способ по настоящему изобретению можно использовать для определяемой данными идентификации микроорганизмов в клинических образцах, мониторинга нагрузки микроорганизма у индивидуума и ответа на направленное лечение и в качестве дополнения к стандартным клиническим микробиологическим анализам. Способ по настоящему изобретению также можно использовать для определяемой данными идентификации наличия опухолевых клеток в клинических образцах, мониторинга опухолевой нагрузки у индивидуума и ответа на направленное лечение и в качестве дополнения к стандартным клиническим онкологическим анализам.

Настоящее изобретение подробно описано с использованием фигур и примеров, представленных ниже и используемых исключительно в иллюстративных целях, а не для ограничения настоящего изобретения. Благодаря описанию и примерам специалисту в этой области будут понятны дополнительные варианты осуществления, также включенные в настоящее изобретение.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На фигуре 1 показан полный пробный эксперимент для пациента S9 (тест не прекращали при определении того, что микроорганизм является значимым) по семи разным микроорганизмам. Также показана горизонтальная пунктирная линия, указывающая на пороговое значение статистической значимости.

На фигуре 2 показан полный пробный эксперимент для пациента S11 (тест не прекращали при определении того, что микроорганизм является значимым) по четырем разным микроорганизмам. Также показана горизонтальная пунктирная линия, указывающая на пороговое значение статистической значимости.

На фигуре 3 показан полный пробный эксперимент для пациента S60 (тест не прекращали при определении того, что микроорганизм является значимым) по пяти разным микроорганизмам. Также показана горизонтальная пунктирная линия, указывающая на пороговое значение статистической значимости.

ПРИМЕРЫ

Способы, используемые в настоящем изобретении, представлены в настоящем описании или осуществлены, как известно в этой области и как описано, например, в Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. Все способы, включая использование наборов и реагентов, осуществляют по инструкциям производителя, если не указано иначе.

ПРИМЕР 1

Биологические образцы, т.е. плазму крови, получали от людей, как предполагают, страдающих инфекционным заболеванием. Нуклеиновые кислоты в образцах секвенировали способом секвенирования нового поколения, получая множество ридов последовательности. Эти данные хранили, а затем анализировали следующим образом.

Отдельные риды последовательности сравнивали с одной или более базами данных, содержащими генетическую информацию людей и множества микроорганизмов, таким образом, что каждый рид, по возможности, картировали к конкретному микроорганизму или геному человека. При картировании получали общее количество ридов, картируемых к конкретному микроорганизму, и общее количество ридов, которые можно картировать к биологическому виду, т.е. конкретному микроорганизму, геному человека, а также любым другим микроорганизмам, в реальном времени. Таким образом, количество ридов, приписываемых конкретному микроорганизму или человеку, было известным в каждый момент времени в течение осуществления диагностического способа.

Эта информация позволяла получать count-vector C: cm, ..., cl; m=1,... l, что верно для количества ридов для каждого вида m в образце/у пациента j в произвольный, но фиксированный момент времени во время диагностики. cm изменяется с течением времени во время диагностики пациента j, в то время как новые риды картируют к биологическому виду. Кроме того, C может повышаться с идентификацией новых видов микроорганизмов. Сначала создают пустой вектор и получают динамическое значение один в течение рабочего цикла способа. С помощью C описывают микробную нагрузку у пациента, в настоящее время подвергаемого диагностике. Для идентификации микроорганизмов, нагрузка которых аномально повышена, обратную кумулятивную функцию распределения (cdf) нагрузки этого конкретного микроорганизма у пациента j в указанный момент времени вычисляли следующим образом:

где cm является количеством ридов, измеряемым для вида m у пациента j в настоящее время, и n является количеством ридов, которые можно картировать вообще (микроорганизма и носителя). С помощью pM описывают вероятность обнаружения, вычисляемую в реальном времени и представляющую собой вероятность детекции рида для вида m.

В отличие от общепринятого тестирования, этот анализ не является анализом конечных результатов, его осуществляют в рамках последовательного тестирования. Таким образом, с помощью подхода последовательного тестирования получают всю необходимую и важную информацию во время осуществления теста, а не по его завершении. Это представляет собой новый способ диагностики инфекции и новые способы тестирования в области секвенирования нового поколения. Получаемая информация представляет собой значение p, с помощью которого определяют, является ли текущее количество нуклеиновой кислоты, картируемой к конкретному виду, необычным и, таким образом, достигает очень низкого значения p с учетом вероятности обнаружения для этого вида и текущих заданных параметров теста.

Этот способ позволяет определять новые характеристические переменные, такие как "количество сигналов микроорганизма на событие". Эти переменные напрямую зависят от того, сколько раз микроорганизм становился статистически значимым, и, таким образом, новые переменные имеют особое значение. Возможными характеристическими переменными являются "количество ридов микроорганизма в секунду" или "количество ридов микроорганизма на рид человека". Такие переменные можно вычислять для каждого индивидуума и каждого микроорганизма, и, таким образом, они обеспечат более глубокое понимание степени тяжести инфекции в случае каждого анализируемого образца. Кроме того, эти характеристические переменные позволят сравнивать образцы, секвенированные разными способами, т.к. такие переменные не зависят от технологий.

ПРИМЕР 2

Нуклеиновые кислоты из биологического образца плазмы крови, полученного от индивидуума S9, секвенировали таким образом, что вычисляли вероятность обнаружения сравниваемого рида последовательности, картируемого к конкретному микроорганизму, у индивидуума с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, по изобретению. Результаты приведены на фигуре 1.

На фигуре 1 показана полная последовательность теста (тест не прерывали или прекращали при достижении значимости для конкретного микроорганизма) одновременно на 7 разных микроорганизмов. Также показана красная горизонтальная пунктирная линия, соответствующая статистическому пороговому значению, которое должно быть превышено для того, чтобы микроорганизм считали "значимым" для вызывания инфекции. Также очевидно, что синяя линия, соответствующая микроорганизму Enterobacter cloacae, пересекает статистическое пороговое значение всего лишь после нескольких временных точек получения данных таким образом, что тест можно прекращать для этого микроорганизма всего лишь через несколько временных точек. Фиолетовая линия, соответствующая бактерии E. coli, демонстрирует небольшое повышение, но не пересекает уровень значимости как "значимая", пока не будет достигнуто 500 тыс. ридов, что свидетельствует о том, что этот и другие микроорганизмы представляют собой либо контаминацию, либо симбиотические микроорганизмы.

ПРИМЕР 3

Нуклеиновые кислоты из биологического образца плазмы крови, полученного от индивидуума S11, секвенировали таким образом, что вычисляли вероятность обнаружения сравниваемого рида последовательности, картируемого к конкретному микроорганизму, у индивидуума с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду по настоящему изобретению. Результаты приведены на фигуре 2.

Аналогично фигуре 1, на фигуре 2 показано быстрое повышение вероятности того, что одна бактерия, в этом случае K. pneumoniae (указана зеленым цветом), является важной для патологического состояния, т.е. является причинным фактором инфекции. Следует отметить, что определяют Cutibacterium acnes, являющуюся бактерией, живущей на коже человека, но значимость/вероятность того, что эта бактерия является причинным фактором инфекции, равна нулю. Это свидетельствует о том, что способ, как и предполагали, позволяет отфильтровывать симбиотические виды. В отличие от этого, значимость E. coli повышается до порогового значения уровня значимости по достижении 350 тыс. ридов. Хотя это не показано как "значимое", но может свидетельствовать о том, что пациент имеет риск развития вторичной инфекции, вызванной E. coli.

Это свидетельствует о том, что с помощью способа получают информацию, которую нельзя получить с использованием существующего анализа "конечных результатов". Таким образом, этим способом получают данные, позволяющие клиницисту предпринимать действия против инфекции до того, как это станет действительно клинически значимым. Другим преимуществом способа, представленного в настоящем описании, является возможность детекции инфекций, вызванных множеством микроорганизмов, и дальнейшего определения того, какие микроорганизмы являются основными причинными факторами.

ПРИМЕР 4

Нуклеиновые кислоты из биологического образца плазмы крови, полученного от индивидуума S60, секвенировали таким образом, что вычисляли вероятность обнаружения сравниваемого рида последовательности, картируемого к конкретному микроорганизму, у индивидуума с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, по настоящему изобретению. Результаты приведены на фигуре 3.

Как показано на фигуре 3, основным возбудителем инфекции является B. fragilis, т.к. зеленая линия пересекает пороговое значение уровня значимости с самого начала осуществления способа. Однако, после некоторых событий (анализируемых ридов) две другие бактерии резко пересекают пороговое значение уровня значимости, что свидетельствует о том, что эти две бактерии также вносят свой вклад в развитие сепсиса у индивидуума, что указано оранжевой и фиолетовой линиями для E. coli и S. aureus, соответственно.

Сравнение этого результата с результатом общепринятого рутинного теста для всех трех бактерий показывает, что они будут одинаковыми. Каждому микроорганизму будет приписана более или менее одинаковая значимость. Однако, с использованием способа, представленного в настоящем описании, четко идентифицируют основной причинный фактор, а посредством объективного использования характеристических переменных, таких как "события на время" идентифицировали основной причинный фактор, а также другие микроорганизмы, вносящие свой вклад в инфекцию.

По осям на указанных выше фигурах всегда отложены логарифм значения p, вычисленного по формуле 1, и количество анализируемых ридов. Разумеется, единицы, приведенные на оси, можно изменять. В этом случае это необходимо исключительно, чтобы благодаря новым единицам было возможным уникальное упорядочение ридов. Оно может представлять собой, например, порядок, в котором риды получают, или время, когда их сравнивают с базой данных. Используя описанный выше способ, можно вычислять указанные выше характеристические переменные, например "количество ридов на событие до достижения значимости" для конкретного микроорганизма и пациента. Эти переменные можно использовать для сравнения разных пациентов, зараженных одним и тем же микроорганизмом. Кроме того, посредством сравнения переменных для разных микроорганизмов у одного и того же пациента можно идентифицировать основной причинный фактор.

Предполагают, что в случае реальных инфекций имеет место диапазон в некотором интервале, названном [x-y], измеряемом, например, по "количеству ридов на событие". При этом контаминирующие и симбиотические микроорганизмы будут находиться вне границ этого "инфекционного интервала". Таким образом, статистический анализ с использованием этих инфекционных интервалов будет достаточным для идентификации инфекций и оценки значимости идентифицированных микроорганизмов. Кроме того, с помощью этих интервалов оценивают тяжесть инфекции. Это осуществляют с использованием статистической основы анализа времени ожидания. В большинстве случаев анализы времени ожидания осуществляют с использованием экспоненциальной функции. Таким образом, при условии, что переменная, описывающая "характеристическую переменную инфекции", имеет распределение в соответствии с экспоненциальной случайно переменной:

X ~ Exp (λ) [2]

и при условии, что время ожидания для конкретного микроорганизма составляет 500-1000 ридов, получают λ=1/500 и λ=1/1000. Т.к. интерес представляет вероятность P(50<X<1000), авторы настоящего изобретения вычисляли P(x<1000)-P(x≤500). Это соответствует вероятности отсутствия инфекции. Т.к. для авторов настоящего изобретения желательным являлся более "быстрый" интервал, они вычисляли P(X≤500). В этом случае, если 500-й рид снова является ридом микроорганизма, вычисляют P(X>500)=e-500λ≈0,36. Таким образом, очень вероятно, что будут получать рид микроорганизма после 500 ридов носителя с учетом интервала 500-1000 для этого конкретного вида. Однако, при нахождении рида второго микроорганизма всего после 10 ридов, вычисляют P(X>10)=e-100λ≈0,98, т.к. при нахождении рида микроорганизма после 10 сигналов (сравниваемых ридов) интерес представляет P(X≤10), и, таким образом, 1-P(X>10)=0,019. Таким образом, маловероятно обнаружить микроорганизм после 10 сигналов, и, соответственно, если микроорганизм определяют после 10 сигналов, существует необходимость сообщить об этом клиницисту.

Оба подхода, объединение вероятностей с фиксированным, но произвольным количеством событий с учетом набора событий и анализ результирующего времени ожидания, не описаны в области диагностики инфекционных заболеваний или диагностики в целом. В основном, если получение данных можно разделить по разным каналам или блокам, снова можно параллелизовать тестирование по каждому отдельному каналу (т.е. тестировать каждый канал отдельно и обрабатывать каждый канал как отдельный эксперимент) и, таким образом, минимизировать время до получения результата. Это также невозможно при использовании анализа конечных результатов, что означает, что способ, представленный в настоящем описании, можно масштабировать в направлении высокопроизводительного анализа в отличие от анализа конечных результатов.

Изобретение, в частности, относится к следующему:

1. Способу определения наличия микроорганизмов у индивидуума, включающему:

(a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты;

(b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных; и

(c) определение количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике.

2. Способу определения наличия микроорганизмов у индивидуума, включающему:

(a)сравнение ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума; и

(b) определение количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности картируемых к биологическому виду, во временной динамике.

3. Способу по п.1 или 2, дополнительно включающему вычисление баллов значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду.

4. Способу по п.3, где, если баллы для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как присутствующий у индивидуума.

5. Способу по п.3, где, если баллы для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как значимый для вызывания заболевания у индивидуума.

6. Способу по п.5, где, если баллы для конкретного микроорганизма превышают пороговое значение на несколько ридов последовательности, заболевание по причине наличия микроорганизма считают тяжелым.

7. Способу определения наличия патологического состояния у индивидуума, включающему:

(a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты;

(b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида, для определения того, картируется ли сравниваемый рид последовательности к контрольному индивидууму; и

(c) определение количества сравниваемых ридов последовательности, картируемых и некартируемых к контрольному индивидууму, во временной динамике.

8. Способу по п.7, дополнительно включающему вычисление баллов значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, некартируемого к контрольному индивидууму, с учетом количества сравниваемых ридов последовательности, некартируемых к контрольному индивидууму, и количества сравниваемых ридов последовательности, картируемых к контрольному индивидууму.

9. Способу по п.8, где, если баллы соответствуют пороговому значению или превышают его, патологическое состояние определяют как присутствующее у индивидуума.

10. Способу по любому из пп.7-9, где патологическое состояние является злокачественным новообразованием.

11. Способу по п.10, где злокачественное новообразование вызвано генетической аномалией.

12. Способу по любому из пп.7-9, где патологическое состояние является инфекцией, вызванной микроорганизмом.

13. Способу по п.12, где микроорганизм является вирусом, бактерией, грибом или паразитом.

14. Способу по любому из предшествующих пп., где биологический образец выбран из группы, состоящей из цельной крови, сыворотки, плазмы крови, амниотической жидкости, синовиальной жидкости, ликвора, мазка ткани или клеток, смыва ткани или клеток, мочи, ткани, мокроты, кала, желудочно-кишечных секретов, лимфы и лаважа.

15. Способу по любому из предшествующих пп., где индивидуум является позвоночным, предпочтительно, млекопитающим, например, человеком, собакой, кошкой, свиньей, лошадью, крупным рогатым скотом, овцой, козой, мышью или крысой.

16. Способу по п.15, где индивидуум является человеком.

17. Способу по любому из предшествующих пп., где секвенирование осуществляют посредством молекулярного высокопроизводительного анализа последовательности.

18. Способу по любому из предшествующих пп., где, если конкретный микроорганизм или патологическое состояние определяют как присутствующее у индивидуума, способ дополнительно включает введение индивидууму фармацевтически активного соединения, о котором известно, что с помощью него можно лечить заболевание, вызванное конкретным микроорганизмом или патологическим состоянием.

19. Способу диагностики инфекционного заболевания, вызванного микроорганизмами, у индивидуума, включающему:

(a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты;

(b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных;

(c) определение количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, во временной динамике; и

(d) вычисление баллов значимости для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду,

где, если баллы для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как вызывающий инфекционное заболевание.

20. Машиночитаемому носителю данных, на котором хранят программный код, содержащий команды, посредством выполнения которых процессором осуществляют способ по любому из пп.1-19.

21. Компьютерная система, содержащая процессор, сконфигурированный для осуществления способа по любому из пп.1-19.

Похожие патенты RU2763969C2

название год авторы номер документа
ИНДИВИДУАЛИЗИРОВАННЫЕ ПРОТИВООПУХОЛЕВЫЕ ВАКЦИНЫ 2012
  • Сахин Угур
  • Крайтер Себастьян
  • Дикен Мустафа
  • Дикманн Ян
  • Козловски Михаель
  • Бриттен Цедрик
  • Кэстл Джон
  • Лёвер Мартин
  • Ренард Бернхард
  • Омококо Тана
  • Де Граф Йоханнес Хендрикус
RU2670745C9
ИНДИВИДУАЛИЗИРОВАННЫЕ ПРОТИВООПУХОЛЕВЫЕ ВАКЦИНЫ 2012
  • Сахин Угур
  • Крайтер Себастьян
  • Дикен Мустафа
  • Дикманн Ян
  • Козловски Михаель
  • Бриттен Цедрик
  • Кэстл Джон
  • Лёвер Мартин
  • Ренард Бернхард
  • Омококо Тана
  • Де Граф Йоханнес Хендрикус
RU2779946C2
СПОСОБЫ ПРОГНОЗИРОВАНИЯ ПРИМЕНИМОСТИ БЕЛКОВ ИЛИ БЕЛКОВЫХ ФРАГМЕНТОВ ДЛЯ ИММУНОТЕРАПИИ 2017
  • Формер, Матиас
  • Захин, Угур
  • Шрёрс, Барбара
  • Лёвер, Мартин
  • Бёгель, Себастьян
RU2782336C2
КОМПОЗИЦИИ И СПОСОБЫ ИММУНОТЕРАПИИ 2014
  • Брентдженс Реньер Дж.
  • Джексон Холли Дж.
RU2680010C2
ОБНАРУЖЕНИЕ МУТАЦИЙ И ПЛОИДНОСТИ В ХРОМОСОМНЫХ СЕГМЕНТАХ 2015
  • Бабиарц Джошуа
  • Константин Тюдор Помпилиу
  • Юбанк Лейн А.
  • Джемелос Джордж
  • Хилл Мэттью Мика
  • Киркизляр Хусейн Эсер
  • Рабиновиц Мэттью
  • Сакария Онур
  • Сигурджонссон Стёрмир
  • Зиммерман Бернхард
RU2717641C2
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ TUSC2-ИММУНОТЕРАПИИ 2017
  • Рот, Джек, А.
  • Цзи, Линь
RU2755903C2
АНТИ-GITR-АНТИТЕЛА 2010
  • Шибай Сяо Минь
  • Ермаков Григорий П.
  • Ходжес Дуглас Дж.
  • Преста Леонард Г.
RU2595409C2
АНТИ-GITR-АНТИТЕЛА 2010
  • Шибай Сяо Минь
  • Ермаков Григорий П.
  • Ходжес Дуглас Дж.
  • Преста Леонард Г.
RU2646139C1
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ВЫСОКОМУЛЬТИПЛЕКСНОЙ ПЦР 2012
  • Циммерманн Бернхард
  • Хилл Мэттью М.
  • Лакроут Филипп Гилберт
  • Додд Майкл
RU2650790C2
КОМПОЗИЦИИ И СПОСОБЫ ИММУНОТЕРАПИИ 2014
  • Брентдженс, Реньер, Дж.
  • Джексон, Холли, Дж.
RU2798348C2

Иллюстрации к изобретению RU 2 763 969 C2

Реферат патента 2022 года СПОСОБЫ И УСТРОЙСТВА ДЛЯ ОПРЕДЕЛЕНИЯ ПАТОЛОГИЧЕСКИХ СОСТОЯНИЙ В РЕАЛЬНОМ ВРЕМЕНИ С ИСПОЛЬЗОВАНИЕМ НУКЛЕИНОВЫХ КИСЛОТ

Группа изобретений относится к области биотехнологии. Предложен способ определения наличия микроорганизмов у индивидуума (варианты), способ определения наличия патологического состояния у индивидуума, способ диагностики инфекционного заболевания, вызванного микроорганизмами, у индивидуума, а также машиночитаемый носитель данных и компьютерная система для осуществления указанных способов. Причем указанные способы включают получение множества ридов последовательности нуклеиновой кислоты индивидуума, сравнение указанных ридов последовательности с содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов базами данных, вычисление баллов значимости во временной динамике для вероятности обнаружения у индивидуума сравниваемого картируемого к конкретному микроорганизму картируемого к конкретному микроорганизму рида последовательности. Изобретения обеспечивают эффективную обработку данных секвенирования для получения точных результатов и/или осуществления быстрой идентификации возбудителя заболевания. 7 н. и 4 з.п. ф-лы, 3 ил., 4 пр.

Формула изобретения RU 2 763 969 C2

1. Способ определения наличия микроорганизмов у индивидуума, включающий:

(a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты;

(b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных; и

(c) определение во временной динамике количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду; и

(d) вычисление баллов значимости во временной динамике для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду, где, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как присутствующий у индивидуума.

2. Способ определения наличия микроорганизмов у индивидуума, включающий:

стадию вычисления во временной динамике баллов значимости для вероятности обнаружения у индивидуума рида последовательности, картируемого к конкретному микроорганизмус учетом количества ридов последовательности, картируемых к конкретному микроорганизму, и количества ридов последовательности, картируемых к биологическому виду, где, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как присутствующий у индивидуума,

где риды последовательности, картируемые к конкретному микроорганизму, и риды последовательности, картируемые к биологическому виду, получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

3. Способ определения наличия микроорганизмов у индивидуума, включающий:

(a) стадию определения во временной динамике количества ридов последовательности, картируемых к конкретному микроорганизму, и количества ридов последовательности, картируемых к биологическому виду, где риды последовательности получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов для определения того, картируется ли рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума; и

(b) вычисление баллов значимости во временной динамике для вероятности обнаружения у индивидуума рида последовательности, картируемого к конкретному микроорганизму, с учетом количества ридов последовательности, картируемых к конкретному микроорганизму, и количества ридов последовательности, картируемых к биологическому виду, где, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как присутствующий у индивидуума.

4. Способ по любому из пп.1-3, где, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как значимый для вызывания заболевания у индивидуума.

5. Способ по п.4, где, если баллы значимости для конкретного микроорганизма превышают пороговое значение на несколько ридов последовательности, заболевание по причине наличия микроорганизма считают тяжелым.

6. Способ определения наличия патологического состояния у индивидуума, включающий:

стадию вычисления во временной динамике баллов значимости для вероятности обнаружения у индивидуума рида последовательности, некартируемого к контрольному индивидууму с учетом количества ридов последовательности, некартируемых к контрольному индивидууму, и количества ридов последовательности, картируемых к контрольному индивидууму, где, если баллы значимости соответствуют пороговому значению или превышают его, патологическое состояние определяют как присутствующее у индивидуума,

где риды последовательности, картируемые к контрольному индивидууму, и риды последовательности, некартируемые к контрольному индивидууму, получают посредством сравнения ридов последовательности с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида, для определения того, картируется ли сравниваемый рид последовательности к контрольному индивидууму, и где риды последовательности получают посредством секвенирования нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума.

7. Способ по п.6, где патологическое состояние является злокачественным новообразованием.

8. Способ по п.6, где патологическое состояние является инфекцией, вызванной микроорганизмом.

9. Способ диагностики инфекционного заболевания, вызванного микроорганизмами, у индивидуума, включающий:

(a) секвенирование нуклеиновых кислот, присутствующих в биологическом образце, полученном от индивидуума, для получения множества ридов последовательности нуклеиновой кислоты;

(b) сравнение ридов последовательности, полученных на стадии (a), с одной или более базами данных, содержащими генетическую информацию контрольного индивидуума того же вида и генетическую информацию множества микроорганизмов, для определения того, картируется ли сравниваемый рид последовательности к биологическому виду, информация о котором содержится в одной или более базах данных;

(c) определение во временной динамике количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду; и

(d) вычисление баллов значимости во временной динамике для вероятности обнаружения у индивидуума сравниваемого рида последовательности, картируемого к конкретному микроорганизму, с учетом количества сравниваемых ридов последовательности, картируемых к конкретному микроорганизму, и количества сравниваемых ридов последовательности, картируемых к биологическому виду,

где, если баллы значимости для конкретного микроорганизма соответствуют пороговому значению или превышают его, конкретный микроорганизм определяют как вызывающий инфекционное заболевание.

10. Машиночитаемый носитель данных, на котором хранят программный код, содержащий команды, посредством выполнения которых процессором осуществляют способ по любому из пп.1-9.

11. Компьютерная система, содержащая процессор, сконфигурированный для осуществления способа по любому из пп.1-9.

Документы, цитированные в отчете о поиске Патент 2022 года RU2763969C2

Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
Автомобиль-сани, движущиеся на полозьях посредством устанавливающихся по высоте колес с шинами 1924
  • Ф.А. Клейн
SU2017A1
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса 1924
  • Шапошников Н.П.
SU2015A1
HASMAN H
et al
Rapid Whole-Genome Sequencing for Detection and Characterization of Microorganisms Directly from Clinical Samples // Journal of Clinical Microbiology, Vol.52, No.1, 2014, p.139-146
GRUMAZ S
et al
Next-generation sequencing

RU 2 763 969 C2

Авторы

Стивенс, Филип

Даты

2022-01-12Публикация

2018-07-18Подача