Область техники
Изобретение относится к медицине, а именно, к молекулярно-генетической диагностике, которая может быть использована для выявления индивидуумов, подверженных наибольшему риску тяжелой формы течения COVID-19, включая неблагоприятный исход данного заболевания. Для оказания медицинской помощи пациентам из группы риска при COVID-19 на ранних этапах могут быть использованы скорректированные алгоритмы административных и медицинских действий.
Уровень техники
Известно, что риск летального исхода при инфицировании новой коронавирусной инфекцией повышается в зависимости от ряда факторов, в числе которых возраст, мужской пол (вероятность смерти при заражении коронавирусом выше для мужчин, чем для женщин), индекс массы тела, уровень глюкозы. Тяжелое течение с летальным исходом наиболее часто регистрируют у людей старшей возрастной группы с заболеваниями сердечно-сосудистой системы, цереброваскулярной патологией и злокачественными новообразованиями. Из всех хронических заболеваний наиболее опасным при COVID-19 является сахарный диабет. На втором месте после диабета по опасности при COVID-19 находятся болезни почек и сердечно-сосудистые заболевания [Wang T., Du Z., Zhu F., Cao Z., An Y., Gao Y., et al. Comorbidities and multi-organ injuries in the treatment of COVID-19 // Lancet. 2020. Vol. 395, № 10228. P. e52. DOI: 10.1016/S0140-6736(20)30558-4].
Известно, что на характер течения заболевания COVID-19 также влияет фактор генетической предрасположенности. При этом из уровня техники известно, что молекулы HLA класса I являются одним из ключевых медиаторов первых звеньев в развитии специфического иммунного ответа на COVID-19. Сразу после попадания в клетку SARS-CoV-2 индуцирует трансляцию белков вируса. Некоторые из этих белков попадают в протеасомы инфицированной клетки, расщепляются до пептидов длиной 8-12 аминокислотных остатков и связываются с рецепторами HLA класса I. После связывания комплекс, состоящий из молекулы HLA класса I и пептида, переносится на поверхность инфицированной клетки, где он может взаимодействовать с Т-клеточным рецептором CD8+ Т-лимфоцитов. В ответ на взаимодействие CD8+ Т-лимфоцит активируется и начинает делиться; через 5-7 дней образуются популяции вирусспецифических цитотоксических CD8+ Т-лимфоцитов, способных разрушать инфицированные клетки с помощью перфоринов и сериновых протеаз [Wherry EJ, Ahmed R. Memory CD8 T-Cell Differentiation during Viral Infection. J Virol. 2004;78(11):5535-5545. doi:10.1128/jvi.78.11.5535-5545.2004].
Существует три основных типа рецепторов HLA класса I: HLA-A, HLA-B и HLA-C. Рецепторы каждого типа присутствуют в двух вариантах, унаследованных от родителей. Существуют десятки вариантов каждого аллеля рецепторов HLA-I; каждый аллель обладает индивидуальной способностью распознавать различные чужеродные белки. Распределение аллелей является специфичным для отдельных популяций [Wang JH, Zheng X, Ke X, Dorak MT, Shen J, Boodram B, et al. Ethnic and geographical differences in HLA associations with the outcome of hepatitis C virus infection. Virol J. 2009;6. doi:10.1186/1743-422X-6-46]. Известно влияние комбинации рецепторов HLA класса I на тяжесть течения различных инфекционных заболеваний, включая малярию [Lima-Junior JdC, Pratt-Riccio LR. Major histocompatibility complex and malaria: Focus on Plasmodium vivax Infection. Front Immunol. 2016;7(JAN). doi:10.3389/fimmu.2016.00013], туберкулез [Mazzaccaro R0, Gedde M, Jensen ER, Van Santen HM, Ploegh HL, Rock KL, et al. Major histocompatibility class I presentation of soluble antigen facilitated by Mycobacterium tuberculosis infection. Proc Natl Acad Sci U S A. 1996;93(21):11786-11791. doi:10.1073/pnas.93.21.11786.], ВИЧ [Goulder PJR, Watkins DI. Impact of MHC class I diversity on immune control of immunodeficiency virus replication. Nat Rev Immunol. 2008;8(8):619-630. doi:10.1038/nri2357] и вирусный гепатит [Wang JH, Zheng X, Ke X, Dorak MT, Shen J, Boodram B, et al. Ethnic and geographical differences in HLA associations with the outcome of hepatitis C virus infection. Virol J. 2009;6. doi:10.1186/1743-422X-6-46].
Существуют ряд публикаций, в которых описаны взаимосвязи между генотипом HLA и чувствительностью к SARS-CoV. В частности известно, что аллели HLA-B*07:03 [Ng MHL, Lau KM, Li L, Cheng SH, Chan WY, Hui PK, et al. Association of human-leukocyte-antigen class I (B*0703) and class II (DRB1*0301) genotypes with susceptibility and resistance to the development of severe acute respiratory syndrome. J Infect Dis. 2004;190(3):515-518. doi:10.1086/421523], HLA-B*46:01 [Lin M, Tseng HK, Trejaut JA, Lee HL, Loo JH, Chu CC, et al. Association of HLA class I with severe acute respiratory syndrome coronavirus infection. BMC Med Genet. 2003;4. doi:10.1186/1471-2350-4-9] и HLA-C*08:01 [Chen YMA, Liang SY, Shih YP, Chen CY, Lee YM, Chang L, et al. Epidemiological and genetic correlates of severe acute respiratory syndrome coronavirus infection in the hospital with the highest nosocomial infection rate in Taiwan in 2003. J Clin Microbiol. 2006;44(2):359-365. doi:10.1128/JCM.44.2.359-365.2006] являются факторами предрасположенности к тяжелой форме заболевания; аллель 21 HLA-C*15:02 ассоциирован с легкой формой [Wang SF, Chen KH, Chen M, Li WY, Chen YJ, Tsao CH, et al. Human-leukocyte antigen class i Cw 1502 and Class II DR 0301 genotypes are associated with resistance to severe acute respiratory syndrome (SARS) infection. Viral Immunol. 2011;24(5):421-426. doi:10.1089/vim.2011.0024].
В исследовании, проведенном китайскими учеными, было выявлено наличие редкого аллеля HLA-C*07:29 и HLA-B*15:27 у китайских пациентов с COVID-19 [Wang W, Zhang W, Zhang J, He J, Zhu F. Distribution of HLA allele frequencies in 82 Chinese individuals with coronavirus disease-2019 (COVID-19). Hla. 2020;96(2):194-196. doi:10.1111/tan.13941].
Из уровня техники известна взаимосвязь количества пептидов с высокой константой взаимодействия с индивидуальным генотипом HLA: чем больше вирусных пептидов с высокой аффинностью связывается с HLA I класса, тем легче протекает заболевание. Также было показано, что частота встречаемости аллелей HLA-A*01:01 и HLA-A*02:01 связана с числом инфекций и смертностью в различных регионах Италии [Pisanti S, Deelen J, Gallina AM, Caputo M, Citro M, Abate M, et al. Correlation of the two most frequent HLA haplotypes in the Italian population to the differential regional incidence of Covid-19. J Transl Med. 2020;18(1). doi:10.1186/s12967-020-02515-].
Таким образом, из уровня техники известно влияние различных сочетаний аллелей HLA I класса на течение заболевания, вызванного SARS-CoV-2. Однако отсутствуют способы, позволяющие выявлять для различных популяций уникальные комбинации аллелей HLA I класса, ответственные за развитие тяжелой формы COVID-19 у индивидов.
Наиболее близким к заявляемому решению является способ оценки риска развития тяжелой формы COVID-19 [Iturrieta-Zuazo, I., Rita, C. G., , A., de Malet Pintos-Fonseca, A., , N., , R., Tejeda-Velarde, A., Serrano-Villar, S., , J. L., & , I. (2020). Possible role of HLA class-I genotype in SARS-CoV-2 infection and progression: A pilot study in a cohort of Covid-19 Spanish patients. Clinical Immunology, 219, 108572. https://doi.org/10.1016/j.clim.2020.108572], включающий забор биологического материала, выделение геномной ДНК с последующим генотипированием аллелей генов HLA-A, HLA-B, HLA-C, обработку результатов генотипирования и прогнозирование риска развития тяжелой форма COVID-19 с высокой вероятностью летального исхода. Известный способ основан на исследовании биологического материала 5 пациентов с легкой формой, 20 пациентов средней тяжести и 20 пациентов с тяжелой формой COVID-19. Выделение геномной ДНК с последующим генотипированием аллелей генов HLA-A, HLA-B, HLA-C было проведено с помощью наборов реагентов RSSOW1A, RSSOW1B и RSSOW1C (One lambda inc) и мультиплексного анализатора FlexMap 3D. Критерии для оценки риска развития тяжелой формы COVID-19 были получены на основе анализа аффинности взаимодействия пептидов вируса SARS-CoV-2 c молекулами HLA-I пациента, относящегося к одной из трех групп по тяжести течения заболевания; в случае, если аффинность взаимодействия пептида с одной из молекул HLA-I была менее 50 нМоль, то Индекс высокоаффинных пептидов увеличивали на 1; пороговые значения для прогноза риска развития тяжелой формы COVID-19 для всех пациентов определяли после определения Индекса высокоаффинных пептидов.
Однако в известном способе пороговые значения для прогноза риска развития тяжелой формы COVID-19 определялись на основе выборки без учета данных об умерших пациентах. При этом малый объем выборки, использование только качественных, а не количественных характеристик взаимодействия вирусный пептид - молекула HLA-I, отсутствие этапа проверки чувствительности и специфичности критериев прогноза риска развития тяжелой форма COVID-19 на контрольной выборке, ставят под сомнение точность и достоверность получаемых прогнозных оценок развития тяжелой формы COVID-19.
Технической проблемой, решаемой заявляемым изобретением, является разработка универсального способа оценки риска развития тяжелой формы COVID-19, который может быть применен для различных популяций, с получением достоверных и высокоточных прогнозных оценок.
Раскрытие изобретения
Техническим результатом заявляемого изобретения является обеспечение повышения точности прогнозных оценок риска развития тяжелой формы COVID-19 для лиц возрастом от 35 до 60 лет.
Технический результат достигается тем, что способ оценки риска развития тяжелой формы COVID-19 включает забор биологического материала, выделение геномной ДНК с последующим генотипированием аллелей генов HLA-A, HLA-C, обработку результатов генотипирования и прогнозирование по полученным данным риска развития тяжелой формы COVID-19 с высокой вероятностью летального исхода, при этом обработку результатов генотипирования осуществляют с использованием метода главных компонент, посредством определения для каждого аллеля значений 2-й и 3-й главных компонент гена HLA-A и значения 4-й главной компоненты гена HLA-C из БД аллелей генов HLA-A, HLA-C, предварительно определенных для популяции, в которую входит исследуемый индивидуум, и содержащей значения упомянутых главных компонент аллелей соответствующих генов, с последующим суммированием всех значений главных компонент, нормированием значения полученной суммы и сравнением с пороговым значением. Прогнозируют риск развития тяжелой формы COVID-19 при получении нормированного значения суммы выше порогового значения.
БД аллелей генов HLA-A, HLA-C со значениями главных компонент формируют по итогам соответствующего генотипирования популяции (популяционный срез, предпочтительно составляет не менее 400 человек), включая пациентов, умерших от COVID-19 (предпочтительно не менее 20 пациентов в возрасте до 60 лет, не менее 80 пациентов в возрасте от 60 лет), расчета коэффициентов связывания всех полученных аллелей HLA-A, HLA-C с вирусными пептидами, вызывающими COVID-19 (штамма SARS-CoV-2 и/или его мутаций), например, с помощью программы netMHCpan [https://doi.org/10.1093/nar/gkaa379], или любой аналогичной программой для расчета коэффициентов связывания аллелей HLA класса I и пептидов, с последующей обработкой полученных данных методом главных компонент, при этом обработку осуществляют отдельно для каждого гена HLA-A, HLA-C, а количество главных компонент определяют таким образом, чтобы доля дисперсии, обусловленной каждой компонентой, составляла не менее 5% от исходной дисперсии.
Нормирование суммы полученных значений главных компонент () аллелей генов HLA-A, HLA-C индивидуума может быть реализовано по формуле , где - сумма всех минимальных значений главных компонент по каждому аллелю из БД, - сумма всех максимальных значений главных компонент по каждому аллелю из БД, - нормированный индекс риска (или просто индекс риска).
Пороговое значение может быть определено на основании использования значений главных компонент умерших пациентов в возрасте до 60 лет и после 60 из БД аллелей генов HLA-A, HLA-C, при этом для каждого умершего пациента определяют значения 2-й и 3ей главных компонент гена HLA-A и значение 4-ой главной компоненты гена HLA-C из БД аллелей генов HLA-A, HLA-C, с последующим суммированием всех значений главных компонент, нормированием полученных сумм (по формуле выше), после чего из полученных значений , , …, ( - нормированный индекс риска для -го пациента, - общее число пациентов) в качестве порогового значения выбирают значение, характеризующее максимальную долю пациентов, умерших до 60 лет, в группе пациентов, с выше порогового значения. При этом определение максимальной доли пациентов, умерших до 60 лет, может быть реализовано с помощью точного теста Фишера.
Возможен вариант реализации заявляемого способа с двумя пороговыми значениями - верхним и нижним, где способ определения верхнего порогового значения описан выше и характеризует границу высокого риска развития тяжелой формы COVID-19 с высокой вероятностью летального исхода, нижнее пороговое значение (или дополнительное пороговое значение) определяет границу низкого риска развития тяжелой формы COVID-19. В качестве дополнительного порогового значения выбирают значение, характеризующее минимальную долю пациентов, умерших до 60 лет, в группе пациентов, с ниже порогового значения.
В качестве биологического материала для оценки риска развития тяжелой формы COVID-19 может быть использована венозная или капиллярная кровь, буккальный соскоб. Геномная ДНК может быть выделена с помощью различных наборов реагентов, например, QIAamp DNA Blood, или HigherPurity™ Blood DNA Extraction Kit (Convax), или GeneJET Whole Blood Genomic DNA Purification Mini Kit (Thermo Scientific), или любого аналогичного набора для выделения геномной ДНК. Генотипирование осуществляют с применением набора реагентов для подготовки библиотек фрагментов ДНК генов HLA-A, HLA-C для генотипирования секвенированием нового поколения, например, HLA-Эксперт (ООО «ДНК-Технология») или любого аналогичного набора, известного из уровня техники для указанного применения.
Заявленный способ был разработан по итогам проведенных исследований генетического материала около 540 пациентов, включая генетический материал умерших пациентов в возрасте до 60 лет и после 60 (111 пациентов). В результате выявлены возможные связи между генотипами умерших пациентов, их возрастом на момент смерти с критическим течением COVID-19, на основании которых разработаны критерии, обеспечивающие высокую точность и достоверность получаемых прогнозных оценок, а также генетические факторы, ассоциированные с тяжестью течения COVID-19.
Использование в заявляемом способе данных HLA-генотипа пациентов умерших от COVID-19 в возрасте до 60 лет и старше 60 лет значимо повлияло на повышение точности получаемых оценок. Смерть - крайнее проявление тяжелого течения заболевания; смерть от COVID-19 - сочетание сопутствующих заболеваний, неадекватного ответа иммунной системы, одной из причин которого является генетическая предрасположенность; сравнение умерших от COVID-19 в возрасте до 60 лет (когда у большинства популяции сопутствующие заболевания еще не могут внести значительный вклад в течение заболевания) с умершими в возрасте старше 60 лет позволили выявить преимущественный вклад наследственного фактора.
Кроме того, в способе, описанном в работе Iturrieta-Zuazo и соавторов, оценку риска проводят только по генотипу HLA-A, только по генотипу HLA-B, только по генотипу HLA-C, и по полному генотипу HLA-1. В процессе разработки заявляемого способа было выявлено, что в повышение точности прогнозных оценок вносит вклад комплекс, состоящий из аллелей HLA-А HLA-С, в результате из анализируемых аллелей были исключены аллели HLA-B.
Кроме того, применение способа, описанного в работе Iturrieta-Zuazo и соавторов, к данным генотипов выборки пациентов, предложенной в заявляемом способе, показало значение площади под ROC-кривой, равное 0.57, p = 0.15 при пороге на аффинность, равном 500 нМ, и 0.59, p = 0.07 при пороге на аффинность, равном 50 нМоль. При этом площадь под ROC-кривой при использовании заявляемого способа составила 0,68, p = 0,003, что свидетельствует о ее большей чувствительности и специфичности.
Кроме того, в заявляемом способе предложены иные критерии оценки аффинности пептидов и аллелей HLA-I. В способе, описанном в работе Iturrieta-Zuazo и соавторов, упоминается два способа интерпретации математического моделирования аффинности пептида и аллели HLA-I: при аффинности менее 50 нМоль взаимодействие считалось возможным, при более и равно 50 нМоль - нет; при аффинности менее 500 нМоль взаимодействие считалось возможным, при более и равно 500 нМоль - нет. Заявляемый способ использует непрерывную шкалу значений аффинности от 1 до 5000 в отличие от способа Iturrieta-Zuazo и соавторов, который бинаризует (0 или 1) значение аффинности. Учитывая, что значение площади под ROC-кривой заявляемого способа превосходит значение для прототипа, использование непрерывной шкалы аффинностей позволяет повысить точность прогноза.
Таким образом, заявляемый способ демонстрирует более высокую точность получения прогнозных оценок по течению COVID-19 по сравнению со способом-прототипом, что является важным для применения/изменения тактики лечения пациента.
Краткое описание чертежей
Изобретение поясняется иллюстративными материалами.
На фиг. 1 представлена оценка риска, разделяющая группы пациентов, умерших в возрасте до и после 60 лет, и контрольных индивидуумов. А: распределение индекса риска в рассматриваемых группах. Б: рабочая характеристическая кривая приемника для индекса риска. В: эмпирическая функция распределения индекса риска. Вертикальные пунктирные линии определяют пороговое и дополнительное пороговое значения. Г: распределение исследуемых индивидуумов по группам низкого и высокого рисков.
Осуществление изобретения
Заявляемый способ осуществляют следующим образом.
Под тяжелой формой COVID-19 понимается состояние пациента, требующее его пребывания в отделении интенсивной терапии и/или кислородной поддержки, в процессе лечения (например, ЧДД более 30/мин, SpO2 ≤ 93%, PaO2 /FiO2 ≤ 300 мм рт.ст.).
Предварительно для популяции, в которую входит исследуемый индивидуум, формируют БД аллелей генов HLA-A, HLA-C со значениями главных компонент, которую затем используют для оценки риска развития тяжелой формы COVID-19 у конкретного пациента.
БД аллелей генов HLA-A, HLA-C со значениями главных компонент формируют по итогам соответствующего генотипирования популяции. Предпочтительно, чтобы популяционный срез включал не менее 400 человек, в т.ч. пациентов, умерших от COVID-19 - предпочтительно не менее 20 пациентов в возрасте до 60 лет, не менее 80 пациентов в возрасте от 60 лет. Из выборки исключают пациентов с иммуносупрессией (например, больные ВИЧ, принимающие химиотерапию, лица с автоиммунными заболеваниями, принимающие иммуносупрессанты, пациенты с трансплантациями).
Оценку риска развития тяжелой формы COVID-19 проводят в несколько этапов.
1. Забор биологического материала и генотипирование.
Для проведения генотипирования аллелей HLA-A, и HLA-C получают биологический материал индивидуума, выделяют из него геномную ДНК и проводят анализ секвенирования нового поколения. Биологическим материалом может служить венозная или капиллярная кровь, букальный соскоб. Выделение геномной ДНК можно проводить с помощью различных наборов реагентов, например, QIAamp DNA Blood, или HigherPurity™ Blood DNA Extraction Kit (Convax), или GeneJET Whole Blood Genomic DNA Purification Mini Kit (Thermo Scientific), или использовать любой аналогичный набор для выделения геномной ДНК.
Генотипирование осуществляют с применением набора реагентов для подготовки библиотек фрагментов ДНК генов HLA-A, HLA-C для генотипирования секвенированием нового поколения HLA-Эксперт (ООО «ДНК-Технология»), или TruSight HLA v2 Sequencing Panel Library Preparation Kits (Illumina), или любого аналогичного набора для подготовки фрагментов ДНК генов HLA-A, HLA-C. Секвенирование производят в обоих направлениях 2-4 экзонов, аннотация генотипов может быть произведена, например, с использованием базы данных IMGT/HLA [Robinson J, Barker DJ, Georgiou X, Cooper MA, Flicek P, Marsh SGE. IPD-IMGT/HLA Database. Nucleic Acids Res. 2020;48(D1):D948-D955. doi:10.1093/nar/gkz950].
2. Формирование матрицы связывания вирусных пептидов и аллелей.
Для формирования матрицы связывания используют последовательности белков SARS-CoV-2 требуемого штамма. Для заявляемого способа были использованы последовательности белков SARS-CoV-2, опубликованные на портале GISAID [Elbe S, Buckland-Merrett G. Data, disease and diplomacy: GISAID's innovative contribution to global health. Glob Challenges. 2017;1(1):33{46. doi:10.1002/gch2.1018]. Выравнивание белковых последовательностей с целью получения консенсусной последовательности может быть произведено с помощью таких программных продуктов, как Clustal Omega [Sievers F, Higgins DG. Clustal Omega for making accurate alignments of many protein sequences. Protein Sci. 2018;27(1):135{145. doi:10.1002/pro.3290]., или Kalign [https://doi.org/10.1186/1471-2105-6-298], или любого аналогичного продукта для осуществления множественного выравнивания аминокислотных последовательностей. Для каждой аминокислоты каждого вирусного белка производят расчет вероятности разрезания протеасомой в данной позиции, которое может быть реализовано, например, с использованием программного продукта NetChop [https://doi.org/10.1007/s00251-005-0781-7]. Список вирусных пептидов определяют в виде множества всевозможных фрагментов белков, состоящих из 8-12 аминокислот, имеющих вероятность протеасомного разреза не менее 0.1 с каждого из концов фрагмента.
Далее определяют аффинности связывания вирусных пептидов с рецепторами HLA-I, которые могут быть реализованы с использованием программы netMHCpan [https://doi.org/10.1093/nar/gkaa379], или MHCflurry [https://doi.org/10.1016/j.cels.2018.05.014], или любой аналогичной программой для предсказания аффинностей связывания аллелей HLA класса I и множества пептидов. Пептиды, имеющие низкую аффинность связывания ко всем аллелям из данной популяции, исключают. В качестве порогового значения, характеризующего низкую аффинность, используют 500 нмоль. Для оставшихся пептидов аффинности инвертируют, умножают на 500 и логарифмируют по основанию 10 (константы 500 и 10 не влияют на дальнейший статистический анализ и введены для удобства визуального исследования). Результат вычислений записывают в матрицу, строкам которой соответствуют аллели популяции, а столбцам - вирусные пептиды.
3. Обработка матрицы связывания методом главных компонент.
К матрице аффинностей связывания применяют метод главных компонент. В рамках данного метода исходный набор пептидов заменяют на их наиболее информативные линейные комбинации. Количество главных компонент определяют таким образом, чтобы доля дисперсии, обусловленная каждой компонентой, составляла не менее 5%.
Для каждого индивидуума с определенным генотипом рецепторов HLA-I, производят суммирование главных компонент, соответствующих каждой паре двух аллелей (HLA-A, HLA-C). При этом в суммировании участвуют вторая и третья главные компоненты по аллелям HLA-A, и четвертая компонента по HLA-C. Итоговая формула выглядит следующим образом:
,
где HLA-A1, HLA-A2, HLA-C1, HLA-C2 - аллели, соответствующие генотипу рассматриваемого индивидуума; РС2, РС3, РС 4 - вторая, третья и четвертая главная компонента генов HLA-A, HLA-A и HLA-C, соответственно.
Далее, полученную сумму приводят к диапазону путем линейной нормировки: , где - нормированный индекс риска (или просто индекс риска), - минимально возможная сумма среди рассматриваемой популяции, - максимально возможная сумма среди рассматриваемой популяции.
4. Определение групп высокого и низкого рисков.
Сравнение нормированного индекса риска с заданными пороговыми значениями - верхним и нижним, определяет группы пациентов высокого и низкого рисков развития тяжелой формы COVID-19. А именно, если значение выше верхнего порогового значения (основного), то индивидуума относят к группе высокого риска, если же ниже нижнего порогового значения (дополнительного), то индивидуума относят к группе низкого риска.
Пороговое значение определяют следующим образом. Сначала, для выборки умерших пациентов определяют нормированные индексы риска , , …, ( - нормированный индекс риска для -го пациента, - общее число пациентов). Выбор порогового значения происходит последовательной проверкой каждого значения : для каждого такого значения подсчитывают долю умерших в возрасте до 60 лет со значением большим , далее полученную долю сравнивают с общей долей умерших до 60 лет с помощью точного теста Фишера. В качестве порогового значения выбирают то значение , для которого тест определил минимальное -значение. Расчет дополнительного порогового значения производят аналогичным образом: для каждого , определяют долю умерших пациентов в возрасте до 60 лет со значением меньшим , далее полученную долю сравнивают с общей долей умерших до 60 лет с помощью точного теста Фишера; в качестве дополнительного порогового значения выбирают то значение , для которого тест определил минимальное -значение.
Заявляемый способ был разработан по итогам проведенных исследований на основе данных контрольной группы из 428 добровольцев, которая была сформирована с использованием электронных записей генотипов HLA Федерального регистра доноров костного мозга (Российский национальный исследовательский медицинский университет им. Н.И. Пирогова) и 111 пациентов, инфицированных COVID-19, которые умерли в период с мая по июль 2020 года по данным Городской клинической 46-ой больницы им. О. М. Филатова (Москва, Россия). Для изучения влияния генотипа HLA класса I на течение COVID-19 было проведено генотипирование HLA для умерших пациентов с COVID-19, а также контрольной группы (n = 428) и исследована взаимосвязь между генотипами и возрастом на момент смерти. Все пациенты имели, по крайней мере, один положительный результат теста на SARS-CoV-2 с помощью RT-qPCR из мазков носоглотки или бронхоальвеолярного лаважа. Из исследований были исключены пациенты с патологиями ВИЧ, рак и принимавшие иммуносупрессивные препараты.
Кровь (2 мл) у умерших пациентов была взята врачом из правого желудочка во флаконе с ЭДТА. Пациенты были разделены на две группы в зависимости от возраста смерти: взрослые (возраст ≤60 лет, n = 26) и пожилые люди (возраст >60 лет, n = 85).
Демографические и клинические данные этих когорт представлены в Таблице 1. Хотя пациенты с тяжелой сопутствующей патологией были исключены из исследования, 76,6% умерших пациентов имели, по крайней мере, одно основное заболевание. Только цереброваскулярные заболевания имели статистически значимое отношение шансов при сравнении групп взрослых и пожилых людей (3,8% против 34,1%, точный критерий Фишера Р = 1,89×10-3). Другие сердечно - сосудистые заболевания, такие как ишемическая болезнь сердца и сердечная недостаточность, также были более частыми в группе пожилых людей, что, однако, не было статистически значимым. Было выявлено, что процент случаев диабета составил около 3,5% в обеих анализируемых группах. Кроме того, частота хронических заболеваний почек (стадии 4-5) в обеих группах составляла 23,1% для взрослых и 16,5% для пожилых.
Полученные значения нормированного индекса риска достоверно разделяли группы умерших до и после 60 лет (P = 3,48×10-3, U-критерий Манна-Уитни) и площадью под кривой рабочей характеристики приемника (AUC ROC), равной 0,68 (перестановочный тест Р = 3,10×10-3), см. фиг. 1. Различия распределений нормированных индексов риска в когорте умерших до 60 и контрольной группе также были статистически значимыми (U-критерий Р = 3,31×10-3), в то время как разница между умершими после 60 и контрольными группами отсутствовала (Р = 0,283).
Разделение пациентов на группы высокого и низкого риска с использованием порогового и дополнительного порогового значений привело как к значимому разделению пациентов, умерших до 60 и после 60 лет (точный тест Фишера), так и к разделению от умерших до 60 от контрольных индивидуумов в группах низкого и высокого риска.
В проведенных исследованиях были использованы следующие функции из модуля scipy.stats Python [Virtanen P, Gommers R, Oliphant TE, Haberland M, Reddy T, Cournapeau D, et al. SciPy 1.0: fundamental algorithms for scientific computing in Python. Nat Methods. 2020;17(3):261-272. doi:10.1038/s41592-019-0686-2]: fisher exact для точного теста Фишера, mannwhitneyu для U-теста Манна-Уитни. Процедура Бенджамини-Хохберга использовалась для выполнения множественной коррекции тестирования. Анализ главных компонент проводился с помощью модуля scikit-learn Python [Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research. 2011;12(85):2825-2830]. Перестановочный тест для оценки значимости площади под рабочим приемником значений характеристической кривой (AUC ROC) проводился с n=1000000 перестановками меток. Участки ROC-кривой были построены с помощью Seaborn и Matplotlib [Hunter JD. Matplotlib: A 2D graphics environment. Comput Sci Eng. 2007;9(3):90-95. doi:10.1109/MCSE.2007.55].
Ниже представлены примеры реализации заявляемого изобретения.
Пример 1
Сергей П., 52 года. Был произведен забор венозной крови. Геномная ДНК была выделена с помощью набора QIAamp DNA Blood. В процессе генотипирования с помощью секвенирования нового поколения был использован набор реагентов HLA-Эксперт. В результате был получен следующий набор аллелей:
• HLA-A*01:01, HLA-A*01:01 (гомозигота по гену HLA-A).
• HLA-C*06:02, HLA-C*14:02 (гетерозигота по гену HLA-C).
Из БД главных компонент были взяты следующие значения:
• 2-я компонента HLA-A*01:01 = 7.89756817;
• 3-я компонента HLA-A*01:01 = 26.3922471;
• 4-я компонента HLA-C*06:02 = 6.93361097;
• 4-я компонента HLA-C*14:02 = 5.99825324.
Сумма приведенных значений с учетом гомозиготности HLA-A*01:01:
После нормировки с использованием показателей , был получен индекс риска:
Полученное значение оказалось выше порогового значения 89, и индивидуум был отнесен к высокой группе риска. Расчет данного порогового значения представлен в Примере 3.
Через полтора месяца после анализа индивидуум переболел тяжелой формой COVID-19 (реанимация, искусственная вентиляция легких, ЧДД 34/мин, SpO2 90%, PaO2/FiO2 293 мм рт.ст).
Пример 2
Юлия С., 44 года. Был произведен забор капиллярной крови. Геномная ДНК была выделена с помощью набора GeneJET Whole Blood Genomic DNA Purification Mini Kit. В процессе генотипирования с помощью секвенирования нового поколения был использован набор реагентов HLA-Эксперт. В результате был получен следующий набор аллелей:
• HLA-A*02:01, HLA-A*03:01 (гетерогизота по гену HLA-A).
• HLA-C*07:01, HLA-C*07:02 (гетерозигота по гену HLA-C).
Из БД главных компонент были взяты следующие значения:
• 2-я компонента HLA-A*02:01 = -15.14995773;
• 3-я компонента HLA-A*02:01 = 2.36347801;
• 2-я компонента HLA-A*03:01 = -23.65737308;
• 3-я компонента HLA-A*03:01 = -11.30419339;
• 4-я компонента HLA-C*07:01 = 1.32836588;
• 4-я компонента HLA-C*07:02 = 0.35309398.
Сумма приведенных значений
После нормировки с использованием показателей , был получен индекс риска:
Полученное значение оказалось ниже дополнительного порогового значения 41, и индивидуум был отнесен к низкой группе риска. Расчет данного порогового значения представлен в Примере 3.
Через две недели после анализа индивидуум бессимптомно переболел COVID-19 (диагностика проведена с помощью ПЦР теста).
Пример 3. Определение порогового значения
Для расчета пороговых значений была использована когорта из 111 пациентов, умерших от COVID-19 (26 пациентов в возрасте до 60 лет, 85 пациентов старше 60 лет). Был произведен забор венозной крови post mortem, выделение геномной ДНК проведено с помощью набора QIAamp DNA Blood. В процессе генотипирования с помощью секвенирования нового поколения был использован набор реагентов HLA-Эксперт. Значения индексов риска были рассчитаны для каждого пациента аналогично Примерам 1 и 2.
Для каждого значения сначала была выделена группа пациентов с индексом риска более , далее была рассчитана доля пациентов, умерших до 60 лет, среди данной группы, после чего рассчитанная доля сравнивалась с общей долей пациентов, умерших до 60 лет, равной (точный тест Фишера). В качестве порогового значения было выбрано число , равное 89, - для данного значения рассчитанная доля была максимальной (-значение согласно точному тесту Фишера равно ). Аналогично было определено дополнительное пороговое значение: минимальное -значение, равное 0.0156, было получено при выборке дополнительного порогового значения, равного N38 = 41.
Таким образом, заявляемый способ продемонстрировал высокую точность получения прогнозных оценок.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ОЦЕНКИ РИСКА РАЗВИТИЯ ТЯЖЕЛОЙ ФОРМЫ COVID-19 | 2021 |
|
RU2751410C1 |
СПОСОБ ОЦЕНКИ РИСКА НЕОБХОДИМОСТИ ПРИМЕНЕНИЯ КИСЛОРОДНОЙ ТЕРАПИИ ПРИ COVID-19 | 2021 |
|
RU2777487C1 |
Способ оценки риска развития тяжелого течения COVID-19 | 2022 |
|
RU2782796C1 |
Способ оценки риска развития тяжелого течения коронавирусной инфекции у женщин | 2021 |
|
RU2761138C1 |
НАБОР РЕАГЕНТОВ ДЛЯ ОПРЕДЕЛЕНИЯ РИСКА ВОЗНИКНОВЕНИЯ РЕЦИДИВА ОНКОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ МОЛОЧНОЙ ЖЕЛЕЗЫ | 2017 |
|
RU2671557C1 |
Способ прогнозирования исхода острого заболевания, вызванного новой коронавирусной инфекцией COVID-19 | 2021 |
|
RU2766347C1 |
Способ прогнозирования риска развития COVID-19 у больных гемобластозами | 2022 |
|
RU2783422C1 |
СПОСОБ ПРОГНОЗИРОВАНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ РЕВМАТОИДНОГО АРТРИТА ПРЕПАРАТОМ ОЛОКИЗУМАБ НА ОСНОВЕ ГЕНОТИПИРОВАНИЯ | 2020 |
|
RU2749247C1 |
СПОСОБ ПРОГНОЗИРОВАНИЯ ВЫСОКОЙ СТЕПЕНИ РИСКА ТЯЖЕЛОГО ТЕЧЕНИЯ COVID-19 | 2022 |
|
RU2787517C1 |
Способ прогнозирования риска летального исхода у пациентов с тяжелым и среднетяжёлым течением COVID-19 при проведении упреждающей противовоспалительной терапии | 2021 |
|
RU2770357C1 |
Изобретение относится к медицине, а именно к молекулярно-генетической диагностике, и может быть использовано для оценки риска развития тяжелой формы COVID-19. Проводят забор биологического материала, выделение геномной ДНК, генотипирование аллелей генов HLA-A, HLA-C и прогнозирование по полученным данным риска развития тяжелой формы COVID-19. Результаты генотипирования обрабатывают с использованием метода главных компонент. Для каждого аллеля определяют значения 2-й и 3-й главных компонент гена HLA-A и значения 4-й главной компоненты гена HLA-C из базы данных (БД) аллелей генов HLA-A, HLA-C, предварительно определенных для популяции, в которую входит исследуемый индивидуум, и содержащей значения упомянутых главных компонент аллелей соответствующих генов. Все значения главных компонент суммируют. Значение полученной суммы нормируют, определяют пороговое значение. Прогнозируют риск тяжелого течения COVID-19 при получении нормированного значения суммы выше порогового значения. Способ обеспечивает возможность повышения точности прогнозных оценок риска развития тяжелой формы COVID-19 для лиц возрастом от 35 до 60 лет за счет формирования БД аллелей генов HLA-A, HLA-C со значениями главных компонент, которую затем используют для оценки риска развития тяжелой формы COVID-19 у конкретного пациента, а также использования в заявляемом способе данных HLA-генотипа пациентов, умерших от COVID-19 в возрасте до 60 лет и старше 60 лет, что значимо влияет на повышение точности получаемых оценок. 8 з.п. ф-лы, 3 пр., 1 ил.
1. Способ оценки риска развития тяжелой формы COVID-19, включающий забор биологического материала, выделение геномной ДНК, генотипирование аллелей генов HLA-A, HLA-C и прогнозирование по полученным данным риска развития тяжелой формы COVID-19, отличающийся тем, что результаты генотипирования обрабатывают с использованием метода главных компонент, при этом определяют для каждого аллеля значения 2-й и 3-й главных компонент гена HLA-A и значения 4-й главной компоненты гена HLA-C из базы данных (БД) аллелей генов HLA-A, HLA-C, предварительно определенных для популяции, в которую входит исследуемый индивидуум, и содержащей значения упомянутых главных компонент аллелей соответствующих генов; далее все значения главных компонент суммируют, значение полученной суммы нормируют, определяют пороговое значение; прогнозируют риск тяжелого течения COVID-19 при получении нормированного значения суммы выше порогового значения.
2. Способ по п. 1, отличающийся тем, что БД аллелей генов HLA-A, HLA-C со значениями главных компонент формируют по итогам соответствующего генотипирования популяции, включая пациентов, умерших от COVID-19, расчета коэффициентов связывания всех полученных аллелей HLA-A, HLA-C с вирусными пептидами, вызывающими COVID-19, с последующей обработкой полученных данных методом главных компонент, при этом обработку осуществляют отдельно для каждого гена HLA-A, HLA-C, а количество главных компонент определяют таким образом, чтобы доля дисперсии, обусловленной каждой компонентой, составляла не менее 5% от исходной дисперсии.
3. Способ по п. 1, отличающийся тем, что нормирование суммы полученных значений главных компонент () аллелей генов HLA-A, HLA-B, HLA-C индивидуума осуществляют с использованием формулы , где – сумма всех минимальных значений главных компонент по каждой аллели из БД, – сумма всех максимальных значений главных компонент по каждой аллели из БД, – нормированный индекс риска.
4. Способ по п. 1, отличающийся тем, что пороговое значение определяют на основании использования значений главных компонент умерших пациентов в возрасте до 60 лет и после 60 из БД аллелей генов HLA-A, HLA-C, при этом для каждого умершего пациента определяют значения 2-й и 3-й главных компонент гена HLA-A и значение 4-й главной компоненты гена HLA-C из БД аллелей генов HLA-A, HLA-C, с последующим суммированием всех значений главных компонент, нормированием полученных сумм, после чего из полученных значений , , …, ( – нормированный индекс риска для i-го пациента, – общее число пациентов) в качестве порогового значения выбирают значение, характеризующее максимальную долю пациентов, умерших до 60 лет, в группе пациентов с выше порогового значения.
5. Способ по п. 4, отличающийся тем, что определение максимальной доли пациентов, умерших до 60 лет, проводят с помощью точного теста Фишера.
6. Способ по п. 4, отличающийся тем, что определяют дополнительное пороговое значение, которое определяет границу низкого риска развития тяжелой формы COVID-19, в качестве дополнительного порогового значения выбирают значение, характеризующее минимальную долю пациентов, умерших до 60 лет, в группе пациентов с ниже порогового значения.
7. Способ по п. 1, отличающийся тем, что в качестве биологического материала используют венозную или капиллярную кровь, букальный соскоб.
8. Способ по п. 1, отличающийся тем, что геномную ДНК выделяют с помощью набора реагентов QIAamp DNA Blood, или HigherPurity™ Blood DNA Extraction Kit, или GeneJET Whole Blood Genomic DNA Purification Mini Kit, или любого аналогичного набора для выделения геномной ДНК.
9. Способ по п. 1, отличающийся тем, что генотипирование осуществляют с применением набора реагентов для подготовки библиотек фрагментов ДНК генов HLA-A, HLA-B, HLA-C для генотипирования секвенированием нового поколения HLA-Эксперт.
Авторы
Даты
2021-04-26—Публикация
2021-02-14—Подача