ОБЛАСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение в основном относится к детекции и идентификации различных форм генетических маркеров и различных форм белков с потенциальной пользой в качестве диагностических маркеров. В частности, настоящее изобретение относится к одновременному применению нескольких диагностических маркеров для улучшенной детекции агрессивных форм рака предстательной железы. Более конкретно, настоящее изобретение относится к одновременному применению нескольких диагностических маркеров для улучшенной детекции агрессивного рака предстательной железы для мужчин с индексом массы тела (BMI) выше 25.
УРОВЕНЬ ТЕХНИКИ, ПРЕДШЕСТВУЮЩИЙ ИЗОБРЕТЕНИЮ
Определение специфического антигена простаты (PSA) в сыворотке широко используется для скрининга и ранней детекции рака предстательной железы (PCa). Как описано в статье "Polygenic Показатель риска Improves Prostate Cancer Risk Prediction: Results from the Stockholm-1 Cohort Study" Markus Aly и соавторов, опубликованной в EUROPEAN UROLOGY 60 (2011) 21-28 (включенной в настоящий документ в качестве ссылки), PSA в сыворотке, который измеряют в современных клинических иммунологических анализах, преимущественно существует в виде одной из трех "безкомплексных" форм (свободный PSA) или в виде комплекса с α1-антихимотрипсином (ACT). Показано, что соотношение свободного и общего PSA в сыворотке значительно улучшает детекцию PCa. Другие факторы, такие как возраст и подтвержденный семейный анамнез, также могут дополнительно улучшить детекцию PCa. Перспективным способом скрининга и ранней детекции рака предстательной железы является анализ генетических маркеров, ассоциированных с PCa, в частности однонуклеотидных полиморфизмов (SNP). Анализ множества SNP, ассоциированных с PCa, в комбинации с такими биомаркерами, как PSA, и c общей информацией о пациенте может улучшить оценку риска посредством комбинации нескольких SNP в генетический показатель.
Скрининг и ранняя детекция рака предстательной железы представляют собой сложную задачу, и в настоящее время не подтверждено ни одного одиночного биомаркера, достаточно хорошего для специфичного и чувствительного картирования мужской части популяции. Таким образом, проведены попытки комбинирования уровня биомаркеров для получения формулы, приводящей к улучшенным результатам при скрининге и ранней детекции PCa. Наиболее общим примером является стандартный тест на PSA, который фактически является оценкой "свободного" PSA и "общего" PSA. PSA находится в одной из "безкомплексных" форм и в одной из форм, где PSA образует комплекс с α1-антихимотрипсином. Другим таким примером является использование комбинаций концентраций свободного PSA, общего PSA и одной или нескольких проферментных форм PSA с целью диагностики, как описано в WO03100079 (METHOD OF ANALYZING PROENZYME FORMS OF PROSTATE SPECIFIC ANTIGEN IN SERUM TO IMPROVE PROSTATE CANCER DETECTION), включенной в настоящий документ в качестве ссылки. Одной из возможных комбинаций концентраций PSA и концентраций проферментов, которая может приводить к улучшенным результатам при скрининге и ранней детекции PCa, является индекс фи. Индекс фи разработан как комбинация PSA, свободного PSA и формы-предшественника PSA [-2]про-PSA для лучшей детекции PCa у мужчин при спорных результатах теста PSA (например, PSA 2-10 нг/мл) и не вызывающего подозрений пальцевого исследования прямой кишки, как описано в публикации "Cost-effectiveness of Prostate Health Index for prostate cancer detection" Nichol MB с соавторами, опубликованной в BJU Int. 2011 Nov 11. doi: 10.1111/j. 1464-410X.2011,10751.x, включенной в настоящий документ в качестве ссылки. Другим таким примером является комбинация psp94 и PSA, как описано в US 2012021925 (DIAGNOSTIC ASSAYS FOR PROSTATE CANCER USING PSP94 AND PSA BIOMARKERS).
Существуют другие биомаркеры с потенциальной диагностической или прогностической важностью для оценки наличия PCa у пациента, включающие MIC-1, как описано в публикации "Macrophage Inhibitory Cytokine 1: A New Prognostic Marker in Prostate Cancer" David A. Brown с соавторами, опубликованной в Clin. Cancer. Res. 2009; 15(21):OF1-7, включенной в настоящий документ в качестве ссылки.
Ранее описаны попытки комбинирования информации из множества источников в одну алгоритмическую модель для прогноза риска PCa. В открытой публикации "Blood Biomarker Levels to Aid Discovery of Cancer-Related Single-Nucleotide Polymorphisms: Kallikreins and Prostate Cancer" Robert Klein с соавторами, опубликованной в Cancer Prev. Res. (2010), 3(5):611-619 (включенной в настоящий документ в качестве ссылки), авторы описывают, как биомаркеры крови могут содействовать обнаружению новых SNP, но также демонстрируют, что существует потенциальная роль для включения в прогностические модели генотипа и уровней биомаркеров. Кроме того, в этой публикации предоставлены свидетельства того, что неаддитивная комбинация генетических маркеров и биомаркеров при взаимодействии может иметь прогностическое значение при оценке риска PCa. Позже Xu и соавторы изобретения в патентной заявке WO 2012031207 (включенной в настоящий документ в качестве ссылки) описали способ определения корреляции генетических маркеров с раком предстательной железы с высокой степенью злокачественности, преимущественно с целью идентификации индивидуумов, подходящих для химиопрофилактической терапии с использованием лечения ингибитором 5-альфа-редуктазы (например, дутастеридом или финастеридом). Совместно в этих двух открытых описаниях обобщен известный уровень техники комбинирования генетической информации и концентрации биомаркеров с целью оценки риска PCa, а также для злокачественных опухолей с высокой степенью злокачественности.
Современными показателями скрининга и ранней детекции PSA являются чувствительность приблизительно 80% и специфичность приблизительно 30%. Рассчитано, что при современном скрининге приблизительно 65% подвергают необязательной биопсии предстательной железы и что пропускаются 15-20% клинически значимых случаев рака предстательной железы. Только в Соединенных Штатах Америки приблизительно каждый год проводят 1 миллион биопсий, в результате чего диагностируют приблизительно 192000 новых случаев. Таким образом, даже небольшое улучшение эффективности диагностики приводит к большой экономии издержек здравоохранения вследствие меньшего количества биопсий и к меньшему страданию людей вследствие инвазивных диагностических процедур.
Современной клинической практикой (в Швеции) является использование общего PSA в качестве биомаркера для детекции бессимптомного и раннего рака предстательной железы. Общим пороговым значением для дальнейшего анализа с использованием биопсии предстательной железы является 3 нг/мл. Однако вследствие отрицательных последствий скрининга PSA в настоящее время не существует организованного скрининга PSA, рекомендованного в Европе или Северной Америке.
Особенно важно точно идентифицировать у индивидуумов агрессивный рак предстательной железы (aPCa) вследствие того, что чем быстрее индивидууму будет предоставлено лечение, тем больше будет вероятность излечения злокачественной опухоли. Однако идентификация aPCa является сложной, частично потому, что для разработки статистических моделей необходимы более крупные группы для обеспечения достаточного количества случаев и контролей. Таким образом, пригодность прогностических моделей aPCa является низкой. Однако настоящее изобретение относится к прогностическим моделям для идентификации aPCa посредством анализа биомаркеров и генетического профиля индивидуума.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение основано на открытии того, что комбинация диагностических маркеров различного происхождения может улучшать способность детектировать aPCa в общей популяции. В частности, настоящее изобретение улучшает возможность детектировать aPCa у индивидуумов с высоким индексом массы тела (BMI). Это может приводить к большой экономии для общества, так как более рано идентифицированные агрессивные злокачественные опухоли легче поддаются лечению.
Таким образом, на основе открытий настоящего изобретения один из аспектов настоящего изобретения относится к способу, основанному на составленной с избыточностью комбинации данных для проверки присутствия или отсутствия агрессивного рака предстательной железы (PCa) у индивидуума, включающему этапы:
1. Получения у указанного индивидуума по меньшей мере одного биологического образца;
2. Анализа в указанном биологическом образце
a. категории биомаркеров PCa, посредством определения присутствия или концентрации каждого из множества биомаркеров, ассоциированных с PCa, из указанной категории биомаркеров PCa;
b. категории SNP, ассоциированных с PCa, (SNPpc), посредством определения присутствия или отсутствия каждого из множества SNPpc из указанной категории SNPpc;
3. Комбинирования данных, относящихся к указанной категории биомаркеров PCa с получением комбинированного значения для биомаркеров, представляющего ассоциированный с биомаркерами PCa риск развития PCa;
4. Комбинирования данных, относящихся к указанной категории SNPpc с получением комбинированного значения для SNPpc, представляющего ассоциированный с SNPpc риск развития PCa, где способ при получении комбинированного значения для SNPpc позволяет пренебречь подмножеством по меньшей мере 5% SNPpc из категории SNPpc;
5. Комбинирования комбинированного значения для биомаркеров и комбинированного значения для SNPpc с получением общего комбинированного значения;
6. Определение корреляции указанного общего комбинированного значения с присутствием или отсутствием у указанного индивидуума агрессивного PCa посредством сравнения указанного общего комбинированного значения с предопределенным пороговым значением, установленным с использованием контрольных образцов диагноза известного агрессивного PCa и заболевания с доброкачественным течением.
По одному из аспектов изобретения один или несколько из этапов способа, как правило этапы 3, 4, 5 и/или 6, выполняются средствами компьютерного программного продукта при исполнении на компьютере, содержащем процессор и память.
Как правило, этап 3 описанного выше способа проводят на компьютере, запрограммированном на получение или вычисление комбинированного значения для биомаркеров на основе данных, полученных на этапе 2a; этап 4 описанного выше способа проводят на компьютере, запрограммированном на получение или вычисление комбинированного значения для SNPpc на основе данных, полученных на этапе 2b; этап 5 проводят на компьютере, запрограммированном на получение или вычисление общего комбинированного значения на основе данных, полученных на этапах 3 и 4; и/или этап 6 описанного выше способа проводят на компьютере, запрограммированном для определения корреляции общего комбинированного значения с присутствием или отсутствием у указанного индивидуума агрессивного PCa посредством сравнения указанного общего комбинированного значения с предопределенным пороговым значением, установленным с использованием контрольных образцов диагноза известного агрессивного PCa и заболевания с доброкачественным течением. Кроме того, настоящее изобретение относится к не транзисторному материальному считываемому компьютером носителю данных с исполняемыми командами для проведения таких вычислений или получения таких комбинированных значений и/или для проведения этапа определения корреляции, как описано выше.
Выбор порогового значения (или порогового уровня) зависит от множества факторов, включая в качестве неограничивающих примеров сам риск заболевания и риск, ассоциированный с неточным диагностированием индивидуума как положительного при отсутствии заболевания (ложноположительный). Выбор порогового значения более подробно описан ниже.
В предпочтительном варианте осуществления изобретения этап 2(a) указанного выше способа включает определение присутствия или концентраций по меньшей мере частично избыточных биомаркеров PCa, где по меньшей мере один, например, два, биомаркера PCa выбраны из группы, состоящей из (i) PSA, (ii) общего PSA (tPSA), (iii) интактного PSA (iPSA), (iv) свободного PSA (fPSA) и (v) hK2.
Более конкретно, при получении указанного комбинированного значения для биомаркеров способ позволяет пренебречь
подмножеством по меньшей мере одного из указанных биомаркеров PCa (i)-(v) из категории биомаркеров PCa, таким как подмножество из одного, двух, трех или четырех из указанных биомаркеров PCa (i)-(v).
Кроме того, в одном из вариантов осуществления при получении комбинированного значения для SNPpc указанный выше способ позволяет пренебречь по меньшей мере 10%, например 15%, например 20%, например 30% из SNPpc из категории SNPpc.
Предпочтительно, данные, относящиеся к категории биомаркеров PCa, комбинируют в соответствии с предопределенным уравнением с получением указанного комбинированного значения для биомаркеров, и/или данные, относящиеся к категории SNPpc, комбинируют в соответствии с предопределенным уравнением с получением указанного комбинированного значения для SNPpc. Также указанное комбинированное значение для биомаркеров и указанное комбинированное значение для SNPpc предпочтительно комбинируют в соответствии с предопределенным уравнением с получением указанного общего комбинированного значения.
В одном из вариантов осуществления указанный выше способ дополнительно включает этап рекомендации проведения биопсии у индивидуума, если общее комбинированное значение превышает пороговое значение.
В еще одном варианте осуществления указанный выше способ дополнительно включает этап рекомендации смены индивидуумом привычной диеты для потери массы для достижения значения BMI ниже 30, регулярных упражнений и/или прекращения курения, если общее комбинированное значение превышает пороговое значение.
В одном из вариантов осуществления настоящего изобретения SNP, ассоциированные с PCa, (SNPpc) включают по меньшей мере один из rs11672691, rs11704416, rs3863641, rs12130132, rs4245739, rs3771570, rs7611694, rs1894292, rs6869841, rs2018334, rs16896742, rs2273669, rs1933488, rs11135910, rs3850699, rs11568818, rs1270884, rs8008270, rs4643253, rs684232, rs11650494, rs7241993, rs6062509, rs1041449, rs2405942, rs12621278, rs9364554, rs10486567, rs6465657, rs2928679, rs6983561, rs16901979, rs16902094, rs12418451, rs4430796, rs11649743, rs2735839, rs9623117 и rs138213197.
В одном из вариантов осуществления способ дополнительно включает анализ категории SNP, ассоциированных с концентрацией биомаркеров PCa, (SNPbm) посредством определения присутствия или отсутствия по меньшей мере одного SNPbm; комбинации данных, относящихся к указанным SNPbm с получением комбинированного значения для SNPbm, и включения указанного комбинированного значения для SNPbm в указанное общее комбинированное значение.
В одном из вариантов осуществления по меньшей мере один SNPbm включает по меньшей мере один из rs3213764, rs1354774, rs1227732, rs2736098, rs401681, rs10788160, rs11067228, rs1363120, rs888663 и rs1054564.
В одном из вариантов осуществления изобретения способ дополнительно включает анализ категории SNP, ассоциированных с индексом массы тела указанного индивидуума, (SNPbmi) посредством определения присутствия или отсутствия по меньшей мере одного SNPbmi; комбинации данных, относящихся к указанным SNPbmi с получением комбинированного значения для SNPbmi, и включения указанного комбинированного значения для SNPbmi в указанное общее комбинированное значение.
В одном из вариантов осуществления по меньшей мере один SNPbmi включает по меньшей мере один из rs3817334, rs10767664, rs2241423, rs7359397, rs7190603, rs571312, rs29941, rs2287019, rs2815752, rs713586, rs2867125, rs9816226, rs10938397 и rs1558902.
В другом варианте осуществления изобретения способ дополнительно включает сбор семейного анамнеза, относящегося к PCa, истории лечения и данных физического обследования у указанного индивидуума; где указанный семейный анамнез, история лечения и/или данные физического обследования включают в комбинированные данные, получая указанное общее комбинированное значение.
В еще одном варианте осуществления изобретения способ дополнительно включает анализ дополнительной категория биомаркеров PCa, с измерением присутствия или концентрации одного или каждого из множества биомаркеров PCa из указанной дополнительной категории биомаркеров; комбинацией данных, относящихся к указанной дополнительной категории биомаркеров PCa с получением дополнительного комбинированного значения для биомаркеров для указанной дополнительной категории биомаркеров PCa, и включением указанного дополнительного комбинированного значения для биомаркеров в общее комбинированное значение; где комбинация данных для получения дополнительного комбинированного значения для биомаркеров составлена с избыточностью, так как дополнительная категория биомаркеров PCa содержит более одного биомаркера PCa.
В предпочтительном варианте осуществления дополнительная категория биомаркеров PCa содержит биомаркер MIC-1 и необязательно другие родственные MIC-1 биомаркеры или биомаркер MSMB и необязательно другие родственные MSMB биомаркеры.
В другом варианте осуществления способ включает анализ каждой из множества дополнительных категорий биомаркеров PCa и получения дополнительного комбинированного значения для биомаркеров для каждой из категорий биомаркеров PCa описанным выше способом. Предпочтительно анализируют по меньшей мере две дополнительных категории биомаркеров PCa, где одна дополнительная категория биомаркеров PCa содержит биомаркер MIC-1 и необязательно другие родственные MIC-1 биомаркеры, а другая дополнительная категория содержит биомаркер MSMB и необязательно другие родственные MSMB биомаркеры.
В одном из вариантов осуществления биологический образец представляет собой образец крови.
В одном из вариантов осуществления изобретения общее комбинированное значение рассчитывают способом, в котором используют неаддитивный эффект SNP, ассоциированных с концентрацией биомаркеров PCa, (SNPbm) и соответствующей концентрации биомаркеров PCa.
В предпочтительном варианте осуществления способа по настоящему изобретению значение BMI индивидуума составляет более 25, например, более 30.
В одном из вариантов осуществления способа определение присутствия или отсутствия SNP проводят с использованием масс-спектрометрии MALDI.
В одном из вариантов осуществления способа определение присутствия или концентрации биомаркеров PCa проводят с использованием технологии микропанелей.
В предпочтительном варианте осуществления способа определение присутствия или отсутствия SNP (принадлежащего к любой категории SNP) включает определение количества аллелей указанного SNP. В одном из вариантов осуществления один или два аллеля соответствуют присутствию указанного SNP, а ноль аллелей соответствует отсутствию указанного SNP у указанного индивидуума; где ноль аллелей соответствует гомозиготе, отрицательной по указанному SNP, один аллель соответствует положительной гетерозиготе, а два аллеля соответствуют положительной гомозиготе.
В одном из вариантов осуществления описанный выше способ включает использование устройства для анализа ELISA, устройства для анализа микропанелей, устройства для анализа иммунопреципитации, устройства для анализа иммунофлуоресценции, устройства для радиоиммунологического анализа или устройства для масс-спектрометрии с использованием лазерной десорбции/ионизации с помощью матрицы (MALDI) для определения присутствия или концентрации биомаркера PCa.
В одном из вариантов осуществления, который можно комбинировать с указанным выше вариантом осуществления, описанный выше способ включает использование устройства для масс-спектрометрии с использованием лазерной десорбции/ионизации с помощью матрицы (MALDI) для определения присутствия или отсутствия SNP.
Другой аспект настоящего изобретения относится к устройству для анализа для проведения этапа 2a (т.е. определения присутствия или концентрации по меньшей мере одного биомаркера PCa) и этапа 2b (т.е. определения присутствия или отсутствия по меньшей мере одного SNPpc) описанного выше способа для проверки присутствия или отсутствия агрессивного рака предстательной железы у индивидуума, где указанное устройство для анализа содержит твердую фазу с иммобилизованными на ней по меньшей мере двумя различными категориями лигандов, где:
- первая категория указанных лигандов специфически связывается с биомаркером PCa и включает множество различных лигандов, специфически связывающихся с каждым из множества различных биомаркеров PCa, предпочтительно по меньшей мере с одним из PSA, iPSA, tPSA, fPSA, hK2 и необязательно MSMB и/или MIC-1; и
- вторая категория указанных лигандов специфически связывается с SNPpc и включает множество различных лигандов, специфически связывающихся с каждым из множества различных SNPpc, таких как по меньшей мере один из rs11672691, rs11704416, rs3863641, rs12130132, rs4245739, rs3771570, rs7611694, rs1894292, rs6869841, rs2018334, rs16896742, rs2273669, rs1933488, rs11135910, rs3850699, rs11568818, rs1270884, rs8008270, rs4643253, rs684232, rs11650494, rs7241993, rs6062509, rs1041449 или rs2405942, rs12621278, rs9364554, rs10486567, rs6465657, rs2928679, rs6983561, rs16901979, rs16902094, rs12418451, rs4430796, rs11649743, rs2735839, rs9623117 и rs138213197.
В одном из вариантов осуществления устройство для анализа дополнительно адаптировано для определения присутствия или отсутствия SNPbm, в случае чего твердая фаза устройства для анализа дополнительно содержит третью категорию иммобилизованных лигандов, которая специфически связывается с SNPbm и включает один или множество различных лигандов, специфически связывающихся с одним или каждым из множества различных SNPbm, таких как по меньшей мере один из rs1227732, rs3213764, rs1354774, rs2736098, rs401681, rs10788160, rs11067228, rs1363120, rs888663 и rs1054564.
В одном из вариантов осуществления устройство для анализа адаптировано для определения присутствия или отсутствия SNPbmi, в случае чего твердая фаза дополнительно содержит четвертую категорию иммобилизованных лигандов, которая специфически связывается с SNPbmi и включает один или множество различных лигандов, специфически связывающихся с одним или множеством различных SNPbmi, таких как по меньшей мере один из rs3817334, rs10767664, rs2241423, rs7359397, rs7190603, rs571312, rs29941, rs2287019, rs2815752, rs713586, rs2867125, rs9816226, rs10938397 и rs1558902.
В одном из вариантов осуществления описанное выше устройство для анализа включает устройство для анализа ELISA, устройство для анализа микропанелей, устройство для анализа иммунопреципитации, устройство для анализа иммунофлуоресценции, устройство для радиоиммунологического анализа или устройство для масс-спектрометрии с использованием лазерной десорбции/ионизации с помощью матрицы (MALDI) для определения присутствия или концентрации биомаркера PCa.
В одном из вариантов осуществления, который можно комбинировать с указанным выше вариантом осуществления, описанное выше устройство для анализа включает устройство для масс-спектрометрии с использованием лазерной десорбции/ионизации с помощью матрицы (MALDI) для определения присутствия или отсутствия SNP.
По дополнительному аспекту изобретения предоставлен набор для тестирования для проведения этапа 2a (т.е. определения присутствия или концентрации по меньшей мере одного биомаркера PCa) и этапа 2b (т.е. определения присутствия или отсутствия по меньшей мере одного SNPpc) описанного выше способа для проверки присутствия или отсутствия агрессивного рака предстательной железы у индивидуума, содержащий соответствующее устройство для анализа, как описано выше и по меньшей мере две категории детектируемых молекул, где:
- первая категория указанных детектирующих молекул способна к детекции биомаркера PCa, предпочтительно по меньшей мере одного из PSA, iPSA, tPSA, fPSA, и hK2 и необязательно MSMB и/или MIC-1; и
- вторая категория указанных детектирующих молекул способна к детекции SNPpc, таких как по меньшей мере один из rs11672691, rs11704416, rs3863641, rs12130132, rs4245739, rs3771570, rs7611694, rs1894292, rs6869841, rs2018334, rs16896742, rs2273669, rs1933488, rs11135910, rs3850699, rs11568818, rs1270884, rs8008270, rs4643253, rs684232, rs11650494, rs7241993, rs6062509, rs1041449 или rs2405942, rs12621278, rs9364554, rs10486567, rs6465657, rs2928679, rs6983561, rs16901979, rs16902094, rs12418451, rs4430796, rs11649743, rs2735839, rs9623117 и rs138213197.
В одном из вариантов осуществления набор для тестирования содержит устройство для анализа, которое дополнительно адаптировано для определения присутствия или отсутствия по меньшей мере одного SNPbm, и третью категорию детектирующих молекул, способных к детекции SNPbmi, таких как по меньшей мере одна из rs1227732, rs3213764, rs1354774, rs2736098, rs401681, rs10788160, rs11067228, rs1363120, rs888663 и rs1054564.
В одном из вариантов осуществления набор для тестирования содержит устройство для анализа, которое адаптировано для определения присутствия или отсутствия SNPbmi, и четвертую категорию детектирующих молекул, которые способны к детекции SNPbmi, таких как по меньшей мере одна из rs3817334, rs10767664, rs2241423, rs7359397, rs7190603, rs571312, rs29941, rs2287019, rs2815752, rs713586, rs2867125, rs9816226, rs10938397 и rs1558902.
В другом аспекте настоящего изобретения предоставлено устройство для анализа, содержащее твердую фазу с иммобилизованными на ней по меньшей мере двумя различными категориями лигандов, где:
- первая категория указанных лигандов специфически связывается с биомаркером PCa и включает множество различных лигандов, специфически связывающихся с каждым из множества различных биомаркеров PCa, выбранных по меньшей мере одного из PSA, iPSA, tPSA, fPSA и hK2 и необязательно MSMB и/или MIC-1; и
- вторая категория указанных лигандов специфически связывается с SNPpc и включает множество различных лигандов, специфически связывающихся с каждым из множества различных SNPpc, выбранных по меньшей мере одного из rs11672691, rs11704416, rs3863641, rs12130132, rs4245739, rs3771570, rs7611694, rs1894292, rs6869841, rs2018334, rs16896742, rs2273669, rs1933488, rs11135910, rs3850699, rs11568818, rs1270884, rs8008270, rs4643253, rs684232, rs11650494, rs7241993, rs6062509, rs1041449 или rs2405942, rs12621278, rs9364554, rs10486567, rs6465657, rs2928679, rs6983561, rs16901979, rs16902094, rs12418451, rs4430796, rs11649743, rs2735839, rs9623117 и rs138213197.
В одном из вариантов осуществления устройства для анализа твердая фаза дополнительно содержит третью категорию иммобилизованных лигандов, которые специфически связываются с SNPbm, включающую один или множество различных лигандов, специфически связывающихся с одним или каждым из множества различных SNPbm, выбранных по меньшей мере одного из rs1227732, rs3213764, rs1354774, rs2736098, rs401681, rs10788160, rs11067228, rs1363120, rs888663 и rs1054564.
В дополнительном варианте осуществления устройства для анализа, твердая фаза дополнительно содержит четвертую категорию иммобилизованных лигандов, которые специфически связываются с SNPbmi, включающую один или множество различных лигандов, специфически связывающихся с одним или каждым из множества различных SNPbmi, выбранных по меньшей мере одного из rs3817334, rs10767664, rs2241423, rs7359397, rs7190603, rs571312, rs29941, rs2287019, rs2815752, rs713586, rs2867125, rs9816226, rs10938397 и rs1558902.
В другом аспекте изобретения предоставлен компьютерный программный продукт, непосредственно загружаемый во внутреннюю память цифрового компьютера, где компьютерный программный продукт содержит средства программного кода для выполнения по меньшей мере этапа 3 (т.е. комбинирования данных, относящихся к указанной категории биомаркеров PCa с получением комбинированного значения для биомаркеров), этапа 4 (т.е. комбинирования данных, относящихся к указанной категории SNPpc с получением комбинированного значения для SNPpc), этапа 5 (т.е. комбинирования комбинированного значения для биомаркеров и комбинированного значения для SNPpc с получением общего комбинированного значения) и/или этапа 6 (определения корреляции указанного общего комбинированного значения с присутствием или отсутствием агрессивного PCa у указанного индивидуума посредством сравнения общего комбинированного значения с предопределенным пороговым значением, установленной с использованием контрольных образцов диагноза известного агрессивного PCa и заболевания с доброкачественным течением) описанного выше способа проверки присутствия или отсутствия агрессивного рака предстательной железы у индивидуума; такого как этап 1 (т.е. получение у указанного индивидуума по меньшей мере одного биологического образца), этап 2 (анализ категории биомаркеров PCa посредством определения присутствия или концентрации каждого из множества биомаркеров PCa и анализ категории SNPpc посредством определения присутствия или отсутствия каждого из множества SNPpc в биологическом образце), этапы 3,4,5 и 6 указанного способа.
В одном из вариантов осуществления компьютерный программный продукт дополнительно содержит средства программного кода для анализа категории SNPbm посредством определения присутствия или отсутствия по меньшей мере одного SNPbm.
В другом варианте осуществления компьютерный программный продукт дополнительно содержит средства программного кода для анализа категории SNPbmi посредством определения присутствия или отсутствия по меньшей мере одного SNPbmi.
Дополнительный аспект изобретения относится к устройству, содержащему устройство для анализа, как описано выше, и соответствующий компьютерный программный продукт, как описано выше.
КРАТКОЕ ОПИСАНИЕ РИСУНКОВ
На фигуре 1 представлены кривые ROC для линейной модели из примера 1, иллюстрирующего различие в эффективности между PSA (101) и многопараметрической моделью (102) в прогнозе aPCa.
На фигуре 2 представлен пример дерева решений для прогноза необходимости направления индивидуума на биопсию.
На фигуре 3 представлены кривые ROC для линейной модели из примера 1, иллюстрирующего различие в эффективности между PSA (301) и многопараметрической моделью (302) в прогнозе aPCa у индивидуумов со значением BMI более 25.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Для целей настоящей заявки и для ясности ниже приведены следующие определения:
В основном термин "PSA" относится к сывороточному специфическому антигену предстательной железы. PSA существует в различных формах, где термин "свободный PSA" относится к PSA, который является несвязанным или не связанным с другой молекулой, термин "связанный PSA" относится к PSA, который является связанным или образующим комплекс с другой молекулой, и, наконец, термин "общий PSA" относится к сумме свободного PSA и связанного (образующего комплекс) PSA. Термин "с/о PSA" представляет собой отношение несвязанного PSA к общему PSA. Также существуют молекулярные производные PSA, где термин "про-PSA" относится к неактивной форме-предшественнику PSA, а "интактный PSA" относится к дополнительной форме про-PSA, которая является интактной и неактивной.
Термин "диагностический анализ" относится к детекции присутствия или характера патологического состояния. Он может использоваться взаимозаменяемо со "способом диагностики". Диагностические анализы отличаются по их чувствительности и специфичности.
Одной из мер применимости диагностического средства является "площадь под кривой операционных характеристик приемника", которая общеизвестна как статистика ROC-AUC. Эта широко признанная мера учитывает и чувствительность, и специфичность средства. Как правило, мера ROC-AUC находится в диапазоне от 0,5 до 1,0, где значение 0,5 означает, что средство не имеет диагностической ценности, а значение 1,0 означает, что средство обладает 100% чувствительностью и 100% специфичностью.
Термин "чувствительность" относится к доле всех индивидуумов с PCa, которые верно идентифицированы как индивидуумы с PCa (что эквивалентно количеству истинноположительных случаев, деленных на сумму количества истинноположительных случаев и ложноотрицательных случаев).
Термин "специфичность" относится к доле всех индивидуумов, здоровых в отношении PCa (т.е. не больных PCa), которые верно идентифицированных, как индивидуумы, здоровые в отношении PCa (что эквивалентно количеству истинноотрицательных случаев, деленных на сумму количества истинноотрицательных случаев и ложноположительных случаев).
Термин "биомаркер" относится к белку, части белка, пептиду или полипептиду, которые можно использовать в качестве биологического маркера, например, в диагностических целях.
Термин "калликреин-подобный биомаркер" относится к белковым биомаркерам, принадлежащим или родственным калликреиновому семейству белков, включающему в качестве неограничивающих примеров специфический антиген предстательной железы (PSA) в свободной форме или в форме комплекса, про-PSA (ряд изоформ PSA) и в частности в укороченной форме (-2) про-PSA, в форме интактного PSA, простатическую кислую фосфатазу (PAP) человека и калликреин 2 человека (сокращаемый в настоящей заявке как hK2, или HK2, или hk2).
Термин "однонуклеотидный полиморфизм" (SNP) относится к генетическим свойствам определенного локуса генетического кода индивидуума. SNP может быть ассоциирован с повышенным риском PCa, и, таким образом, его можно использовать для диагностического или прогностического анализов индивидуума. База данных однонуклеотидных полиморфизмов (dbSNP) представляет собой архив генетической изменчивости в пределах и в совокупности различных видов, разработанный и размещенный национальным центром биотехнологической информации (NCBI) совместно с национальным исследовательским институтом генома человека (NHGRI), где оба расположены в США. Хотя название базы данных подразумевает коллекцию только одного класса полиморфизмов (т.е., однонуклеотидных полиморфизмов (SNP)), фактически она содержит целый ряд молекулярных вариантов. Каждая уникальная поступающая запись об SNP получает ссылочный номер ID SNP ("rs#"; "кластер refSNP"). В настоящей заявке SNP в основном идентифицированы с использованием номеров rs#. Таким образом, в настоящей заявке SNP используют для обозначения ряда молекулярных вариантов, включенных в dbSNP, а не только однонуклеотидных полиморфизмов. Для целей настоящей заявки термины "SNP" и "несколько SNP" можно использовать взаимозаменяемо, и их можно использовать для описания одного и/или нескольких "однонуклеотидных полиморфизмов".
Термин "индекс массы тела" (BMI) относится к приближенному расчету жировой ткани организм человека на основе массы и роста индивидуума в соответствии с формулой BMI = масса/(рост*рост), где масса представляет собой массу индивидуума, выражаемую в килограммах, а рост представляет собой рост индивидуума, выражаемый в метрах. Как правило, полагают, что нормальное значение BMI у здорового индивидуума находится в диапазоне от 18,5 до 25, а индивидуумов с BMI>30, как правило, рассматривают как страдающих ожирением.
Термин "агрессивный рак предстательной железы" (aPCa) относится к более серьезному состоянию, чем заболевание обычным раком предстательной железы. aPCa можно определять различными способами, включая в качестве неограничивающих примеров (a) рак предстательной железы с индексом Глисона 7 или более, (b) рак предстательной железы в стадии опухоли три или более, (c) рак предстательной железы у индивидуума со значением PSA более 10 нг/мл, (d) индивидуум с повышенным значением PSA (время удвоения менее одного года) и (e) компьютеризированный анализ изображений (например, позитронно-эмиссионная томография (PET), или однофотонная эмиссионная компьютерная томография (SPECT), или компьютеризированная рентгеновская томография (CT), или магнитно-резонансная томография (MRI), или ультразвуковая визуализация или любой другой компьютеризированный анализ изображений), регистрирующий размер опухоли в верхнем квартиле популяции пациентов.
Термин "история болезни (анамнез)" относится к информации, относящейся к прошедшим исследованиям, диагнозам и/или лечению любого злокачественного заболевания. Одним из неограничивающих примеров истории болезни (анамнеза) является проводимое ранее у индивидуума исследование на присутствие PCa посредством биопсии предстательной железы.
Термин "категория параметров" относится к группе или семейству ассоциированных параметров, таких как ассоциированные биомаркеры или ассоциированные SNP, которые частично или полностью вырождены в отношении эффективности прогноза. Одним из примеров категории параметров является "калликреин-подобные биомаркеры", категория, которая включает, например, PSA, общий PSA (tPSA), интактный PSA (iPSA), свободный PSA (fPSA) и hk2. Другим примером категории параметров является "SNP, ассоциированные с BMI", категория, которая включает SNP, которые ассоциированы с BMI индивидуума. В прогностических моделях по настоящему изобретению могут оказаться достаточными результаты измерения (данные) для подмножества членов каждой категории, чтобы каждая категория была представлена в прогностической модели, несмотря на использование только подмножества членов соответствующих категорий. В настоящей заявке термин "категория параметров" иногда обозначают только как "категория".
Термин "комбинированное значение" относится к комбинации данных, ассоциированных с категорией параметров репрезентативным значением для указанной категории параметров. Как правило, комбинацию данных можно обрабатывать в соответствии с одним или несколькими предопределенными уравнениями. Комбинированное значение представляет собой результат вычисления комбинации данных в соответствии с одним или несколькими из предопределенных уравнений. Для различных результатов измерения (т.е. данных) применимы различные уравнения в зависимости от того какие подмножества членов категорий параметров этих данных доступны. Одним из неограничивающих примеров способа формирования комбинированного значения для конкретной категории параметров является использование среднего имеющихся результатов для членов указанной категории. В настоящей заявке термин "комбинированное значение" иногда обозначают как "показатель". Одним из неограничивающих примеров комбинированного значения является "комбинированное значение для биомаркеров". Другим неограничивающим примером комбинированного значения является "генетическое комбинированное значение" (или "генетический показатель"), а более конкретно "комбинированное значение для SNP".
Термин "составленная с избыточностью комбинация данных" относится к комбинации данных, полученной посредством множества измерений с получением комбинированного значения для одной или нескольких категорий параметров или их подмножеств, где комбинирование данных проводят так, что комбинированное значение, представляющую одну из категорий параметров, можно получать на основе подмножества данных для указанной категории, например, где некоторые данные потеряны или ошибочны, или на всем множестве данных для указанной категории.
Как используют в настоящей заявке, термин "множество" означает "два или более".
Настоящее изобретение относится к способам диагностики, способствующим указанию, оценке, детекции и/или определению присутствия или отсутствия у индивидуума агрессивного рака предстательной железы. При желании, настоящее изобретение можно применять в определенных подгруппах для увеличения эффективности и применимости изобретения в указанных подгруппах. Хотя настоящее изобретение можно использовать для индивидуумов-мужчин общей популяции, возможно конструировать способы диагностики для детекции aPCa с увеличенной эффективностью для определенных подгрупп. Одним из неограничивающих примеров определенной подгруппы являются индивидуумы с высоким индексом массы тела (BMI), например, BMI>25, или BMI>30, или BMI>35. Другим неограничивающим примером определенной подгруппы являются индивидуумы с низким значением PSA, например, PSA<4 нг/мл, или PSA<3 нг/мл, или PSA<2 нг/мл, или PSA<1 нг/мл.
Основным принципом изобретения является использование комбинации биомаркеров и генетической информации таким образом, что комбинаторное использование оцениваемой информации об индивидууме улучшает качество постановки диагноза.
- Сбор у указанного пациента семейного анамнеза в отношении PCa (категория HIST).
- Сбор данных физического обследования пациента, таких как масса, BMI, возраст и подобное (категория PPD)
- Получение у указанного пациента ряда биологических образцов.
- Определение или количественное определение в указанных биологических образцах присутствия или концентрации множества определенных биомаркеров (категория биомаркеров) с последующей комбинацией данных, относящихся к указанным биомаркерам, с получением комбинированного значения для биомаркеров.
- Определение или количественное определение в указанных биологических образцах генетического статуса указанных пациентов относительно множества определенных SNP, ассоциированных с PCa, (категория SNPpc) посредством определения или количественного определения присутствия или отсутствие множества определенных SNP, ассоциированных с PCa, (SNPpc), и с последующей комбинацией полученных данных, относящихся к SNP, ассоциированным с PCa, с получением комбинированного значения для SNPpc.
- Определение или количественное определение в указанных биологических образцах генетического статуса указанных пациентов относительно множества определенных SNP, ассоциированных с уровнем экспрессии биомаркеров или концентрацией биомаркеров, (категория SNPbm) посредством определения или количественного определения присутствия или отсутствия множества определенных SNP, ассоциированных с уровнем экспрессии биомаркеров или концентрацией биомаркеров, (SNPbm) с получением комбинированного значения для SNPbm.
- Определение или количественное определение в указанных биологических образцах генетического статуса указанных пациентов относительно множества определенных SNP, ассоциированных с индексом массы тела (BMI) указанного индивидуума, (категория SNPbmi) посредством определения или количественного определения присутствия или отсутствия множества определенных SNP, ассоциированных с BMI, (SNPbmi) с получением комбинированного значения для SNPbmi.
- Комбинация данных по меньшей мере двух категорий, определенных выше, с получением общего комбинированного значения для использование в детекции раннего агрессивного рака предстательной железы.
- Определение посредством использования указанного общего комбинированного значения, отдельно или в комбинации с дополнительным данными, вероятности наличия у пациента aPCa.
Более подробно, этап, включающий сбор семейного анамнеза, в качестве неограничивающих примеров включает определение того, страдает ли или страдал PCa любой близкородственный мужской член семьи (такой как отец, брат или сын пациента).
Как правило, собирают данные физического обследования пациента, которые получают посредством регулярного медицинского осмотра, где определяют возраст, массу, рост, BMI и подобные данные физического обследования.
Сбор биологических образцов у пациента в качестве неограничивающих примеров включает плазму, сыворотку, ДНК лейкоцитов периферической крови и мочу.
Количественное определение присутствия или концентрации биомаркеров в биологическом образце можно проводить множеством различных способов. Одним из общеупотребимых способов является использование твердофазного иммуноферментного анализа (ELISA), в котором используют антитела и калибровочную кривую для оценки присутствия и (когда возможно) концентрации выбранного биомаркера. Как видно из публикации "Association between saliva PSA and serum PSA in conditions with prostate adenocarcinoma" Shiiki N с соавторами, опубликованной в Biomarkers, 2011 Sep; 16(6):498-503, включенной в настоящий документ в качестве ссылки, анализы ELISA общеупотребимы и известны в данной области. Другим общеупотребимым способом является использование анализа микропанелей для количественного определения присутствия или концентрации биомаркеров в биологическом образце. Типичный анализ микропанелей включает плоское предметное стекло, на котором в неперекрывающихся областях на одной из сторон стекла фиксируют множество различных захватывающих реагентов (как правило, антител), каждый из которых выбран для специфического захвата одного типа биомаркеров. Биологическому образцу в течение определенного периода времени позволяют контактировать с областью, где расположены указанные захватывающие реагенты, с последующей отмывкой области захватывающих реагентов. На этой стадии, в случае, если требуемый биомаркер находился в биологическом образце, соответствующий захватывающий реагент захватывает фракцию требуемого биомаркера и удерживает ее на предметном стекле даже после отмывки. Затем в область с захватывающими реагентами (которая в этот момент потенциально содержит ассоциированные биомаркеры) добавляют набор реагентов для детекции, где указанные реагенты для детекции способны (i) связываться с биомаркером, находящимся на предметном стекле и (ii) продуцировать детектируемый сигнал (как правило, посредством конъюгации с флуоресцентным красителем). Как правило, необходимо, чтобы на предметное стекло добавляли один реагент для детекции на биомаркер. Существует множество других способов, которыми можно определить присутствие или концентрацию биомаркера, включая в качестве неограничивающих примеров анализы иммунопреципитации, анализы иммунофлуоресценции, радиоиммунологические анализы и масс-спектрометрию с использованием лазерной десорбции/ионизации с помощью матрицы (MALDI), чтобы указать несколько примеров.
Как правило, количественное определение присутствия SNP посредством анализа биологического образца включает анализ посредством масс-спектрометрии MALDI на основе аллель-специфической достройки праймеров, даже если равным образом применимы другие способы. Это применимо к SNP любого типа, т.е. и к SNP, ассоциированным с PCa, (SNPpc), и к SNP, ассоциированным с BMI, (SNPbmi), и к SNP, ассоциированным с экспрессией/концентрацией биомаркеров, (SNPbm).
Комбинация данных может представлять собой алгоритмическую комбинацию результатов любого типа, такую как линейная комбинация данных, где линейная комбинация улучшает эффективность диагностики (например, как определяют с использованием ROC-AUC). Другая возможная комбинация включает нелинейную полиномиальную зависимость.
Подходящие биомаркеры для диагностики aPCa в качестве неограничивающих примеров включают специфический антиген предстательной железы (PSA) в любой из свободной формы или формы в комплексе, про-PSA (ряд изоформ PSA) и в частности укороченной формы (-2) про-PSA, формы интактного PSA, простатическую кислую фосфатазу (PAP) человека, калликреин 2 человека (hK2), антиген раннего рака предстательной железы (EPCA), секреторный белок предстательной железы (PSP94; также известный как бета-микросеминопротеин и MSMB), глутатион-S-трансферазу π (GSTP1) и α-метилацилкофермент-A-рацемазу (AMACR). Ассоциированные биомаркеры, которые могут быть пригодны для улучшения диагностической точности способа, включают ингибирующий макрофаги цитокин 1 (MIC-1; также известный как GDF-15).
Подходящие SNP, ассоциированные с PCa, в качестве неограничивающих примеров включают rs12621278 (хромосома 2, локус 2q31.1), rs9364554 (хромосома 6, локус 6q25.3), rs10486567 (хромосома 7, локус 7p15.2), rs6465657 (хромосома 7, локус 7q21.3), rs2928679 (хромосома 8, локус 8p21), rs6983561 (хромосома 8, локус 8q24.21), rs16901979 (хромосома 8, локус 8q24.21), rs16902094 (хромосома 8, локус 8q24.21), rs12418451 (хромосома 11, локус 11q13.2), rs4430796 (хромосома 17, локус 17q12), rs11649743 (хромосома 17, локус 17q12), rs2735839 (хромосома 19, локус 19q13.33), rs9623117 (хромосома 22, локус 22q13.1) и rs138213197 (хромосома 17, локус 17q21)
Дополнительно подходящие SNP, ассоциированные с PCa, в качестве неограничивающих примеров включают rs11672691, rs11704416, rs3863641, rs12130132, rs4245739, rs3771570, rs7611694, rs1894292, rs6869841, rs2018334, rs16896742, rs2273669, rs1933488, rs11135910, rs3850699, rs11568818, rs1270884, rs8008270, rs4643253, rs684232, rs11650494, rs7241993, rs6062509, rs1041449 и rs2405942.
Дополнительно подходящие SNP, ассоциированные с PCa, в качестве неограничивающих примеров включают rs138213197, как описано в публикации "Germline mutations in HOXB13 and prostate-cancer risk" Ewing CM с соавторами, опубликованной в N. Engl. J. Med. 2012 Jan 12;366(2):141-9 (включенной в настоящий документ в качестве ссылки), 1100delC (22q12.1) и I157T (22q12.1), как описано в публикации "A novel founder CHEK2 mutation is associated with increased prostate cancer risk" Cybulski C с соавторами, опубликованной в Cancer Res. 2004 Apr 15;64(8):2677-9 (включенной в настоящий документ в качестве ссылки), и 657del5 (8q21), как описано в публикации "NBS1 is a prostate cancer susceptibility gene" Cybulski C с соавторами, опубликованной в Cancer Res. 2004 Feb 15;64(4):1215-9 (включенной в настоящий документ в качестве ссылки).
Можно определить категорию параметров "SNP, ассоциированные с PCa", которая включает SNP, ассоциированные с PCa. Подходящие представители включают (но не ограничены ими) SNP, перечисленные выше.
Подмножества представителей этой категории должно быть достаточно для фактического представления категории в прогностической модели.
Подходящие SNP, ассоциированные с отличными от PCa процессами, в качестве неограничивающих примеров включают rs3213764, rs1354774, rs2736098, rs401681, rs10788160, rs11067228, которые все ассоциированы с уровнем экспрессии PSA. Можно определить категорию параметров "SNP, ассоциированные с концентрацией PSA" или "SNP, ассоциированные с уровнем экспрессии PSA", которая включает SNP, ассоциированные с концентрацией или уровнем экспрессии PSA. Подмножества представителей этой категории должно быть достаточно для фактического представления категории в прогностической модели. SNP rs3213764 и rs1354774 конкретно ассоциированы с уровнем экспрессии свободного PSA.
Дополнительно подходящие SNP, ассоциированные с отличными от PCa процессами, в качестве неограничивающих примеров включают rs1363120, rs888663, rs1227732, rs1054564, которые все ассоциированы с уровнем экспрессии цитокина-биомаркера воспаления MIC1. Можно определить категорию параметров "SNP, ассоциированные с концентрацией MIC1" или "SNP, ассоциированные с уровнем экспрессии MIC1", которая включает SNP, ассоциированные с концентрацией или уровнем экспрессии MIC1. Подмножества представителей этой категории должно быть достаточно для фактического представления категории в прогностической модели.
Можно определить категорию параметров "SNP, ассоциированные с концентрацией биомаркеров PCa" или "SNP, ассоциированные с уровнем экспрессии биомаркеров PCa", которая включает SNP, ассоциированные с концентрацией или уровнем экспрессии соответствующих биомаркеров, таких как специфический антиген предстательной железы (PSA) в любой из свободной формы или формы в комплексе, про-PSA (ряд изоформ PSA) и в частности укороченной формы (-2) про-PSA, формы интактного PSA, простатическая кислая фосфатаза (PAP) человека, калликреин 2 человека (hK2), антиген раннего рака предстательной железы (EPCA), секреторный белок предстательной железы (PSP94; также известный как бета-микросеминопротеин и MSMB), глутатион-S-трансфераза n (GSTP1), α-метилацилкофермент-A-рацемаза (AMACR) и ингибирующий макрофаги цитокин 1 (MIC-1; также известный как GDF-15). Подмножества представителей этой категории должно быть достаточно для фактического представления категории в прогностической модели.
Дополнительно подходящие SNP, ассоциированные с отличными от PCa процессами, в качестве неограничивающих примеров включают rs3817334, rs10767664, rs2241423, rs7359397, rs7190603, rs571312, rs29941, rs2287019, rs2815752, rs713586, rs2867125, rs9816226, rs10938397 и rs1558902, которые все ассоциированы с BMI индивидуума. Другие подходящие SNP, ассоциированные с BMI, описаны в публикации "Contribution of 32 GWAS-identified common variants to severe obesity in European adults referred for bariatric surgery" Magi с соавторами, опубликованной в PLoS One. 2013 Aug 7;8(8):e70735 (включенной в настоящий документ в качестве ссылки). Можно определить категорию параметров "SNP, ассоциированные с уровнем экспрессии BMI", которая включает SNP, ассоциированные с BMI индивидуума. Подмножества представителей этой категории должно быть достаточно для фактического представления категории в прогностической модели.
Предпочтительная группа SNP для использования в оценке присутствия или отсутствия агрессивного рака предстательной железы у индивидуума представляет собой rs582598, rs439378, rs2207790, rs1046011, rs10458360, rs7525167, rs10489871, rs7529518, rs4245739, rs4512641, rs10178804, rs11900952, rs1873555, rs10191478, rs6755901, rs6545962, rs721048, rs2710647, rs12612891, rs2028900, rs1009, rs12233245, rs6760417, rs10496470, rs10199796, rs12475433, rs16860513, rs12151618, rs3765065, rs13017302, rs12988652, rs871688, rs749264, rs3771570, rs4346531, rs6770955, rs12637074, rs2660753, rs13319878, rs6437715, rs2162185, rs1515542, rs2270785, rs9830294, rs1439024, rs6762443, rs888507, rs6794467, rs12490248, rs1477886, rs4833103, rs3796547, rs17779822, rs2366711, rs16849146, rs1894292, rs12640320, rs3805284, rs12500426, rs4699312, rs17021918, rs7679673, rs2047408, rs2647262, rs12506850, rs7658048, rs2078277, rs12505546, rs13113975, rs4246742, rs2736098, rs401681, rs11134144, rs10060513, rs40485, rs2087724, rs1482679, rs16901841, rs1295683, rs2070874, rs7752029, rs2018334, rs9358913, rs1140809, rs409558, rs3096702, rs9267911, rs2025645, rs9359428, rs6569371, rs2813532, rs1933488, rs712242, rs6934898, rs9456490, rs651164, rs3120137, rs9364554, rs9457937, rs10486562, rs10807843, rs7801918, rs6962297, rs2465796, rs6957416, rs7777631, rs2272316, rs6961773, rs2132276, rs13265330, rs16887736, rs2911756, rs2272668, rs2339654, rs1380862, rs9297746, rs12543663, rs10086908, rs16901922, rs1016343, rs17832285, rs16901979, rs4871779, rs10107982, rs16902094, rs620861, rs17467139, rs6983267, rs9297756, rs10094059, rs7818556, rs1992833, rs986472, rs12552397, rs4273907, rs4237185, rs753032, rs11253002, rs2386841, rs10795841, rs10508422, rs7075945, rs10508678, rs539357, rs10826398, rs3818714, rs7090755, rs10993994, rs4382847, rs1891158, rs10887926, rs10788160, rs6579002, rs10832514, rs7358335, rs1944047, rs3019779, rs10896437, rs12793759, rs7106762, rs7102758, rs2449600, rs585197, rs2509867, rs11568818, rs7125415, rs11601037, rs11222496, rs4570588, rs6489721, rs3213764, rs17395631, rs4423250, rs11168936, rs10875943, rs3759129, rs902774, rs1827611, rs4760442, rs11610799, rs6539333, rs11067228, rs7485441, rs6489794, rs4119478, rs17070292, rs2293710, rs17256058, rs1950198, rs2331780, rs7141529, rs12880777, rs17123359, rs785437, rs524908, rs12903579, rs7178085, rs7164364, rs896615, rs11634741, rs9972541, rs12594014, rs11631109, rs1558902, rs8044335, rs2738571, rs885479, rs385894, rs684232, rs4925094, rs17138478, rs11649743, rs2107131, rs7213769, rs12946864, rs306801, rs138213197, rs1863610, rs17224342, rs9911515, rs12947919, rs966304, rs17744022, rs7234917, rs1943821, rs2227270, rs1363120, rs888663, rs1227732, rs1054564, rs4806120, rs11672691, rs758643, rs3745233, rs6509345, rs2659051, rs2735839, rs1354774, rs2691274, rs6090461, rs2297434, rs6062509, rs2315654, rs2823118, rs2838053, rs398146, rs16988279, rs2269640, rs4822763, rs132774, rs747745, rs5978944, rs6530238, rs5934705, rs5935063, rs4830488, rs17318620, rs5945619, rs5945637, rs11091768, rs2473057, rs5918762, rs4844228, rs6625760 и rs17324573. Несмотря на то, что использование всего списка является предпочтительным, для использования в оценке присутствия или отсутствие агрессивного рака предстательной железы у индивидуума пригодно любое подмножество этого списка. SNP из этого списка (все или подмножество, содержащее приблизительно 95%, или 90%, или 85%, или 80%, или 75%, или 70% SNP из этого списка) можно помещать на одну и ту же твердую подложку, например на одно и то же предметное стекло, для одновременной детекции в подходящем аналитическом устройстве.
Как описано ранее, оценка эффективности показателей скрининга PCa является сложной. Хотя характеристики ROC-AUC обеспечивают определенное представление об эффективности, желательны дополнительные способы. Одним из альтернативных способов оценки эффективности скрининга PCa является расчет процентного содержания положительных биопсий при данном уровне чувствительности и сравнение эффективности скрининга с использованием только PSA с любым из новых способов скрининга. Однако это требует точного определения эффективности PSA.
Один из примеров оценки эффективности скрининга PSA описан IM Thompson с соавторами в публикации "Assessing prostate cancer risk: results from the Prostate Cancer Prevention Trial", опубликованной в J. Natl. Cancer Inst. 2006 Apr 19;98(8):529-34 (включенной в настоящий документ в качестве ссылки). В этой публикации для определения чувствительности PSA использовали данные биопсии предстательной железы у мужчин, включенных в программу по исследованию предотвращения рака предстательной железы (PCPT). Всего включали 5519 мужчин из плацебо-группы PCPT, прошедших биопсию предстательной железы, у которых проведено по меньшей мере одно измерение PSA и пальцевое исследование прямой кишки (DRE), проведенное в пределах года перед биопсией, и по меньшей мере два измерения PSA, проведенные в пределах 3 лет перед биопсией предстательной железы. В этой публикации описано, что при использовании в качестве порога значения PSA 3 нг/мл пропускают приблизительно 41% злокачественных опухоли с высокой степенью злокачественности (т.е. злокачественных опухолей с индексом Глисона 7 или более).
IM Thompson с соавторами в "Operating characteristics of prostate-specific antigen in men with an initial PSA level of 3.0 ng/ml or lower", опубликованной в JAMA. 2005 Jul 6;294(1):66-70 (включенной в настоящий документ в качестве ссылки), описан второй анализ с использованием той же исследуемой группы. В этой публикации, авторы представили оценку чувствительности и специфичности PSA для всех случаев рака предстательной железы, с индексом Глисона 7+ и индексом Глисона 8+. При использовании при биопсии в качестве порогового значения для PSA 3,1 нг/мл для опухолей с индексом Глисона 7+ определена чувствительность 56,7% и специфичность 82,3%. В этой публикации авторы сделали заключение, что порогового значения для PSA с одновременно высокой чувствительностью и высокой специфичностью для мониторинга здоровых мужчин на рак предстательной железы не существует, зато постоянно существует риск рака предстательной железы при всех значениях PSA. Это иллюстрирует сложности с PSA в качестве теста для скрининга, несмотря на подтверждение взаимосвязи PSA с раком предстательной железы.
Одним из неизбежных следствий сложностей в получении точных и сравнимых оценок эффективности прогноза любой данной диагностической или прогностической модели при скрининге PCa состоит в том, что при расчете относительного улучшения нового способа по сравнению с использованием только PSA, расчетное относительное улучшение будет зависеть от множества факторов. Одним важным фактором, влияющим на расчетное относительное улучшение, является способ получения контрольной группы (т.е. известных отрицательных случаев). Так как проводить биопсию у индивидуумов без показаний PCa является неэтичным, контрольную группы выбирают с систематической ошибкой. Таким образом, относительное улучшение нового способа зависит от того, как произведен выбор контрольной группы, и существует множество хорошо известных способов выбора контрольных групп. Таким образом, любое заявляемое расчетное улучшение следует рассматривать в свете такой вариации. В лучшем случае авторы оценивают, что если относительное улучшение нового способа заявлено как 15% по сравнению со значением только для PSA с использованием одного из хорошо известных способов отбора контрольной группы, указанный новый способ будет по меньшей мере на 10% лучше, чем значение только для PSA с использованием любого другого хорошо известного способа отбора контрольной группы.
Для широкого использования в обществе эффективность скрининга должна обеспечивать приемлемые преимущества для экономики здравоохранения. По грубым оценкам эффективность способа скрининга приблизительно на 15% лучше, чем у PSA (т.е. позволяет избежать 15% ненужных биопсий) при том же уровне чувствительности, т.е. детектируя то же количество случаев рака предстательной железы в популяции, может иметь шанс на широкое использование при современном уровне затрат на системы здравоохранения. Однако для определенных подгрупп индивидуумов новый способ скрининга может обеспечивать экономические преимущества также для меньших улучшений по сравнению с эффективностью значения PSA. Следует отметить, что несмотря на то, что приложены значительные усилия для поиска комбинированной модели для оценки риска PCa (как проиллюстрировано в нескольких из цитируемых в этой патентной заявке документах), в настоящее время в Европе регулярного применения не нашел ни один из таких комбинированных способов. Таким образом, предыдущие известные многопараметрические способы не удовлетворяют социально-экономическим стандартам для применения в современном здравоохранении. Способ по настоящему изобретению обладает лучшей эффективностью, чем ранее представленные комбинированные способы и удовлетворяет социально-экономическим требованиям к эффективности для общего рассмотрения в системе здравоохранения.
Одним возможным способом получения способа скрининга aPCa, удовлетворяющего требованиям для широкого применения, является комбинация информации из нескольких источников. На уровне общего представления это включает комбинирование значений, получаемых из анализа биомаркеров (например, значений PSA), генетических профилей (например, профиля SNP), семейного анамнеза и других источников. Комбинация сама по себе имеет вероятность обеспечить лучшую диагностическую оценку, чем любой из включаемых факторов отдельно. Ранее описаны попытки комбинации значений в многопараметрическую модель для обеспечения лучшей диагностической оценки, как описано в других разделах настоящей заявки.
Комбинация данных может представлять собой алгоритмическую комбинацию результатов любого типа, такую как линейная комбинация данных, где линейная комбинация улучшает эффективность диагностики (например, как определяют с использованием ROC-AUC). Другие возможные способы комбинации в модель, способную обеспечивать диагностическую оценку, включают (но не ограничены ими) нелинейные полиномы, способы опорных векторов, классификаторы на основе нейронных сетей, дискриминационный анализ, способ "случайный лес", усиление градиента, частные наименьшие квадраты, гребневую регрессию, способ лассо, эластические сети, способ k ближайших соседей. Кроме того, в книге "The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition" T Hastie, R Tibshirani и J Friedman, опубликованной Springer Series in Statistics, ISBN 978-0387848570 (включенной в настоящий документ в качестве ссылки) описано множество подходящих способов комбинации данных для прогноза или классификации конкретного исхода.
Алгоритм, который преобразует данные из различных категорий в одно значение, указывающее на вероятность наличия у пациента aPCa, предпочтительно представляет собой нелинейную функцию, где зависимость от различных категорий используют для дальнейшего увеличения эффективности диагностики способа. Например, одной из важных зависимостей является измеряемый уровень выбранного биомаркера, комбинируемый с любым ассоциированным генетическим маркером, ассоциированным с ожидаемым уровнем экспрессии указанного биомаркера. В случаях, когда в образце, полученном у пациента, выявлена повышенная концентрация биомаркера и одновременно указанный пациент генетически предрасположен к наличию низких уровней указанных биомаркеров, важность повышенного уровня биомаркера возрастает. Подобным образом, если уровень биомаркера однозначно ниже, чем нормальный у пациента генетически предрасположенного к наличию высоких уровней указанных биомаркеров, противоречивые данные увеличивают важность интерпретации уровня биомаркера. Алгоритм, используемый для предварительной оценки риска агрессивного PCa, может выигрывать от использования трансформированных переменных, например, при использовании значения log10(PSA). Трансформация особенно выгодна для переменных с распределением, которое явно отклоняется от нормального распределения. Возможные трансформации переменных в качестве неограничивающих примеров включают логарифм, обращение, квадрат и квадратный корень. Дополнительно является общепринятым центрировать каждую переменную относительно нулевого среднего и единичной дисперсии.
Хотя комбинирование данных можно проводить различными способами, типичный способ по настоящему изобретению можно проиллюстрировать приведенным ниже неограничивающим способом.
В типичном случае данные, относящиеся к биомаркерам, принадлежащим к категории параметров, комбинируют в соответствии с предопределенным уравнением с получением комбинированного значения, которое ассоциировано с риском, ассоциированным с самой категорией параметров. Одним неограничивающим примером является расчет среднего значения всех доступных определяемых значений (данных) для представителей категории биомаркеров и использование указанного среднего значения в качестве комбинированного значения, представляющего указанную категорию биомаркеров. Очевидно, что этот способ можно применять вне зависимости от того, как много биомаркеров является членами категории. Если доступны данные только для одного из биомаркеров, включенных в категорию, их можно использовать для представления категории биомаркеров самостоятельно. Для биомаркеров определяемым значением, как правило используемым на этапе комбинирования данных, является концентрация указанного биомаркера, выявляемая в биологическом образце. Например, для биомаркеров PSA и HK2 чаще всего она представляет собой концентрацию биомаркера в образце крови, выраженная в единицах нг/мл.
Как правило, расчет генетического показателя (т.е. генетического комбинированного значения или, более конкретно, комбинированного значения для SNP) основан на предопределенном отношении шансов для каждого отдельного SNP, включенного в категорию параметров. Для каждого SNP предварительно определяют отношение шансов, т.е. вероятность того, что индивидуум, несущий SNP (т.е. несет аллель риска, определяемый SNP), имеет исследуемое заболевание или состояние. Как правило, определение отношения шансов для SNP проводят в больших проспективных исследованиях, включающих тысячи индивидуумов с известными патологическими состояниями или заболеваниями.
Генетический показатель для индивидуума в качестве неограничивающего примера можно рассчитывать по следующему алгоритму: для тестируемого индивидуума каждый SNP обрабатывают указанным далее способом. Для каждого SNP индивидуум может нести два аллеля риска SNP (положительная гомозигота по указанному SNP) или один аллель риска (положительная гетерозигота по указанному SNP) или ни одного аллеля риска (отрицательная гомозигота по указанному SNP). Количество аллелей SNP умножают на натуральный логарифм отношения шансов для указанного SNP с получением значения оценки риска для конкретного SNP. Это означает, что у индивидуума, негативного по конкретному SNP (т.е. не несет аллелей риска SNP), вклада указанного конкретного SNP в риск нет. Эту процедуру повторяют для всех SNP, для которых доступны экспериментальные данные. Когда подсчитаны все значения оценок риска, рассчитывают средний вклад в риск для SNP, для которых доступны экспериментальные данные, и используют в качестве генетического показателя для указанного индивидуума, т.е. в качестве генетического комбинированного значения в отношении определенной категории SNP. Очевидно, что этот способ можно применять вне зависимости от того, как много SNP являются членами категории SNP.
Для дальнейшей иллюстрации типичного способа по настоящему изобретению, когда его применяют для индивидуума, приняты следующие соглашения. Определены две категории параметров, во-первых категория белковых биомаркеров (или категория биомаркеров) с представителями Prot1 и Prot2, а во-вторых генетическая категория (или более конкретно, категория SNP) с представителями Snp1, Snp2 и Snp3. В эксперимент включены 100 индивидуумов с известным состоянием C и 100 индивидуумов, для которых известно, что у них нет состояния C, взаимосвязь Prot1, Prot2, Snp1, Snp2 и Snp3 с состояниям C установлена и выражена в виде одного комбинированного значения для белковых биомаркеров для Prot1 и Prot2 и одного генетического комбинированного значения для Snp1, Snp2 и Snp3, а также одного общего комбинированного значения, которое в свою очередь ассоциировано с риском наличия состояния C. Комбинированное значение для категории белковых биомаркеров рассчитывают с использованием следующих предопределенных уравнений:
P=(Prot1+2*Prot2)/3 [если доступны данные, относящиеся к Prot1 и к Prot2 (т.е. к значению Prot1 и к значению Prot2)]
P'=Prot1 [в случае, если доступны только данные, относящиеся к Prot1 (т.е. к значению Prot1)]
P"=Prot2 [в случае, если доступны только данные, относящиеся к Prot2 (т.е. к значению Prot2)]
Таким образом, в этом гипотетическом случае в эксперименте выявлено, что (a) Prot1 и Prot2 имеют одинаковый масштаб и (b) значение Prot2 в два раза важнее для оценки, если у индивидуума присутствует состояние C, чем Prot1. Если доступны данные только для одного из белковых биомаркеров, для представления категории белковых биомаркеров их можно использовать самостоятельно.
Отношения шансов для представителей генетической категории определены предварительно и являлись следующими: Snp1=1,1; Snp2=1,2; и Snp3=1,3. Комбинированное значение для генетической категории рассчитывают как генетический показатель, описанный выше.
Затем комбинированное значение для белковых биомаркеров и генетический показатель (который в этом случае эквивалентен комбинированному значению для генетической категории или комбинированному значению для SNP) комбинируют в общее комбинированное значение в соответствии со следующим предопределенным уравнением:
Y=P+10*показатель,
где Y ассоциирован с риском наличия состояния C, P представляет собой комбинированное значение для белковых биомаркеров (и P можно заменять на P' или P", как определено выше), а показатель представляет собой генетический показатель. Все уравнения необходимо выводить на основе большой группы индивидуумов, в данном гипотетическом случае 100+100 индивидуумов, в которой получена взаимосвязь между Y и исследуемым заболеванием или патологическим состоянием. В данном гипотетическом случае полагают, что если
Y>5 риск наличия состояния у индивидуума C повышен, а если Y>10 риск является очень высоким.
Теперь предположим, что первого индивидуума A тестируют на Prot1, Prot2, Snp1, Snp2 и Snp3. В данном конкретном случае все определения были успешны и привели к следующим результатам:
Prot1=3 нг/мл
Prot2=6 нг/мл
Snp1 = отрицательная гомозигота т.е. отсутствие аллелей риска = 0
Snp2 = положительная гетерозигота, т.е. один аллель риска = 1
Snp3 = положительная гомозигота, т.е. два аллеля риска = 2
Комбинированное значение для категории белковых биомаркеров в этом случае представляет собой P=(3+2*6)/3=5. Комбинированное значение для генетической категории, также известной как генетический показатель, представляет собой показатель = (0*log(1,1)+1*log(1,2)+2*log(1,3))/3=0,2357. Общее комбинированное значение представляет собой Y=5+10*0,2357=7,357. Таким образом, рассчитано, что риск наличия состояния C для индивидуума A является повышенным, но не очень высоким.
Теперь дополнительно предположим, что на Prot1, Prot2, Snp1, Snp2 и Snp3 тестируют второго индивидуума B. В данном конкретном случае успешными были три измерения и привели к следующим результатам:
Prot1=2 нг/мл
Prot2 = ОТСУТСТВУЮЩИЕ ДАННЫЕ
Snp1 = положительная гомозигота, т.е. два аллеля риска = 2
Snp2 = ОТСУТСТВУЮЩИЕ ДАННЫЕ
Snp3 = положительная гетерозигота, т.е. один аллель риска = 1
Комбинированное значение для категории белковых биомаркеров в этом случае представляет собой P'=2, так как доступны только результаты для Prot1. Комбинированное значение для генетической категории, также известной как генетический показатель, представляет собой показатель = (2*log(1,1)+1*log(1,3))/2=0,2264. Общее комбинированное значение представляет собой Y=2+10*0,2264=4,264. Таким образом, рассчитано, что риск наличия состояния C для индивидуума B является низким.
Как правило, в моделях, прогнозирующих риск развития aPCa, часто определяют одно или несколько пороговых значений. Выбор порогового значения (или порогового уровня) зависит от множества факторов, включая в качестве неограничивающих примеров сам риск заболевания и риск, ассоциированный с неточной диагностикой индивидуума, у которого нет заболевания, как положительного (ложноположительный результат). Как правило, в общем случае прогностическая модель представляет собой монотонную функцию Y = f(x1, x2,.., xN), где рассчитанный риск наличия заболевания коррелирует с увеличенным значением Y. Это означает, что если пороговое значение установлено на низком уровне, тест будет давать большое количество ложноположительных результатов, но с другой стороны будет детектировать большинство индивидуумов, у которых действительно присутствует заболевание. Если пороговый уровень установлен на высокое значение, происходит обратное, когда у индивидуумов со значением Y, выше порогового уровня, с очень высокой вероятностью присутствует заболевание, но большое количество индивидуумов с заболеванием будут получать отрицательные результаты теста (т.е. большое количество ложноотрицательных результатов). Выбор порогового уровня зависит от множества факторов, включая социально-экономические последствия баланса (a) пропущенных индивидуумов с заболеванием и (b) лечения индивидуумов без заболевания.
При применении на практике, иногда случается, что одно или несколько определений завершаются неудачно в результате, например, непредвиденных технических проблем, человеческого фактора или любой другой неожиданной и необычной причины. В таких случаях массив данных, полученных для индивидуума, будет неполным. Как правило, такой неполный массив данных оценивать трудно или даже невозможно. Однако настоящее изобретение основано на измерениях большого количества признаков, из которых множество являются частично избыточными. Это означает, что даже для индивидуумов, для которых массив данных является неполным, во многих случаях возможно получить высококачественную оценку по изобретению. В частности это верно в категориях, где, например, калликреин-подобные биомаркеры коррелированы и частично избыточны. Таким образом, технически возможно применять алгоритмический двухэтапный подход, где вклад калликреиновых биомаркеров объединяют в калликреиновый показатель (или калликреиновое значение). Затем этот калликреиновый показатель на втором этапе комбинируют с другими данными (такими как генетический показатель, возраст и семейный анамнез, в качестве указания нескольких неограничивающих примеров) с получением диагностической или прогностической информации о PCa. Подобные двухэтапные способы можно применять для других классов маркеров, таких как генетические маркеры, ассоциированные с BMI, или белковые биомаркеры, родственные суперсемейству трансформирующего фактора роста бета (большому семейству структурно родственных клеточных регуляторных белков, которое включает MIC-1), в качестве указания двух неограничивающих примеров.
Свойство избыточности можно реализовывать множеством различных способов. Одним из возможных способов использования свойства избыточности является определение множества биомаркеров, представляющих биомаркеры, родственные общему полю или семейству. Одним неограничивающим примером такого поля или семейства являются калликреин-подобные биомаркеры. Можно определять более одного определенного множества (или категории) биомаркеров, и, кроме того, вне такого множества все еще можно использовать другие биомаркеры. Как правило, категории являются неперекрывающимися, т.е. любой определенный биомаркер является представителем только одной определенной категории или его используют отдельно. Затем для всех биомаркеров делается попытка определения присутствия или концентрации. В большинстве случаев определение для всех биомаркеров является успешным, но иногда одно или несколько значений теряются. Для обеспечения низкой чувствительности модели к потерянным значениям, можно определять комбинированное значение для категории биомаркеров, которое можно определять с использованием всех или подмножества представителей определенной категории. Для работы на практике это требует того, чтобы представители определенной категории биомаркеров являлись по меньшей мере частично избыточными. На следующем этапе комбинированное значение для категории биомаркеров комбинируют с другими значениями биомаркеров, другими комбинированными значениями для категорий биомаркеров (если определены две или более категорий биомаркеров), генетическим показателем, ассоциированным с риском PCa, генетическим показателем, ассоциированным с другими характеристиками (такими как BMI или концентрация биомаркеров, в качестве указания двух неограничивающих примеров), семейным анамнезом, возрастом и другими носителями информации, ассоциированными с риском aPCa в общее комбинированное значение. В заключение общее комбинированное значение используют для оценки риска aPCa.
Таким образом, целью комбинированного значения для категории биомаркеров является служение в качестве промежуточного значения, которое можно рассчитывать с использованием неполных данных. Предположим, что определенная категория биомаркеров включает N различных биомаркеров, обозначаемых B1, B2, B3, … BN, все родственные семейству биомаркеров B. В этом случае, может существовать N различных моделей, доступных для расчета комбинированного значения для биомаркеров семейства B, C:
C=f1(B1,B2, B3, … BN)
C=f2(B2,B3, … BN)
C=f3(B1,B3, … BN)
…
C=fN(B1,B2, B3, … BN-1),
где f1(), f2() … fN() представляют собой математические функции, использующие значения биомаркеров B1, … BN в качестве аргументов и определенным образом дающие единственное значение функции C, представляющее комбинированное значение для биомаркеров семейства B. Один из неограничивающих примеров функций f1(), … fN() включает линейные комбинации настоящих аргументов. С таким набором нескольких функций, способных к расчету C для всех случаев потери одного биомаркера, расчет общего комбинированного значения становится менее чувствительным к отсутствующим данным. Следует понимать, что когда присутствуют не все данные, оценка C может быть менее хорошего качества, но все еще быть достаточно хорошей для оценки риска PCa. Таким образом, при использовании такой стратегии для получения оценки C успешными должны быть только определения N-1 биомаркеров. Дополнительно возможно получить оценки для любого количества потерянных данных, т.е., если успешными должны быть определения N-2 биомаркеров, для оценки C можно сформировать и использовать другой набор функций f().
Таким образом, в отношении биомаркеров PCa, настоящее изобретение относится к способу, который основан на составленной с избыточностью комбинации данных, как определено в других частях настоящей заявки. Более конкретно, способ включает определение присутствия или концентрации по меньшей мере частично избыточных биомаркеров PCa, где по меньшей мере один, например, два, биомаркера PCa выбраны из группы, состоящей из (i) PSA, (ii) общего PSA (tPSA), (iii) интактного PSA (iPSA), (iv) свободного PSA (fPSA) и (v) hK2. При получении комбинированного значения для биомаркеров способ позволяет пренебречь подмножеством по меньшей мере одного из биомаркеров PCa (i)-(v). Другими словами, способ допускает возможность формирования комбинированного значения для биомаркеров из данных, относящихся не ко всем биомаркерам PCa из категории биомаркеров, более конкретно, из данных, относящихся к подмножеству самое большое из четырех указанных биомаркеров PCa. Как понятно специалисту, это эквивалентно способу, где для получения указанного комбинированного значения для биомаркеров необходимы данные, относящиеся к подмножеству самое большое из четырех указанных биомаркеров PCa. Преимуществом способа по настоящему изобретению является то, что пропуск, недостаток или потеря данных, относящихся к подмножеству указанных биомаркеров PCa, является приемлемым для получения комбинированного значения для биомаркеров.
Как понятно специалисту, настоящее изобретение относится к тому, что способ включает формирование комбинированного значения для биомаркеров из данных, относящихся ко всем биомаркерам из категории биомаркеров при условии, что данные, относящиеся ко всем биомаркерам, доступны.
В одном из вариантов осуществления способ позволяет пренебречь подмножеством из одного, двух, трех или четырех биомаркеров PCa (i) PSA, (ii) общего PSA (tPSA), (iii) интактного PSA (iPSA), (iv) свободного PSA (fPSA) и (v) hK2. Другими словами, способ допускает формирование указанного комбинированного значения для биомаркеров из данных, относящихся к подмножеству из четырех, трех, двух или одного из биомаркеров PCa (i)-(v), соответственно.
Как указано ранее в настоящей заявке, способ может дополнительно включать анализ одного или каждого из множества дополнительных категорий биомаркеров PCa, где комбинация данных для формирования каждого дополнительного комбинированного значения для биомаркеров составлена с избыточностью, где дополнительная категория биомаркеров PCa содержит более одного биомаркера PCa. При получении комбинированного значения для биомаркеров способ позволяет пренебречь определенным подмножеством биомаркеров PCa. Другими словами, способ допускает формирование комбинированного значения для биомаркеров из данных, относящихся не ко всем биомаркерам PCa из дополнительной категории биомаркеров, таких как данные, относящиеся к подмножеству из 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% или 90% биомаркеров PCa из дополнительной категории биомаркеров PCa. Как понятно специалисту, настоящее изобретение относится к тому, что способ включает формирование каждого дополнительного комбинированного значения для биомаркеров из данных, относящихся ко всем биомаркерам PCa из категории биомаркеров PCa при условии, что данные, относящиеся ко всем биомаркерам PCa, являются доступными.
Показатели генетического риска (т.е. генетические показатели или генетические комбинированные значения, более конкретно комбинированные значения для SNP) также нечувствительны к небольшим потерям данных, например, вследствие непредвиденных технических проблем, человеческого фактора или любой другой неожиданной и необычной причины. Как правило, вклад одного из snp в показатель риска не коррелирует ни с одним из других snp. В случае snp, изменение риска из-за каждого из snp является малым, но при совместном использовании нескольких SNP, ассоциированных с патологическим состоянием, изменение риска для указанного патологического состояния становится достаточно большим для влияния на эффективность модели. Предпочтительное количество snp для формирования генетического показателя составляет по меньшей мере 3 snp, предпочтительно - 10 snp, более предпочтительно - 25 snp, еще более предпочтительно - 50 snp, более предпочтительно - 60 snp, еще более предпочтительно - 70 snp, еще более предпочтительно - 80 snp, более предпочтительно - 90 snp, еще более предпочтительно - 100 snp, еще более предпочтительно - 150 snp, еще более предпочтительно - 200 snp, еще более предпочтительно - 250 и даже еще более предпочтительно - 300 snp. Это означает, что влияние одного любого snp на общий результат, как правило, является небольшим, и пропуск нескольких snp, как правило, не изменяет общую оценку риска по генетическому показателю в любом большом способе, т.е., как правило, не изменяет комбинированное значение для SNP в значительной степени. На существующем уровне техники типичные потери данных в генетических исследованиях большого масштаба составляют порядка 1-2%, что означает, что если генетический показатель состоит из 100 различных snp, типичная генетическая характеристика индивидуума предоставляет информацию о 98-99 из этих snp. Однако модель по настоящему изобретению, по существу как описано в работе по настоящему изобретению, может выдерживать большую потерю или отсутствие данных, например, потерю 5-7% информации, или 7-15%, или даже 15-30%. В этом смысле, комбинация данных, относящихся к SNPpc, является по меньшей мере частично избыточной.
Таким образом, в отношении генетических маркеров (SNP), настоящее изобретение относится также к способу, который основан на составленной с избыточностью комбинации данных, как определено в других частях настоящей заявки. При формировании комбинированного значения для SNP способ позволяет пренебречь по меньшей мере 5% SNPpc. Другими словами, способ допускает формирование указанного комбинированного значения для SNPpc из данных, относящихся не ко всем SNPpc из категории SNPpc, более конкретно из данных, относящихся к подмножеству самое большое из 95% указанных SNPpc. Как понятно специалисту, это эквивалентно способу, где для получения указанного комбинированного значения для SNPpc, необходимы данные, относящиеся к подмножеству самое большое из 95% указанного SNPpc. Преимуществом способа по настоящему изобретению является то, что пропуск, недостаток или потеря данных, относящихся к подмножеству указанных SNPpc, является приемлемым для получения комбинированного значения для SNPpc.
Как понятно специалисту, настоящее изобретение относится к тому, что способ включает формирование комбинированного значения для SNPpc из данных, относящихся ко всем SNPpc из категории SNPpc, если данные, относящиеся ко всем SNPpc, доступны. Подобным образом, настоящее изобретение относится к тому, что способ включает формирование комбинированного значения для SNPpc из данных, относящихся к подмножеству из 99%, 98%, 97% или 96% указанных SNPpc.
В одном из вариантов осуществления способ при получении комбинированного значения для SNPpc позволяет пренебречь 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25% или 30% SNPpc. Другими словами, способ допускает формирование указанного комбинированного значения для SNPpc из данных, относящихся к подмножеству из 94%, 93%, 92%, 91%, 90%, 85%, 80%, 75% или 70% SNPpc, соответственно.
Одним из неограничивающих примеров такой составленной с избыточностью комбинации данных является расчет среднего риска, относящегося к каждому из SNP, для которых существуют экспериментальные данные. Другим неограничивающим примером такой составленной с избыточностью комбинации данных является получение нескольких независимых уравнений для расчета комбинированного значения, по одному уравнению для каждого подмножества данных, которое можно использовать для получения указанного комбинированного значения.
Один подходящий способ ассоциации SNP с патологическим состоянием (например, PCa, или BMI>25, или повышенная концентрация биомаркера hk2 в крови) описан в открытой публикации "Blood Biomarker Levels to Aid Discovery of Cancer-Related Single-Nucleotide Polymorphisms: Kallikreins and Prostate Cancer" Robert Klein с соавторами, опубликованной в Cancer Prev. Res. 2010; 3:611-619 (включенной в настоящий документ в качестве ссылки). В этой публикации авторы описывают, как можно ассоциировать SNP rs2735839 с повышенным значением (свободного PSA)/(общий PSA). Кроме того, они смогли установить ассоциацию SNP rs10993994 с повышенным риском PCa, повышенным значением общего PSA, повышенным значением свободного PSA и повышенным значением hk2, и, наконец, SNP rs198977 был ассоциирован с повышенным риском PCa, повышенным значением (свободного PSA)/(общий PSA) и повышенным значением hk2.
На практике, один из общих способов для ассоциации SNP с патологическим состоянием основан на оценке клинического испытания по принципу "случай-контроль", в котором сравнивают две большие группы индивидуумов, одну контрольную группу здоровых индивидуумов и одну группу случаев с исследуемым патологическим состоянием. Всех индивидуумов в каждой группе генотипируют по большинству из известных SNP. Когда доступны все данные генотипирования, исследуют значимость отличий частот аллелей в группе случаев и в контрольной группе. В таких системах типичной единицей для описания величины эффекта является отношение шансов. Отношение шансов описывает отношение между двумя долями: долей индивидуумов в группе случаев с данным конкретным аллелем и долей индивидуумов в контрольной группе с тем же аллелем. Если частота аллеля в группе случаев значительно выше частоты аллеля в контрольной группе, отношение шансов будет более 1. Если частота аллелей в группе случаев значительно ниже частоты аллелей в контрольной группе, отношение шансов будет менее 1.
Один из предпочтительных способов комбинации информации из нескольких источников описан в открытой публикации "Polygenic Risk Score Improves Prostate Cancer Risk Prediction: Results from the Stockholm-1 Cohort Study" Markus Aly с соавторами, опубликованной в EUROPEAN UROLOGY 60 (2011) 21-28 (включенной в настоящий документ в качестве ссылки). Ассоциации SNP и PCa при биопсии оценивали с использованием теста на тренд Кохрана-Армитажа. Отношения шансов аллелей (OR) с 95% доверительными интервалами рассчитывали с использованием моделей логистической регрессии. Для каждого пациента получали показатель генетического риска посредством суммирования количества аллелей риска (0, 1 или 2) в каждом из SNP, умноженных на логарифм OR SNP. Ассоциации между диагнозом PCa и повышенными факторами риска исследовали в анализе логистической регрессии. Часть модели, относящаяся к негенетической информации, включала логарифмически трансформированный общий PSA, логарифмически трансформированное отношение свободного PSA к общему, возраст на момент биопсии и PCa в семейном анамнезе (да или нет). Для оценки прогнозируемых вероятностей PCa при биопсии использовали повторную 10-кратную перекрестную проверку. Девяносто пяти процентные доверительные интервалы для значений ROC-AUC получали с использованием нормального приближения. Все описанные значения p основаны на двусторонних гипотезах.
Существует множество рациональных обоснований для различения рака предстательной железы вообще и агрессивного рака предстательной железы. В большинстве случаев рак предстательной железы представляет собой медленно прогрессирующее заболевание. Тот факт, что у большинства мужчин диагноз ставят в пожилом возрасте означает, что большая доля мужчин с диагнозом рак предстательной железы умирает от других причин. Таким образом, возможность оценить наличие у индивидуума повышенного риска агрессивного рака предстательной железы до биопсии делает возможным, например, мотивацию изменения индивидуумом образа жизни. Прекращение курения, достижение значения BMI ниже 30 и регулярная физическая нагрузка (приблизительно 30 минут 3-6 суток в неделю), все являются факторами, которые в основном способствуют увеличению продолжительности жизни в условиях тяжелого заболевания, включая рак предстательной железы. Таким образом, если у индивидуума выявлен повышенный риск aPCa, это является причиной рекомендации указанному индивидууму прекратить курение, попытаться достичь BMI<30 и начать физическую нагрузку. Другим важным аспектом являются диетические ограничения. Изменяя диету развитие PCa можно замедлять или задерживать. Существуют факты, свидетельствующие, что сниженное потребление пищи может уменьшить риск дебюта PCa, что описано Song с соавторами в публикации "Whole milk intake is associated with prostate cancer-specific mortality among U.S. male physicians", опубликованной в J. Nutr. 2013 Feb; 143(2):189-96 (включенной в настоящий документ в качестве ссылки). Существуют подобные факты в отношении положительного действия потребления зеленого чая и потребления соевых продуктов. Таким образом, если у индивидуума выявлен повышенный риск aPCa, это является причиной рекомендации указанному индивидууму снизить потребление молочных продуктов и/или увеличить потребление зеленого чая и продуктов на основе сои.
Пример 1
Для иллюстрации настоящего изобретения из массива данных STHLM2 извлекали массив данных, включающий 215 случаев (индивидуумы, для которых известно, что они страдают aPCa с индексом Глисона 7 или более) и 627 контролей (индивидуумы, для которых известно, что они не страдают aPCa). Как видно на веб-странице http://sthlm2.se/ массив данных STHLM2 доступен в общем пользовании. В итоге в течение 2010-2012 годов в исследование STHLM2 были включены приблизительно 26000 мужчин, проходивших тестирование PSA в области Стокгольма. 215+627=842 индивидуумов охарактеризованы по приведенным ниже биомаркерам и SNP.
Биомаркеры:
Общий специфический антиген предстательной железы (tPSA) [нг/мл]
Интактный специфический антиген предстательной железы (iPSA) [нг/мл]
Свободный специфический антиген предстательной железы (fPSA) [нг/мл]
Калликреин 2 человека (hK2) [нг/мл]
Ингибирующий макрофаги цитокин 1 (MIC-1) [нг/мл]
Бета-микросеминопротеин (MSMB) [нг/мл]
SNP:
657del5, rs10086908, rs1016343, rs10187424, rs1041449, rs10486567, rs1054564, rs10875943, rs10896449, rs10934853, rs10993994, rs11067228, rs11135910, rs11228565, rs11568818, rs11649743, rs11650494, rs11672691, rs11704416, rs12130132, rs12409639, rs12418451, rs12500426, rs12543663, rs12621278, rs12653946, rs1270884, rs130067, rs13252298, rs13385191, rs1354774, rs1363120, rs137853007, rs138213197, rs1447295, rs1465618, rs1512268, rs1571801, rs16901979, rs16902094, rs17021918, rs17632542, rs17879961, rs1859962, rs1894292, rs1933488, rs1983891, rs2018334, rs2121875, rs2242652, rs2273669, rs2292884, rs2405942, rs2660753, rs2735839, rs2736098, rs2928679, rs3213764, rs339331, rs3771570, rs3850699, rs3863641, rs401681, rs4245739, rs4430796, rs445114, rs4643253, rs4857841, rs4962416, rs5759167, rs5919432, rs5945619, rs6062509, rs620861, rs6465657, rs6763931, rs684232, rs6869841, rs6983267, rs6983561, rs7127900, rs7210100, rs721048, rs7241993, rs7611694, rs7679673, rs7931342, rs8008270, rs8102476, rs888663, rs902774, rs9364554, rs9600079, rs9623117
У каждого индивидуума собирали общую информацию, включая возраст и семейный анамнез (да или нет). Возраст выражали в единицах лет.
Для принятия решения о том, каких индивидуумов следует направлять на биопсию, необходимо для каждого тестируемого индивидуума рассчитать значение, которое коррелирует с вероятностью наличия у указанного индивидуума рака предстательной железы с индексом Глисона 7 или более. Это можно сделать посредством комбинации определенных значений биомаркеров в следующем предопределенном уравнении:
y=-0,4366579+0,0577639*показатель - 0,1026622*HK2-0,0312050*fPSA+0,0640730*iPSA+0,0256631*MIC1-0,0069049*MSMB+0,0012231*tPSA+0,0069759*возраст
В этом уравнении, "показатель" представляет собой переменную генетического показателя, рассчитанную, как описано в открытой публикации "Polygenic Risk Score Improves Prostate Cancer Risk Prediction: Results from the Stockholm-1 Cohort Study" Markus Aly с соавторами, опубликованную в EUROPEAN UROLOGY 60 (2011) 21-28 (включенной в настоящий документ в качестве ссылки), содержащую подтвержденные SNP, предрасположенности к раку предстательной железы (указанные SNP, ассоциированы с предрасположенностью к раку предстательной железы или ассоциированы с уровнями биомаркеров PSA, свободного PSA, MSMB и MIC-1 в плазме), перечисленные в настоящем примере. Параметры "HK2", "fPSA", "iPSA", "MIC1", "MSMB", "tPSA" относятся к соответствующим определенным значениям (нетрансформированным) этих биомаркеров, а "возраст" представляет собой возраст индивидуума. Уравнение получено с использованием оценки по обычному способу наименьших квадратов (также можно непосредственно использовать другие линейные оценки, например, оценку по методу логистической регрессии). В данной конкретной модели информация о семейном анамнезе пропущена.
Полученное значение "y" сильно коррелирует с риском рака предстательной железы с индексом Глисона 7 или более, как проиллюстрировано на фигуре 1. Кривые ROC на фигуре 1 представляют только PSA (101) и модель, описанную в настоящем примере (102). Если y принимает значение выше порогового значения, мужчине следует рекомендовать обратиться к урологу для исследования предстательной железы с использованием биопсии. Факт, что эта модель предсказывает агрессивный PCa с высокой степенью злокачественности неявно означает, что если полученное значение "y" является небольшим, у пациента все еще остается риск наличия PCa хотя и в неагрессивной форме. Небольшое полученное значение "y" также может свидетельствовать, что у пациента нет PCa.
Пороговое значение зависит от компромисса между чувствительностью и специфичностью теста. Например, если используют пороговое значение 0,166, этот конкретный тест приводит к чувствительности 0,9 и специфичности 0,38. Это можно сравнивать с использованием в качестве скринингового теста только значения PSA, который приводит к чувствительности 0,9 и специфичности 0,22. На практике это означает, что эта конкретная модель, как ее применяют в группе из 827 индивидуумов приводит к тому же количеству детектированных злокачественных опухолей с высоким риском (индекс Глисона 7 и более), что и тест PSA, но с меньшим на 100 количеством направленных на биопсию индивидуумов, что соответствует улучшению по сравнению с тестом только PSA приблизительно на 15%.
Если в качестве второго примера используют пороговое значение 0,201, этот конкретный тест приводит к чувствительности 0,8 и специфичности 0,52. На уровне чувствительности 0,8 можно предотвратить приблизительно 20% биопсий, от спрогнозированных с использованием PSA.
Пример 2
Для дополнительной иллюстрации настоящего изобретения для получения прогноза применяли альтернативный способ расчета. Такие уравнения, как уравнение, используемое в примере 1, не являются единственным способом, которым биомаркеры можно комбинировать для прогноза aPCa. Фактически, способ для расчета y для прогноза aPCa может быть сложным или даже невозможно записать на листе бумаги. Более сложным, но очень мощным примером того, как можно комбинировать биомаркеры является использование леса деревьев решений. Пример дерева решений (200) приведен на фигуре 2. Предположим, что индивидуума в возрасте 81 год тестировали на биомаркеры и SNP с результатами HK2=0,2425 и PSA=84,1. При применении дерева решений (200), как проиллюстрировано на фигуре 2, верхний узел (201) относится к значению hk2. Так как значение HK2 у индивидуума не удовлетворяет условию узла, из этого узла следует перейти по левой ветви. Второй узел (202) также относится к значению hk2, и в этом случае значение hk2 индивидуума не удовлетворяет условию узла, и следовательно из узла следует перейти по правой ветви. Узел третьего уровня (203) относится к возрасту. Так как возраст индивидуума не удовлетворяет условию узла, из этого узла следует перейти по правой ветви. Узел пятого уровня относится к значению PSA, и так как значение PSA индивидуума не удовлетворяет условию узла, из этого узла следует перейти по левой ветви. В этой точке больше нет узлов, что означает, что достигнут лист дерева решений. Каждый лист содержит соответствующий вывод, в данном конкретном примере значение листа "1" означает "отправлять на биопсию", а "0" означает "не отправлять на биопсию". У приведенного для примера индивидуума в этом случае окончание происходит в листе со значением "0", что означает, что предоставляемый посредством этого дерева решений прогноз представляет собой "не отправлять на биопсию".
Проблема с опорой исключительно на одно дерево решений для расчета y для предсказания aPCa состоит в том, что одно дерево решений имеет очень высокую дисперсию (т.е. если данные немного изменяются, рассчитанное значение y вероятно также изменится, что приводит к дисперсии в прогнозе aPCa), хотя его систематическая ошибка является очень низкой. Одним из возможных способов снижения высокой дисперсии является конструирование леса декоррелированных деревьев способом с использованием алгоритма "случайный лес", как описано в публикации "Random Forests" Leo Breiman, опубликованной в Machine Learning 45 (1): 5-32 (2001) (включенной в настоящий документ в качестве ссылки). Получают большое количество деревьев, и перед получением каждого дерева данные случайным образом нарушают таким образом, что ожидаемое значение его прогноза не изменяется. Для прогноза aPCa все деревья отдают голос в решение о необходимости направления индивидуума на биопсию. Такой прогноз с голосованием сохраняет неискаженные свойства деревьев решений, однако значительно снижает дисперсию (подобно тому как дисперсия среднего меньше дисперсии отдельных измерений, используемых для подсчета среднего). Так как способ с алгоритмом "случайный лес" зависит от генерации случайных чисел, он представляет собой сложную процедуру для записи алгоритма получения прогноза в конечном виде.
При применении к массиву данных, как описано в примере 1, эта модель при чувствительности 0,9 может предотвратить приблизительно 20% от количества биопсий по сравнению с тестом только PSA.
Пример 3
Для дополнительной иллюстрации настоящего изобретения из массива данных STHLM2 извлекали массив данных, включающий 51 случай (индивидуумы, для которых известно, что они страдают aPCa с индексом Глисона 7 или более) и 195 контролей (индивидуумы, для которых известно, что они не страдают aPCa). У всех этих случаев и контролей значения BMI составляли более 25. 51+195=246 индивидуумов охарактеризованы по приведенным ниже биомаркерам.
Биомаркеры:
Общий специфический антиген предстательной железы (tPSA) [нг/мл]
Интактный специфический антиген предстательной железы (iPSA) [нг/мл]
Свободный специфический антиген предстательной железы (fPSA) [нг/мл]
Калликреин 2 человека (hK2) [нг/мл]
Ингибирующий макрофаги цитокин 1 (MIC-1) [нг/мл]
Бета-микросеминопротеин (MSMB) [нг/мл]
Также в этом примере использовали те же SNP, как определено в предыдущем примере 1. У каждого индивидуума собирали общую информацию, включая прохождение индивидуумом ранее биопсии предстательной железы (prevBiop), возраст и семейный анамнез (да или нет). Возраст выражали в единицах лет, рост в метрах и массу в килограммах.
Для принятия решения о том, каких индивидуумов следует направлять на биопсию, необходимо для каждого тестируемого индивидуума рассчитать значение, которое коррелирует с вероятностью наличия у указанного индивидуума рака предстательной железы с индексом Глисона 7 или более. Это можно сделать посредством комбинации определенных значений биомаркеров в общее комбинированное значение с использованием следующего предопределенного уравнения:
y=21,487704+0,548938*prevBiop+0,014242*GenScore+0,311481*hk2-0,043471*fPSA+0,047176*iPSA+0,068407*mic1-0,008860*msmb+0,002693*tPSA+0,006325*возраст-0,121356*height+0,119005*масса-0,388930*bmi
В этом уравнении, "показатель" представляет собой переменную генетического показателя, рассчитанную, как описано в предыдущем примере 1. Параметры "HK2", "fPSA", "iPSA", "MIC1", "MSMB", "tPSA" относятся к соответствующим определенным значениям (нетрансформированным) этих биомаркеров, а "возраст", "рост", "масса" и "bmi" представляют собой возраст, рост, массу и bmi индивидуума. Параметр "prevBiops" означает прохождение ранее индивидуумом биопсии предстательной железы, отражая историю болезни (анамнез) указанного индивидуума. Уравнение получено с использованием оценки по обычному способу наименьших квадратов (также можно непосредственно использовать другие линейные оценки, например, оценку по методу логистической регрессии). В данной конкретной модели информация о семейном анамнезе пропущена.
Полученное значение "y" сильно коррелирует с риском агрессивного рака предстательной железы с индексом Глисона 7 или более, как проиллюстрировано на фигуре 3. Кривые ROC на фигуре 3 представляют только PSA (301) и модель, описанную в настоящем примере (302). Если y принимает значение выше порогового значения, мужчине следует рекомендовать обратиться к урологу для исследования предстательной железы с использованием биопсии.
Пороговое значение зависит от компромисса между чувствительностью и специфичностью теста. Например, если используют пороговое значение 0,201, этот конкретный тест приводит к чувствительности 0,8, и тест предотвратит приблизительно 44% биопсий по сравнению с использованием только PSA.
Пример 4
Для дополнительной иллюстрации свойств категории параметров и избыточности в категории, массив данных из примера 1 охарактеризовывали в отношении следующего:
Биомаркеры:
Общий специфический антиген предстательной железы (tPSA) [нг/мл]
Интактный специфический антиген предстательной железы (iPSA) [нг/мл]
Свободный специфический антиген предстательной железы (fPSA) [нг/мл]
Калликреин 2 человека (hK2) [нг/мл]
Ингибирующий макрофаги цитокин 1 (MIC-1) [нг/мл]
Бета-микросеминопротеин (MSMB) [нг/мл]
SNP, принадлежащие к категории SNP, ассоциированных с PCa, (SNPpc):
657del5, rs10086908, rs1016343, rs10187424, rs1041449, rs10486567, rs1054564, rs10875943, rs10896449, rs10934853, rs10993994, rs11067228, rs11135910, rs11228565, rs11568818, rs11649743, rs11650494, rs11672691, rs11704416, rs12130132, rs12409639, rs12418451, rs12500426, rs12543663, rs12621278, rs12653946, rs1270884, rs130067, rs13252298, rs13385191, rs1354774, rs1363120, rs137853007, rs138213197, rs1447295, rs1465618, rs1512268, rs1571801, rs16901979, rs16902094, rs17021918, rs17632542, rs17879961, rs1859962, rs1894292, rs1933488, rs1983891, rs2018334, rs2121875, rs2242652, rs2273669, rs2292884, rs2405942, rs2660753, rs2735839, rs2736098, rs2928679, rs3213764, rs339331, rs3771570, rs3850699, rs3863641, rs401681, rs4245739, rs4430796, rs445114, rs4643253, rs4857841, rs4962416, rs5759167, rs5919432, rs5945619, rs6062509, rs620861, rs6465657, rs6763931, rs684232, rs6869841, rs6983267, rs6983561, rs7127900, rs7210100, rs721048, rs7241993, rs7611694, rs7679673, rs7931342, rs8008270, rs8102476, rs888663, rs902774, rs9364554, rs9600079, rs9623117
У каждого индивидуума собирали общую информацию, включая возраст и проведение ранее биопсии (да или нет). Возраст выражали в единицах лет.
Уравнение для общего комбинированного значения, которое используют в качестве прогностической модели, получали в соответствии с предопределенным уравнением:
Y=-0,632820+0,118107*K+0,139045*
prevBiopsy+0,051609*показатель+0,048033*MIC1-0,001368*MSMB+0,008002*возраст,
где показатель представляет собой генетический показатель, т.е. комбинированное значение, полученное на основе SNP, ассоциированных с PCa, (т.е. комбинированное значение для SNPpc), как описано ранее, и K представляет собой комбинированное значение для категории параметров для калликреин-подобных биомаркеров, MIC1 представляет собой концентрацию MIC1, MSMB представляет собой концентрацию MSMB, возраст представляет собой возраст индивидуума, и PrevBiopsy представляет собой 1, если индивидууму ранее проводили биопсию (и 0, если не проводили). В зависимости от доступности данных по калликреину для конкретного индивидуума комбинированное значение для категории калликреин-подобных биомаркеров K рассчитывали различными способами.
K=(0,6122516+0,0012714*fPSA+0,0001864*PSA+0,0200385*iPSA0,0377976*HK2-1,3108243 mPSA)/0,1559314
K'=(0,3961801+0,0001864*PSA+0,0200385*iPSA-0,0377976*HK2)/0,109478
K'''=(0,3961967+0,0012714*fPSA+0,0200385*iPSA-0,0377976*HK2)/0,1090876
K'''=(0,3987352+0,0200385*iPSA-0,0377976*HK2)/0,1033296
K''''=(0,6548828+0,0012714*fPSA+0,0001864*PSA-1,3108243 tftPSA)/0,1068742
В этих уравнениях PSA представляет собой концентрацию PSA, fPSA представляет собой концентрацию свободного PSA, iPSA представляет собой концентрацию интактного PSA, HK2 представляет собой концентрацию HK2 и с/о PSA представляет собой отношение свободного PSA и общего PSA. K представляет собой значение параметра, пригодное для использования, когда доступны все указанные данные по калликреину. Параметры K', K'', K''' и K'''' представляют собой приближения K, которые пригодны для использования в случае, когда один или несколько видов данных по калликреину пропущены.
При тестировании описанной выше модели, получали следующие результаты:
- Полная модель, все данные включены: ROC-AUC=0,77
- Использование всех SNP и приближения K': ROC-AUC=0,70
- Использование всех SNP и приближения K'': ROC-AUC=0,70
- Использование всех SNP и приближения K''': ROC-AUC=0,70
- Использование всех SNP и приближения K'''': ROC-AUC=0,75
- Использование данных K'''' и случайного пропуска 10% данных по SNP: ROC-AUC=0,74
- Использование данных K'''' и случайного пропуска 30% данных по SNP: ROC-AUC=0,73
В качестве точки сравнения, при использовании для прогноза риска aPCa только PSA, ROC-AUC=0,65. Таким образом, модель в настоящем примере (a) выглядит лучше, чем исходная модель, когда используют все данные, но также (b) нечувствительна к потерям вводимых данных, благодаря избыточности в категориях параметров. Можно пропустить один или несколько результатов измерений (т.е. данных) калликреин-подобных биомаркеров, также в комбинации с потерей 10% (или даже 30%) информации об SNP, и все еще получать пригодные результаты, которые будут лучше, чем исходная модель, где использовали только PSA. В практических условиях такой нечувствительный режим делает возможным оценку риска наличия aPCa у индивидуума даже в случаях, когда некоторые данные пропущены вследствие технологической ошибки, отсутствия материала образца, человеческого фактора или любой другой причины. Это обладает потенциалом снижения стоимости для медучреждения вследствие снижения количества повторных тестов. Это также может обеспечить более удобные для пациента условия с более быстрым ответом и снижением необходимости посещения индивидуумом медучреждения для получения дополнительного образца для процедуры повторного теста.
Хотя изобретение описано в отношении его предпочтительных вариантов осуществления, которые составляют наилучший способ, известный авторам изобретения, следует понимать, что можно проводить различные изменения и модификации, которые очевидны специалисту в данной области, без отклонения от объема изобретения, указанного в прилагаемой формуле изобретения.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ПРОГНОЗА ДЛЯ ИНДИВИДУУМОВ С РАКОМ ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ | 2013 |
|
RU2669809C2 |
СПОСОБ ОБНАРУЖЕНИЯ СОЛИДНОЙ ЗЛОКАЧЕСТВЕННОЙ ОПУХОЛИ | 2015 |
|
RU2720148C2 |
СПОСОБ ГАРМОНИЗАЦИИ РЕЗУЛЬТАТОВ АНАЛИЗА | 2019 |
|
RU2817657C2 |
СИСТЕМЫ И СПОСОБЫ УЛУЧШЕНИЯ ДИАГНОСТИКИ ЗАБОЛЕВАНИЙ С ПРИМЕНЕНИЕМ ИЗМЕРЯЕМЫХ АНАЛИТОВ | 2018 |
|
RU2782359C2 |
СПОСОБЫ ПРОГНОЗИРОВАНИЯ РАКА ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ | 2016 |
|
RU2760577C2 |
НАБОР РЕАГЕНТОВ ДЛЯ ВЫЯВЛЕНИЯ МАРКЕРА ЭПИТЕЛИАЛЬНЫХ КАРЦИНОМ | 2018 |
|
RU2735918C2 |
КОГОРТЫ БИОМАРКЕРОВ МОЧИ, ПРОФИЛЬ ЭКСПРЕССИИ ГЕНОВ И СПОСОБЫ ИХ ПРИМЕНЕНИЯ | 2014 |
|
RU2668164C2 |
ТЕРАПЕВТИЧЕСКИЕ СРЕДСТВА И ИХ ПРИМЕНЕНИЕ | 2012 |
|
RU2606773C2 |
СПОСОБ ЛЕЧЕНИЯ РАКА ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ АНТАГОНИСТОМ ГОНАДОТРОПИН-ВЫСВОБОЖДАЮЩЕГО ГОРМОНА (GnRH) ДЕГАРЕЛИКСОМ | 2009 |
|
RU2504393C2 |
БИОМАРКЕРЫ ДЛЯ ПРОГНОЗИРОВАНИЯ ВОЗНИКНОВЕНИЯ РАКА | 2011 |
|
RU2586295C2 |
Группа изобретений относится к медицине и касается способа на основе составленной с избыточностью комбинации данных для проверки присутствия или отсутствия агрессивного рака предстательной железы (PCa) у индивидуума, включающего этапы получения у указанного индивидуума биологического образца; анализа биомаркеров PCa и SNP, ассоциированных с PCa (SNPpc), в указанном биологическом образце; комбинирования полученных данных; определения корреляции указанного комбинированного значения с присутствием или отсутствием агрессивного PCa у указанного индивидуума. Группа изобретений также касается устройства для проведения этапов указанного способа; набора для тестирования для проведения этапов указанного способа. Группа изобретений обеспечивает получение лучших результатов анализа, чем при использовании только теста PSA. 4 н. и 14 з.п. ф-лы, 4 пр., 3 ил.
1. Способ на основе составленной с избыточностью комбинации данных для проверки присутствия или отсутствия агрессивного рака предстательной железы (PCa) у индивидуума, включающий этапы:
1) получения у указанного индивидуума по меньшей мере одного биологического образца;
2) анализа в указанном биологическом образце
a) категории биомаркеров PCa посредством определения присутствия или концентрации каждого из множества калликреин-подобных биомаркеров PCa из указанной категории биомаркеров PCa; и
b) категории SNP, ассоциированных с PCa, (SNPpc), посредством определения присутствия или отсутствия каждого из одного или двух аллелей риска из множества SNPpc из указанной категории SNPpc;
3) комбинирования данных, относящихся к указанной категории биомаркеров PCa, с получением комбинированного значения для биомаркеров, основанного на концентрации указанного биомаркера в указанном биологическом образце, представляющего ассоциированный с биомаркерами PCa риск развития PCa, где комбинированное значение для биомаркеров формируется из данных по меньшей мере трех биомаркеров;
4) комбинирования данных, относящихся к указанной категории SNPpc, с получением комбинированного значения для SNPpc, основанного на предопределенном отношении шансов риска PCa для каждого отдельного SNP, включенного в категорию SNPpc, представляющего ассоциированный с SNPpc риск развития PCa, где способ при получении комбинированного значения для SNPpc позволяет пренебречь подмножеством по меньшей мере из 10% и до 30% SNPpc из категории SNPpc, где комбинированное значение для SNPpc формируется из данных по меньшей мере 90 SNPpc;
5) комбинирования комбинированного значения для биомаркеров и комбинированного значения для SNPpc с получением общего комбинированного значения;
6) определения корреляции указанного общего комбинированного значения с присутствием или отсутствием агрессивного PCa у указанного индивидуума посредством сравнения указанного общего комбинированного значения с предопределенным пороговым значением, установленным с использованием контрольных образцов, известного наличия агрессивного PCa и отсутствия агрессивного PCa, и
где по меньшей мере один, например, два, калликреин-подобных биомаркера PCa выбраны из группы, состоящей из (i) PSA, (ii) общего PSA (tPSA), (iii) интактного PSA (iPSA), (iv) свободного PSA (fPSA) и (v) hK2.
2. Способ по п. 1, отличающийся тем, что способ при получении указанного комбинированного значения для биомаркеров позволяет пренебречь подмножеством по меньшей мере из одного из указанных биомаркеров PCa (i)-(v) из категории биомаркеров PCa, такого как подмножество из одного, двух, трех или четырех из указанных биомаркеров PCa (i)-(v).
3. Способ по п. 1, дополнительно включающий рекомендацию биопсии индивидууму, если общее комбинированное значение превышает пороговое значение.
4. Способ по п. 1, дополнительно включающий рекомендацию индивидууму изменить привычную диету для потери массы, достижения значения BMI ниже 30, регулярной физической нагрузки и/или прекращения курения, если общее комбинированное значение превышает пороговое значение.
5. Способ по п. 1, отличающийся тем, что SNPpc выбраны из группы, состоящей из 657del5, rs10086908, rs1016343, rs10187424, rs1041449, rs10486567, rs1054564, rs10875943, rs10896449, rs10934853, rs10993994, rs11067228, rs11135910, rs11228565, rs11568818, rs11649743, rs11650494, rs11672691, rs11704416, rs12130132, rs12409639, rs12418451, rs12500426, rs12543663, rs12621278, rs12653946, rs1270884, rs130067, rs13252298, rs13385191, rs1354774, rs1363120, rs137853007, rs138213197, rs1447295, rs1465618, rs1512268, rs1571801, rs16901979, rs16902094, rs17021918, rs17632542, rs17879961, rs1859962, rs1894292, rs1933488, rs1983891, rs2018334, rs2121875, rs2242652, rs2273669, rs2292884, rs2405942, rs2660753, rs2735839, rs2736098, rs2928679, rs3213764, rs339331, rs3771570, rs3850699, rs3863641, rs401681, rs4245739, rs4430796, rs445114, rs4643253, rs4857841, rs4962416, rs5759167, rs5919432, rs5945619, rs6062509, rs620861, rs6465657, rs6763931, rs684232, rs6869841, rs6983267, rs6983561, rs7127900, rs7210100, rs721048, rs7241993, rs7611694, rs7679673, rs7931342, rs8008270, rs8102476, rs888663, rs902774, rs9364554, rs9600079 и rs9623117.
6. Способ по п. 1, отличающийся тем, что SNPpc выбраны из группы, состоящей из rs582598, rs439378, rs2207790, rs1046011, rs10458360, rs7525167, rs10489871, rs7529518, rs4245739, rs4512641, rs10178804, rs11900952, rs1873555, rs10191478, rs6755901, rs6545962, rs721048, rs2710647, rs12612891, rs2028900, rs1009, rs12233245, rs6760417, rs10496470, rs10199796, rs12475433, rs16860513, rs12151618, rs3765065, rs13017302, rs12988652, rs871688, rs749264, rs3771570, rs4346531, rs6770955, rs12637074, rs2660753, rs13319878, rs6437715, rs2162185, rs1515542, rs2270785, rs9830294, rs1439024, rs6762443, rs888507, rs6794467, rs12490248, rs1477886, rs4833103, rs3796547, rs17779822, rs2366711, rs16849146, rs1894292, rs12640320, rs3805284, rs12500426, rs4699312, rs17021918, rs7679673, rs2047408, rs2647262, rs12506850, rs7658048, rs2078277, rs12505546, rs13113975, rs4246742, rs2736098, rs401681, rs11134144, rs10060513, rs40485, rs2087724, rs1482679, rs16901841, rs1295683, rs2070874, rs7752029, rs2018334, rs9358913, rs1140809, rs409558, rs3096702, rs9267911, rs2025645, rs9359428, rs6569371, rs2813532, rs1933488, rs712242, rs6934898, rs9456490, rs651164, rs3120137, rs9364554, rs9457937, rs10486562, rs10807843, rs7801918, rs6962297, rs2465796, rs6957416, rs7777631, rs2272316, rs6961773, rs2132276, rs13265330, rs16887736, rs2911756, rs2272668, rs2339654, rs1380862, rs9297746, rs12543663, rs10086908, rs16901922, rs1016343, rs17832285, rs16901979, rs4871779, rs10107982, rs16902094, rs620861, rs17467139, rs6983267, rs9297756, rs10094059, rs7818556, rs1992833, rs986472, rs12552397, rs4273907, rs4237185, rs753032, rs11253002, rs2386841, rs10795841, rs10508422, rs7075945, rs10508678, rs539357, rs10826398, rs3818714, rs7090755, rs10993994, rs4382847, rs1891158, rs10887926, rs10788160, rs6579002, rs10832514, rs7358335, rs1944047, rs3019779, rs10896437, rs12793759, rs7106762, rs7102758, rs2449600, rs585197, rs2509867, rs11568818, rs7125415, rs11601037, rs11222496, rs4570588, rs6489721, rs3213764, rs17395631, rs4423250, rs11168936, rs10875943, rs3759129, rs902774, rs1827611, rs4760442, rs11610799, rs6539333, rs11067228, rs7485441, rs6489794, rs4119478, rs17070292, rs2293710, rs17256058, rs1950198, rs2331780, rs7141529, rs12880777, rs17123359, rs785437, rs524908, rs12903579, rs7178085, rs7164364, rs896615, rs11634741, rs9972541, rs12594014, rs11631109, rs1558902, rs8044335, rs2738571, rs885479, rs385894, rs684232, rs4925094, rs17138478, rs11649743, rs2107131, rs7213769, rs12946864, rs306801, rs138213197, rs1863610, rs17224342, rs9911515, rs12947919, rs966304, rs17744022, rs7234917, rs1943821, rs2227270, rs1363120, rs888663, rs1227732, rs1054564, rs4806120, rs11672691, rs758643, rs3745233, rs6509345, rs2659051, rs2735839, rs1354774, rs2691274, rs6090461, rs2297434, rs6062509, rs2315654, rs2823118, rs2838053, rs398146, rs16988279, rs2269640, rs4822763, rs132774, rs747745, rs5978944, rs6530238, rs5934705, rs5935063, rs4830488, rs17318620, rs5945619, rs5945637, rs11091768, rs2473057, rs5918762, rs4844228, rs6625760 и rs17324573.
7. Способ по п. 1, дополнительно включающий сбор у указанного индивидуума семейного анамнеза в отношении PCa, истории лечения и данных физического обследования; где указанный семейный анамнез, историю лечения и/или данные физического обследования включают в комбинированные данные, получая указанное общее комбинированное значение.
8. Способ по п. 2, дополнительно включающий анализ дополнительной категории биомаркеров PCa, посредством определения присутствия или концентрации одного или каждого из множества биомаркеров PCa из указанной дополнительной категории биомаркеров; комбинации данных, относящихся к указанной дополнительной категории биомаркеров PCa, с получением дополнительного комбинированного значения для биомаркеров для указанной дополнительной категории биомаркеров PCa и включением указанного дополнительного комбинированного значения для биомаркеров в общее комбинированное значение; где комбинация данных для получения дополнительного комбинированного значения для биомаркеров составлена с избыточностью, где дополнительная категория биомаркеров PCa содержит более одного биомаркера PCa.
9. Способ по п. 8, где дополнительная категория биомаркеров PCa содержит биомаркер MIC-1 и другие родственные MIC-1 биомаркеры, биомаркер MSMB или другие родственные MSMB биомаркеры.
10. Способ по п. 1, где указанный биологический образец представляет собой образец крови.
11. Способ по п. 1, где значение BMI указанного индивидуума составляет 25.
12. Способ по п. 1, где определение присутствия или отсутствия указанного SNPs проводят с использованием масс-спектрометрии MALDI.
13. Способ по п. 1, где определение присутствия или концентрации указанных биомаркеров PCa проводят с использованием технологии микропанелей.
14. Устройство для анализа для проведения этапов 2a и 2b по п. 1, содержащее твердую фазу с иммобилизованными на ней по меньшей мере двумя различными категориями лигандов, где:
- первая категория указанных лигандов специфически связывается с калликреин-подобным биомаркером PCa и включает множество различных лигандов, специфически связывающихся с каждым из по меньшей мере трех различных биомаркеров PCa, включающих по меньшей мере один из PSA, iPSA, tPSA, fPSA и hK2; и
- вторая категория указанных лигандов специфически связывается с по меньшей мере 90 SNPpc и включает множество различных лигандов, специфически связывающихся с каждым из указанных SNPpc, и, где указанные SNPpc выбраны из SNPpc, перечисленных в п. 5 или 6.
15. Устройство для анализа по п. 14, отличающееся тем, что указанное устройство для анализа включает дополнительную категорию лигандов, специфически связывающихся с MSMB и/или MIC-1.
16. Набор для тестирования для проведения этапов 2a и 2b по п. 1, содержащий устройство для анализа по п. 14 или 15 и по меньшей мере две категории детектирующих молекул, где:
- первая категория указанных детектирующих молекул способна к детекции по меньшей мере трех калликреин-подобных биомаркеров PCa, включающих по меньшей мере один из PSA, iPSA, tPSA, fPSA и hK2; и
- вторая категория указанных детектирующих молекул способна к детекции по меньшей мере 90 SNPpc, и, где указанные SNPpc выбраны из SNPpc, перечисленных в п. 5 или 6.
17. Набор для тестирования по п. 16, отличающийся тем, что указанный набор для тестирования включает дополнительную категорию детектирующих молекул, включающих MSMB и/или MIC-1.
18. Считываемый компьютером носитель данных с исполняемыми командами для выполнения по меньшей мере этапов 3, 4 и 5 по п. 1.
Авторы
Даты
2018-12-19—Публикация
2013-11-20—Подача