Способ определения последовательности нуклеотидов Российский патент 2018 года по МПК G01N33/48 

Описание патента на изобретение RU2669406C1

Изобретение относится к генной инженерии, к анализу белковых соединений, а именно к способам и средствам определения последовательности нуклеотидов или фореза (электрофореза) и может быть использовано в медицине, криминалистике, юриспруденции и других областях для секвенирования и идентификации ДНК и прочих макромолекул для повышения достоверности результата.

Известен патент Китая 105349617, С12М 1/34, C12Q 1/68, 24.02.2016, в котором предложено в образец в процессе секвенирования добавлять экзогенное референтное вещество и по результатам его секвенирования корректировать алгоритм обработки результатов измерения образца в части отбора релевантных сигналов.

К недостаткам известного способа следует отнести то, что в отборе релевантных сигналов участвуют шумовые выбросы, а также то, что корректируется лишь алгоритм, что не позволяет существенно повысить достоверность способа.

Известен также патент Китая 105046665, G06T 5/00, 11.11.2015, в котором задача подавления гауссовского шума при секвенировании решается путем применения вейвлет-трансформации, Bi-свертки и выбора «локальных» вейвлет-коэффициентов для вычисления уточненного порога в модели Лапласа.

Недостаток данного способа заключается в том, что для подавления шумов используется априорная модель, что ограничивает достоверность способа. Кроме того, описанные выше операции осуществляются на этапе анализа информационного сигнала, то есть анализу подвергается и шумовая составляющая, ее пики могут быть сочтены релевантными, что также снижает достоверность полученных данных.

Наиболее близким к предложенному является способ по патенту Китая 106701746, C12N 15/11, 24.05.2017, в котором описан способ определения последовательности нуклеотидов путем электрофореза, включающий введение в образец люминесцентных маркеров и регистрацию их излучения под воздействием излучения накачки с выделением пиков излучения на фоне шумовой составляющей, присутствующей, как отмечено выше, в любой методике секвенирования, а также последующий отбор релевантных пиков люминесцентного излучения.

По существу данному способу присущи те же недостатки - низкая достоверность результатов вследствие малого отношения сигнал/шум и невозможности количественно определить достоверность контроля с целью принятия решения на основании полученных данных.

Техническим результатом, ожидаемым от использования изобретения, является повышение достоверности способа за счет подавления шума и возможности количественно оценить полученный результат.

Указанный результат достигается тем, что в способе определения последовательности нуклеотидов, включающем введение в образец люминесцентных маркеров и регистрацию их излучения под воздействием излучения накачки с выделением пиков излучения на фоне шумовой составляющей, а также отбор релевантных пиков люминесцентного излучения, регистрацию люминесцентного излучения маркеров производят с дискретностью распознавания параметров шумовой составляющей, а до отбора релевантных пиков люминесцентного излучения на основании полученных параметров шумовой составляющей производят расчет достоверности каждого пика и отбрасывают пики с достоверностью ниже пороговой.

Поясним существо предложения. При проведении электрофореза дискретность регистрации излучения весьма велика, то есть используются чрезвычайно низкие частоты опроса фотоприемника, что связано с низкой скоростью прохождения образцом капиллярной сборки. В предложении эта временная дискретность снижается (частота опроса возрастает) до значений, обеспечивающих надежное определение шумовых характеристик, таких как характер распределения и тип шума, спектральные характеристики (белый, розовый, коричневый и т.п.), мощность и т.п. Количественно это означает повышение частоты опроса, например, в сотни раз по сравнению с общепринятой практикой.

При этом также, как и в известном решении, производится выделение пиков излучения на фоне шумовой составляющей, то есть последняя фильтруется аппаратными или алгоритмическими средствами до и/или после регистрации, в результате после выделения пиков мы имеем набор из релевантных пиков, не релевантных пиков и случайных пиков (выбросов), обусловленных шумовой составляющей, прошедших упомянутые средства фильтрации. На данном этапе в предложенном способе для каждого пика производится расчет вероятности его появления в результате случайных причин, то есть вероятности того, что данный пик является «шумовым» выбросом, обусловлен шумовой составляющей. Расчет производится по стандартным, общепринятым методикам теории вероятностей с использованием ранее полученных параметров шума (см. например, по поводу типов шумов и их свойств: А. ван дер Зил "Шумы при измерениях", Мир 1979. с. 8-9, 28-36, 44-58; М., Букингем "Шумы в электронных приборах и системах" // Мир 1986. с. 18-51, 160-163, 193-195). Химия и физика различных событий в процессе измерений по-разному влияет на распределение шума (касается как электрофореза, так и других методов, используемых при секвенировании). Это, с одной стороны, может стать дополнительным источником информации о процессе, но с другой - требует репрезентативности выборки при накоплении информации о шуме, чем и определяются требования к дискретизации. Последняя, в свою очередь, зависит от частоты опроса и скорости прохождения образцов, что также может регулироваться в реальном времени по команде от процессора. (О требованиях к репрезентативности выборки см., в частности: Елисеева И.И., Юзбашев М.М. Общая теория статистики: М.: Финансы и статистика, 2001. раздел 7.2; Е.Д. Шабалдин и др. "Метрология и электрические измерения" // Изд-во ГОУ ВПО «Рос. гос. проф. пед. ун-т», 2006 с. 48-64). В отношении оптимальных способов выделения сигнала на фоне известных шумов методики также хорошо разработаны (см., например: Харкевич А.А. "Борьба с помехами" Наука, 1965. с 61-70, 144-167).

Упомянутыми выше методами получают, например, вероятность ложного обнаружения сигнала в текущий момент времени или на интервале накопления, а величина дополнительная к этой вероятности является достоверностью данного пика. В результате на последующий этап анализа результатов измерения, отбора релевантных пиков люминесцентного излучения, то есть пика нужного маркера, расположенного на нужном участке анализируемой макромолекулы, поступает отклик (пик), полученный под воздействием излучения накачки нужной частоты, а не отклик маркера иного типа на «чужую» накачку, например.

Таким образом, на операцию отбора поступает массив данных, в котором каждому выделенному пику присвоено значение его достоверности и пики с достоверностью ниже заданной могут быть отсеяны до этапа анализа, что и позволяет повысить достоверность данного этапа и способа в целом.

При этом дополнительно в процессе регистрации может выбираться минимальный пик с достоверностью выше пороговой и по нему и полученным параметрам шумовой составляющей периодически определяться отношение сигнал/шум и корректироваться мощность и/или спектр сигнала накачки и/или скорость прохождения образца до получения отношения сигнал/шум не хуже заданного или достижения максимума отношения сигнал/шум.

В данном случае устанавливается критерий выбора достоверного (в рамках принятых допущений) полезного сигнала для расчета отношения сигнал/шум и последующей корректировки указанных выше параметров с целью получения заданного или большего соотношения сигнал/шум. При этом возрастает число пиков излучения с достоверностью выше заданной и, соответственно, достоверность способа в целом. При этом немаловажно, что в результате подстроек может меняться сам характер шума, например, на более оптимальный с точки зрения возможностей отстройки от него.

Кроме того, выбор минимального пика и корректировка параметров сигнала накачки могут производиться на локальном участке образца.

Говоря о локальном участке образца мы имеем в виду, что образец протяженный. Также можно говорить о локальном участке установки или капиллярной сборки, данные понятия эквивалентны для целей предлагаемого способа. Также следует понимать, что «на локальном участке образца» может трактоваться и как «для локального участка образца». И если выше речь шла о минимальном пике для всего образца, то есть пике, выбранном на длительном интервале наблюдения, на протяжении всего образца или его значительной части, то в данном варианте реализации способа речь идет об одновременном наблюдении и выборе минимального пика и последующей корректировке параметров накачки для нескольких участков образца. Это позволяет дополнительно оптимизировать параметры сигнала накачки.

Целесообразно также сначала использовать весь диапазон спектра и/или мощности сигнала накачки, а затем уже снижать скорость прохождения образца. При этом остается неизменным важнейший для практического применения параметр - производительность способа.

Далее, сигнал накачки может модулироваться, а регистрацию люминесцентного излучения маркеров в этом случае производят в процессе демодуляции.

И, наконец, при расчете достоверности каждого пика могут учитываться априорные данные об образце, измерительной установке и концентрации реактивов. Эти данные могут быть получены из результатов исследования тестовых образцов с известной последовательностью нуклеотидов, сертификатов на реактивы и т.п. Совокупность этих данных наряду с результатом измерения шумовой составляющей позволяет точнее рассчитать вероятность случайного появления пика данной амплитуды.

Более того, как уже упоминалось, данные о характере шума и его изменениях являются ценной информацией для верификации всего процесса (на этом основании можно отбраковывать реактивы (праймеры), сравнивая результаты с образцовыми для данного типа и данной установки, а также добиваться оптимальных режимов проведения исследования), что в целом очень позитивно влияет на достоверность результатов.

Рассмотрим существо предложения на примерах. На фиг. 1 изображен алгоритм осуществления способа в общем случае. На фиг. 2 схематично показана временная диаграмма электрофореза. Сигнал на выходе фотоприемника, регистрирующего излучение люминесценции маркеров обозначен позицией 1, позицией 2 обозначена измеренная мощность шума, а позицией 3 - пороговый уровень для выделения пика, в качестве которого принимается сигнал, превышающий данный уровень. Этот уровень задается в начале измерения априорно, но может корректироваться по ходу секвенирования, в частности целесообразно устанавливать его пропорциональным средней мощности шумовой составляющей.

Как показано на фиг. 1, особенностью предложенного способа является последовательное выполнение контроля шумовой составляющей, расчета вероятности того, что очередной пик на кривой флуоресцентного излучения маркеров является ложным сигналом, обусловленным шумовым выбросом, и отбор пиков с достоверностью выше заданного порога (эти операции отмечены фигурными скобками на фиг. 1), причем все эти три операции производятся до корреляционного анализа результатов множества проведенных измерений и прочих методов отбора релевантных пиков или интерпретации накопленных данных.

В результате, как показано на фиг. 2, каждому пику на кривой 1, расположенному выше порогового уровня 3 ставится в соответствие частота излучения f, координата X вдоль оси прохождения образца и достоверность, причем пик f1, X1 при амплитуде выше пика f2, Х2 имеет меньшую достоверность (0,35 и 0,54 соответственно), так что при пороговой достоверности 0,4 первый пик учтен при анализе данных измерения не будет.

Не менее важной особенностью предлагаемого способа является возможность дополнительного повышения достоверности результатов за счет увеличения отношения сигнал/шум. Это становится возможным благодаря тому, что параметры шума фиксируются непрерывно. И контроль параметров шумовой составляющей и регистрация излучения флуоресценции с последующим выделением пиков сопровождаются, разумеется, запоминанием измеренных значений сигнала на выходе фотоприемника или фильтра, стоящего за ним, то есть фиксацией и запоминанием мгновенных значений сигнала, пропорционального величине излучения маркеров. Так что когда выше говорилось о контроле параметров шумовой составляющей и регистрации излучения флуоресценции с последующим выделением пиков как о раздельных операциях, речь шла о интерпретации одного зафиксированного (фиксируемого в каждый момент времени) сигнала флуоресценции, разделения его на шумовую составляющую и так называемые пики. После этого и появляется возможность определения текущего или среднего для интервала или всего образца отношения сигнал/шум (по минимальному пику, причем, если определение этого отношения и корректировка сигнала накачки или скорости образца производятся в текущем времени, за минимальный принимается последний зафиксированный пик). Далее, в текущем режиме или между измерениями (а также на интервале) изменяют вышеперечисленные параметры установки (мощность излучения накачки, спектр, скорость образца) до получения оптимального соотношения сигнал/шум.

Данная последовательность действий иллюстрируется алгоритмом, представленным на фиг. 3. Как следует из фиг. 3, изменение параметров излучения накачки или величины скорости образца продолжается до достижения максимума соотношения сигнал/шум. На практике данный алгоритм работает как любой алгоритм обратной связи, обеспечивая постоянную настройку параметров способа для обеспечения его максимальной достоверности.

Фиг. 4 иллюстрирует вариант предлагаемого способа, в котором регистрируют излучение маркеров в процессе демодуляции. На фиг. 4 обозначено: 4 - источник модулированного излучения накачки, 5 - фотоприемник, 6 - демодулятор, 7 - блок обработки. Излучение источника 4 (широкая стрелка) поступает на образец (не показан), выход фотоприемника 5 соединен со входом демодулятора 6, выход которого подключен ко входу блока обработки (процессора). Выход синхронизации источника 4 соединен с управляющим входом демодулятора 6.

Таким образом, на образец поступает модулированное излучение накачки (говоря о регистрации излучения маркеров в процессе демодуляции, мы предполагаем, что излучение накачки было модулированным), а модулированный выходной сигнал фотоприемника 5 демодулируется и затем поступает на обработку (выделение шумовой составляющей, определение вида и параметров последней, вычисление отношения сигнал/шум, отсеивание пиков с достоверностью ниже заданной и т.д.). Регистрация излучения маркеров именно в процессе демодуляции позволяет дополнительно снизить влияние помех, повысить отношение сигнал/шум и достоверность способа в целом.

Как отмечено выше, в предложенном способе производится расчет вероятности появления каждого пика в результате случайного выброса, и данная величина определяется не только шумовым спектром, но и параметрами установки, используемых реактивов и свойствами образца. Коэффициенты влияния указанных величин на вероятность выброса могут быть определены заранее, по результатам предшествующих измерений и учтены с помощью формулы:

В=Bp*Ko*Kp*Ky,

где В - вероятность выброса данной амплитуды, Вр - Расчетная вероятность выброса, полученная из шумовых характеристик вышеуказанным образом, Kо, Kp, Ky - соответственно коэффициенты влияния образца, реактивов и установки.

Отметим также, что в предлагаемом способе эффект дополнительного повышения достоверности вследствие настройки оптимального режима по величине отношения сигнал/шум оказывается существенно выше, чем можно было бы предположить из опыта настройки известных процессов. В действительности, поскольку способ основан на алгоритмическом подавлении шума, для слабого сигнала (каковым является отклик большого числа маркеров) применение способа оказывается возможным благодаря тому, что пики от этих маркеров «приподнимаются» над уровнем шумов, иными словами данный эффект не является ожидаемым. То же относится и к модуляции накачки с последующей демодуляцией сигнала фотоприемника.

И еще одно обстоятельство оказывает неожиданное, дополнительное влияние на повышение достоверности способа и, одновременно, его производительности. Помимо возможности более достоверно выделять артефакты по свойственному им характеру шума речь идет еще и о том, что повышение частоты опроса фотоприемника в десятки и сотни раз дает дополнительную информацию не только о шуме, но и форме релевантных пиков (что также позволяет точнее определить их амплитуду), и эта дополнительная информация учитывается при отборе релевантных пиков, расчете вероятности случайного появления пиков и т.д. Таким образом достигается существенно большая достоверность исследований, что очень важно для таких областей, как, например, медицинская диагностика и криминалистика.

Похожие патенты RU2669406C1

название год авторы номер документа
Способ анализа последовательности нуклеотидов 2017
  • Камочкина Инга Якубовна
RU2663693C1
СПОСОБ ОПТИЧЕСКОГО ОПРЕДЕЛЕНИЯ КОМПОНЕНТА, ПРЕИМУЩЕСТВЕННО СЕРОВОДОРОДА, И ЕГО КОНЦЕНТРАЦИИ В ПОТОКЕ ГАЗА 2016
  • Могильная Татьяна Юрьевна
  • Томилин Вячеслав Иванович
  • Суминов Игорь Вячеславович
  • Никитина Маргарита Николаевна
  • Ильичев Дмитрий Александрович
RU2626389C1
СПОСОБ ЛАЗЕРНОЙ ЛОКАЦИИ И ЛАЗЕРНОЕ ЛОКАЦИОННОЕ УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2001
  • Кутаев Ю.Ф.
  • Манкевич С.К.
  • Носач О.Ю.
  • Орлов Е.П.
RU2183841C1
СПОСОБ ЛАЗЕРНОЙ ЛОКАЦИИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 1999
  • Кутаев Ю.Ф.
  • Манкевич С.К.
  • Носач О.Ю.
  • Орлов Е.П.
RU2152056C1
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ВЫСОКОМУЛЬТИПЛЕКСНОЙ ПЦР 2012
  • Циммерманн Бернхард
  • Хилл Мэттью М.
  • Лакроут Филипп Гилберт
  • Додд Майкл
RU2650790C2
СПОСОБЫ И ПРИБОРЫ ДЛЯ ОБНАРУЖЕНИЯ И ИДЕНТИФИКАЦИИ ЗАКОДИРОВАННЫХ ГРАНУЛ И БИОЛОГИЧЕСКИХ МОЛЕКУЛ 2007
  • Горфинкель Вера
  • Горбовицки Борис
  • Горбовицки Микаил
RU2487169C2
Способ определения сроков нанесения рукописных надписей на документы 2021
  • Баранова Татьяна Анатольевна
  • Ершова Ксения Олеговна
  • Кочемировский Владимир Алексеевич
  • Кочемировская Светлана Валерьевна
  • Мохоров Дмитрий Анатольевич
  • Фогель Алена Александровна
  • Шануренко Игорь Александрович
RU2809556C2
УСТРОЙСТВО ДЛЯ АВТОМАТИЧЕСКОГО ДЕТЕКТИРОВАНИЯ БЫСТРОДВИЖУЩИХСЯ ЗАЩИТНЫХ МЕТОК, СОДЕРЖАЩИХ МИКРОКРИСТАЛЛЫ АЛМАЗА С АКТИВНЫМИ NV-ЦЕНТРАМИ 2014
  • Левченко Алексей Олегович
  • Зибров Сергей Александрович
  • Васильев Виталий Валентинович
  • Сивак Александр Владимирович
  • Рудой Виктор Моисеевич
  • Величанский Владимир Леонидович
RU2566600C1
БЕЗЭТАЛОННЫЙ СПОСОБ ИЗМЕРЕНИЯ КВАНТОВОЙ ЭФФЕКТИВНОСТИ КАТОДА ФОТОЭЛЕКТРОННОГО УМНОЖИТЕЛЯ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2023
  • Прудковский Павел Андреевич
  • Сафроненков Даниил Алексеевич
  • Кузнецов Кирилл Андреевич
  • Китаева Галия Хасановна
RU2819206C1
СПОСОБ СЕКВЕНИРОВАНИЯ ДНК И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ (ВАРИАНТЫ) 2013
  • Мантуров Алексей Олегович
  • Гуторов Михаил Александрович
RU2539038C1

Иллюстрации к изобретению RU 2 669 406 C1

Реферат патента 2018 года Способ определения последовательности нуклеотидов

Изобретение относится к медицине и может быть использовано для определения последовательности нуклеотидов в образце пациента. Для этого в образец вводят люминесцентные маркеры и регистрируют их излучения под воздействием излучения накачки. Выделяют пики излучения, а также проводят отбор релевантных пиков люминесцентного излучения. Причем регистрацию люминесцентного излучения маркеров производят с дискретностью распознавания параметров шумовой составляющей. До отбора релевантных пиков люминесцентного излучения на основании полученных параметров шумовой составляющей производят расчет достоверности каждого пика. При этом отбрасывают пики с достоверностью ниже пороговой. После чего проводят отбор релевантных пиков и определяют последовательность нуклеотидов. Изобретение позволяет повысить достоверность способа определения последовательности нуклеотидов при проведении электрофореза. 5 з.п. ф-лы, 4 ил.

Формула изобретения RU 2 669 406 C1

1. Способ определения последовательности нуклеотидов, включающий введение в образец люминесцентных маркеров и регистрацию их излучения под воздействием излучения накачки с выделением пиков излучения, а также отбор релевантных пиков люминесцентного излучения, отличающийся тем, что регистрацию люминесцентного излучения маркеров производят с дискретностью распознавания параметров шумовой составляющей и до отбора релевантных пиков люминесцентного излучения на основании полученных параметров шумовой составляющей производят расчет достоверности каждого пика, отбрасывают пики с достоверностью ниже пороговой, после чего проводят отбор релевантных пиков и определяют последовательность нуклеотидов.

2. Способ по п. 1, отличающийся тем, что дополнительно в процессе регистрации выбирают минимальный пик с достоверностью выше пороговой и по нему и полученным параметрам шумовой составляющей периодически определяют отношение сигнал/шум и корректируют мощность и/или спектр сигнала накачки и/или скорость прохождения образца до получения отношения сигнал/шум не хуже заданного или достижения максимума отношения сигнал/шум.

3. Способ по п. 2, отличающийся тем, что выбор минимального пика и корректировку параметров сигнала накачки производят на локальном участке образца.

4. Способ по п. 2, отличающийся тем, что сначала используют весь диапазон спектра и/или мощности сигнала накачки, а затем уже снижают скорость прохождения образца.

5. Способ по п. 1, отличающийся тем, что сигнал накачки модулируют, а регистрацию люминесцентного излучения маркеров производят в процессе демодуляции.

6. Способ по п. 1, отличающийся тем, что при расчете достоверности каждого пика учитывают априорные коэффициенты влияния параметров установки, образца и реактивов, полученные предварительно при расчете достоверности пиков образцов известного состава.

Документы, цитированные в отчете о поиске Патент 2018 года RU2669406C1

CN 106701746 A, 24.05.2017
СПОСОБ ВЫДЕЛЕНИЯ ДИСКРЕТНЫХ СОСТАВЛЯЮЩИХ В СПЕКТРЕ СИГНАЛА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2006
  • Гарин Валерий Юрьевич
  • Овсянников Владимир Николаевич
RU2331893C1
ОБНАРУЖЕНИЕ ВОДЯНЫХ ЗНАКОВ 2005
  • Робертс Дэвид К.
RU2367018C2
ИВАНОВ В
Э
и др., Простой способ обнаружения гармонических составляющих в шумовом сигнале, Вестник ТОГУ, 2009, N 3(14), C.55-62.

RU 2 669 406 C1

Авторы

Камочкина Инга Якубовна

Даты

2018-10-11Публикация

2017-11-23Подача