ОБЛАСТЬ ТЕХНИКИ
Настоящее техническое решение относится к области медицины, в частности, к способу уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам.
УРОВЕНЬ ТЕХНИКИ
В уровне техники предложены различные методы корректировки смещения сигнала основываясь на информации о принадлежности батчу или порядку загрузки. Например, в работах [1], [2] описываются методы линейной регрессии на номере загрузки или номере экспериментального батча. Работа [3] использует локально взвешенное сглаживание диаграммы рассеяния. Популярный метод ComBat [4], изначально разработанный для данных секвенирования, основывается на эмпирическом байесовском подходе и на данный момент является популярным методом для коррекции сдвига сигнала области масс-спектрометрии.
Несмотря на существование большого количества подходов, до сих пор не ясно, какой из многочисленных методов работает лучше для решения задачи корректировки смещения сигнала.
Описанные выше методы призваны каждый детектированный липидный признак максимально очистить от нежелательных факторов.
Предлагаемый способ позволяет фильтровать (удалять) некоторые признаки с целью избавления от основной части технического шума.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Технической проблемой, на решение которой направлено заявленное техническое решение, является создание способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, который охарактеризован в независимом пункте формулы.
Технический результат заключается в уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией, посредством удаления липидных признаков со слабым или отсутствующим сигналом.
Заявленный результат достигается за счет осуществления способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, содержащий этапы, на которых:
получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;
на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;
если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:
Фиг. 1 иллюстрирует пример общей схемы вычислительного устройства.
ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.
Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.
Предлагаемый метод основан на теории, что техническим факторам в большой степени подвержены липидные признаки, которые несут мало биологического сигнала. Под липидными признаками понимается количественное измерение некоторого химического соединения в каждом образце заданного эксперимента. В результате эксперимента жидкостной хроматографии с масс-спектрометрии для каждого образца получается спектр. С сырыми спектрами работать нельзя, для этого существуют специализированные программные обеспечения, которые из набора спектров, соответствующих образцам, производят таблицу с признаками. Таким образом, для каждого образца, вместо спектра имеется набор признаков, которое программное обеспечение нашло в данном спектре. Признак соответствует некоторому химическому соединению, и значение признака - количеству этого соединение в данном образце. В процессе пробоподготовки и данного экспериментального метода получаются липидные соединения.
Технические факторы валяют на липидные признаки следующим образом: например, образцы делятся на две группы по значениям какого-то липидного признака, то есть половина образцов имеет большие значения по этому признаку, а другая половина имеет меньшие значения. Однако это разделение связано не с биологическими факторами, а с техническими, такими, как, например, порядок загрузки образца в масс-спектрометр. То есть для заданного липидного признака, его значения подвержены как биологическим факторам, так и не желательным техническим факторам, а итоговый сигнал складывается как сумма этих факторов.
На первом этапе способа получают технические образцы в которых отсутствует биологический сигнал и биологические образцы в которых присутствует биологический сигнал.
Под биологическими образцами понимаются те образцы, для которых необходимо в процессе эксперимента получить липидные измерения. Это может быть образец мозга, или плазмы кровы и/или другой ткани. Биологический образец противопоставляется техническим образцам - это образцы, которые сами по себе не интересны, но добавляются в эксперимент для вспомогательных функций. Данные технические образцы подготавливаются заранее, они проходят все те же этапы пробоподготовки, что и обычные образцы, однако без добавления биологического материала. Для создания тестовых данных были использованы данные проекта Карты Мозга, и программа XCMS для их первичной обработки.
На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.
Был проведен сравнительный анализ для данных “карты мозга”, это образцы разных регионов мозга человека и человекоподобных обезьян. Для сравнения работы предложенного способа использовалась популярная программа «ComBat»[4], которая призвана очищать липидные признаки от зашумляющих технических факторов. На данных выхода предложенного способа использовалась наивная коррекция, основанная на среднем значении липидных признаков в одном батче образцов (выравнивание среднего сигнала по батчу). Батч эффект возникает, когда небиологические факторы в эксперименте вызывают изменения в данных, полученных в эксперименте.
В качестве метрики использовалось количество значимых признаков между двумя интересующими группами образцов - образцов из первичной коры и вторичной коры головного мозга данных проекта Карты Мозга. В качестве поправки на множественное тестированное мы использовали поправку Бенджамини-Иекутели, а не более известную поправку Бенджамини-Хохберга в связи с тем, что предположение о неотрицательной взаимосвязи тестов может не выполняться в данных масс-спектрометрии. Из 9089 липидных признаков, которые были детектированы в наших данных, по результатам работы программы «ComBat»[4] было получено 506 значимых признаков после поправки на множественное тестирование. По результатам предложенного способа было получено 633 значимых признаков после поправки на множественное тестирование, что соответствует приросту в 25%. Таким образом, предлагаемый способ позволяет извлечь больше полезного сигнала из данных.
На Фиг. 1 далее будет представлена общая схема вычислительного устройства (100), обеспечивающего обработку данных, необходимую для реализации заявленного решения.
В общем случае устройство (100) содержит такие компоненты, как: один или более процессоров (101), по меньшей мере одну память (102), средство хранения данных (103), интерфейсы ввода/вывода (104), средство В/В (105), средства сетевого взаимодействия (106).
Процессор (101) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (100) или функциональности одного или более его компонентов. Процессор (101) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (102).
Память (102), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.
Средство хранения данных (103) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (103) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.
Интерфейсы (104) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.
Выбор интерфейсов (104) зависит от конкретного исполнения устройства (N00), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.
В качестве средств В/В данных (105) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Средства сетевого взаимодействия (106) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (105) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.
Компоненты устройства (100) сопряжены посредством общей шины передачи данных (110).
В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.
Источники информации
[1] Kuligowski J, Pérez-Guaita D, Lliso I, Escobar J, León Z, Gombau L, Solberg R, Saugstad OD, Vento M, Quintás G. Detection of batch effects in liquid chromatography-mass spectrometry metabolomic data using guided principal component analysis. Talanta. 2014 Dec;130:442-8. doi:10.1016/j.talanta.2014.07.031. Epub 2014 Jul 18. PubMed PMID: 25159433.
[2] San-Yuan Wang, Ching-Hua Kuo, and Yufeng J. Tseng. Batch Normalizer: A Fast Total Abundance Regression Calibration Method to Simultaneously Adjust Batch and Injection Order Effects in Liquid Chromatography/Time-of-Flight Mass Spectrometry-Based Metabolomics Data and Comparison with Current Calibration Methods. Analytical Chemistry 2013 85 (2), 1037-1046.
[3] Fernández-Albert F, Llorach R, Garcia-Aloy M, Ziyatdinov A, Andres-Lacueva C, Perera A. Intensity drift removal in LC/MS metabolomics by common variance compensation. Bioinformatics. 2014 Oct 15;30(20):2899-905. doi: 10.1093/bioinformatics/btu423. Epub 2014 Jul 2. PubMed PMID: 24990606.
[4] Leek, J. T., Johnson, W. E., Parker, H. S., Jaffe, A. E., & Storey, J. D. (2012). The sva package for removing batch effects and other unwanted variation in high-throughput experiments. Bioinformatics, 28(6), 882-883. http://doi.org/10.1093/bioinformatics/bts034.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ УЛУЧШЕНИЯ КАЧЕСТВА АННОТАЦИИ ЛИПИДНЫХ ПРИЗНАКОВ, ОТНОСЯЩИХСЯ К ОТДЕЛЬНЫМ ЛИПИДНЫМ КЛАССАМ, С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИИ О ВРЕМЕНИ ЗАДЕРЖКИ В МАСС-СПЕКТРОМЕТРЕ | 2020 |
|
RU2743418C1 |
СПОСОБ И СИСТЕМА КОРРЕКЦИИ НЕЖЕЛАТЕЛЬНЫХ КОВАРИАЦИОННЫХ ЭФФЕКТОВ В МИКРОБИОМНЫХ ДАННЫХ | 2019 |
|
RU2742003C1 |
СПОСОБ ВЫЯВЛЕНИЯ ДИАБЕТИЧЕСКОЙ ФЕТОПАТИИ ПЛОДА | 2020 |
|
RU2742801C1 |
СПОСОБ ОБРАБОТКИ ХРОМАТО-МАСС-СПЕКТРОМЕТРИЧЕСКИХ ДАННЫХ ДЛЯ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ПОИСКА ДИАГНОСТИЧЕСКИХ МАРКЕРОВ ПРИ ПРОВЕДЕНИИ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ | 2021 |
|
RU2803128C2 |
СПОСОБ ВЫЯВЛЕНИЯ САХАРНОГО ДИАБЕТА ПЕРВОГО ТИПА | 2020 |
|
RU2752372C1 |
Способ диагностики психических расстройств по липидам крови | 2022 |
|
RU2818128C2 |
СПОСОБ ДИАГНОСТИКИ СИФИЛИСА С ИСПОЛЬЗОВАНИЕМ МЕТОДА ПРЯМОГО ПРОТЕОМНОГО ПРОФИЛИРОВАНИЯ СЫВОРОТКИ КРОВИ | 2008 |
|
RU2381505C1 |
НОВОЕ ПРИМЕНЕНИЕ ПРОБИОТИКОВ | 2009 |
|
RU2497536C2 |
Способ диагностики преэклампсии по аминокислотному профилю плазмы крови | 2019 |
|
RU2717942C1 |
СПОСОБ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ ТИПА САХАРНОГО ДИАБЕТА | 2021 |
|
RU2788106C1 |
Изобретение относится к области медицины. Предложен компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом. Получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал. На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных. Изобретение обеспечивает уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией посредством удаления липидных признаков со слабым сигналом. 1 ил.
Компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом, содержащий этапы, на которых:
получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;
на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;
если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.
СПОСОБ ОБРАБОТКИ ЗВУКОВОГО СИГНАЛА | 2011 |
|
RU2464649C1 |
ЛОХОВ П.Г | |||
и др | |||
Масс-спектрометрический анализ липидома плазмы крови, как способ диагностики заболеваний, оценки эффективности и оптимизации лекарственной терапии | |||
Биомедицинская химия | |||
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса | 1924 |
|
SU2015A1 |
РОККА П | |||
Калибровка параметров генетического алгоритма для задач проектирования фазированных антенных |
Авторы
Даты
2022-04-04—Публикация
2020-05-18—Подача