Заявитель испрашивает приоритет согласно датам подачи патентной заявки US 61/515722 (5 августа 2011 г.) и патентной заявки US 61/647299 (15 мая 2012 г.), которые включены в данный документ путем ссылки.
Область техники
Представленная в данном документе технология относится к идентификации неизвестных соединений и, в частности, но не исключительно, к способам и системам идентификации неизвестных соединений посредством газовой хроматографии и масс-спектрометрии.
Уровень техники
В настоящее время идентификация неизвестных веществ с использованием библиотек масс-спектральных стандартов основана исключительно на характеристиках согласования по спектру. Когда библиотеки предварительно отбирают, чтобы выбрать подгруппу библиотеки, содержащую набор кандидатов на соответствие, традиционные подходы к предварительному отбору основаны на спектральных характеристиках. Однако в некоторых случаях эти решения неспособны включить правильное соединение в перечень предварительно отобранных кандидатов. Кроме того, множество соединений, которые не могут соответствовать на основании хроматографических условий, включают в группу предварительно отобранных кандидатов, что дополнительно усложняет правильную идентификацию. Таким образом, несмотря на применимость чувствительных ГХ-МС систем и обширные базы данных для идентификации неизвестных соединений, в уровне техники требуется более надежная и/или эффективная идентификация неизвестных соединений.
Краткое описание изобретения
Соответственно, представленная в данном документе технология относится к идентификации неизвестных соединений и, в частности, но не исключительно, к способам и системам идентификации неизвестных соединений посредством газовой хроматографии и масс-спектрометрии с использованием индекса удерживания, связанного с временем удерживания, в качестве основного параметра предварительного отбора для выбора надлежащего перечня спектров кандидатов на соответствие из обычной справочной библиотеки стандартов. Оцененный индекс удерживания используют в качестве одного критерия при определении конечного соответствия помимо масс-спектральных характеристик (или других свойств, если не используют масс-спектрометр и ю). Прогнозирование индекса удерживания для соединений из библиотеки приводит к более высокому качеству начальных списков поиска и более достоверной идентификации. Это устраняет необходимость в выполнении анализа с дополнительными стандартами или в проведении экспериментов после анализа для обеспечения или подтверждения идентификации по времени удерживания. Кроме того, использование прогнозируемого индекса удерживания улучшает качество идентификации неизвестных соединений.
В некоторых воплощениях в данном документе представлены способы и системы для создания базы данных или библиотеки соединений с ассоциированными индексами удерживания или другими показателями времени удерживания. В некоторых воплощениях записи в базе данных или библиотеке включают соединения, имеющие индексы удерживания, связанные с временем удерживания, полученные путем моделирования, а не путем эксперимента. В некоторых воплощениях такие показатели определяют путем виртуального анализа соединения и присваивания прогнозируемого показателя удерживания на основе виртуального анализа. В некоторых воплощениях виртуальный анализ включает: а) выбор отдельных атомов или химических групп и их связей в соединении (например, -CH3, -CH2- и т.п.), б) присваивание величины удерживания (например, коэффициента) атому или группе на основе обучающего набора данных, содержащего идентичные или похожие атомы или группы из соединений с известными (например, экспериментально определенными) данными по удерживанию, и в) суммирование величин удерживания отдельных атомов/групп для получения показателя прогнозируемого времени удерживания для молекулы. В некоторых воплощениях природу начальной молекулы используют для выбора обучающего набора данных с наибольшей степенью вероятности, чтобы обеспечить точные результаты (например, обучающий набор данных основывают на молекулах похожей структуры или похожего класса соединений в качестве искомого соединения). По существу в данном документе представлены более полные базы данных / библиотеки соединений, которые содержат соединения, имеющие либо экспериментально определенные данные по времени удерживания, либо связанные с ними виртуально определенные данные по времени удерживания, либо и то, и другое.
В некоторых воплощениях выбираемый полный набор соединений присутствует в двух или более отдельных базах данных или библиотеках. В некоторых воплощениях отдельные элементы двух или более отдельных баз данных или библиотек содержат соединения, имеющие связанные характеристики. В некоторых воплощениях характеристика представляет собой связанную с соединением точность данных по индексу удерживания (например, первая база данных может включать соединения, известные как имеющие точные данные, а вторая база данных может включать соединения, известные или прогнозируемые как имеющие менее точные данные). В некоторых воплощениях характеристика представляет собой структурный класс соединения (например, органическое, неорганическое, алкан, алкил, ароматическое соединение, арильные соединения и т.д.). В некоторых воплощениях характеристика представляет собой функциональное использование соединения (например, растворители, боевые отравляющие вещества, токсины и т.д.).
В некоторых воплощениях в данном документе представлены способы и системы, которые позволяют точную и эффективную идентификацию неизвестного соединения. В некоторых воплощениях кривую индекса удерживания получают путем использования двух или более известных соединений. Оцененный индекс удерживания (например, оцененный индекс удерживания Ковача или ОИУК) вычисляют путем измерения времени удерживания (ВУ) неизвестного соединения и соотнесения измеренного ВУ с наклоном кривой ИУК.
В некоторых воплощениях ОИУК затем используют для выбора подгруппы молекул в базах данных или библиотеках. Например, в некоторых воплощениях любое соединение в данной библиотеке в пределах конкретного диапазона ОИУК (например, 20 единиц ИУК) выбирают в качестве кандидата для дальнейшего анализа. В некоторых воплощениях используемый интервал изменяется по требованию и может изменяться от библиотеки к библиотеке на основании факторов, включающих, но не ограниченных перечисленным, точность данных в библиотеке (например, меньший интервал используют, когда обращаются с запросом к высокоточной библиотеке), природу соединений в библиотеке и т.п. После выбора подгруппу кандидатов затем сравнивают с другой собранной информацией, чтобы идентифицировать соединение или соединения в библиотеке, которые наилучшим образом соответствуют измеренным свойствам неизвестного соединения. Например, в некоторых воплощениях различные масс-спектральные свойства, определенные для неизвестного соединения, сравнивают с соответствующими свойствами подгруппы кандидатов соединений, чтобы выбрать наилучшее соответствие и идентифицировать неизвестное соединение.
В некоторых воплощениях все компоненты, требуемые для осуществления способов, размещены в одном устройстве. Например, прибор ГХ-МС может содержать базы данных известных соединений и процессор и/или программное обеспечение, выполненные с возможностью анализа данных, как описано в любом из способов в данном документе. Альтернативно, одну или более функций можно обеспечить в отдельном устройстве, которое может быть расположено вблизи или на расстоянии от прибора ГХ-МС. Например, базы данных и/или компоненты анализа данных могут присутствовать в компьютере, расположенном на расстоянии от прибора ГХ-МС. Данные передают между прибором ГХ-МС и компьютером через соединительную сеть (например, защищенную беспроводную сеть и т.п.).
Таким образом, в некоторых воплощениях данная технология обеспечивает способ идентификации неизвестного соединения с использованием газовой хроматографии - масс-спектрометрии (ГХ-МС), при этом способ включает оценку прогнозируемого индекса удерживания стандартного соединения на основе атомной структуры стандартного соединения и присваивание прогнозируемого индекса удерживания стандартному соединению. В некоторых воплощениях способ оценки прогнозируемого индекса удерживания стандартного соединения на основе атомной структуры стандартного соединения включает определение типа атома и типа связи для каждого атома стандартного соединения; выбор сравнительного соединения из базы данных, при этом сравнительное соединение имеет известный индекс удерживания и состоит из атомов таких же типов и связей таких же типов, как и стандартное соединение; присваивание коэффициента каждому атому сравнительного соединения, при этом коэффициент характеризует вклад атома в известный индекс удерживания сравнительного соединения; и использование данного коэффициента для оценки индекса удерживания стандартного соединения. В некоторых воплощениях способ включает выбор множества сравнительных соединений из базы данных для обеспечения обучающего набора данных, при этом каждое соединение из обучающего набора данных имеет известный индекс удерживания и состоит из атомов таких же типов и связей таких же типов, как и стандартное соединение. В некоторых воплощениях присваивание коэффициента включает создание матрицы. В частности, в некоторых воплощениях обеспечивают, чтобы столбец матрицы соответствовал типу атома, а строка матрицы соответствовала соединению из базы данных, при этом соединение имеет известный индекс удерживания и состоит из атомов таких же типов и связей таких же типов, как и стандартное соединение.
В некоторых воплощениях способ включает определение точности оцененного индекса удерживания. Точность используют в некоторых воплощениях, например, для сортировки базы данных с использованием точности оцененного индекса удерживания для разделения базы данных с использованием точности оцененного индекса удерживания или для обеспечения интервала поиска.
Кроме того, воплощения представленной в данном документе технологии включают оценку индекса удерживания неизвестного соединения, исследуемого с помощью ГХ-МС. В некоторых воплощениях оценка индекса удерживания неизвестного соединения, исследуемого с помощью ГХ-МС, включает измерение времени удерживания неизвестного соединения и преобразование времени удерживания неизвестного соединения в индекс удерживания неизвестного соединения с использованием известного соотношения между временем удерживания и индексом удерживания. В некоторых воплощениях способы дополнительно включают использование индекса удерживания неизвестного соединения для предварительного выбора стандартных соединений из базы данных и сопоставление неизвестного соединения со стандартным соединением.
Соответственно, один аспект технологии относится к способу идентификации неизвестного соединения с использованием ГХ-МС, при этом способ включает оценку индексов удерживания соединений из библиотеки стандартов на основе атомной структуры каждого соединения, оценку индекса удерживания неизвестного соединения с использованием данных ГХ-МС по времени удерживания неизвестного соединения и известного соотношения между временем удерживания и индексом удерживания, и использование индекса удерживания, оцененного для неизвестного соединения, для предварительного выбора подгруппы библиотечных соединений из библиотеки стандартов для последующей идентификации соответствия.
Кроме того, описанную технологию применяют в системе идентификации неизвестного соединения с использованием ГХ-МС, причем система включает прибор ГХ-МС, базу данных стандартных соединений и процессор, выполненный с возможностью осуществления воплощения одного из описанных выше способов. В некоторых воплощениях прибор ГХ-МС удален от базы данных стандартных соединений. В некоторых воплощениях процессор выполнен с возможностью обеспечения библиотеки стандартных соединений на основании индекса удерживания, а в некоторых воплощениях процессор выполнен с возможностью выбора подбиблиотеки из базы данных стандартных соединений. В некоторых воплощениях обеспечено разделение базы данных стандартных соединений на две или более подбиблиотеки.
Дополнительные воплощения будут более понятны специалистам на основе идей, содержащихся в данном документе. Например, необходимо понимать, что описанные в данном документе способы не ограничены использованием анализа ГХ-МС. В широком многообразии хроматографических или других аналитических технологий можно использовать один или более аспектов описанной в данном документе технологии.
Краткое описание чертежей
Эти и другие признаки, аспекты и преимущества настоящей технологии станут лучше понятны в связи со следующими чертежами.
Фиг. 1 представляет собой график ИУК из библиотеки NIST (НИСТ, Национальный институт стандартов и технологии) в зависимости от ОИУК для 26 соединений, определенный с использованием первого прибора ГХ-МС.
Фиг. 2 представляет собой график ИУК из библиотеки NIST в зависимости от ОИУК для 26 соединений, определенный с использованием второго прибора ГХ-МС.
Фиг. 3 представляет собой график сравнения двух ОИУК для 26 соединений, определенный с использованием двух приборов, упомянутых на Фиг. 1 и 2.
Подробное описание изобретения Представленная в данном документе технология относится к идентификации неизвестных соединений и, в частности, но не исключительно, к способам и системам идентификации неизвестных соединений посредством газовой хроматографии и масс-спектрометрии с использованием вычисленного ИУК на основе измеренного времени удерживания в качестве основного параметра предварительного отбора для выбора соответствующего перечня спектров кандидатов для установления соответствия с традиционной справочной библиотекой стандартов МС. Оцененный ИУК используют в качестве одного критерия при определении конечного соответствия помимо масс-спектральных характеристик (или других свойств, если не используют масс-спектроскопию). Прогнозирование ИУК или времени удерживания библиотечных соединений приводит к более высокому качеству начальных списков поиска и более достоверной идентификации. Это устраняет потребность в выполнении анализа с дополнительными стандартами или в проведении экспериментов после анализа для обеспечения или подтверждения идентификации по ВУ. Кроме того, использование прогнозируемого ИУК улучшает качество идентификации.
Определения
По всему тексту описания и формулы изобретения следующие термины имеют значения, явным образом связанные с представленными ниже, если в контексте явно не указано противоположное. Используемое в данном документе выражение «в одном воплощении» не обязательно относится к одному и тому же воплощению, хотя это и возможно. Кроме того, используемое в данном документе выражение «в другом воплощении» не обязательно относится к другому воплощению, хотя это и возможно. Таким образом, как описано ниже, различные воплощения изобретения можно легко объединять, не выходя за область защиты или не отклоняясь от идеи изобретения.
Кроме того, используемый в данном документе союз «или» является инклюзивным оператором «или» и эквивалентен термину «и/или», если в контексте явно не указано противоположное. Термин «на основе» не является эксклюзивным и позволяет основываться на дополнительных неописанных факторах, если в контексте явно не указано противоположное. Кроме того, по всему тексту описания формы единственного числа включают формы множественного числа. Значение предлога «в» включает «в» и «на».
Используемый в данном документе термин «индекс удерживания Ковача» (ИУК) относится к особому прогнозирующему параметру времени удерживания химического соединения в газовой хроматографии. ИУК применяют при идентификации неизвестных соединений в газовой хроматографии. ИУК соединения связан с его временем удерживания (интервалом времени, которое оно проводит в колонне) и является характерным для условий анализа образца, например, типа колонны, жидкой фазы, расхода, температурной программы и т.п.
Используемый в данном документе термин «химическое соединение» или «соединение» означает чистое химическое вещество, состоящее из одного или более различных химических элементов, которое можно разделить на более простые вещества посредством химических реакций. Химические соединения обладают уникальной и определенной химической структурой и состоят из фиксированного соотношения атомов, которые удерживаются вместе в определенном пространственном расположении химическими связями. Химические соединения могут быть молекулярными соединениями («молекулой»), удерживаемыми вместе ковалентными связями, солями, удерживаемыми вместе ионными связями, интерметаллическими соединениями, удерживаемыми вместе металлическими связями, или комплексами, удерживаемыми вместе координационными ковалентными связями. Используемый в данном документе термин «чистые химические элементы» означает химические соединения, даже если они состоят из молекул, которые содержат только несколько атомов одного элемента (например, H2, S8 и т.п.).
Воплощения технологии
Хотя данное описание относится к определенным проиллюстрированным воплощениям, необходимо понимать, что эти воплощения представлены в качестве примера и не являются ограничивающими.
Газовая хроматография - масс-спектрометрия (ГХ-МС) является способом, который объединяет возможности газожидкостной хроматографии и масс-спектрометрии для идентификации различных веществ в исследуемом образце. В этой технологии используют газовый хроматограф (ГХ) для разделения различных соединений. Этот поток разделенных соединений подают непосредственно в ионный источник масс-спектрометра, например, на металлическую нить, к которой приложено напряжение. Эта нить излучает электроны, которые ионизируют соединения. Ионы затем могут дополнительно распадаться на фрагменты с образованием предсказуемых структур. Неповрежденные ионы и фрагменты проходят в анализатор масс-спектрометра, где их в итоге детектируют. Применения ГХ-МС включают обнаружение наркотиков, пожарно-техническую экспертизу, экологический анализ, исследование взрывчатых веществ и идентификацию неизвестных образцов. ГХ-МС также можно использовать в службе безопасности аэропортов для обнаружения веществ в багаже или на человеческом теле или в военной обстановке для обнаружения, например, химических и/или биологических боевых отравляющих веществ, взрывчатых веществ, компонентов ракетного топлива и других представляющих интерес химических соединений. Помимо этого, можно идентифицировать следы элементов в материалах, которые ранее считали разложившимися так, что их нельзя идентифицировать.
Газовую хроматографию (ГХ) используют для разделения и анализа соединений, которые можно испарить без разложения. Обычные применения ГХ включают исследование чистоты конкретного вещества или разделение отдельных компонентов смеси (также можно определить относительные количества таких компонентов). В некоторых ситуациях ГХ может помочь при идентификации соединения. В препаративной хроматографии ГХ можно использовать для приготовления чистых соединений из смеси.
В газовой хроматографии подвижной фазой является газ-носитель, обычно инертный газ, такой как гелий, или нереакционноспособный газ, такой как азот. Неподвижная фаза представляет собой микроскопический слой жидкости или полимера на инертном твердом носителе внутри стеклянной или металлической трубки, называемой колонной. Прибор, используемый для выполнения газовой хроматографии, называют газовым хроматографом. Анализируемые газообразные соединения взаимодействуют со стенками колонны, которая покрыта различными неподвижными фазами. Это приводит к тому, что каждое соединение элюируется за другое время, известное как время удерживания соединения. Именно сравнение времен удерживания придает ГХ ее аналитическую полезность. Разделение соединений в колонне обеспечивает возможность приготовительных и последующих аналитических применений.
Масс-спектрометрия (МС) является аналитической технологией, в которой измеряют отношение массы к заряду заряженных частиц. Ее используют для определения масс частиц, для определения элементного состава образца или молекулы и для выяснения химических структур молекул, таких как пептиды и другие химические соединения. Принцип МС состоит в ионизации химических соединений для образования заряженных молекул или фрагментов молекул и измерении их отношений массы к заряду. Ионизированные фрагменты разделяют согласно их отношению массы к заряду в анализаторе с помощью электромагнитных полей, и детектируют ионы, обычно количественным способом, чтобы получить масс-спектр.
Так как точную структуру молекулы расшифровывают через набор масс фрагментов, интерпретация масс-спектров требует объединенного использования различных технологий. Обычно первая стратегия идентификации неизвестного соединения состоит в сравнении его экспериментального масс-спектра с библиотекой масс-спектров. Если поиск не дает результатов, тогда выполняют ручную интерпретацию масс-спектров или интерпретацию масс-спектров с помощью программного обеспечения. Компьютерное моделирование процессов ионизации и фрагментации, происходящих в масс-спектрометрии, является основным средством задания структуры молекулы. Предположительную структуру фрагментируют в компьютерном моделировании, и получающуюся схему сравнивают с наблюдаемым спектром. Такое моделирование часто поддерживают с помощью библиотеки фрагментации, которая содержит опубликованные схемы для известных реакций разложения. Использующее преимущество этой идеи программное обеспечение было разработано как для небольших молекул, так и для белков.
Представленная в данном документе технология относится к идентификации неизвестного соединения на основе сравнения данных ГХ-МС с базой данных стандартных соединений. В частности, данная технология включает:
1) вычисление прогнозируемого ИУК соединений из библиотеки стандартов на основе атомной структуры каждого соединения,
2) вычисление ИУК неизвестного соединения с использованием i) данных ГХ-МС по ВУ для неизвестного соединения и ii) известного соотношения между ВУ и ИУК для преобразования измеренного ВУ в прогнозируемый ИУК, и
3) использование вычисленного ИУК неизвестного соединения для предварительного выбора подгруппы библиотечных соединений для последующей точной идентификации соответствия.
Примерные аспекты этой технологии дополнительно описаны ниже.
1. Определение ИУК соединений в базах данных стандартов Индекс удерживания Ковача (ИУК) является прогнозирующим фактором времени удерживания химического вещества в газовой хроматографии. ИУК использовали в качестве вспомогательного средства при идентификации неизвестных соединений в газовой хроматографии в течение десятилетий. ИУК соединения связан с его временем удерживания (интервалом времени, которое оно проводит в колонне) и является характерным для условий анализа образца, например, типа колонны, жидкой фазы, расхода, температурной программы и т.п. ИУК не использовали для широкой идентификации неизвестных соединений.
Как показано в данном документе, ИУК является полезным при идентификации неизвестных соединений с помощью ГХ-МС. В заданном интервале удерживания в базе данных можно произвести выборку на основе ИУК. Одно из преимуществ использования такого фильтра состоит в устранении соединений с похожими масс-спектрами, которые элюируются при других временах, таким образом уменьшают количество потенциальных кандидатов, которые могут совпадать с неизвестным соединением. Однако ИУК не был измерен для всех соединений, входящих в базы данных, обычно используемые для идентификации неизвестных соединений. Таким образом, в данном документе представлены способы оценки ИУК на основании структуры соединения.
Вообще, используют алгоритм для прогнозирования ИУК соединений в библиотеке стандартов масс-спектров на основе химической формулы и структуры. Прогнозируемый ИУК затем используют для оценки времени удерживания для библиотечного соединения для конкретного набора условий, типа колонны, жидкой фазы и температурной программы. Полная идентификация неизвестного соединения с помощью ГХ-МС исторически основана только на масс-спектре. Возможность оценки времени удерживания соединения на основе структуры и формулы обеспечивает возможность включения времени удерживания в качестве основного элемента в критерии поиска неизвестного соединения, сильно улучшая качество идентификации. Данный алгоритм включают в программу поиска масс-спектров с использованием оцененного времени удерживания в качестве параметра предварительного отбора для выбора соответствующего перечня спектров кандидатов для соответствия с библиотекой эталонов. Оцененное время удерживания используют в качестве одного критерия для определения конечного соответствия, помимо масс-спектральных характеристик.
В частности, при оценке ИУК используют молекулярную структуру, которая является информацией, предоставленной базами данных стандартов, например, предоставленной Национальным институтом стандартов и технологии (НИСТ, NIST). Структуру молекулы разделяют на ее атомные компоненты и типы связей. Каждый отдельный атом представляют в виде отдельной переменной, кодируют с использованием атомных чисел, типов связей и в зависимости от того, находится ли он в кольце или нет. Используя обучающий набор похожих соединений с известными ИУК, вычисляют вклад каждого типа атомов в ИУК с использованием метода наименьших квадратов. Эти значения используют в качестве коэффициентов, которые применяют к новым молекулам с теми же видами атомов. Помимо прогнозируемого ИУК определяют оценку точности посредством перекрестной проверки обучающего набора. Как ИУК, так и точность являются значимыми при отборе библиотечных соединений.
Чтобы продемонстрировать этот способ, в качестве примера используют следующее химическое вещество.
Наименование: 4-пентен-1-ол
Не учитывая атомы водорода, присутствуют 6 атомов - 5 атомов углерода и 1 атом кислорода. Каждый атом регистрируют, используя описанную выше схему кодирования.
Первое значение атома (1) идентифицирует его как атом углерода (атомный номер 6) и то, что он не находится в кольце (за 6 следует 0). Следующее значение означает, что он связан с другим атомом углерода (снова используют 6), и что связь является двойной связью (за 6 следует 2). Отметим, что при использовании этой схемы отсутствует различие между атомами (3) и (4). Поэтому имеются только 5 однозначно определяемых атомов, каждый с коэффициентом, который необходимо вычислить.
При использовании пяти однозначно определяемых переменных следующий шаг состоит в нахождении элементов библиотеки с известными ИУК, которые содержат эти атомы и только эти атомы. Из 15005 элементов библиотеки соединений, имеющих известный ИУК, существуют 7 элементов, которые удовлетворяют этим критериям.
1. 3-бутен-1-ол
2. 11,13-тетрадекадиен-1-ол
3. 9,11-додекадиен-1-ол
4. 5-гексен-1-ол
5. 10-ундецен-1-ол
6. 9-децен-1-ол
7. 11-додеценол
Используя эти соединения, создают матрицу. В частности, этот перечень соединений дает матрицу 7×5, в которой каждая строка представляет собой один из 7 элементов библиотеки, а каждый столбец представляет собой один из 5 типов однозначно определяемых атомов. Элементами матрицы являются числа каждого типа атомов, которые содержит каждое соединение. Таким образом, для испытываемого образца, 4-пентен-1-ола, строка матрицы выглядит следующим образом: [1 1 2 1 1]. Используя 7 известных образцов, вычисляют коэффициенты для каждой переменной, используя оптимизацию по методу наименьших квадратов. Тогда прогнозируемый ИУК представляет собой линейную комбинацию:
ИУК=1×b+1×b2+2×b3+1×b4+1×b5
где b1, b2, b3, b4 и b5 являются вычисленными выше коэффициентами для каждого типа однозначно определяемых атомов.
Точность вычисляют, используя подход с перекрестной проверкой с исключением по одному. Например, первый 3-бутен-1-ол удаляют из обучающего набора и оценивают коэффициенты, используя оставшиеся 6 элементов библиотеки. Прогноз для 3-бутен-1-ола вычисляют, используя данные коэффициенты, и сравнивают с известным значением. Этот процесс повторяют путем удаления соединения и последующего вычисления прогнозируемого значения для каждого из 7 элементов библиотеки. Точность вычисляют как среднеквадратичную ошибку перекрестной проверки.
В некоторых воплощениях ИУК вычисляют для всех соединений, собранных в библиотеке известных стандартных соединений (например, базе данных стандартов, предоставленной НИСТ). Вычисленную точность прогнозируемых ИУК, которая связана с предполагаемой ошибкой идентификации соответствия для неизвестного соединения, используют для сортировки данных и разделения библиотеки на подбиблиотеки. Точность для подбиблиотеки также используют для определения ширины интервала (например, диапазона значений ИУК для поиска, который, в некоторых воплощениях, сосредоточен на прогнозируемом ИУК (например, прогнозируемом на основании времени удерживания) для неизвестного соединения), используемой для определения соответствия неизвестного соединения с подбиблиотекой путем сравнения прогнозируемого ИУК неизвестного соединения с диапазоном (в пределах интервала) вычисленных ИУК (например, как спрогнозировано или оценено из их известных химических структур) для базы данных стандартов. Например, больший интервал используют, когда предполагаемая ошибка при идентификации соответствия больше, а меньший интервал используют, когда предполагаемая ошибка при идентификации соответствия меньше. Кроме того, в некоторых воплощениях библиотеку или подбиблиотеку предварительно сортируют по значениям ИУК, чтобы создать индексированную таблицу поиска на основе отсортированного ИУК. Таблицу поиска (например, индекс) используют для идентификации подбиблиотеки или для выбора диапазона данных внутри подбиблиотеки или библиотеки для использования в идентификации соответствия данных ГХ-МС.
В некоторых воплощениях алгоритмы явно показаны в программном обеспечении. В некоторых воплощениях программное обеспечение связано с устройством. В одном аспекте устройство является устройством, содержащим ГХ-МС. Некоторые воплощения представленной в данном документе технологии дополнительно включают функциональные возможности для сбора, хранения и/или анализа данных. Например, в некоторых воплощениях устройство содержит процессор, память и/или базу данных для, например, хранения и обработки инструкций, анализа данных, выполнения вычислений с использованием этих данных, преобразования данных и хранения данных. В некоторых воплощениях устройство хранит базу данных стандартных образцов, а в некоторых воплощениях базу данных стандартных образцов хранят удаленным образом (например, на удаленном компьютере, на удаленном сервере). В некоторых воплощениях устройство выполнено с возможностью вычисления функции данных. В некоторых воплощениях устройство включает программное обеспечение, выполненное с возможностью передачи отчетов о медицинских или клинических результатах, а в некоторых воплощениях устройство включает программное обеспечение для поддержки отчетов о неклинических результатах.
Многие молекулярные испытания включают определение присутствия или отсутствия или измерение количества или концентраций множества анализируемых веществ, и из уравнения, содержащего переменные, представляющие свойства множества анализируемых веществ, получают значение, которое находит применение в осуществлении диагностики или оценке присутствия или характеристик анализируемого вещества. По существу, в некоторых воплощениях считывающее устройство вычисляет это значение и, в некоторых воплощениях, предоставляет значение пользователю устройства, использует значение для получения указателя, связанного с результатом (например, светодиода, иконки на ЖК мониторе, звука и т.п.), сохраняет значение, передает значение или использует значение для дополнительных вычислений.
Кроме того, в некоторых воплощениях процессор выполнен с возможностью регулирования устройства. В некоторых воплощениях процессор используют для начала и/или окончания измерения и сбора данных. В некоторых воплощениях устройство содержит интерфейс пользователя (например, клавиатуру, клавиши, циферблаты, выключатели и т.п.) для приема данных, введенных пользователем, которые процессор использует для управления измерением. В некоторых воплощениях устройство дополнительно содержит выход для передачи данных (например, с помощью проводного или беспроводного соединения) во внешний пункт назначения, например, компьютер, дисплей, сеть и/или внешний накопитель. Например, в некоторых воплощениях система, связанная с устройствами ПК через локальную сеть Ethernet и внутренний радиомодем (например, ХВее ZB Pro, который обеспечивает операционную совместимость с устройствами ZigBee других производителей), включена для содействия легкой загрузке данных. Некоторые аспекты технологии обеспечивают кодирование передачи данных для защиты уязвимых данных в течение передачи. В некоторых воплощениях обеспечивают небольшое, портативное, переносное устройство, содержащее эти детали и компоненты.
В некоторых воплощениях базу данных стандартов и вычисленные значения ИУК сохраняют удаленно от устройства ГХ-МС или места проведения испытания. Например, в некоторых воплощениях устройство используют для испытания вещества в полевых условиях, а данные стандартов сохраняют на операционной базе (например, штаб или командный пункт и т.п.). В некоторых воплощениях базу данных стандартов и вычисленные значения ИУК сохраняют связанно внутри функционального средства, связанного с ГХ-МС испытанием или устройством (например, на флэш-памяти, жестком диске и т.п.). Воплощения обеспечивают, что устройство в полевых условиях и компьютерное оборудование на базе находятся в соединении (например, проводном или беспроводном) друг с другом.
В некоторых воплощениях прогнозы ИУК адаптивно обновляют на основе добавления новых данных и новых обучающих наборов, связанных с новыми соединениями, фрагментами и атомами. В некоторых воплощениях значения ИУК находят применение при объяснении пиков МС на основе известного химического взаимодействия ионов при МС (например, рациональное обоснование непредвиденных или необъяснимых пиков, объяснение примесей, определение массы молекулярного фрагмента при МС и т.п.). В некоторых воплощениях рабочие параметры МС изменяют на основе информации ИУК, полученной для неизвестного соединения и возможных кандидатов на соответствие ему.
2. Вычисление прогнозируемого ИУК неизвестного соединения Соответственно, один аспект представленной в данном документе технологии относится к обратной свертке полностью известных и неизвестных масс-спектров и предварительному отбору кандидатов на соответствие спектру из справочной библиотеки стандартов на основании индекса удерживания (например, ИУК). В одном аспекте реализуют алгоритм в программном обеспечении для идентификации ГХ-МС пика и обратной свертки масс-спектров известного и неизвестного соединения. С помощью этого алгоритма получают точные времена удерживания и группируют массы согласно временам удерживания. В нем также используют алгоритм спектрального анализа для удаления фонового шума и электронного шума из данных ГХ-МС. Это сильно уменьшает проблему ложных результатов в программах идентификации соединения. К тому же, использование ГХ высокого разрешения обеспечивает возможность точного вычисления индексов удерживания неизвестных соединений, которые были восстановлены из свертки. Сравнивая высокоточные индексы удерживания неизвестных соединений с индексами удерживания соединений из справочной библиотеки (например, из базы данных НИСТ), можно с высокой степенью точности прогнозировать возможные соответствия соединений. Индексы удерживания, вычисленные из времени удерживания (ВУ) соединения, используют в качестве основных критериев предварительного отбора для идентификации неизвестного соединения. Это обеспечивает высококачественный список для обработки и последующей идентификации.
При использовании стандартных квадрупольных спектров из справочной библиотеки для идентификации придерживаются ряда правил. Существующие спектральные базы данных ГХ-МС (например, предоставленные НИСТ и AMDIS) используют для идентификации неизвестного соединения с помощью масс-спектрометрии. Данные в этих базах данных были собраны из образцов, проанализированных на квадрупольном масс-спектрометре. Однако масс-спектры ионной ловушки могут слегка или значительно отличаться от спектров, полученных на квадрупольном масс-спектрометре. Таким образом, когда спектры ионной ловушки исследуют в сравнении с библиотеками масс-спектров (например, НИСТ, AMDIS и т.п.), которые преимущественно являются квадрупольными спектрами, результаты часто являются некорректными, например, получают неправильный (например, более низкий) показатель вероятности или соединение не удается идентифицировать. Эта проблема приводит к более низкой степени достоверности идентификации или к невозможности правильной идентификации соединения.
По существу, предложены улучшенные технологии поиска для использования существующих справочных библиотек ГХ-МС с ионной ловушкой и других технологий масс-спектрометрии. В частности, первичный поиск основан на сравнениях ИУК. В некоторых аспектах технология относится к использованию стандарта подтверждения достоверности характеристики, который используют для определения ИУК выбранных соединений на основе ГХ-МС. Используя эти данные, ось абсцисс традиционного газового хроматографа преобразуют в индексы ИУК. Соединения из стандарта подтверждения достоверности характеристики используют в качестве внутренних стандартов для преобразования ВУ неизвестных соединений в единицы ИУК. Интервал единиц ИУК определяют на основании вычисленного ИУК и эталонной базы данных, а кандидаты выбирают из соединений, находящихся внутри этого интервала. Программное обеспечение затем ищет фрагменты с одинаковой массой в пределах выбранных спектров, присваивая каждому вероятностный фактор. Преобразование МС выполняют на каждом из выбранных спектров на основе классификации функциональных групп и того, как каждая функциональная группа ведет себя в МС. Данные функциональных групп собирают для соединений из каждой из следующих функциональных групп, чтобы определить характеристики преобразования МС каждой группы: альдегид, гидроксил, алкан, кетон, амин, хлорсодержащее соединение, бромсодержащее соединение, ароматическое соединение, фосфорсодержащее соединение, азотсодержащее соединение, серосодержащее соединение, простой эфир и сложный эфир.
Факторы, которые учитывают в поиске, включают, но не ограничиваются перечисленным:
- основной спектральный пик МС в зависимости от библиотеки
- молекулярный ионный пик в зависимости от библиотеки
- присутствие М+1
- присутствие димера и димера+1
- схема фрагментации МС в зависимости от библиотеки
- сдвиг массы
- спектры переднего фронта
В некоторых воплощениях вычисленный ИУК и информацию о неизвестном соединении (например, химическое семейство, относительная чистота, источник, применение (например, обнаружение химического оружия) и т.п.) используют для модификации способа определения пиков МС. То есть, для некоторых значений ИУК некоторые пики МС приведены с большим или меньшим весом в обратной свертке МС, и включено соответствие на основе известных теоретических или эмпирических данных по соответствию МС.
3. Использование значений ОИУК в качестве предварительного отбора в библиотеке
В некоторых воплощениях ИУК, определенный из ВУ, ошибку вычисления ИУК, сложность неизвестного соединения, родство неизвестного соединения с известными соединениями и другие факторы используют для выбора используемой подбиблиотеки.
Использование значений ОИУК продемонстрировано следующим примером, в котором при поиске в стандартной библиотеке неизвестных соединений (например, в базе данных масс-спектров Национального института стандартов) для неизвестного соединения получают множество совпадений, основанных только на масс-спектре. Например, при исследовании неизвестного соединения получили три основных совпадения:
На основании минимальных различий в результатах поиска, указывающих на то, что спектры похожи, невозможно подтвердить, которое из этих соединений представляет собой правильную идентификацию испытываемого неизвестного вещества. Достоверная идентификация требует получения стандартов для основных совпавших соединений и запуска системы с использованием точно таких же условий, как и для неизвестного образца, чтобы определить действительные времена удерживания для подтверждения. Используя приведенный выше алгоритм, значения ОИУК для трех основных совпавших соединений оценили следующим образом:
Измеренное время удерживания неизвестного соединения составляло 74,94. При использовании как результатов соответствия масс-спектров, так и ОИУК, получают объединенную вероятность результатов поиска:
Это обеспечивает дополнительную уверенность в идентификации.
В некоторых воплощениях соответствия ГХ-МС сообщают пользователю. В некоторых воплощениях предоставленные данные содержат полные спектры МС. Чтобы максимизировать эффективность передачи и хранения данных, в некоторых воплощениях сообщают или передают только таблицу пиков МС. В некоторых воплощениях сообщают вероятности для каждого кандидата на соответствие. В некоторых воплощениях кандидатов на соответствие сортируют по некоторому параметру (например, уровню достоверности), а в некоторых воплощениях обеспечивают предупреждение пользователя о возможной ошибке на основании возвращенных соответствий (например, химическое или биологическое оружие, ядовитое для окружающей среды вещество и т.п.).
Примеры
Пример 1
При разработке воплощений настоящей технологии выполняли эксперименты, чтобы оценить технические возможности использования первичного поиска, основанного на ИУК, для улучшения качества совпадений при поиске в базе данных НИСТ с помощью ГХ-МС спектров.
Способы
Сконструировали паровой калибратор, который производит постоянную концентрацию для 2-4 соединений. Два соединения из смеси парового калибратора отбирали в качестве стандартов ИУК, один элюируется в первую минуту хроматограммы, второй - приблизительно за 1,5 минуты. Определяли наклон линии регрессии и отрезок, отсекаемый ею на координатной оси, для этих двух соединений и использовали для вычисления оцененного ИУК (ОИУК) согласно следующей формуле:
неизвестный ОИУК=УВ (в секундах )× наклон + смещение.
Двадцать пять химических веществ из девяти различных функциональных групп затем исследовали на дублированных ГХ-МС приборах (Guardion 7 GC-MS, TORION Technologies). Вычисляли ОИУК и сравнивали с ИУК из библиотеки НИСТ, чтобы оценить соответствие оцененного значения со значением в базе данных НИСТ. Также сравнивали вычисленный ОИУК для двух дублированных ГХ-МС систем.
Результаты
Для неполярных соединений получили ОИУК, который отличался от НИСТ не более чем на 40 единиц ИУК. Все ОИУК полярных соединений были выше, чем ИУК из библиотеки НИСТ. Для полярных соединений ОИУК отличался менее чем на 100 единиц ИУК для всех соединений, за исключением формальдегида. ОИУК, вычисленный на дублированных приборах, показал превосходное соответствие. Эти результаты показывают, что система на основе ОИУК подходит для предварительного отбора соединений из библиотеки НИСТ в качестве кандидатов на соответствие и в качестве фактора при определении качества соответствия.
Все публикации и патенты, упомянутые в приведенном выше описании, включены в данный документ путем ссылки во всей их полноте для всех целей. Различные модификации и изменения описанных композиций, способов и применений технологии понятны специалисту в данной области без отклонения от объема защиты и идеи описанной технологии. Хотя данная технология была описана в связи с конкретными примерами воплощений, необходимо понимать, что заявленное изобретение не должно быть чрезмерно ограничено такими конкретными воплощениями. Несомненно, подразумевается, что различные модификации описанных режимов осуществления изобретения, которые очевидны специалисту в фармакологии, биохимии, медицине или связанных областях, включены в объем защиты следующей формулы изобретения.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ИДЕНТИФИКАЦИИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ НА ОСНОВЕ МЕТОДА ВЫСОКОЭФФЕКТИВНОЙ ЖИДКОСТНОЙ ХРОМАТОГРАФИИ И МАСС-СПЕКТРОМЕТРИИ | 2011 |
|
RU2469314C2 |
СПОСОБ ВЫЯВЛЕНИЯ НЕИЗВЕСТНЫХ ВЕЩЕСТВ В БИОЛОГИЧЕСКИХ ЖИДКОСТЯХ ПАЦИЕНТОВ, ПРИНИМАВШИХ НАРКОТИЧЕСКИЕ ИЛИ ПСИХОАКТИВНЫЕ ВЕЩЕСТВА | 2009 |
|
RU2419788C2 |
СПОСОБ ВЫЯВЛЕНИЯ И ОПРЕДЕЛЕНИЯ ПРОИСХОЖДЕНИЯ НЕИЗВЕСТНЫХ ВЕЩЕСТВ В СПИРТНЫХ НАПИТКАХ | 2009 |
|
RU2392616C1 |
СПОСОБ ИДЕНТИФИКАЦИИ НАРКОТИЧЕСКИХ И ПСИХОАКТИВНЫХ ВЕЩЕСТВ В БИОЛОГИЧЕСКИХ ЖИДКОСТЯХ | 2009 |
|
RU2390771C1 |
Способ удаленной идентификации и распознавания объектов сложного состава | 2021 |
|
RU2757649C1 |
СПОСОБ ИДЕНТИФИКАЦИИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ МЕТОДОМ ХРОМАТО-МАСС-СПЕКТРОМЕТРИИ | 2015 |
|
RU2599900C2 |
Способ определения массовых концентраций хлорорганических соединений в химических реагентах, применяемых в процессе добычи, подготовки и транспортировки нефти | 2022 |
|
RU2792016C1 |
СПОСОБ КАЛИБРОВКИ СИСТЕМЫ ГАЗОВОЙ ХРОМАТОГРАФИИ - МАСС СПЕКТРОМЕТРИИ (ГХ-МС), ОСНАЩЕННОЙ СПЕЦИАЛЬНЫМ ПО, ДЛЯ ОПРЕДЕЛЕНИЯ МАРКЕРОВ МИКРООРГАНИЗМОВ В ИССЛЕДУЕМОЙ ПРОБЕ МАТЕРИАЛА БИОЛОГИЧЕСКОГО ПРОИСХОЖДЕНИЯ | 2012 |
|
RU2501011C2 |
Аппарат для испытаний двигателей (варианты) | 2016 |
|
RU2713811C2 |
СПОСОБ ИДЕНТИФИКАЦИИ СПИРТА ЭТИЛОВОГО И ЭТАНОЛСОДЕРЖАЩИХ ЖИДКОСТЕЙ | 2007 |
|
RU2348032C2 |
Изобретение относится к идентификации неизвестных соединений и, в частности, но не исключительно, к способам и системам идентификации неизвестных соединений методом газовой хроматографии - масс-спектрометрии с использованием индекса удерживания в качестве второго параметра для идентификации. Компьютерный способ создания базы данных стандартных соединений с ассоциированными индексами удерживания для идентификации неизвестного соединения с использованием газовой хроматографии - масс-спектрометрии, ГХ-МС, включает оценку прогнозируемого индекса удерживания стандартного соединения из библиотеки масс-спектрометрических стандартов ГХ-МС на основе атомной структуры стандартного соединения. Также компьютерный способ включает присваивание прогнозируемого индекса удерживания стандартному соединению для создания записи в базе данных, идентифицирующей стандартное соединение и прогнозируемый индекс удерживания. Техническим результатом является повышение надежности и эффективности идентификация неизвестных соединений. 5 н. и 10 з.п. ф-лы, 3 ил.
1. Компьютерный способ создания базы данных стандартных соединений с ассоциированными индексами удерживания для идентификации неизвестного соединения с использованием газовой хроматографии - масс-спектрометрии, ГХ-МС, включающий:
а) оценку прогнозируемого индекса удерживания стандартного соединения из библиотеки масс-спектрометрических стандартов ГХ-МС на основе атомной структуры стандартного соединения, и
б) присваивание прогнозируемого индекса удерживания стандартному соединению для создания записи в базе данных, идентифицирующей стандартное соединение и прогнозируемый индекс удерживания.
2. Способ по п. 1, где стадия оценки включает:
i) определение типа атома и типа связи для каждого атома стандартного соединения,
ii) выбор сравнительного соединения из базы данных, при этом сравнительное соединение имеет известный индекс удерживания и состоит из атомов таких же типов и связей таких же типов, как и стандартное соединение,
iii) присваивание коэффициента каждому атому сравнительного соединения, при этом данный коэффициент характеризует вклад атома в известный индекс удерживания сравнительного соединения, и
iv) применение коэффициента для оценки индекса удерживания стандартного соединения.
3. Способ по п. 2, включающий выбор множества сравнительных соединений из базы данных, чтобы обеспечить обучающий набор, при этом каждое соединение из обучающего набора имеет известный индекс удерживания и состоит из атомов таких же типов и связей таких же типов, как и стандартное соединение.
4. Способ по п. 2, в котором присваивание коэффициента включает создание матрицы, например, в которой столбец матрицы соответствует типу атома, а строка матрицы соответствует соединению из базы данных, при этом соединение имеет известный индекс удерживания и состоит из атомов таких же типов и связей таких же типов, как и стандартное соединение.
5. Способ по п. 1, дополнительно включающий определение точности оцененного индекса удерживания, например, дополнительно включающий одну из следующих операций:
(а) сортировку базы данных с использованием точности оцененного индекса удерживания,
(б) разделение базы данных с использованием точности оцененного индекса удерживания,
(в) использование точности оцененного индекса удерживания для обеспечения интервала поиска.
6. Способ по п. 1, дополнительно включающий оценивание индекса удерживания неизвестного соединения, анализируемого с помощью ГХ-МС.
7. Способ по п. 6, в котором оценивание включает:
i) измерение времени удерживания неизвестного соединения,
ii) преобразование времени удерживания неизвестного соединения в индекс удерживания неизвестного соединения с использованием известного соотношения между временем удерживания и индексом удерживания.
8. Способ по п. 6, дополнительно включающий использование индекса удерживания неизвестного соединения для предварительного выбора стандартных соединений из базы данных и установление соответствия неизвестного соединения со стандартным соединением.
9. Способ идентификации неизвестного соединения с использованием ГХ-МС, включающий:
а) создание базы данных способом по п. 1,
б) оценку индекса удерживания неизвестного соединения с использованием данных ГХ-МС по времени удерживания неизвестного соединения и известного соотношения между временем удерживания и индексом удерживания,
в) использование индекса удерживания, оцененного для неизвестного соединения, и индексов удерживания из записей в базе данных для предварительного выбора подгруппы стандартных соединений из базы данных, и
г) установление соответствия неизвестного соединения с данной подгруппой для идентификации неизвестного соединения.
10. Система идентификации неизвестного соединения с использованием ГХ-МС, включающая:
а) устройство ГХ-МС,
б) базу данных стандартных соединений,
в) процессор, выполненный с возможностью осуществления способа по любому из пп. 1-9.
11. Система по п. 10, в которой устройство ГХ-МС удалено от базы данных стандартных соединений.
12. Система по п. 10, в которой процессор выполнен с возможностью выбора подбиблиотеки из базы данных стандартных соединений.
13. Система по п. 10, в которой база данных стандартных соединений разделена на две или более подбиблиотеки.
14. Устройство для создания базы данных стандартных соединений с ассоциированными индексами удерживания для идентификации неизвестного соединения с использованием газовой хроматографии - масс-спектрометрии, ГХ-МС, содержащее процессор и память, включающую программные команды, выполненные с возможностью программирования процессора для осуществления способа по любому из пп. 1-9.
15. База данных, созданная способом по любому из пп. 1-5 и выполненная с возможностью сообщения с системой ГХ-МС.
US 2003130799 A1 10.07.2003 | |||
WO2007012643 A1 01.02.2007 | |||
US2009179147 A1 16.07.2009 | |||
US5827946 A 27.10.1998 | |||
US2008175929 A1 24.07.2008. |
Авторы
Даты
2017-05-15—Публикация
2012-08-03—Подача