СИСТЕМА И СПОСОБ ЕДИНООБРАЗНОГО СОПОСТАВЛЕНИЯ НЕСТРУКТУРИРОВАННЫХ ЗАПИСАННЫХ ПРИЗНАКОВ СO СВЯЗАННЫМИ ТЕРАПЕВТИЧЕСКИМИ ПРИЗНАКАМИ Российский патент 2019 года по МПК G06F16/35 G06F16/23 

Описание патента на изобретение RU2701702C2

1. ОБЛАСТЬ ТЕХНИКИ

[01] Настоящее изобретение относится к системе и способу единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со структурированными записанными признаками в структурированной терапевтической информации. Единообразно сопоставленные записанные признаки полезны для вторичного использования в клинических и относящихся к обеспечению безопасности пациентов исследованиях.

2. УРОВЕНЬ ТЕХНИКИ

[02] Хорошо известно, что системы компьютеризированной записи врачебного предписания (computerized provider order entry, CPOE (системы CPOE)) внедряются в сферу национального здравоохранения. Системы CPOE предоставляют платформу для ускоренной выписки рецептов, уменьшения ошибок при лечении и создания больших электронных баз данных по лекарственным средствам для клинического исследования. Системы CPOE не гарантируют функциональную совместимость данных по лекарственным средствам. Информация, вводимая в системы CPOE, не является нормализованной.

РАСКРЫТИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

[03] Соответственно, согласно одному или более аспектам настоящего изобретения относятся к системе, выполненной с возможностью единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со связанными терапевтическими признаками в структурированной терапевтической информации. Система содержит один или более аппаратных компьютерных процессоров, выполненных с возможностью исполнения компьютерочитаемых команд для:

получения неструктурированных терапевтических записей, включающих в себя первую неструктурированную терапевтическую запись;

идентификации неструктурированных записанных признаков в отдельных неструктурированных терапевтических записях и

сопоставления идентифицированных неструктурированных записанных признаков в неструктурированных терапевтических записях с соответствующими связанными терапевтическими признаками,

причем такое сопоставление основано на контекстной информации, связанной с неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки, так, что, в ответ на идентификацию первого неструктурированного записанного признака в первой неструктурированной терапевтической записи, первый неструктурированный записанный признак оказывается сопоставленным с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с первой неструктурированной терапевтической записью,

причем контекстная информация, связанная с первой неструктурированной терапевтической записью, включает в себя одно или более из следующего: синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи.

[04] Согласно еще одному аспекту настоящее изобретение относится к способу единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со связанными терапевтическими признаками в структурированной терапевтической информации с помощью системы для сопоставления. Система содержит один или более аппаратных компьютерных процессоров. Способ содержит этапы, на которых:

получают, с помощью упомянутых одного или более аппаратных компьютерных процессоров, неструктурированные терапевтические записи, включающие в себя первую неструктурированную терапевтическую запись;

идентифицируют, с помощью упомянутых одного или более аппаратных компьютерных процессоров, неструктурированные записанные признаки в отдельных неструктурированных терапевтических записях и

сопоставляют, с помощью упомянутых одного или более аппаратных компьютерных процессоров, идентифицированные неструктурированные записанные признаки в неструктурированных терапевтических записях с соответствующими связанными терапевтическими признаками,

причем такое сопоставление основано на контекстной информации, связанной с неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки, так что, в ответ на идентификацию первого неструктурированного записанного признака в первой неструктурированной терапевтической записи, первый неструктурированный записанный признак сопоставляют с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с первой неструктурированной терапевтической записью,

причем контекстная информация, связанная с первой неструктурированной терапевтической записью, включает в себя одно или более из: синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи.

[05] Согласно еще одному аспекту настоящее изобретение относится к системе, выполненной с возможностью единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со связанными терапевтическими признаками в структурированной терапевтической информации. Система содержит:

средства для получения неструктурированных терапевтических записей, включающих в себя первую неструктурированную терапевтическую запись;

средства для идентификации неструктурированных записанных признаков в отдельных неструктурированных терапевтических записях и

средства для сопоставления идентифицированных неструктурированных записанных признаков в неструктурированных терапевтических записях с соответствующими связанными терапевтическими признаками,

причем такое сопоставление основано на контекстной информации, связанной с неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки, так что, в ответ на идентификацию первого неструктурированного записанного признака в первой неструктурированной терапевтической записи, первый неструктурированный записанный признак оказывается сопоставленным с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с первой неструктурированной терапевтической записью,

причем контекстная информация, связанная с первой неструктурированной терапевтической записью, включает в себя одно или более из следующего: синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи.

[06] Эти и другие задачи, признаки и характеристики настоящего изобретения, а также способы функционирования и функции связанных элементов структуры и сочетания частей и меры экономии при изготовлении, станут более очевидными после рассмотрения последующего описания и прилагаемой формулы изобретения со ссылкой на сопроводительные чертежи, все из которых образуют часть данной спецификации, в которых одинаковые ссылочные позиции обозначают соответствующие части на различных фигурах. Следует четко понимать, однако, что чертежи приведены только в иллюстративных и описательных целях и не предназначены для определения объема изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[07] На Фиг. 1 показана система, выполненная с возможностью единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со связанными терапевтическими признаками в структурированной терапевтической информации.

[08] На Фиг. 2 показано сопоставление неструктурированных записанных признаков с соответствующими связанными терапевтическими признаками.

[09] На Фиг. 3 показан один вариант осуществления прикладной системы уточнения.

[10] На Фиг. 4 показана подсистема машинного обучения и обработки естественного языка (natural language processing, NLP) для предварительной обработки базы данных по лекарственным средствам.

[11] На Фиг. 5 показан способ единообразного сопоставления неструктурированных записанных признаков со связанными терапевтическими признаками.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[12] Используемая в данном документе форма единственного числа включает в себя множественные упоминания, пока контекст явно не будет указывать иное. Используемое в данном документе утверждение, что две или более частей или компонентов «соединены», должно означать, что части связаны или функционируют совместно либо прямо, либо косвенно, то есть через одну или более промежуточных частей или компонентов, пока существует линия связи. Используемая в данном документе совокупность признаков «непосредственно соединены» означает, что два элемента находятся в непосредственном контакте друг с другом. Используемая в данном документе совокупность признаков «жестко соединены» или «зафиксированы» означает, что два компонента соединены так, что они перемещаются как один с поддержанием постоянной ориентации друг относительно друга.

[13] Используемое в данном документе слово «цельный» означает, что компонент создан в качестве одного элемента или блока. То есть компонент, который включает в себя элементы, которые созданы по отдельности и затем соединены вместе в качестве одного блока, не является «цельным» компонентом или телом. Используемое в данном документе утверждение, что две или более частей или компонентов «входят в зацепление» друг с другом, должно означать, что части прилагают силу друг против друга либо непосредственно, либо через одну или более промежуточных частей или компонентов. Используемый в данном документе термин «номер» должен означать один или целое число, большее одного (то есть множество).

[14] Направленные фразы, используемые в данном документе, такие как, например и без ограничения, верх, низ, лево, право, выше, ниже, перед, зад и производные от них, относятся к ориентации элементов, изображенных на чертежах, и не ограничивают формулу изобретения, пока в ней этого не будет указано явно.

[15] На Фиг. 1 схематично показана система 10, выполненная с возможностью единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со связанными терапевтическими признаками в структурированной терапевтической информации. Проблемы с системами компьютеризированной записи врачебного предписания (CPOE) и с функциональной совместимостью данных по лекарственным средствам постоянно присутствуют вследствие разнообразия в местных (создаваемых медицинским работником) предпочтениях для названий лекарственных средств и/или стандартных систем кодировки, что в результате приводит к ограниченной нормализации записей в базах данных по лекарственным средствам и потенциальным неточностям в результатах исследования, полученных из таких данных. Широко используемая стандартная терминология, такая как NDC (Национальный код лекарственных средств (National Drug Code)) Управления по контролю за продуктами питания и лекарственными средствами (Food and Drug Administration) может быть трудна в реализации и управлении, поскольку коды создаются отдельными поставщиками лекарственных средств, а не международной управляющей организацией. Терминологии первого банка данных с медицинскими сведениями (First Data Bank MedKnowledge), Национальной картотеки данных по лекарственным средствам (National Drug Data File, NDDF) и Перечня иерархических кодов ингредиентов (Hierarchical Ingredient Code List, HICL) предоставляют равноценные альтернативы для NDC. Однако вследствие ошибок при записи данных и использования неоднозначных сокращений для препаратов в области здравоохранения в базах данных по лекарственным средствам часто распространены несовпадения в названиях и кодах HICL или NDDF. Эти проблемы неблагоприятно влияют на вторичное использование баз данных по лекарственным средствам при относящемся к здравоохранению исследовании.

[16] Система 10 выполнена с возможностью идентификации и/или анализа неструктурированных терапевтических записанных признаков и сопоставления их с соответствующими связанными терапевтическими признаками в структурированной информации. Такая идентификация и/или анализ могут включать в себя текстовый анализ с обработкой естественного языка (natural language processing, NLP), машинное обучение и/или другие методики и/или модели. Модели машинного обучения (например, наивный байесовский классификатор и/или другие модели) обучаются на наборе предварительно идентифицированных и сопоставленных (со связанными терапевтическими признаками) неструктурированных записанных признаков и затем применяют изученные правила для классификации впоследствии идентифицируемых неструктурированных записанных признаков. При наличии ошибок и/или других противоречий в неструктурированных терапевтических записях (например, орфографические ошибки и/или несовместимые сокращения) производительность систем машинного обучения снижается. Система 10 может сочетать методики машинного обучения (например, наивный байесовский классификатор и/или другие) с подходами предварительной обработки и/или снятия омонимии (например, с основанным на NLP текстовым анализом) для сопоставления неструктурированных терапевтических записанных признаков с соответствующими связанными терапевтическими признаками (например, классифицировать неструктурированные терапевтические записанные признаки на основе кодов HICL или NDDF) с усовершенствованным единообразием и/или достоверностью. Облегчение классификации неструктурированных терапевтических записанных признаков с усовершенствованным единообразием совершенствует функциональную совместимость посредством нормализации неструктурированных терапевтических записанных признаков до больших структурированных связанных с терапией информационным базам данных. Облегчение классификации неструктурированных терапевтических записанных признаков с усовершенствованным единообразием делает данные более полезными для вторичного использования при клиническом и относящемся к обеспечению безопасности пациента исследовании. Например, система 10 может облегчать стандартизированное кодирование названий лекарственных средств в фармацевтических/клинических базах данных. В некоторых вариантах осуществления система 10 включает в себя одно или более из вычислительного устройства 21, источника 25 данных, процессора 20 и/или других компонентов.

[17] Вычислительное устройство 21 может быть выполнено так, что пользователь может осуществлять доступ к системе 10 через вычислительное устройство 21. Вычислительное устройство 21 может включать в себя одно или более из пользовательского интерфейса 24, электронного хранилища 22, процессора 20 и/или других компонентов. В некоторых вариантах осуществления вычислительное устройство 21 может быть выполнено с возможностью осуществления связи с одним или более внешними источниками 25 данных, процессором 20 и/или другими компонентами системы 10. Вычислительное устройство 21 может быть выполнено с возможностью осуществления связи с источниками 25 данных, процессором 20 и/или другими компонентами системы 10 согласно одноранговой архитектуре, архитектуре клиент-сервер и/или другим архитектурам. Посредством неограничивающего примера заданное вычислительное устройство 21 может включать в себя одно или более из настольного компьютера, портативного компьютера, карманного компьютера, планшетной вычислительной платформы, Нетбука (NetBook), смартфона и/или других вычислительных платформ. Вычислительное устройство 21 может включать в себя линии связи и/или порты для предоставления возможности обмена информации с сетью, другими вычислительными платформами (например, одним или более другими вычислительными устройствами 21) и/или другими устройствами. В некоторых вариантах осуществления связь между вычислительным устройством 21, процессором 20, источником 25 данных и/или другими компонентами системы 10 может быть беспроводной и/или проводной. Например, вычислительное устройство 21 может осуществлять связь с процессором 20 и/или источником 25 данных беспроводным образом через сеть Wi-Fi, через технологию Bluetooth® и/или другую беспроводную технологию. В некоторых вариантах осуществления вычислительное устройство 21 может осуществлять связь с пользовательским процессором 20 и/или источником 25 данных через проводное USB-соединение, например. В некоторых вариантах осуществления вычислительное устройство 21 может включать в себя процессор 20 и/или источник 25 данных.

[18] Пользовательский интерфейс 24 выполнен с возможностью предоставления интерфейса между системой 10 и оператором 12 и/или другими пользователями, через который оператор 12 и/или другие пользователи может предоставлять информацию в систему 10 и принимать информацию от нее. Это предоставляет возможность передачи данных, сигналов, результатов, неструктурированных терапевтических записей и/или команд и любых других передаваемых объектов, совместно называемых «информацией», между пользователем и одним или более источниками 25 данных, процессорами 20 и/или другими компонентами системы 10.

[19] Примеры интерфейсных устройств, подходящих для включения в пользовательский интерфейс 24, содержат клавишную панель, кнопки, переключатели, клавиатуру, рукоятки, рычаги, экран отображения, сенсорный экран, громкоговорители, микрофон, сигнальную лампочку, слышимый сигнал тревоги, принтер, осязательное устройство с обратной связью и/или другие интерфейсные устройства. В некоторых вариантах осуществления пользовательский интерфейс 24 содержит множество отдельных интерфейсов. В некоторых вариантах осуществления пользовательский интерфейс 24 содержит по меньшей мере один интерфейс, который выполнен неотъемлемым с источником 25 данных, процессором 20 и/или другими компонентами системы 10.

[20] Следует понимать, что другие методики связи, жесткопроводной или беспроводной, также предусмотрены настоящим изобретением в качестве пользовательского интерфейса 24. Например, настоящее изобретение предусматривает, что пользовательский интерфейс 24 может быть объединен с интерфейсом съемного хранилища, предоставляемым электронным хранилищем 22. В данном примере информация может быть загружена в систему 10 со съемного хранилища (например, смарт-карты, карты флэш-памяти, съемного диска и т.д.), что предоставляет возможность пользователю(ям) настраивать вариант реализации системы 10. Другие примерные методики и устройства ввода, приспособленные для использования с системой 10 в качестве пользовательских интерфейсов 24, содержат, но не ограничены этим, порт RS-232, линию связи RF, линию связи IR, модем (телефон, кабель или другое). Короче говоря, любая методика для обмена информацией с системой 10 предусмотрена настоящим изобретением в качестве пользовательского интерфейса 24.

[21] Пользовательский интерфейс 24 выполнен с возможностью содействия Компьютеризированной записи врачебного предписания (CPOE) и/или другой информационной записи и/или выбору. Это может включать в себя запись и/или выбор неструктурированной терапевтической информации (неструктурированных терапевтических записей, которые включают в себя терапевтические записанные признаки), через пользовательский интерфейс 24. В некоторых вариантах осуществления оператор (например, доктора, медсестры, пользователи и/или другие операторы) вводит неструктурированную терапевтическую информацию (например, текстовую терапевтическую запись для конкретного пациента, которая описывает лечение, предоставляемое для и/или предписанное пациенту, которое включает в себя названия лекарственных средств, количественные величины, расписание лечения, частоты и/или другие записанные признаки) с помощью пользовательского интерфейса 24 и/или других компонентов. Система 10 выполнена так, что данная информация хранится в источнике 25 данных и/или в других устройствах. Как описано выше, неструктурированные (например, текстовые) терапевтические записи могут включать в себя единицы измерения лекарственного средства, дозы, сокращения, информацию о лекарственном средстве/терапии и/или другую информацию и/или признаки. В некоторых вариантах осуществления неструктурированные терапевтические записи могут включать в себя орфографические ошибки, сокращения, сокращения, характерные для оператора, который вводит информацию, неоднозначные слова и/или другую информацию. В некоторых вариантах осуществления вычислительное устройство 21 может быть выполнено с возможностью содействия хранению таких неструктурированных терапевтических записей в электронном хранилище 22, содействия передачи неструктурированных терапевтических записей источнику 25 данных и/или осуществлению других действий с неструктурированными терапевтическими записями.

[22] Электронное хранилище 22 содержит электронный носитель хранения информации, который электронным образом хранит информацию. Электронный носитель хранения информации электронного хранилища 22 может содержать один или оба из системного хранилища, которое выполнено неотъемлемым (то есть по существу несъемным) с вычислительным устройством 21, и/или съемное хранилище, которое соединено с возможностью отсоединения с системой 10 через, например, порт (например, порт USB, порт шины FireWire и т.д.) или накопитель (например, накопитель на дисках и т.д.). Электронное хранилище 22 может содержать один или более из оптически считаемого носителя хранения информации (например, оптические диски и т.д.), магнитным образом считываемого носителя хранения информации (например, магнитная лента, магнитный накопитель на жестких дисках, накопитель на гибких дисках, и т.д.), основанного на электрическом заряде носителя хранения информации (например, EPROM, RAM и т.д.), твердотельного носителя хранения информации (например, карта флэш-памяти, и т.д.) и/или других электронным образом считываемых носителей хранения информации. Электронное хранилище 22 может хранить алгоритмы программного обеспечения, информацию, определенную процессором 20, информацию, принятую от пользователя через пользовательский интерфейс 24, и/или другую информацию, которая предоставляет возможность системе 10 функционировать должным образом. Электронное хранилище 22 может быть (полностью или частично) отдельным компонентом внутри системы 10, либо электронное хранилище 22 может быть выполнено (полностью или частично) как неотъемлемая часть с одним или более другими компонентами системы 10 (например, внутри вычислительного устройства 21).

[23] Источник 25 данных выполнен с возможностью электронного хранения терапевтических карточек, неструктурированных терапевтических записей, структурированной терапевтической информации (например, связанных терапевтических признаков, связок связанных терапевтических признаков (например, групп относящихся друг к другу связанных терапевтических признаков), предварительно определенных сопоставлений между неструктурированными терапевтическими записанными признаками и связанными терапевтическими признаками и/или другой информации. В некоторых вариантах осуществления источник 25 данных может включать в себя источник 42 неструктурированных данных, источник 44 структурированных данных и/или другие источники информации. В некоторых вариантах осуществления источник 25 данных может быть и/или включать в себя сервер 46 и/или другие компоненты.

[24] Источник 42 неструктурированных данных выполнен с возможностью хранения неструктурированной терапевтической информации. Неструктурированная терапевтическая информация включает в себя терапевтические карточки и/или другую информацию. Терапевтические карточки могут включать в себя неструктурированные терапевтические записи, контекстную информацию и/или другую информацию. Неструктурированные терапевтические записи получаются и/или принимаются из различных источников (например, различных вычислительных устройств 21). Неструктурированные терапевтические записи включают в себя неструктурированные терапевтические записанные признаки и/или другую информацию. Источник 42 неструктурированных данных выполнен с возможностью хранения неструктурированных терапевтических записей, принятых через вычислительное устройство 21 и/или другие источники неструктурированной терапевтической информации. Источник 42 неструктурированных данных выполнен с возможностью хранения контекстной информации, относящейся к терапии и/или характеризующей ее (например, медицинская терапия и/или другая терапия). Такая информация может быть введена и/или выбрана оператором. Такая информация может включать в себя одно или более из имени или имен оператора(ов), географического местоположения пациента и/или лечебного учреждения, названия и/или местоположения госпиталя, типа учреждения, названия должности оператора (например, доктор, медсестра, фармацевт и т.д.); слов, предложений, сокращений, синтаксиса, форматирования, и т.д., которые связывают различные названия лекарственных средств, количественные величины, частоты лечения и/или другую информацию в неструктурированной терапевтической записи; и/или другой информации. Неструктурированные терапевтические записи могут включать в себя неструктурированные терапевтические записанные признаки (например, имя оператора, название должности оператора, название/местоположение лечебного учреждения, название лекарственного средства, количественные величины, частоту лечения и т.д.) и/или другую информацию. Неструктурированные терапевтические записи могут включать в себя сокращения, неоднозначные слова, орфографические ошибки, несовместимые единицы измерения и/или другое отсутствие единообразия. Такое отсутствие единообразия может быть искажением, вызванным пользовательской записью, сложившейся практикой и/или значениями по умолчанию, непреднамеренным распространением избыточных ошибок внутри системы медицинской информации и/или может быть вызвано другими факторами.

[25] Источник 44 структурированных данных выполнен с возможностью хранения связанных терапевтических признаков, связок связанных терапевтических признаков, предварительно определенных сопоставлений неструктурированных записанных признаков со связанными терапевтическими признаками структурированной информации и/или другой информации. Связанные терапевтические признаки могут включать в себя названия лекарственных средств, ингредиенты лекарственных средств, количественные величины (например, дозу), идентификационные коды, коды последовательностей, химические составы, пути введения и/или другую терапевтическую информацию. Связки связанных терапевтических признаков могут включать в себя наборы связанных терапевтических признаков, классы связанных терапевтических признаков (например, внутри набора) и/или другие группы относящихся друг к другу связанных терапевтических признаков. В некоторых вариантах осуществления источник 44 структурированных данных может быть и/или включать в себя одну или более баз данных структурированной информации. В некоторых вариантах осуществления структурированная информация, хранящаяся в источнике 44 структурированных данных, может иметь иерархическую структуру и/или другие форматы. Например, источник 44 структурированных данных может включать в себя базу данных NDC, Первого банка данных медицинских сведений (NDDF), RxNorm, HICL и/или другие базы данных. Посредством неограничивающего примера, в базе данных, такой как база данных NDDF, связанные терапевтические признаки могут соответствовать названиям лекарственных средств, например. В данной базе данных (например) связки связанных терапевтических признаков могут включать в себя класс лекарственных средств, который включает в себя несколько названий лекарственных средств. Данный класс лекарственных средств может быть частью большего набора классов лекарственных средств одного и тот же типа (например, другая связка связанных терапевтических признаков).

[26] В некоторых вариантах осуществления источник 25 данных может быть и/или включать в себя один или более серверов 46. Серверы 46 могут быть выполнены с возможностью хранения неструктурированных терапевтических записей, неструктурированных терапевтических записанных признаков, связанных терапевтических записей, предварительно определенных сопоставлений между неструктурированными терапевтическими записанными признаками и связанными терапевтическими признаками и/или другой информации (например, серверы 46 могут включать в себя источник 42 неструктурированных данных и/или источник 44 структурированных данных); осуществления связи с вычислительным устройством 21, процессором 20 и/или другими устройствами; и/или выполнения других функций. В некоторых вариантах осуществления процессор 20 может быть включен в серверы 46, и/или функции процессора 20, описанные ниже, могут быть выполнены серверами 46. В некоторых вариантах осуществления сервер 46 может быть одним сервером. В некоторых вариантах осуществления сервер 46 может быть и/или включать в себя множество серверов, функционирующих совместно с облачной конфигурацией для выполнения функций, описанных в данном документе. Сервер 46 может включать в себя электронное хранилище, один или более процессоров (например, процессор 20) и/или другие компоненты. Серверы 46 могут включать в себя линии связи или порты для предоставления возможности обмена информацией с сетью и/или другими вычислительными платформами. Иллюстрация серверов 46 на Фиг. 1 в качестве одного объекта не подразумевает ограничения серверов 46 и/или источника 25 данных. Серверы 46 могут включать в себя множество компонентов аппаратного обеспечения, программного обеспечения и/или встроенного микропрограммного обеспечения, функционирующих совместно для предоставления функциональности, присущей в данном документе серверам 46. Например, серверы 46 могут быть реализованы посредством облака из вычислительных платформ, функционирующих совместно в качестве серверов 46.

[27] Процессор(ы) 20 выполнен(ы) с возможностью предоставления возможностей обработки информации в системе 10. Как таковой, процессор 20 может включать в себя одно или более из цифрового процессора, аналогового процессора, цифровой схемы, выполненной для обработки информации, аналоговой схемы, выполненной для обработки информации, конечного автомата и/или других механизмов для электронной обработки информации. Несмотря на то, что процессор 20 изображен на Фиг. 1 в качестве одного объекта, это сделано только в иллюстративных целях. В некоторых вариантах осуществления процессор 20 может содержать множество блоков обработки. Эти блоки обработки могут быть физически расположены внутри одного и того же устройства, либо процессор 20 может представлять собой функциональность обработки множества устройств, функционирующих скоординированным образом.

[28] Как показано на Фиг. 1, процессор 20 выполнен с возможностью исполнения одного или более компонентов компьютерной программы. Процессор 20 может включать в себя один или более из компонента 30 для пользовательского ввода, компонента 32 для идентификации, компонента 34 для сопоставления и/или других компонентов. Процессор 20 может быть выполнен с возможностью исполнения компонентов 30, 32, 34 и/или других компонентов компьютерной обработки посредством программного обеспечения; аппаратного обеспечения; встроенного микропрограммного обеспечения; некоторого сочетания программного обеспечения, аппаратного обеспечения и/или встроенного микропрограммного обеспечения; и/или других механизмов для конфигурации возможностей обработки на процессоре 20. Следует понимать, что несмотря на то, что компоненты 30, 32, 34 изображены на Фиг. 1 совместно расположенными внутри одного блока обработки, в вариантах осуществления, в которых процессор 20 включает в себя множество блоков обработки, один или более из компонентов 30, 32, 34 и/или других компонентов компьютерной обработки может располагаться удаленно от других компонентов. Описание функциональности, предоставляемой различными компонентами 30, 32, 34 и/или другими компонентами компьютерной обработки, описанными ниже, приведено в иллюстративных целях и не подразумевает ограничений, поскольку любой из компонентов 30, 32, 34 и/или других компонентов компьютерной обработки могут предоставлять больше или меньше функциональности в отличие от того, как это описано. Например, один или более из компонентов 30, 32, 34 и/или других компонентов компьютерной обработки может быть исключен, и некоторая или вся его функциональность может быть предоставлена другим из компонентов 30, 32, 34 и/или других компонентов компьютерной обработки. В качестве другого примера, процессор 20 может быть выполнен с возможностью исполнения одного или более дополнительных компонентов, которые могут выполнять некоторую или всю функциональность, приписываемую ниже одному из компонентов 30, 32, 34 и/или других компонентов компьютерной обработки.

[29] Компонент 30 для пользовательского ввода выполнен с возможностью получения неструктурированных терапевтических записей от вычислительного устройства 21 (например, после записи и/или выбора оператором и/или другими пользователями системы 10), от источника 42 неструктурированных данных и/или из других источников. Компонент 30 для пользовательского ввода может получать неструктурированные терапевтические записи в реальном времени или почти в реальном времени от вычислительного устройства 21, в одном или более пакетах из одной или более неструктурированных терапевтических записей от источника 42 неструктурированных данных и/или другими способами.

[30] Компонент 32 для идентификации выполнен с возможностью идентификации неструктурированных терапевтических записанных признаков в неструктурированных терапевтических записях. В некоторых вариантах осуществления компонент 32 для идентификации выполнен с возможностью определения контекста неструктурированных терапевтических записанных признаков в неструктурированных терапевтических записях. В некоторых вариантах осуществления компонент 32 для идентификации выполнен с возможностью использования контекстной информации в терапевтической карточке, относящейся к неструктурированной терапевтической записи, и в неструктурированной терапевтической записи для идентификации признаков неструктурированной терапевтической записи.

[31] Компонент 34 для сопоставления выполнен с возможностью сопоставления идентифицированных неструктурированных записанных признаков в неструктурированных терапевтических записях с соответствующими структурированными записанными признаками. Компонент 34 для сопоставления сопоставляет неструктурированные терапевтические записи со структурированными записанными признаками на основе контекстной информации, связанной с отдельными неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки. Например, в ответ на идентификацию первого неструктурированного терапевтического записанного признака, первый неструктурированный терапевтический записанный признак оказывается сопоставленным с соответствующим структурированным записанным признаком на основе контекстной информации, связанной с первым неструктурированным терапевтическим записанным признаком.

[32] В некоторых вариантах осуществления компонент 34 для сопоставления выполнен так, что сопоставление включает в себя использование алгоритма обработки естественного языка (NLP) для текстового анализа неструктурированных терапевтических записей. Использование алгоритма NLP для текстового анализа может включать в себя несколько этапов, таких как:

(a) исправление орфографических ошибок в неструктурированных терапевтических записях,

(b) устранение неоднозначности сокращений посредством предоставления подробного описания для сокращений,

(c) идентификация торговых марок и/или общих названий для лекарственных средств и/или способов лечения, ставя их в соответствие родовому названию и/или описанию торговой марки и/или общего названия, и/или

(d) идентификация и удаление несемантических (бессмысленных) слов, содержащихся в неструктурированных терапевтических записях, и/или другие этапы.

[33] Посредством неограничивающего примера на Фиг. 2 показано сопоставление идентифицированных неструктурированных записанных признаков 212 в неструктурированной терапевтической записи 202 терапевтической карточки с соответствующими связанными терапевтическими признаками 210 структурированной информации 204. Структурированная информация 204 включает в себя связки 206 связанных терапевтических признаков 210. Идентифицированный неструктурированный записанный признак 212, такой как название лекарственного средства (например, Тайленол (Tylenol)), может быть сопоставлен с одним или более связанными признаками 210 структурированной информации 204 (например, родовым названием ацетоаминофен, номером лекарственного средства, рекомендуемой дозой и т.д.). В некоторых вариантах осуществления сопоставление 208 неструктурированных записанных признаков 212 со связанными терапевтическими признаками 210 посредством компонента 34 для сопоставления (Фиг. 1) также сопоставляет отдельно взятый неструктурированный терапевтический записанный признак 212 со связкой 206 (например, классом лекарственного средства и/или кодом лекарственного средства) связанных терапевтических признаков 210 в структурированной информации 204 (например, отдельно взятой базы данных, такой как база данных кодов лекарственных средств HICL). Контекстная информация 214, связанная с неструктурированными записанными признаками 212 (например, синтаксис, создатель, формат и/или другие признаки неструктурированной терапевтической записи 202), используется компонентом 34 для сопоставления (Фиг. 1) с целью сопоставления неструктурированных записанных признаков 212 со связанными признаками 210. В некоторых вариантах осуществления сопоставление 208 неструктурированного записанного признака 212 с отдельно взятым связанным терапевтическим признаком 210 сопоставляет, видоизменяет и/или изменяет неструктурированный записанный признак 212 в структурированный записанный признак.

[34] Как показано на Фиг. 1, в некоторых вариантах осуществления, компонент 34 для сопоставления выполнен так, что сопоставление включает в себя фазу обучения и фазу применения. В фазе обучения после идентификации неструктурированных терапевтических записанных признаков компонентом 32 для идентификации и затем сопоставления неструктурированных терапевтических записанных признаков со связанными терапевтическими признаками компонентом 34 для сопоставления такие сопоставления могут быть изучены компонентом 34 для сопоставления с использованием модели машинного обучения (например, наивной байесовской оценкой) и/или другими способами. Изучение сопоставлений может содержать распознавание подобных и/или тех же самых сопоставлений, которые возникают один или более раз для одного или более неструктурированных терапевтических записанных признаков в неструктурированных терапевтических записях. В некоторых вариантах осуществления модели машинного обучения основаны на исправленных названиях лекарственных средств и их соответствующих кодах (например, кодах RxNorm, HICL или последовательности NDDF и/или других одобренных на национальном и/или международном уровне стандартов кодировки). В течение фазы обучения, (например, с использованием модели машинного обучения), компонент 34 для сопоставления определяет степень сопоставления для отдельных сопоставлений (например, вероятность того, что неструктурированный терапевтический записанный признак фактически связан со связанным терапевтическим признаком, с которым он был сопоставлен). В некоторых вариантах осуществления, на основе определенной степени сопоставления между неструктурированными записанными признаками и связанными терапевтическими признаками, компонент 34 для сопоставления затем выполнен с возможностью определения вероятности того, что отдельно взятый неструктурированный терапевтический записанный признак попадает под класс (например, связку связанных терапевтических признаков) лекарственных средств и/или кодов лекарственных средств в отдельно взятой базе данных (например, базе данных кодов лекарственных средств HICL). Например, неструктурированные записанные признаки могут включать в себя терапевтические названия и/или классификационные номера, и компонент 34 для сопоставления выполнен с возможностью определения первой вероятности того, что терапевтические названия и/или классификационные номера относятся к набору терапевтических названий и/или классификационных номеров (например, связке связанных терапевтических признаков) в базе данных (например, структурированной информации), и определения второй вероятности того, что неструктурированные терапевтические признаки (например, названия и/или классификационные номера) относятся к классу конкретной информации (например, HICL или NDDF) терапевтических названий и/или классификационных номеров (например, второй связке связанных терапевтических признаков).

[35] Степень сопоставления и вероятность того, что неструктурированный терапевтический записанный признак попадет под класс лекарственных средств и/или кодов лекарственных средств, используются компонентом 34 для сопоставления в течение последующей фазы применения. В течение фазы применения идентифицированные неструктурированные терапевтические записанные признаки сопоставляются со связанными терапевтическими признаками на основе предыдущих сопоставлений в течение фазы обучения. В течение фазы применения, сопоставления могут быть осуществлены на основе предварительно определенных степеней сопоставлений изученных сопоставлений. Фаза применения может включать в себя распознавание подобных и/или тех же самых сопоставлений (например, тех которые были изучены выше), когда они возникают один или более раз для одного или более неструктурированных терапевтических записанных признаков в неструктурированных терапевтических записях. В некоторых вариантах осуществления определенная степень сопоставления между записанными признаками и связанными терапевтическими признаками используется компонентом 34 для сопоставления для сопоставления конкретного неструктурированного терапевтического записанного признака с отдельным связанным терапевтическим признаком и/или связкой связанных терапевтических признаков (например, классом лекарственных средств). Например, первая вероятность (например, того, что неструктурированный терапевтический признак относится к связанному терапевтическому признаку) и вторая вероятность (например, того, что неструктурированный терапевтический признак относится к отдельно взятой связке связанных терапевтических признаков) могут быть использованы для определения степени сопоставления для последующих неструктурированных терапевтических признаков. В течение фазы применения сопоставления определяются апостериорные вероятности того, что неструктурированные записанные признаки принадлежат одной или более конкретным связкам связанных терапевтических признаков (например, классам лекарственных средств). В некоторых вариантах осуществления неструктурированный терапевтический записанный признак сопоставлен со связанным терапевтическим признаком, который имеет наивысшую апостериорную вероятность сопоставления. В некоторых вариантах осуществления соответствующая апостериорная вероятность представляет собой коэффициент надежности.

[36] На Фиг. 3 показаны действия по обработке естественного языка (NLP), выполняемые компонентом 34 для сопоставления (изображенным на Фиг. 1). Подсистема 300 NLP (например, компонент 34 для сопоставления) может нормализовать неструктурированную терапевтическую информацию с помощью фильтра 302 единиц измерения и цифр, орфографического корректора 304 для многословных фраз, разделителя 306 слитных слов, соединителя 308 слова и приставки и/или других компонентов. Фильтр 302 единиц измерения и цифр может задействовать нормализацию неструктурированных терапевтических записанных признаков (например, названия и/или классификационного номера). Распознавание контекстной информации, содержащейся в терапевтической карточке, связанной с неструктурированной терапевтической записью (например, единицами измерения), предоставляет возможность фильтру 302 единиц измерения и цифр удаления единиц измерения, и обеспечивает системе 10 возможность сопоставления самих записанных признаков.

[37] Орфографический корректор 304 для многословных фраз включает в себя словарь, который построен из множества источников 25 данных (изображенных на Фиг. 1). Орфографический корректор 304 для многословных фраз может включать в себя базу 310 данных, которая включает в себя одно или более из общего словаря английского языка, SNOMED CT, RadLex, RxNorm, NDDF, HICL, собственных таблиц по приему и медикаментам и/или других многословных словарных фраз. В некоторых вариантах осуществления база 310 данных индексируется как по унограммным, так и по диграммным записям. В некоторых вариантах осуществления знающий контекст алгоритм проверки правописания исправляет орфографические ошибки в названиях лекарственных средств.

[38] Неструктурированные терапевтические записи (например, названия лекарственных средств) могут содержать слова, которые лишены точных пробелов и/или пунктуации. Разделитель 306 слитных слов выполнен с возможностью идентификации и переформатирования терапевтических записей точным и единообразным образом. Например, обычные неструктурированные терапевтические записи включают в себя название лекарственного средства «кальцийглюконат» (должно быть «глюконат кальция») и «содабикарбонат» (должно быть «бикарбонат соды»). Разделитель 306 слитных слов отделяет слова, которые являются слитными на основе обнаружения несогласования с приставками и/или диграммного поиска.

[39] Схожим образом, иногда слова могут иметь пробелы и/или знаки препинания, которые там быть не должны. Соединитель 308 слова и приставки создает точный и единообразный способ форматирования терапевтических записей. Поскольку конкретный стиль документации для записей названий лекарственных средств в одной базе данных может не обладать единообразием с другими базами данных (или внутренними к той же самой базе данных), то некоторые операторы 12 (например, практикующие врачи) добавляют пробелы между приставками и/или фактическими терминами в названиях лекарственных средств. Например, «мультивитамины» будут записаны как «мульти витамины». Соединитель 308 слова и приставки нацелен на нормализацию таких слов посредством соединения приставки с ее последующим словом точным и единообразным образом.

[40] На Фиг. 4 показана реализация машинного обучение для обучения системы 10 с помощью предварительно обработанных (например, компонентом 32 для идентификации) терапевтических записей. Неструктурированные терапевтические записи 402a и 402b обрабатываются через фазу 404 обучения (например, фазу обучения, как описано выше) и фазу 406 применения (например, фазу применения, как описано выше). После того, как модель машинного обучения обучена (например, в течение фазы 404 обучения) с использованием предварительно обработанных названий лекарственных средств и/или терапевтических названий (например, неструктурированных записанных признаков) с помощью модуля 408a NLP и сопоставленных с соответствующими связанными терапевтическими признаками, то модель применяется к новым названиям лекарственных средств и/или терапевтическим названиям (например, неструктурированным записанным признакам) для точного и единообразного сопоставления терапевтических признаков/признаков лекарственного средства (например, фаза 406 применения). В некоторых вариантах осуществления способ машинного обучения с наивным байесовским классификатором используется для оценки апостериорной вероятности сопоставления неструктурированных записанных признаков со связанными терапевтическими признаками из заданного списка ключевых слов, которые были уточнены с помощью предварительной обработки (например, модуля NLP). Структурированные терапевтические признаки с наивысшей апостериорной вероятностью выбираются в качестве изученных машиной выходных данных 410. Апостериорная вероятность сопоставления, найденная системой 10, предоставляется в качестве коэффициента надежности и предоставляется в изученных машиной выходных данных 410.

[41] В некоторых вариантах осуществления неструктурированная терапевтическая запись 402a, используемая для обучения, аналогична неструктурированной терапевтической записи 402b, которая используется в фазе 406 применения изученной машиной сопоставления. Как в фазе 404 обучения, так и в фазе 406 применения неструктурированная терапевтическая запись предварительно обрабатывается модулем NLP (408a, 408b соответственно) до сопоставления неструктурированных терапевтических записанных признаков со связанными терапевтическими признаками. Сопоставление может влечь за собой сравнение оцененной вероятности каждого неструктурированного записанного признака со связанным терапевтическим признаком для сопоставления 412a при обучении, а также сопоставления 412b при применении. Данное сравнение формирует апостериорную вероятность того, что связки связанных терапевтических признаков включены в список неструктурированных терапевтических признаков. Такие сопоставления пропорциональны вероятности того, что каждая структурированная терапевтическая запись в неструктурированных терапевтических записанных данных сопоставлена со связанным терапевтическим признаком, и априорной вероятности того, что каждая структурированная терапевтическая запись находится внутри структурированной информации. Параметры вычисляются в течение фазы 404 обучения с большой совокупностью неструктурированных терапевтических записей с правильными структурированными терапевтическими записями. Параметры затем используются в фазе 406 применения для осуществления сопоставлений между неструктурированными терапевтическими записанными признаками и связанными терапевтическими признаками.

[42] Например, в некоторых вариантах осуществления сопоставление трех неструктурированных признаков (например, неструктурированных терапевтических записанных признаков) со связанными терапевтическими признаками внутри двух классов структурированной информации HICL (например, связок связанных терапевтических признаков) требует вычисление вероятности того, что каждый неструктурированный признак находится в классе HICL (например, связке связанных терапевтических признаков):

p(HICL | признак1, признак2, признак3)

∝ p(HICL)p(признак1, признак2, признак3 | HICL)

≈p(HICL)p(признак1 | HICL)p(признак2 | HICL)p(признак3 | HICL)

[43] Если только неструктурированный признак 1 появляется в неструктурированной терапевтической записи, то апостериорная вероятность неструктурированной терапевтической записи, принадлежащей к одному классу HICL, сопоставляется следующим образом:

p(HICL=1 | признак1=1, признак2=0, признак3=0)

≈p(HICL=1)p(признак1=1 | HICL=1)p(признак2=0 | HICL=1)p(признак3=0 | HICL=1)

[44] Четыре параметра вышеупомянутого уравнения могут быть вычислены в течение фазы обучения, например:

p(признак1=1 | HICL=1) = (Общее количество для HICL=1 И признак1 появляется)/(Общее количество для HICL=1)

[45] Машинное обучение единообразного сопоставления неструктурированных терапевтических записей со структурированными терапевтическими записями выполнено для содействия вторичному использованию базы данных по лекарственным средствам eRI в клиническом исследовании (Интеллектуальный анализ данных и выявление знаний). В качестве расширения вторичного использования терапевтических записанных данных система может предоставлять результаты сопоставления для других баз данных неструктурированных записей (например, базы данных eRI для внешних потребителей). Не подразумевается, что примеры использования терапевтических записей являются ограничивающими. Например, неблагоприятное событие и/или выявление инфекции, био наблюдение, выполняемое сосредоточенными на качестве здравоохранения организациями и общественными организациями по здравоохранению, например, Центром контроля и профилактики заболеваний (Center for Disease Prevention and Control, CDC), могут быть улучшены посредством варианта реализации системы для точного и единообразного сопоставления большого количества неструктурированных записанных признаков со связанными терапевтическими признаками и/или связками связанных терапевтических признаков. Единообразные методики стандартизации могут быть полезными в других областях исследования, например, в уточнении национальных баз данных по лекарственным средствам или приведении к единообразию документации CPOE по клиническому исследованию. Примеры, объясненные в данном документе, являются всего лишь иллюстративными и не предназначены ограничивать объем настоящего изобретения.

[46] На Фиг. 5 показан способ 500 единообразного сопоставления неструктурированных записанных признаков в неструктурированных терапевтических записях со связанными терапевтическими признаками с помощью системы для сопоставления. Система для сопоставления содержит один или более аппаратных компьютерных процессоров и/или других компонентов, выполненных с возможностью исполнения компьютерочитаемых команд для исполнения компьютерных программных компонентов. Компьютерные программные компоненты включают в себя компонент для пользовательского ввода, компонент для идентификации, компонент для сопоставления и/или другие компоненты. Этапы способа 500, представленные ниже, приведены в иллюстративных целях. В некоторых вариантах осуществления способ 500 может быть выполнен с одним или более не описанными дополнительными этапами и/или без одного или более из обсужденных этапов. Дополнительно, порядок, в котором этапы способа 500 изображены на Фиг. 5 и описаны ниже, не является ограничивающим.

[47] В некоторых вариантах осуществления способ 500 может быть реализован в одном или более устройствах обработки (например, цифровом процессоре, аналоговом процессоре, цифровой схеме, выполненной с возможностью обработки информации, аналоговой схемы, выполненной с возможностью обработки информации, конечного автомата и/или других механизмах для электронной обработки информации). Упомянутые одно или более устройств обработки могут включать в себя одно или более устройств, исполняющих некоторые или все этапы способа 500 в ответ на команды, хранящиеся электронным образом на электронном носителе хранения информации. Упомянутые одно или более устройств обработки могут включать в себя одно или более устройств, конфигурируемых через аппаратное обеспечение, встроенное микропрограммное обеспечение и/или программное обеспечение для того, чтобы быть специально выполненными для исполнения одного или более из этапов способа 500.

[48] На этапе 502 осуществляется получение пользовательского ввода. Пользовательский ввод может включать в себя неструктурированные терапевтические записи. Например, оператор может ввести неструктурированную терапевтическую запись (например, рецепт на лекарственное средство) в пользовательском интерфейсе CPOE. В некоторых вариантах осуществления этап 502 выполняется компонентом пользовательского ввода, тем же самым или подобным компоненту 30 для пользовательского ввода (изображенному на Фиг. 1 и описанном в данном документе).

[49] На этапе 504 осуществляется идентификация отдельных неструктурированных терапевтических записанных признаков. Неструктурированные терапевтические записанные признаки включены в неструктурированные терапевтические записи, введенные на этапе 502. В некоторых вариантах осуществления этап 504 выполняется компонентом для идентификации, тем же самым или подобным компоненту 32 для идентификации (изображенному на Фиг. 1 и описанному в данном документе).

[50] На этапе 506 осуществляется сопоставление отдельных неструктурированных терапевтических записанных признаков со связанными терапевтическими признаками. Идентифицированные неструктурированные записанные признаки в неструктурированных терапевтических записях сопоставляются со структурированными записанными признаками, причем такое сопоставление основано на контекстной информации, связанной с отдельными неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки. В ответ на идентификацию неструктурированной терапевтической записи, неструктурированная терапевтическая запись сопоставляется с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с неструктурированной терапевтической записью. Контекстная информация включает в себя одно или более из синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи. В некоторых вариантах осуществления сопоставление может включать в себя исправление орфографических ошибок в неструктурированных терапевтических записях, предоставление описаний для сокращений в неструктурированных терапевтических записях, удаление несемантических и/или бессмысленных данных из неструктурированных терапевтических записей, отфильтровывание единиц измерения, исправление написания слов, отделение слов, соединение слов с отделенными приставками, исправление орфографических ошибок, предоставление описаний, удаление несемантических и/или бессмысленных данных и/или других этапов. В некоторых вариантах осуществления этап 506 выполняется компонентом для сопоставления, тем же самым или подобным компоненту 34 для сопоставления (изображенному на Фиг. 1 и описанному в данном документе).

[51] В формуле изобретения любые ссылочные обозначения, помещенные между круглыми скобками, не должны рассматриваться в качестве ограничивающих пункт формулы изобретения. Слово «содержащий» или «включающий в себя» не исключает наличия элементов или этапов, отличающихся от перечисленных в пункте формулы изобретения. В пункте формулы изобретения с устройством, перечисляющем несколько средств, несколько из этих средств могут быть воплощены одним и тем же объектом аппаратного обеспечения. Упоминание некоторого элемента в единственном числе не исключает наличия множества таких элементов. В пункте формулы изобретения с устройством, перечисляющем несколько средств, несколько из этих средств могут быть воплощены одним и тем же объектом аппаратного обеспечения. Простой факт того, что конкретные элементы изложены во взаимно различных зависимых пунктах формулы изобретения, не указывает на то, что эти элементы не могут использоваться в сочетании друг с другом.

[52] Несмотря на то, что в описании, предоставленном выше, приведены подробности в иллюстративных целях на основе того, что в настоящее время считается самыми практичными и предпочтительными вариантами осуществления, следует понимать, что такие подробности приведены исключительно с этой целью и что настоящее изобретения не ограничено явно раскрытыми вариантами осуществления, а напротив, подразумевается, что оно охватывает видоизменения и эквивалентные варианты выполнения, которые попадают под сущность и объем прилагаемой формулы изобретения. Например, следует понимать, что настоящее изобретение предусматривает то, что, по мере возможности, один или более признаков любого варианта осуществления могут сочетаться с одним или более признаками любого другого варианта осуществления.

Похожие патенты RU2701702C2

название год авторы номер документа
СПОСОБ ДВУХУРОВНЕВОГО ПОИСКА ИНФОРМАЦИИ В ПРЕДВАРИТЕЛЬНО ПРЕОБРАЗОВАННОМ СТРУКТУРИРОВАННОМ МАССИВЕ ДАННЫХ 2014
  • Рогачев Игорь Петрович
RU2571406C1
СПОСОБ ПОИСКА ИНФОРМАЦИИ В ПРЕДВАРИТЕЛЬНО ПРЕОБРАЗОВАННОМ СТРУКТУРИРОВАННОМ МАССИВЕ ДАННЫХ 2014
  • Рогачев Игорь Петрович
RU2572367C1
СПОСОБ ФОРМИРОВАНИЯ КАРТЫ СВЯЗЕЙ КОМПОНЕНТОВ ПРЕОБРАЗОВАННОГО СТРУКТУРИРОВАННОГО МАССИВА ДАННЫХ 2014
  • Рогачев Игорь Петрович
RU2571407C1
СПОСОБ ПРЕДВАРИТЕЛЬНОГО ПРЕОБРАЗОВАНИЯ СТРУКТУРИРОВАННОГО МАССИВА ДАННЫХ 2014
  • Рогачев Игорь Петрович
RU2571405C1
МЕРА КАЧЕСТВА ДЛЯ СЛУЖБЫ КОНТЕКСТА ДАННЫХ 2010
  • Марсден Ричард Г.
  • Абекасси Гаэлль
  • Линь Ю
  • Бенум Тронд
  • Ларош-Пи Сирил
  • Брауссард Iii Флойд Луи
RU2571535C2
КУРИРОВАНИЕ МНОГОЯЗЫЧНЫХ КОММЕРЧЕСКИХ ПРИЗНАКОВ И СИНТЕЗ ТРАНСЛИТЕРАЦИИ 2014
  • Скриффиньяно Энтони Дж.
  • Клейн Майкл
  • Кэролан Шон
  • Мэттьюз Уорвик
RU2644071C2
СИСТЕМА И ПРОЦЕСС ДЛЯ АНАЛИЗА, КВАЛИФИЦИРОВАНИЯ И ПРОГЛАТЫВАНИЯ ИСТОЧНИКОВ НЕСТРУКТУРИРОВАННЫХ ДАННЫХ ПОСРЕДСТВОМ ЭМПИРИЧЕСКОЙ АТРИБУЦИИ 2015
  • Скриффиньяно Энтони Дж.
  • Сунбханикх Йем
  • Дэвис Робин Фрай
  • Мэттьюз Уорвик
RU2674331C2
СПОСОБ ОПРЕДЕЛЕНИЯ ПОДОЗРЕНИЙ НА ОРФАННЫЕ ЗАБОЛЕВАНИЯ НА ОСНОВЕ АНАЛИЗА ЭЛЕКТРОННЫХ МЕДИЦИНСКИХ КАРТ 2022
  • Новицкий Роман Эдвардович
  • Гусев Александр Владимирович
RU2824286C2
КОНТЕКСТНЫЕ ЗАПРОСЫ 2011
  • Стрикантх Муниратхнам
  • Ваддади Пхани
  • Наджм Тарек
RU2573764C2
СПОСОБ И СИСТЕМА ОПРЕДЕЛЕНИЯ АКТИВНОСТИ УЧЕТНЫХ ЗАПИСЕЙ В ВЫЧИСЛИТЕЛЬНОЙ СРЕДЕ 2023
  • Усков Святослав Александрович
  • Кравченко Андрей Алексеевич
  • Драчуков Андрей Александрович
  • Жиров Дмитрий Викторович
RU2824919C1

Иллюстрации к изобретению RU 2 701 702 C2

Реферат патента 2019 года СИСТЕМА И СПОСОБ ЕДИНООБРАЗНОГО СОПОСТАВЛЕНИЯ НЕСТРУКТУРИРОВАННЫХ ЗАПИСАННЫХ ПРИЗНАКОВ СO СВЯЗАННЫМИ ТЕРАПЕВТИЧЕСКИМИ ПРИЗНАКАМИ

Изобретения относятся к системам и способу единообразного сопоставления неструктурированных записанных признаков, включенных в неструктурированных терапевтических записях, со связанными терапевтическими признаками в структурированной терапевтической информации. Техническим результатом является обеспечение единообразно сопоставленных записанных терапевтических признаков для вторичного использования в клинических и относящихся к обеспечению безопасности пациентов исследованиях. Система выполнена с возможностью получения неструктурированных терапевтических записей, идентификации неструктурированных записанных признаков внутри отдельных неструктурированных терапевтических записей и сопоставления с соответствующими связанными терапевтическими признаками. Сопоставление неструктурированных записанных признаков со связанными терапевтическими признаками основано на контекстной информации, связанной с отдельными неструктурированными терапевтическими записями. Контекстная информация включает в себя синтаксис неструктурированной терапевтической записи, создателя неструктурированной терапевтической записи и/или формат неструктурированной терапевтической записи. 3 н. и 12 з.п. ф-лы, 5 ил.

Формула изобретения RU 2 701 702 C2

1. Система (10), выполненная с возможностью единообразного сопоставления неструктурированных записанных признаков (212) в неструктурированных терапевтических записях (202) со связанными терапевтическими признаками (210) в структурированной терапевтической информации (204), содержащая:

один или более аппаратных компьютерных процессоров (20), выполненных с возможностью исполнения компьютерочитаемых команд для:

получения неструктурированных терапевтических записей, включающих в себя первую неструктурированную терапевтическую запись;

идентификации неструктурированных записанных признаков в отдельных неструктурированных терапевтических записях и

сопоставления идентифицированных неструктурированных записанных признаков в неструктурированных терапевтических записях с соответствующими связанными терапевтическими признаками,

причем такое сопоставление основано на контекстной информации, связанной с неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки, так что, в ответ на идентификацию первого неструктурированного записанного признака в первой неструктурированной терапевтической записи, первый неструктурированный записанный признак оказывается сопоставленным с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с первой неструктурированной терапевтической записью,

причем контекстная информация, связанная с первой неструктурированной терапевтической записью, включает в себя одно или более из синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи.

2. Система по п. 1, в которой упомянутые один или более аппаратных компьютерных процессоров выполнены так, что связанные терапевтические признаки содержат одно или более из ингредиента лекарственного средства в Списке иерархических кодов ингредиентов (HICL), названия лекарственного средства в Национальной картотеке данных по лекарственным средствам (NDDF), терапевтического названия или классификационного номера.

3. Система по п. 1, в которой упомянутые один или более аппаратных компьютерных процессоров выполнены так, что неструктурированные записанные признаки включают в себя одно или более из неструктурированного ингредиента лекарственного средства, неструктурированного названия лекарственного средства, неструктурированного терапевтического названия или неструктурированного классификационного номера, и

при этом упомянутые один или более аппаратных компьютерных процессоров выполнены с возможностью определения первой вероятности того, что отдельный неструктурированный записанный признак относится к набору связанных терапевтических признаков, и определения второй вероятности того, что отдельный неструктурированный записанный признак относится к конкретному классу связанных терапевтических признаков в наборе связанных терапевтических признаков.

4. Система по п. 1, в которой упомянутые один или более аппаратных компьютерных процессоров выполнены с возможностью определения коэффициента надежности, указывающего степень сопоставления между первым неструктурированным записанным признаком и соответствующим связанным терапевтическим признаком.

5. Система по п. 1, в которой упомянутые один или более аппаратных компьютерных процессоров выполнены так, что сопоставление включает в себя одно или более из:

отфильтровывания единиц измерения из неструктурированных терапевтических записей;

исправления написания слов в неструктурированных терапевтических записях;

отделения слов в неструктурированных терапевтических записях;

соединения слов с отделенными приставками в неструктурированных терапевтических записях;

исправления орфографических ошибок в неструктурированных терапевтических записях;

предоставления описаний для сокращений в неструктурированных терапевтических записях и/или

удаления несемантических и/или бессмысленных данных из неструктурированных терапевтических записей.

6. Способ единообразного сопоставления неструктурированных записанных признаков (212) в неструктурированных терапевтических записях (202) со связанными терапевтическими признаками (210) в структурированной терапевтической информации (204) с помощью системы (10) для сопоставления, причем система содержит один или более аппаратных компьютерных процессоров (20), а способ содержит этапы, на которых:

получают, с помощью упомянутых одного или более аппаратных компьютерных процессоров, неструктурированные терапевтические записи, включающие в себя первую неструктурированную терапевтическую запись;

идентифицируют, с помощью упомянутых одного или более аппаратных компьютерных процессоров, неструктурированные записанные признаки в отдельных неструктурированных терапевтических записях и

сопоставляют, с помощью упомянутых одного или более аппаратных компьютерных процессоров, идентифицированные неструктурированные записанные признаки в неструктурированных терапевтических записях с соответствующими связанными терапевтическими признаками,

причем такое сопоставление основано на контекстной информации, связанной с неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки, так что, в ответ на идентификацию первого неструктурированного записанного признака в первой неструктурированной терапевтической записи, первый неструктурированный записанный признак сопоставляют с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с первой неструктурированной терапевтической записью,

причем контекстная информация, связанная с первой неструктурированной терапевтической записью, включает в себя одно или более из синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи.

7. Способ по п. 6, в котором связанные терапевтические признаки содержат одно или более из ингредиента лекарственного средства в Списке иерархических кодов ингредиентов (HICL), названия лекарственного средства в Национальной картотеке данных по лекарственным средствам (NDDF), терапевтического названия или классификационного номера.

8. Способ по п. 6, в котором неструктурированные записанные признаки включают в себя одно или более из неструктурированного ингредиента лекарственного средства, неструктурированного названия лекарственного средства, неструктурированного терапевтического названия или неструктурированного классификационного номера,

причем способ дополнительно содержит этапы, на которых определяют первую вероятность того, что отдельный неструктурированный записанный признак относится к набору связанных терапевтических признаков, и определяют вторую вероятность того, что отдельный неструктурированный записанный признак относится к конкретному классу связанных терапевтических признаков в наборе связанных терапевтических признаков.

9. Способ по п. 6, дополнительно содержащий этап, на котором определяют коэффициент надежности, указывающий степень сопоставления между первым неструктурированным записанным признаком и соответствующим связанным терапевтическим признаком.

10. Способ по п. 6, в котором сопоставление включает в себя один или более из этапов, на которых:

отфильтровывают единицы измерения из неструктурированных терапевтических записей;

исправляют написания слов в неструктурированных терапевтических записях;

отделяют слова в неструктурированных терапевтических записях;

соединяют слова с отделенными приставками в неструктурированных терапевтических записях;

исправляют орфографические ошибки в неструктурированных терапевтических записях;

предоставляют описания для сокращений в неструктурированных терапевтических записях и/или

удаляют несемантические и/или бессмысленные данные из неструктурированных терапевтических записей.

11. Система (10), выполненная с возможностью единообразного сопоставления неструктурированных записанных признаков (212) в неструктурированных терапевтических записях (202) со связанными терапевтическими признаками (210) в структурированной терапевтической информации (204), содержащая:

средства (20) для получения неструктурированных терапевтических записей, включающих в себя первую неструктурированную терапевтическую запись;

средства (20) для идентификации неструктурированных записанных признаков в отдельных неструктурированных терапевтических записях и

средства (20) для сопоставления идентифицированных неструктурированных записанных признаков в неструктурированных терапевтических записях с соответствующими связанными терапевтическими признаками,

причем такое сопоставление основано на контекстной информации, связанной с неструктурированными терапевтическими записями, в которые включены неструктурированные записанные признаки, так что, в ответ на идентификацию первого неструктурированного записанного признака в первой неструктурированной терапевтической записи, первый неструктурированный записанный признак оказывается сопоставленным с соответствующим связанным терапевтическим признаком на основе контекстной информации, связанной с первой неструктурированной терапевтической записью,

причем контекстная информация, связанная с первой неструктурированной терапевтической записью, включает в себя одно или более из синтаксиса первой неструктурированной терапевтической записи, создателя первой неструктурированной терапевтической записи и/или формата первой неструктурированной терапевтической записи.

12. Система по п. 11, в которой связанные терапевтические признаки содержат одно или более из следующего: ингредиента лекарственного средства в Списке иерархических кодов ингредиентов (HICL), названия лекарственного средства в Национальной картотеке данных по лекарственным средствам (NDDF), терапевтического названия или классификационного номера.

13. Система по п. 11, в которой неструктурированные записанные признаки включают в себя одно или более из: неструктурированного ингредиента лекарственного средства, неструктурированного названия лекарственного средства, неструктурированного терапевтического названия или неструктурированного классификационного номера, и

при этом система дополнительно содержит средства (20) для определения первой вероятности того, что отдельный неструктурированный записанный признак относится к набору связанных терапевтических признаков, и определения второй вероятности того, что отдельный неструктурированный записанный признак относится к конкретному классу связанных терапевтических признаков в наборе связанных терапевтических признаков.

14. Система по п. 11, дополнительно содержащая средства (20) для определения коэффициента надежности, указывающего степень сопоставления между первым неструктурированным записанным признаком и соответствующим связанным терапевтическим признаком.

15. Система по п. 11, в которой сопоставление включает в себя одно или более из:

отфильтровывания единиц измерения из неструктурированных терапевтических записей;

исправления написания слов в неструктурированных терапевтических записях;

отделения слов в неструктурированных терапевтических записях;

соединения слов с отделенными приставками в неструктурированных терапевтических записях;

исправления орфографических ошибок в неструктурированных терапевтических записях;

предоставления описаний для сокращений в неструктурированных терапевтических записях и/или

удаления несемантических и/или бессмысленных данных из неструктурированных терапевтических записей.

Документы, цитированные в отчете о поиске Патент 2019 года RU2701702C2

WO 00/72452 A2, 30.11.2000
Способ приготовления лака 1924
  • Петров Г.С.
SU2011A1
КОНЪЮГАТЫ АНТИТЕЛА С ЛЕКАРСТВЕННЫМ СРЕДСТВОМ 2014
  • Куэвас Марчанте, Кармен
  • Домингес Корреа, Хуан Мануэль
  • Франсесч Сольосо, Андрес
  • Гаррансо Гарсиа-Ибаррола, Мария
  • Мунос Алонсо, Мария Хосе
  • Санчес Мадрид, Франсиско
  • Сапата Эрнандес, Хуан Мануэль
  • Гарсия Арройо, Алисия
  • Урса Печарроман, Мария Анхелес
RU2669812C2
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек 1923
  • Григорьев П.Н.
SU2007A1
СПОСОБ АВТОМАТИЗАЦИИ ОБЩЕЙ ФУНКЦИОНАЛЬНОЙ ДИАГНОСТИКИ 2001
  • Страхов А.Ф.
  • Страхов О.А.
  • Страхова Е.В.
RU2205447C2

RU 2 701 702 C2

Авторы

Шарифи Седех, Реза

Фарри, Оладимеджи Фейисетан

Чжу, Сяньшу

Цзя, Юган

Элгорт, Дэниел Роберт

Даты

2019-09-30Публикация

2015-11-30Подача