СПОСОБ ВВОДА И МНОГОУРОВНЕВОЙ ВЕРИФИКАЦИИ ИНТЕНСИВНО ПОСТУПАЮЩИХ ДАННЫХ В БОЛЬШИХ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИХ СИСТЕМАХ НАУКОМЕТРИЧЕСКОГО СОДЕРЖАНИЯ Российский патент 2021 года по МПК G06F16/30 

Описание патента на изобретение RU2763458C1

ОБЛАСТЬ ТЕХНИКИ

Настоящее техническое решение относится к области вычислительной техники, в частности к компьютерно-реализуемому способу ввода больших наукометрических данных в интерактивную информационно-аналитическую систему.

УРОВЕНЬ ТЕХНИКИ

В сфере науки и высшего образования для поддержки принятия административно-управленческих решений, как правило, используются информационно-аналитические наукометрические системы, именуемые также CRIS-системами (Current Research Information Systems). Такие системы аккумулируют данные о научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности не только организации в целом или отдельным коллективам, но и о результатах отдельных её работников. При решении вопросов административно-управленческого характера, как правило, опираются на аналитические данные по организациям в целом (формирование рейтинговых показателей на разных уровнях, аналитических материалов по отдельным направлениям исследований, отчётных материалов и т.п.), на данные по структурным подразделениям организации и по отдельным работникам (например, конкурсное избрание). Для эффективного и адекватного реалиям решения этих задач необходимо, чтобы перманентно во времени формировалось единое, легко верифицируемое информационное пространство. Такое пространство характеризуется не только тем, что данные верифицированы с использованием всех доступных современных цифровых технологий и административных механизмов, но и тем, что они актуальны, легко воспроизводимы и проверяемы, а также всесторонне отражают научно-техническую, опытно-конструкторскую, инновационно-технологическую деятельность и работу по подготовке соответствующих кадров специалистов субъектами на всех уровнях такой деятельности (организации, коллектива или отдельного работника).

Из уровня техники известно решение, выбранное в качестве наиболее близкого аналога, RU 2569363 C1. Данное решение относится к информационным системам, а именно к системам, позволяющим анализировать публикационную и издательскую активность сотрудников научно-образовательных организаций.

Решение, раскрытое в источнике, направлено на создание автоматизированной информационной системы, позволяющей осуществлять сбор и накопление в разрезе сотрудников организации данных об их публикациях, анализ публикационной активности с различным уровнем детализации, строить настраиваемые пользовательские отчеты в соответствии с формами, предъявляемыми Минобрнауки РФ к результатам интеллектуальной деятельности научно-образовательных организаций.

Предлагаемое решение направлено на устранение недостатков современного уровня техники и отличается от известных решений тем, что предложенный способ, обеспечивает оперативную предобработку вводимых данных и качественную верификацию введенных данных.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Технической проблемой, на решение которой направлено заявленное решение, является создание компьютерно-реализуемого способа ввода и верификации больших наукометрических данных в интерактивную информационно-аналитическую систему. Дополнительные варианты реализации настоящего изобретения представлены в зависимых пунктах изобретения.

Технический результат заключается в повышении качества предобработки вводимых данных и повышении качества верификации введенных данных.

Заявленный результат достигается за счет осуществления компьютерно-реализуемого способа ввода и многоуровневой верификации больших наукометрических данных в интерактивную информационно-аналитическую систему, содержащего этапы, на которых:

выгружают первичные данные о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности посредством файла выгрузки и/или посредством интерфейса внешней информационной системы;

осуществляют автоматический нечёткий поиск дубликатов по заранее заданным первичным данным в интерактивной информационно-аналитической системе;

осуществляют автоматизированное сопоставление авторов результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с уже существующими авторами в интерактивной информационно-аналитической системе;

осуществляют аффилиацию первичных данных с существующими объектами в интерактивной информационно-аналитической системе;

сохраняют первичные данные и создают новый объект в интерактивной информационно-аналитической системе;

осуществляют автоматизированную верификацию нового объекта, созданного в интерактивной информационно-аналитической системе, на разных административных уровнях.

В частном варианте реализации описываемого способа, в автоматизированном режиме загружают библиометрическую и иную справочную информацию посредством файла выгрузки и/или посредством интерфейса внешней информационной системы.

В частном варианте реализации описываемого способа, в автоматическом режиме верифицируют информацию о результате научно-технической, опытно-конструкторской и инновационно-технологической деятельности посредством интерфейса внешней информационной системы.

В частном варианте реализации описываемого способа, в автоматическом режиме отправляют уведомления о добавлении нового результата научно-технической, опытно-конструкторской и инновационно-технологической деятельности пользователей интерактивной информационно-аналитической системы, являющихся авторами этого результата.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:

Фиг. 1 иллюстрирует блок-схему, представляющую модель ввода данных о результатах научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке кадров специалистов.

Фиг. 2 иллюстрирует блок-схему, представляющую модель многоуровневой верификации данных о результатах научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке кадров специалистов.

Фиг. 3 иллюстрирует схему вычислительного устройства.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.

Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.

Предлагаемое решение, в рамках большой, по масштабу данных, и сложно организованной наукометрической информационно-аналитической системы обеспечивает ввод, предобработку и хранение максимально полных, верифицированных данных о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности участвующих в ней работников, коллективов исполнителей проектов и организаций, которые они представляют, путём использования моделей и программных механизмов преимущественного ввода «снизу-вверх» авторами с последующей их верификацией в автоматическом режиме соавторами, ответственными (уполномоченными от организации) за сопровождение информации в системе.

Предметная область, в рамках которой используется предлагаемый способ, состоит в интерактивном сборе, предобработке и хранении большого объёма разноплановых данных о результатах научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности субъектов на разных уровнях её организации (проведении), их перманентном анализе и получении интегральных рейтинговых оценок её результативности (эффективности).

Предлагаемое решение представляет собой способ ввода больших наукометрических данных в интерактивную информационно-аналитическую систему (далее - Система) и их верификации на нескольких взаимодополняющих друг друга административных уровнях организации научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке для неё кадров, реализованный в виде программного средства Системы.

Субъектами предлагаемого решения являются пользователи Системы, взаимодействующие с ней в интерактивном режиме с целью ввода и верификации данных: инициаторы ввода; соавторы результата деятельности, который вводится в систему инициатором; работники, ответственные за сопровождение Системы от структурных подразделений организации, работником которой является инициатор.

Взаимодействие субъектов в процессах ввода и верификации осуществляется посредством использования программно-аппаратных механизмов (интерфейсов), реализующих предлагаемый способ.

Предметные положения, характеризующие способ.

1. Информационно-аналитические наукометрические системы в их широком понимании рассматриваются как инструментальные средства поддержки принятия управленческих решений в сфере научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке для неё кадров специалистов.

2. Для решения различных вопросов управленческого характера (стимулирование эффективной работы, деятельности на приоритетных направлениях и т.д.) требуются аналитические данные на разных административных уровнях: организация; структурное подразделение; научный коллектив; отдельный работник.

3. Ввод и верификация — одна из ключевых компонент Системы для формирования максимально полного и верифицированного информационного пространства.

4. Большое разнообразие видов результатов подлежащей учету деятельности, форматов и источников данных, которые их характеризуют, а также интенсивность их ввода.

5. Полнота (презентативность) данных, необходимая для состоятельности результатов их анализа, обеспечивается регулярным стимулированием (различные конкурсные процедуры, премии и т.п.), которое, в свою очередь, требует их надёжной верификации.

Схема формирования верифицированного информационного пространства.

Для того, чтобы данные можно было использовать для решения административно-управленческих вопросов, они должны быть: верифицированы на этапе их ввода и аккумулирования в базе данных Системы; актуальны во времени, легко восстанавливаемы на всех нижележащих административных уровнях (вплоть до персонального), на которых они формируются; полны.

Обеспечение полноты и актуальности данных требует наличия постоянных стимулирующих ввод данных факторов (конкурсные процедуры, поощрительные надбавки, и другие). В основе существующих стимулирующих процедур лежат механизмы рейтинговых оценок. Для того, чтобы такие оценки были объективны и корректны, используемые для их расчёта данные должны быть верифицированы и актуальны. Следует отметить, что рейтинговые оценки носят предварительный характер и не заменяют проведение экспертизы. Окончательно рейтинговые оценки эффективности (результативности) должны формироваться на основе предварительных рейтинговых оценок с учетом результатов их обсуждения коллегией опытных экспертов.

В качестве базовых принципов использования наукометрии для оценки научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке кадров специалистов, целесообразно руководствоваться положениями Лейденского манифеста, принятого международным научным сообществом в области наукометрии в 2014 г.

1. Количественная оценка деятельности отдельного работника является лишь отправной для последующей её оценки коллегией экспертов.

2. Подлежащая оценке научная и образовательная деятельность и соответствующие индикаторы должны выбираться с учётом целевых установок и особенностей её организации в тех или иных областях знания.

3. Методы оценки деятельности должны учитывать национальные и региональные особенности, в первую очередь — целевые установки её организации.

4. Процессы сбора данных и их анализа должны быть открытыми, прозрачными и простыми для понимания и возможности их воспроизведения.

5. В Системе должны присутствовать механизмы, предоставляющие возможности работникам, деятельность которых оценивается, проверять и анализировать данные, которые положены в основу оценки.

6. Методы оценки должны учитывать тот факт, что научные дисциплины отличаются друг от друга по практике публикаций и цитирования.

7. Количественная оценка отдельных работников должна учитывать их индивидуальные особенности, включая возраст, стаж работы, особенности области знания и другие.

8. Методы оценки должны быть избавлены от индикаторов, незначительно влияющих на целевые установки и конечный результат.

9. Стимулирующее воздействие оценки должно соответствовать целевым установкам, сложившимся на настоящее время.

10. Проверка индикаторов на их соответствие целям и задачам Системы должна быть перманентной.

С целью унификации и приближения способов ввода и верификации Системы к международным стандартам и требованиям, они должны быть ориентированы на реализацию перечисленных принципов.

1. При сборе и верификации данных в больших наукометрических коллекциях предпочтение следует отдавать восходящим потокам их поступления, основанным на персональном или коллективном интересе источника данных.

2. Процессы сбора и верификации данных должны рационально сочетать не только приоритетные восходящие «снизу-вверх», но и нисходящие «сверху вниз» (из агрегированных данных к составляющим их индивидуальным) потоки.

3. Процессы сбора и верификации должны основываться на рациональном (сбалансированном) сочетании для отдельных работников и для коллективов стимулов как принудительного (приказного, обязывающего) характера, так и стимулов, основанных на персональном и/или коллективном интересе.

4. Методы и, соответственно, индикаторы и метрики оценки эффективности результатов деятельности научного работника, должны в сбалансированном режиме включать и составляющие, характеризующие результаты его деятельности в подготовке кадров специалистов в соответствующей области науки и, наоборот, для педагогов — результаты их научной деятельности.

5. Методы оценки эффективности результатов субъектов научной деятельности (и персональной, и коллективов) должны должным образом учитывать её инновационную составляющую.

6. При соблюдении принципов прозрачности (транспарентности) данных общего характера для «широкого» научно-образовательного сообщества в соответствии с положениями нормативно-законодательной базы РФ, механизмы Системы должны гарантировать:

• каждому ученому и педагогу конфиденциальный статус (конфиденциальность) данных персонального характера, а также информации, которая составляет оценку его личной профессиональной деятельности;

• каждой организации и органу государственного управления конфиденциальность агрегированных данных, которые не подлежат разглашению, в том числе — положениями документов локального и ведомственного уровня.

7. Механизмы и данные в Системе в первоочередном порядке должны быть ориентированы на учёт национальных особенностей, интересов и стратегических целевых установок на развитие научного и образовательного потенциала России, а также вытекающих отсюда задач каждой отдельной организации.

8. В основе методологии создания, становления, сопровождения (эксплуатации) и развития Системы должен лежать принцип, позволяющий одновременно:

• создавать математическое, алгоритмическое и программное обеспечение отдельных функционально замкнутых, новых компонентов и блоков Системы;

• обеспечивать доведение вновь вводимых компонентов и блоков Системы до состояния их функциональной самодостаточности и востребованности на практике;

• сопровождать Систему в процессе решения практических задач, на основе анализа результатов эксплуатации обеспечивать ее модернизацию (рефакторинг, реинжиниринг) без потери уже присутствующих функциональных возможностей.

С учётом изложенных выше принципов в качестве базовых требований к способам, которые должны использоваться в механизмах ввода и верификации, рассматриваются следующие далее.

• Авторы вводимых в Систему результатов деятельности могут и должны участвовать в процессах ввода и верификации данных (ввод «снизу-вверх»).

• Во избежание появления дополнительных сложностей верификации (ошибки при вводе, дубликаты и т.п.) данные о каждом отдельном результате деятельности достаточно ввести один раз («однократный ввод»).

• В процессах верификации должны активно использоваться данные, полученные «сверху вниз» из заслуживающих доверия хранилищ данных (каталогов, баз данных и т.п.).

• Подсистема должна позволять вводить результаты как научно-технической, опытно-конструкторской, инновационно-технологической, так и деятельности по подготовке высококвалифицированных кадров для соответствующей области знания.

Требования к процессам взаимодействия пользователя с Системой, к моделям и программному интерфейсу на этапе ввода и верификации данных

• Модель и реализующий её интерес интерфейс должен позволять в визуально понятной пользователю форме вводить информацию о результате.

• Связанные с результатом пользователи (соавторы) должны иметь возможность автоматически получить, проверить и скорректировать введённую информацию.

• Ответственные за сопровождение информации в Системе по месту работы автора или соавторов при проверке правильности введённых данных и перед подтверждением этих данных с их стороны должны иметь возможность скорректировать информацию о результате самостоятельно или попросить сделать это автора.

• При добавлении результата деятельности в Систему должна проводиться проверка на его отсутствие в Системе.

• Если структура информации о результате деятельности предусматривает связь с другими объектами Системы, то интерфейсные механизмы должны предоставить возможность определить, существуют ли в Системе такие объекты.

• При наличии технической возможности интерфейс должен позволять загрузить данные для формы из внешних систем по заданному идентификатору результата в этих системах. Это, однако, не отменяет необходимости проверки на дубликаты и сопоставления авторов.

• Программный интерфейс должен быть непротиворечив с позиции тезауруса (основных определений), принятого в Системе на этапе её проектирования.

• Программные механизмы, реализующие процессы ввода и верификации данных, должны препятствовать деструктивным и нерегламентированным воздействиям на данные со стороны лиц, не имеющих на это полномочий.

Модели проблемной области.

Модель результата научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности.

Модель информации о результате научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности в общем виде может быть представлена следующим образом:

• сведения об авторах результата (ФИО, контактные данные, аффилиации);

• связи результата с другими сущностями (гранты, диссертации, использование оборудования и т.п.);

• выходные данные результата;

• содержательное описание результата (название, аннотации, ключевые слова, полный текст и др.);

• вторичные аналитические данные о результате, которые появились после того, как результат был зарегистрирован (показатели цитируемости, доля некорректных заимствований, иные аналитические данные).

Источники информации об атрибутах, характеризующих различные виды результатов деятельности

Для каждого вида результатов деятельности можно выделить несколько основных источников информации об атрибутах, которые их сопровождают (характеризуют).

Результаты, как правило, регистрируются в изданиях (публикации), базах данных (патенты, авторские свидетельства) или официальных документах (чтение учебных курсов отражается в учебном плане). В таких источниках фиксируются основные сведения о результате (обычно в текстовом виде), а также ему может быть присвоен регистрационный номер. Такого типа источники могут использоваться при проверке корректности сведений, в первую очередь, о выходных данных.

Для некоторых видов результатов могут существовать дополнительные источники данных, которые могут быть получены путём обработки первичных данных о результате. Примером такого источника может являться библиометрическая индексирующая система, которая получает данные непосредственно от издательств, индексирует их и производит новую информацию – импакт-факторы журналов, данные о цитированиях публикаций и другие. В качестве другого примера источника данных пост-обработки результатов можно выделить систему поиска некорректных заимствований «Антиплагиат» и её аналоги.

Для описанных выше типов источников могут быть доступны программные механизмы для поиска и проверки данных. Если есть подобный API и имеется доступ к этому интерфейсу, то возможна автоматическая проверка данных. Если такого интерфейса нет, то возможна ручная проверка (проверка по документам, проверка по официальному сайту источника).

Второй тип источника сведений о результате – его авторы, которые непосредственно принимали участие в получении результата и осуществлять проверку связей этого результата с профилями его соавторов. В большинстве случаев авторы также принимают участие в процессе верификации во время ввода, которая отмечалась выше.

Третьим типом источника может служить сама организация или структурное подразделение этой организации в лице уполномоченного представителя, являющегося пользователем системы, который сможет проверить, насколько полученный результат соотносится с исследованиями подразделения или проверить наличие в статье указанной аффилиации автора с организацией. Кроме того, таким уполномоченным пользователям могут быть доступны сведения о данных всей организации или подразделения, и они могут проводить дополнительные проверки и корректировку данных с представлением об общей картине деятельности. К этому типу источника также могут относиться внутренние информационные системы и базы данных организации, например, система учёта кадров.

Каждый из обозначенных выше типов источников обладает уникальной информацией о результате, которой нет у остальных, или они не являются её первоисточником.

Ввод информации о результате и первичная верификация.

Ввод информации о результате предполагает использование данных из источников и может быть реализован с разной степенью автоматизации, в зависимости от возможностей конкретных источников.

1. Ввод/выгрузка первичных данных.

Этот этап предполагает ввод информации без создания связей с другими объектами системы (Фиг. 1, поз.1.1-1.4). Первичные данные подвергаются автоматическому разбору цепочкой парсеров, которые запускаются последовательно до тех пор, пока один из них не получит разобранные данные или ни один из парсеров не сможет завершить разбор. Основные поддерживаемые парсерами форматы: DOI, JSON, XML, HTML, BibTeX, библиографические ссылки.

1. Если задан идентификатор DOI, то производится запрос к API официального регистратора DOI Crossref. Результатом запроса являются мета-данные результата в формате JSON, которые содержат информацию, полученную от регистрирующего источника, например, издательства.

2. Библиометрические и библиографические информационные системы, как правило, позволяют экспортировать данные в различных форматах. Стандартным форматом библиографических данных является BibTeX и MODS XML, для работы с которыми существует набор утилити bibutils. Эти утилиты позволяют переводить библиографические данные между этими и другими форматами библиометрических данных (RIS, EndNote, Pubmed XML, ISI, Word и др). С помощью bibutils данные переводятся в формат MODS XML, а затем разбираются парсером.

3. Если первичные данные передаются в виде библиографической ссылки, то они автоматически разбираются с использованием сервиса FreeCite. Этот сервис позволяет проводить дообучение алгоритма разбора по результатам пользовательской оценки.

Описанный подход является модульным и позволяет разрабатывать и подключать дополнительные модули загрузки и обработки первичных данных о результатах. Предусмотрен также программный интерфейс для автоматизации процедуры ручного заполнения автором формы с первичными данными.

2. Проверка существования дубликатов.

По заданным первичным данным производится автоматический нечёткий поиск дубликатов (Фиг. 1, поз. 1.5-1.6). Нечеткий поиск — это поиск информации, при котором выполняется сопоставление информации заданному образцу поиска или близкому к этому образцу значению. В случае нахождения дубликатов добавления результата в Систему не производится. В зависимости от типа результата могут использоваться различные алгоритмы поиска дубликатов. За основу может быть использован следующий алгоритм. Если среди атрибутов результата есть его уникальные идентификаторы (DOI или идентификатор во внешней системе), то в первую очередь производится проверка на существование дубликатов с этими же идентификаторами. Дальнейший поиск дубликатов реализуется с помощью нечёткого поиска по таким атрибутам, как название результата, название источника, имена авторов и т.д.

3. Автоматическое сопоставление авторов с пользователями.

На данном этапе информация об авторах предоставляется в текстовом виде и необходимо произвести сопоставление авторов результата с существующими авторами в Системе, часть из которых может являться пользователями. В силу того, что первичная информация может содержать различные вариации имён, инициалов, а также в силу наличия однофамильцев, необходимо учитывать предыдущие совместные упоминания авторов. Информация об авторах передаётся для разбора сервису, основанному на разработанном авторами алгоритме разрешения неоднозначностей в сопоставлении авторов по графу соавторств. Алгоритм заключается в том, что каждому автору нового результата можно сопоставить некоторый набор существующих авторов в Системе на основе текстовой близости между их именами и именами авторов добавляемого результата. Функция текстовой близости может учитывать варианты транслитерации, опечатки, сокращенные или опущенные части имени, а также другие модификации. Оптимальным решением является такой набор авторов, на котором достигается максимальное значение функции качества. Результатом работы алгоритма являются наборы сопоставлений имён авторов и идентификаторов существующих авторов в Системе (Фиг. 1, поз. 1.7).

4. Аффилиации результата с другими объектами в Системе.

Под данным признаком понимается установление связей между объектами. Кроме авторов результат может быть связан с другими объектами Системы, например, журналами, сборниками статей или конференциями. По представленной в первичных данных текстовой информации нужно найти подходящие объекты соответствующего типа (Фиг. 1, поз. 1.8). Если объект найден в Системе, то производится сопоставление, если объект не найден, то создаётся новый объект. В некоторых случаях автоматическое создание нового объекта нежелательно, тогда вместо создания объекта будет открываться заявка на добавление такого объекта в Систему. Подобные заявки могут рассматриваться администраторами Системы. Например, существует объект типа «журнал», при вводе статьи производится поиск журналов по выходным данным, если объект типа «журнал» с такими же выходными данными (ISSN, название) найден, то устанавливается связь с ним. Если не найден, то открывается заявка на добавление журнала с такими выходными данными, которую рассматривают администраторы Системы.

5. Сохранение результата и оповещение пользователей.

Создаётся новый объект в Системе, соответствующий добавляемому результату (Фиг. 1, поз. 1.9). Авторам результата, которые зарегистрированы в Системе, а также ответственным за сопровождение информации в системе по месту работы всех авторов, отправляется уведомление о том, что добавлен новый результат (Фиг. 1, поз. 1.10). При возникновении некорректных привязок или иных ошибок авторы и их ответственные могут вносить исправления или заявлять об отказе от авторства.

Последующие этапы многоуровневой верификации.

Верификация соавторами.

Все соавторы, а также ответственные за сопровождение данных пользователи по подразделениям, в которых работают авторы, имеют возможность корректировать данные о результате (Фиг. 2, поз. 2.4), а также указывать дополнительные данные о публикации, такие как аффилиации авторов с организациями, аффилиации публикации с другими результатами (проектами, диссертациями и другими). Если привязка результата к автору была произведена ошибочно, то соответствующий этому автору пользователь может отказаться от авторства, и публикация не будет отображаться в его профиле.

Верификация во внешних источниках.

Верификацию данных может производиться автоматически с использованием внешних информационных ресурсов. Принимая во внимание то обстоятельство, что в библиометрических системах результаты могут быть проиндексированы с некоторой задержкой после их публикации, целесообразно периодически проводить проверку на индексирование этих результатов (Фиг. 2, поз. 2.5).

Для результатов такого типа, как публикация, поисковые механизмы этих систем позволяют формировать запросы в виде различных наборов выходных данных: название публикации; имена авторов; номера страниц; год выхода публикации; DOI; название журнала; ISSN журнала; номер выпуска и т.п. Поскольку в сведениях могут быть ошибки или различия в написании спецсимволов (публикации по математике или химии), то представляется целесообразным осуществлять поиск не только по полному набору имеющихся данных о публикации, но также и по подмножествам этого набора. Точность поиска при уменьшении подмножества снижается, поэтому запросы упорядочены по степени "надёжности" такого подмножества. Подмножества, по которым невозможно однозначно определить публикацию, например, год и номера страниц, не используются. Если поисковому механизму удалось найти статью во внешней системе, то осуществляется её "привязка": сохраняется идентификатор этой статьи в той системе, где она была найдена. Следует отметить, что подобный принцип поиска является универсальным и может применяться к другим типам результатов в случае наличия соответствующих поисковых механизмов и доступа к ним.

Для тех публикаций, которым удалось создать «привязки», периодически производится обновление числа цитирований по тем показателям, которые рассчитываются библиометрическими системами. Если статья проиндексирована и в Web of Science, и в Scopus, то у неё появляется два показателя: число цитирований по данным Web of Science; число цитирований по данным Scopus.

В зависимости от функциональных возможностей API внешних систем и ограничений подписки организаций к этим системам, возможна реализация дополнительных верификационных механизмов. Примером такого механизма может служить загрузка аффилиаций авторов с организациями. Для корректного учёта опубликованных организацией статей важно, чтобы в каждой статье были корректно указаны аффилиации авторов с этой организацией, поскольку эти публикации выполнены в рамках работы автора в этой организации. Эта информация предоставляется самими авторами во время подготовки публикации, а затем передаётся в издательство.

Модель и программные механизмы верификации ответственными.

Важной частью верификации результатов деятельности является механизм их верификации Системы на разных административно-организационных уровнях. Такая верификация является многоуровневой и предполагает, что результаты сначала проверяются ответственными по подразделениям нижнего уровня (кафедры, лаборатории; см. Фиг. 2, поз. 2.6), а затем проверяются ответственными по подразделениям верхнего уровня (факультеты, институты, центры; см. Фиг. 2, поз. 2.7) или по организации в целом. Ответственные на нижнем уровне имеют представление о том, какая деятельность ведётся в их подразделениях и могут подтвердить данные о результате, направить результат на исправление информации авторам, или отклонить результат с пометкой, что он не относится к деятельности подразделения.

Ответственные на верхнем уровне получают данные о результатах работников со всех подразделений нижнего уровня, поэтому они должны иметь возможность проверять, подтверждён ли результат ответственным или отклонён.

Для подсчёта рейтинговых оценок могут использоваться различные варианты учёта подтверждённых результатов. В зависимости от конкретных задач оценки в расчёт могут попасть те результаты, которые не были отклонены ответственными («чёрный список»), или же только те результаты, которые были подтверждены ответственными («белый список»).

Если авторы результата работают в нескольких структурных подразделениях, то такая проверка производится по всем этим подразделениям.

На Фиг. 1 представлена блок-схема, реализующая бизнес-процессы ввода и верификации сведений о результатах научно-технической, опытно-конструкторской, инновационно-технологической и сопутствующих им форм деятельности, представляется в виде следующих далее блок-схем на примере научно-технической публикации, как результата деятельности.

Пользователю предлагается выбор варианта: получить (импортировать) данные о результате деятельности через файл выгрузки или через программный интерфейс внешней информационной системы (1.1). Далее осуществляется автоматическая загрузка информации о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности, через интерфейс внешнего источника (1.2). Автоматически заполняется форма ввода информации с использованием полученных данных путём их разбора (парсинга) (1.3). Осуществляется процесс заполнения пользователем формы ввода (1.4). Далее осуществляется автоматический поиск дубликатов вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности (1.5). Далее осуществляется проверка, есть ли дубликаты у вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности (1.6). После чего осуществляется автоматическое определение сопоставлений авторов (1.7). Далее происходит автоматическое установление связей (аффилиаций) с другими информационными объектами в системе (1.8). На следующем этапе осуществляется добавление результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности в информационно-аналитическую систему (1.9). После чего, осуществляется запуск процесса оповещения соавторов введенных данных и ответственных за сопровождение информации в информационно-аналитической системе по месту работы всех авторов о том, что добавлены новые результаты научно-технической, опытно-конструкторской и инновационно-технологической деятельности (1.10).

На Фиг. 2 представлена блок-схема, представляющая модель многоуровневой верификации данных о результатах научно-технической, опытно-конструкторской инновационно-технологической и деятельности по подготовке кадров специалистов.

На первом этапе осуществляется автоматический поиск сопоставлений авторов результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности. Далее осуществляется проверка корректности результатов сопоставлений (2.1). После чего, осуществляется автоматический поиск дубликатов вводимых результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности в информационно-аналитическую систему (2.2). Устанавливаются связи (аффилиации) вводимых результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с другими информационными объектами в информационно-аналитической системе (2.3). Далее осуществляется оповещение соавторов и ответственных за сопровождение информации в информационно-аналитической системе о том, что добавлены новые результаты научно-технической, опытно-конструкторской и инновационно-технологической деятельности (2.4). На следующем этапе осуществляется автоматический поиск результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности во внешних информационных системах и базах данных (2.5). После чего, осуществляется подтверждение результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности ответственными за сопровождение информации в информационно-аналитической системе, начиная с уровня структурных подразделений, заканчивая уровнем организации (2.6, 2.7).

На Фиг. 3 далее будет представлена общая схема вычислительного устройства (300), обеспечивающего обработку данных, необходимую для реализации заявленного решения.

В общем случае устройство (300) содержит такие компоненты, как: один или более процессоров (301), по меньшей мере одну память (302), средство хранения данных (303), интерфейсы ввода/вывода (304), средство В/В (305), средства сетевого взаимодействия (306).

Процессор (301) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (300) или функциональности одного или более его компонентов. Процессор (301) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (302).

Память (302), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.

Средство хранения данных (303) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blu-Ray дисков) и т.п. Средство (303) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.

Интерфейсы (304) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.

Выбор интерфейсов (304) зависит от конкретного исполнения устройства (300), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.

В качестве средств В/В данных (305) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.

Средства сетевого взаимодействия (306) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (305) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.

Компоненты устройства (300) сопряжены посредством общей шины передачи данных (310).

В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

Похожие патенты RU2763458C1

название год авторы номер документа
АВТОМАТИЗИРОВАННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА АНАЛИЗА ПУБЛИКАЦИОННОЙ АКТИВНОСТИ СОТРУДНИКОВ НАУЧНО-ОБРАЗОВАТЕЛЬНОЙ ОРГАНИЗАЦИИ 2014
  • Синицын Антон Александрович
  • Никифоров Олег Юрьевич
RU2569363C1
Интегрированная система управления созданием и практической реализацией результатов научно-исследовательских, опытно-конструкторских и технологических работ 2019
  • Хурматуллин Валерий Вакильевич
  • Колесников Дмитрий Валерьевич
  • Колесников Андрей Валерьевич
RU2703678C1
СИСТЕМА И СПОСОБ ОЦЕНКИ ТЕХНОЛОГИЗАЦИИ РЕЗУЛЬТАТОВ МЕДИЦИНСКИХ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИХ ПРОЕКТОВ 2016
  • Куракова Наталия Глебовна
  • Петров Андрей Николаевич
  • Зинов Владимир Глебович
  • Цветкова Лилия Анатольевна
  • Ерёмченко Ольга Александровна
RU2633633C1
СИСТЕМА И СПОСОБ ОЦЕНКИ МЕДИЦИНСКОГО ИССЛЕДОВАНИЯ НА СООТВЕТСТВИЕ МИРОВОМУ УРОВНЮ 2016
  • Куракова Наталия Глебовна
  • Петров Андрей Николаевич
  • Зинов Владимир Глебович
  • Цветкова Лилия Анатольевна
  • Ерёмченко Ольга Александровна
RU2633929C1
АВТОМАТИЗИРОВАННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА УПРАВЛЕНИЯ И КОНТРОЛЯ РАЦИОНАЛИЗАТОРСКОЙ ДЕЯТЕЛЬНОСТИ 2018
  • Мельниченко Андрей Викторович
  • Идиатулин Сергей Александрович
  • Сережников Алексей Петрович
  • Ваннов Владислав Владимирович
RU2706177C1
Программно-аппаратный комплекс 2019
  • Архипов Дмитрий Николаевич
  • Фролов Константин Викторович
  • Павленков Роман Васильевич
  • Новожилов Михаил Геннадьевич
RU2720342C1
Автоматизированная система управления и планирования развития строительной организации 2019
  • Бирюков Александр Николаевич
  • Добрышкин Евгений Олегович
  • Бирюков Юрий Александрович
  • Бирюков Дмитрий Владимирович
  • Лебедкин Анатолий Петрович
  • Бирюков Николай Александрович
  • Рахимов Ирек Бахтиярович
RU2722002C1
Способ передачи данных с использованием штрихкодирования 2020
  • Якимович Борис Анатольевич
  • Мамрыкин Олег Владимирович
  • Кузнецов Андрей Павлович
  • Кадацкая Мария Станиславовна
  • Хисамутдинова Елена Владимировна
RU2820463C2
СИСТЕМА УПРАВЛЕНИЯ ТРУДОВЫМИ РЕСУРСАМИ ПРЕДПРИЯТИЯ - "ЦИФРОВОЙ КЛАСТЕР "ПРЕДПРИЯТИЕ - ВУЗ" 2017
  • Данилаев Дмитрий Петрович
  • Маливанов Николай Николаевич
RU2665275C1
АВТОМАТИЗИРОВАННАЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ ИНТЕРАКТИВНАЯ ОБУЧАЮЩАЯ СИСТЕМА ПОЛИПРОФЕССИОНАЛЬНОЙ ПРОЕКТНОЙ ПОДГОТОВКИ СПЕЦИАЛИСТОВ 2009
  • Павлов Борис Петрович
  • Гортышов Юрий Федорович
  • Мингалеев Газиз Фуатович
  • Салимов Радий Ильдусович
  • Мельничнов Валерий Владимирович
RU2404456C1

Иллюстрации к изобретению RU 2 763 458 C1

Реферат патента 2021 года СПОСОБ ВВОДА И МНОГОУРОВНЕВОЙ ВЕРИФИКАЦИИ ИНТЕНСИВНО ПОСТУПАЮЩИХ ДАННЫХ В БОЛЬШИХ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИХ СИСТЕМАХ НАУКОМЕТРИЧЕСКОГО СОДЕРЖАНИЯ

Изобретение относится к области информационных технологий. Техническим результатом является повышение качества предобработки вводимых данных и верификации введенных данных. Компьютерно-реализуемый способ ввода и многоуровневой верификации больших наукометрических данных в интерактивную информационно-аналитическую систему содержит этапы, на которых: выгружают первичные данные о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности; осуществляют автоматический нечёткий поиск дубликатов по заранее заданным первичным данным; осуществляют автоматизированное сопоставление авторов результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с уже существующими авторами; осуществляют аффилиацию первичных данных с существующими объектами; сохраняют первичные данные и создают новый объект в интерактивной информационно-аналитической системе; осуществляют автоматическую верификацию нового объекта. 2 з.п. ф-лы, 3 ил.

Формула изобретения RU 2 763 458 C1

1. Компьютерно-реализуемый способ ввода и многоуровневой верификации больших наукометрических данных в интерактивную информационно-аналитическую систему, содержащий этапы, на которых:

выгружают первичные данные о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности в интерактивную информационно-аналитическую систему посредством файла выгрузки с автоматическим определением формата загружаемых данных и/или посредством интерфейса внешней информационной системы;

осуществляют автоматический нечёткий поиск дубликатов вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности, с использованием заранее заданных первичных данных и данных о результатах в интерактивной информационно-аналитической системе, при этом, в случае нахождения дубликатов, добавление указанных результатов в интерактивную информационно-аналитическую систему не производится;

осуществляют автоматизированное сопоставление авторов вводимых результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с уже существующими авторами в интерактивной информационно-аналитической системе на основе результатов анализа существующих данных о совместных публикациях авторов вводимого результата;

осуществляют аффилиацию и сохранение первичных данных о вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с существующими объектами в интерактивной информационно-аналитической системе, при этом под объектами в интерактивной информационно-аналитической системе понимаются данные о журналах, сборниках статей или конференций;

сохраняют первичные данные и создают новый объект в интерактивной информационно-аналитической системе;

в автоматическом режиме верифицируют информацию о результате научно-технической, опытно-конструкторской и инновационно-технологической деятельности путем автоматизированного поиска во внешних информационных ресурсах с сохранением идентификаторов найденных результатов и дальнейшего периодического обновления данных о результате, включая связанные с ним библиометрические показатели.

2. Способ по п.1, в котором в автоматизированном режиме загружают библиометрическую и иную справочную информацию посредством файла выгрузки и/или посредством интерфейса внешней информационной системы.

3. Способ по п.1, в котором в автоматическом режиме отправляют уведомления о добавлении нового результата научно-технической, опытно-конструкторской и инновационно-технологической деятельности пользователей интерактивной информационно-аналитической системы, являющихся авторами этого результата.

Документы, цитированные в отчете о поиске Патент 2021 года RU2763458C1

Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
Токарный резец 1924
  • Г. Клопшток
SU2016A1
Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1
АВТОМАТИЗИРОВАННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА АНАЛИЗА ПУБЛИКАЦИОННОЙ АКТИВНОСТИ СОТРУДНИКОВ НАУЧНО-ОБРАЗОВАТЕЛЬНОЙ ОРГАНИЗАЦИИ 2014
  • Синицын Антон Александрович
  • Никифоров Олег Юрьевич
RU2569363C1
Насадок для измерения температуры заторможенного потока воздуха 1959
  • Керстен И.О.
SU133637A1

RU 2 763 458 C1

Авторы

Васенин Валерий Александрович

Афонин Сергей Александрович

Гаспарянц Артем Эдуардович

Зензинов Андрей Александрович

Даты

2021-12-29Публикация

2020-12-07Подача