СПОСОБ ТЕКСТОГЕНЕРАЦИИ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ Российский патент 2024 года по МПК G06N3/02 G06F40/00 

Описание патента на изобретение RU2821835C1

Изобретение относится к нейросетевым вычислительным системам, в частности к системам и способам распознавания смысла текста и текстогенерации, в автоматическом режиме с использованием технологий искусственного интеллекта.

Из уровня техники, патент US 10510000, известно интеллектуальное управление с помощью иерархических многослойных нейронных сетей. Заявленное решение раскрывает технологию использования иерархических многоуровневой нейронной сети, состоящей из связанных отдельных нейронных сетей, предназначенных для фильтрации спама. Каждая нейронная сеть в иерархической сети реализует логику обработки, использующую индивидуальные архитектуры, алгоритмы и методы обучения для анализа грамматических структур и семантического содержания текста сообщений. Заявленное решение направлено на повышение качества текстопонимания за счет использования нескольких моделей нейронных сетей и обучающих выборок.

Но данный способ не позволяет изменять набор и возможности нейронных сетей, входящих в иерархическую интеллектуальную систему, путем дообучения, переобучения или изменения модели нейронных сетей.

Самым близким по своей технической сущности является гибридизация архитектуры интеллектуальных решений для понимания текста и генерации текста известная из уровня техники, «Специальный выпуск тезисов по результатам конференции «14-й Международной конференции по интеллектуальным системам» опубликовано 02.06.2021 г. в сети интернет по адресу https://www.mdpi.com/2076-3417/11/11/5179. Данный источник раскрывает технологию текстопонимания и текстогенерации на основе машинного обучения (см. реферат) в котором: создание экспаундеров (управляющих компонентов), предназначенных для распознавания семантического содержания отдельных фрагментов текста анализируемого документа, входящего в цифровой контент, каждый из которых может инициировать вовлечение других экспаундеров для обеспечения наилучшей точности (см. главу 3); использование нескольких отдельных моделей нейронных сетей, каждая из которых обучается на своем индивидуальном наборе данных, для распознавания отдельного текстового элемента (юнита) (см. главу 3); комбинирование необходимого набора нейронных моделей в конвейер, содержащийся в экспаундере, для решения задачи распознавания (см. главу 3); формирование экспаундером нескольких возможных вариантов распознанных отдельных текстовых элементов, причем если экспаундер не содержит в себе нейронной сети для распознавания какого-либо текстового элемента, то создает запрос на создание новой нейронной сети с другими обучающими данными, полученными от другого экспаундера (рис. 1), на которую в случае ее добавления в конвейер, делегирует выполнение запроса по распознаванию (см. главу 3); выбор наиболее подходящего варианта из распознанных отдельных текстовых элементов, удовлетворяющего заданным критериям (см. главу 5); формирование нового текстового документа на основе выбранных распознанных элементов текста с учетом заданного шаблона, устанавливающего стиль оформления (см. главы 3-4).

Но данный способ не позволяет реализовать параметризацию экспаундера нейронной сетью для динамического расширения функциональных возможностей системы текстопонимания в случае распознавания специфических текстовых документов или их фрагментов, без перестройки и/или переобучения всей системы.

Техническим результатом заявленного изобретения является повышение точности текстопонимания в режиме реального времени и скорости генерации целевого текстового документа за счет реализации многопоточной среды параллельных вычислений.

Заявленный технический результат достигается за счет того, что способ текстогенерации на основе машинного обучения, включающий: создание экспаундеров, предназначенных для распознавания семантического содержания отдельных фрагментов текста анализируемого документа, входящего в цифровой контент, каждый из которых может инициировать вовлечение других экспаундеров для обеспечения наилучшей точности, использование нескольких отдельных моделей нейронных сетей, каждая из которых обучается на своем индивидуальном наборе данных, для распознавания отдельного текстового элемента, комбинирование необходимого набора нейронных моделей в конвейер, содержащийся в экспаундере, для решения задачи распознавания, формирование экспаундером нескольких возможных вариантов распознанных отдельных текстовых элементов, причем если экспаундер не содержит в себе нейронной сети для распознавания какого-либо текстового элемента, то создает запрос на создание новой нейронной сети с другими обучающими данными, полученными от другого экспаундера, на которую в случае ее добавления в конвейер, делегирует выполнение запроса по распознаванию, выбор наиболее подходящего варианта из распознанных отдельных текстовых элементов, удовлетворяющего заданным критериям, формирование нового текстового документа на основе выбранных распознанных элементов текста с учетом заданного шаблона, устанавливающего стиль оформления и при этом этап комбинирования необходимого набора нейронных моделей в конвейер осуществляют путем параметризации существующих экспаундеров новыми нейронными сетями и обучающими наборами данных для формирования экспаундером нескольких решений для каждой задачи распознавания отдельных текстовых элементов, где решения представляют собой необходимые нейронные сети и наборы обучающих данных, при этом с помощью экспаундера в режиме реального времени выполняют динамическое комбинирование новых нейронных сетей и наборов обучающих данных, и последующие решения задач распознавания текстовых документов или их фрагментов в параллельных потоках в многопоточной среде. Способ текстопонимания и текстогенерации на основе машинного обучения включающий экспаундер, конвейер и агрегатор, инкапсулирующих различные модели нейронных сетей и обучающие выборки для их динамической комбинации в процессе текстопонимания, данные элементы предназначены для реализации с помощью шаблонов классов объектно-ориентированного программного обеспечения нейросетевой вычислительной системы текстопонимания. Заявленный способ текстопонимания и текстогенерации (фиг.1), содержащей в качестве основного элемента экспаундер, создаваемый в параллельных потоках распорядителем для решения задач распознавания отдельных текстовых элементов (юнитов), входящих в документ или его фрагмент, отличающийся возможностью адаптивного комбинирования для каждой задачи нескольких решений в многопоточной среде, для чего, в отличие от известных вариантов взаимодействия экспаундеров для компоновки конвейера набором нейронных сетей: «переход», «трансверсия», «вставка» и «удаление» предложен новый вариант взаимодействия «параметризация» разными моделями нейронной сети и наборами данных обучающих выборок. Данное решение отличается от аналогов возможностью функционирования в режиме реального времени за счет реализации многопоточной среды параллельных вычислений. Существующие программные системы нейросетевого текстопонимания требуют дообучения или переобучения с учетом специфики документов с целью адаптации имеющихся алгоритмов для работы на новых наборах данных. Параметризация экспаундера нейронной сетью позволяет динамически расширять функциональные возможности системы текстопонимания реализацией новых алгоритмов, настроенных на распознавание специфических текстовых документов или их фрагментов, без перестройки и/или переобучения всей системы за счет параметризации существующих экспаундеров новыми нейронными сетями или обучающими наборами данных. Экспаундер представляет собой компонент, реализующий работу, связанную с обработкой документа в рамках текстопонимания. Реализация экспаундера содержит очередь элементов, доступных для обработки данным экспаундером конвейер. Элементы конвейера представляют собой рабочие единицы, для обработки которых создаются решения с необходимым набором нейронной сети, набора данных и команд, которые нужно выполнить. Работа в рамках задачи текстогенерации выполняется Агрегатором. Агрегатор представляет собой компонент, реализующий создание новых документов на основе существующих. Документ можно создать следующими способами:

- на основе документа, имеющегося в системе. Тогда к новому документу будут применены те же правила, что и к имеющемуся;

- на основе выбранного шаблона. В новый документ могут агрегироваться разделы и стили из разных шаблонов.

Конвейер вызывает у экспаундера оператор получения описания заданного документа. Поскольку экспаундер является асинхронными, то получение запросов приостанавливается до возобновления, и экспаундер создает решение для обработки полученного документа. Созданное решение устанавливает статус обработки и выбирает подходящую команду из списка команд, после чего осуществляется выбор инструмента для выполнения команды. Решение запускает выполнение обработки и с некоторой периодичностью устанавливает и получает статус выполнения. После получения индикатора успешности выполнения решения конвейер получает результат и запускает работу следующего экспаундера. Диаграмма последовательности, отображающая данный процесс, представлена на фигуре 2. В случае, когда экспаундер имеет несколько возможных комбинаций для решения полученного запроса, то он создает несколько решений. Так, получив несколько вариантов решения, экспаундер осуществляет выбор наиболее подходящего. Экспаундер заведомо может не обладать инструментами решения полученного запроса или же в результате выполнения решений будут получены некорректные решения. В этом случае экспаундер создает запрос распорядителю на создание нового экспаундера. Распорядитель создает части экспаундера с необходимыми свойствами и возвращает новый экспаундер, после чего не справившийся экспаундер делегирует выполнение запроса новому экспаундеру.

Заявленное техническое решение отличается от аналогов возможностью функционирования в режиме реального времени за счет реализации многопоточной среды параллельных вычислений.

Элементы устройства предназначены для реализации с помощью шаблонов классов объектно-ориентированного программного обеспечения нейросетевой вычислительной системы текстопонимания.

Предлагаемые компоненты: Экспаундер и Агрегатор.

Заявленное изобретение содержит следующие пакеты (фиг. 4):

1) «Распознавание изображений» - пакет, содержащий классы для обработки изображений и распознавания текста.

2) «Описание документа» пакет, содержащий классы для описания структуры документов.

3) «Генерация документа» - пакет, содержащий классы для текстогенерации.

4) «Интерпретация документа» пакет, содержащий классы для текстопонимания.

5) «Библиотека ИИ» - пакет, содержащий классы для описания нейронных сетей.

Для описания физического представления разработана диаграмма компонентов (фиг. 5), которая содержит следующие компоненты:

1) «Распознавание изображений» - компонент, объединяющий элементы, предназначенные для распознавания документов, представленных в форматах, отличных от текстовых и извлечения из них текста. Компонент реализует следующие интерфейсы: «Интерфейс распознавания», «Интерфейс изображения». «Интерфейс распознавания» определяет функционал для распознавания изображений. «Интерфейс изображения» определяет функционал для предобработки изображений.

2) «Интерпретация документа» компонент, объединяющий элементы, предназначенные для текстопонимания, в частности для разметки распознанных документов. Компонент реализует следующие интерфейсы: «Интерфейс коллекции экспаундеров», «Интерфейс очереди экспаундеров», «Интерфейс конвейера элементов экспаундера», «Интерфейс команд экспаундера», «Интерфейс экспаундера». «Интерфейс экспаундера» определяет функционал для работы с извлечением и анализом текста.

«Интерфейс коллекции экспаундеров» определяет функционал для работы с коллекциями.

«Интерфейс очереди экспаундеров» - определяет функционал для работы с очередью.

«Интерфейс конвейера элементов экспаундера» - определяет функционал для работы с элементами конвейера.

«Интерфейс команд экспаундера» определяет функционал для работы с командами. Интерфейсы «Интерфейс ИИ» и «Интерфейс тренировочного датасета» реализуются компонентом «Библиотека ИИ», который используется компонентом «Интерпретация документа».

3) «Библиотека ИИ» - компонент, объединяющий элементы, предназначенные для работы с нейронными сетями. Компонент реализует следующие интерфейсы: «Интерфейс ИИ», «Интерфейс тренировочного датасета».

«Интерфейс ИИ» определяет функционал для работы с нейронными сетями в контексте различных задач.

«Интерфейс тренировочного датасета» определяет функционал для работы с наборами данных.

4) «Генерация документа» компонент, объединяющий элементы, предназначенные для генерирования документов. Компонент реализует следующие интерфейсы: «Интерфейс генератора элементов конвейера», «Интерфейс генератора очереди», «Интерфейс генератора команд», «Интерфейс генератора коллекций», «Интерфейс генератора».

«Интерфейс генератора элементов конвейера» определяет функционал для работы с элементами конвейера.

«Интерфейс генератора очереди» определяет функционал для работы с очередью.

«Интерфейс генератора команд» определяет функционал для работы с командами.

«Интерфейс генератора коллекций» определяет функционал для работы с коллекциями.

«Интерфейс генератора» определяет функционал для генерирования документов.

Интерфейсы «Интерфейс ИИ» и «Интерфейс тренировочного датасета» реализуются компонентом «Библиотека ИИ», который используется компонентом «Генерация документа».

5) «Описание документа» компонент, объединяющий элементы, предназначенные для описания документов.

Описание компонента текстогенерации (на фиг. 6) представлено набором классов, рассмотренных далее.

Способ текстогенерации на основе машинного обучения осуществляется следующим образом. Задача на генерацию документа отправляет запрос агрегатору на генерацию документа на базе шаблонов. Агрегатор создает запрос на добавление раздела документа из заданного шаблона, получает нужный раздел, устанавливает требуемый стиль оформления. При необходимости подключается модуль изменения текста. Затем выполненные изменения сохраняются в новом документе. Суть технического решения поясняется диаграммами, где на фигуре 1 изображена нейросетовая вычислительная система текстопонимания, реализующая способ текстопонимания и текстогенерации на основе машинного обучения, на фигуре 2 изображена диаграмма последовательности процесса текстопонимания, на фигуре 3 изображена диаграмма последовательности, отображающая данный процесс. На фигуре 4 изображена диаграмма пакетов заявленного изобретения, на фигуре 5 изображена диаграмма компонентов, а на фигуре 6 диаграмма классов для компонента текстогенерации.

Похожие патенты RU2821835C1

название год авторы номер документа
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТА НА ИЗОБРАЖЕНИЯХ ДОКУМЕНТОВ 2021
  • Гордеев Дмитрий Владимирович
  • Кондратьев Кирилл Андреевич
  • Островский Константин Игоревич
RU2768544C1
ОБНАРУЖЕНИЕ ТЕКСТОВЫХ ПОЛЕЙ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ 2018
  • Зуев Константин Алексеевич
  • Сенкевич Олег Евгеньевич
  • Голубев Сергей Владимирович
RU2699687C1
ИДЕНТИФИКАЦИЯ ПОЛЕЙ И ТАБЛИЦ В ДОКУМЕНТАХ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ С ИСПОЛЬЗОВАНИЕМ ГЛОБАЛЬНОГО КОНТЕКСТА ДОКУМЕНТА 2019
  • Семенов Станислав Владимирович
RU2723293C1
СПОСОБ И СИСТЕМА ПОИСКА ГРАФИЧЕСКИХ ИЗОБРАЖЕНИЙ 2022
  • Шульга Сергей Александрович
RU2807639C1
ДЕТЕКТИРОВАНИЕ РАЗДЕЛОВ ТАБЛИЦ В ДОКУМЕНТАХ НЕЙРОННЫМИ СЕТЯМИ С ИСПОЛЬЗОВАНИЕМ ГЛОБАЛЬНОГО КОНТЕКСТА ДОКУМЕНТА 2019
  • Семенов Станислав Владимирович
RU2721189C1
Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта 2017
  • Дрокин Иван Сергеевич
  • Бухвалов Олег Леонидович
  • Сорокин Сергей Юрьевич
RU2720363C2
СИСТЕМА РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЯ: BEORG SMART VISION 2020
  • Зуев Георгий Алексеевич
  • Колосов Антон Александрович
RU2777354C2
СПОСОБ УПРАВЛЕНИЯ ДИАЛОГОМ И СИСТЕМА ПОНИМАНИЯ ЕСТЕСТВЕННОГО ЯЗЫКА В ПЛАТФОРМЕ ВИРТУАЛЬНЫХ АССИСТЕНТОВ 2020
  • Ашманов Станислав Игоревич
  • Сухачев Павел Сергеевич
  • Зоркий Федор Кириллович
RU2759090C1
МАШИННОЕ ОБУЧЕНИЕ 2005
  • Уилльямс Дэвид Р.
  • Хилл Джеффри
RU2391791C2
РАСПОЗНАВАНИЕ СОБЫТИЙ НА ФОТОГРАФИЯХ С АВТОМАТИЧЕСКИМ ВЫДЕЛЕНИЕМ АЛЬБОМОВ 2020
  • Савченко Андрей Владимирович
RU2742602C1

Иллюстрации к изобретению RU 2 821 835 C1

Реферат патента 2024 года СПОСОБ ТЕКСТОГЕНЕРАЦИИ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ

Изобретение относится к способу текстогенерации на основе машинного обучения. Технический результат заключается в повышении скорости генерации целевого текстового документа за счет реализации многопоточной среды параллельных вычислений. Способ включает в себя создание экспаундеров, предназначенных для распознавания семантического содержания отдельных фрагментов текста анализируемого документа, входящего в цифровой контент, каждый из которых может инициировать вовлечение других экспаундеров для обеспечения наилучшей точности, использование нескольких отдельных моделей нейронных сетей, каждая из которых обучается на своем индивидуальном наборе данных, для распознавания отдельного текстового элемента, комбинирование необходимого набора нейронных моделей в конвейер, содержащийся в экспаундере, для решения задачи распознавания, формирование экспаундером нескольких возможных вариантов распознанных отдельных текстовых элементов, причем если экспаундер не содержит в себе нейронной сети для распознавания какого-либо текстового элемента, то создает запрос на создание новой нейронной сети с другими обучающими данными, полученными от другого экспаундера, на которую в случае ее добавления в конвейер делегирует выполнение запроса по распознаванию, выбор наиболее подходящего варианта из распознанных отдельных текстовых элементов, удовлетворяющего заданным критериям, формирование нового текстового документа на основе выбранных распознанных элементов текста с учетом заданного шаблона, устанавливающего стиль оформления, при этом этап комбинирования необходимого набора нейронных моделей в конвейер осуществляют путем параметризации существующих экспаундеров новыми нейронными сетями и обучающими наборами данных для формирования экспаундером нескольких решений для каждой задачи распознавания отдельных текстовых элементов, где решения представляют собой необходимые нейронные сети и наборы обучающих данных, при этом с помощью экспаундера в режиме реального времени выполняют динамическое комбинирование новых нейронных сетей и наборов обучающих данных и последующие решения задач распознавания текстовых документов или их фрагментов в параллельных потоках в многопоточной среде. 6 ил., 2 табл.

Формула изобретения RU 2 821 835 C1

Способ текстогенерации на основе машинного обучения, включающий создание экспаундеров, предназначенных для распознавания семантического содержания отдельных фрагментов текста анализируемого документа, входящего в цифровой контент, каждый из которых может инициировать вовлечение других экспаундеров для обеспечения наилучшей точности, использование нескольких отдельных моделей нейронных сетей, каждая из которых обучается на своем индивидуальном наборе данных, для распознавания отдельного текстового элемента, комбинирование необходимого набора нейронных моделей в конвейер, содержащийся в экспаундере, для решения задачи распознавания, формирование экспаундером нескольких возможных вариантов распознанных отдельных текстовых элементов, причем если экспаундер не содержит в себе нейронной сети для распознавания какого-либо текстового элемента, то создает запрос на создание новой нейронной сети с другими обучающими данными, полученными от другого экспаундера, на которую в случае ее добавления в конвейер делегирует выполнение запроса по распознаванию, выбор наиболее подходящего варианта из распознанных отдельных текстовых элементов, удовлетворяющего заданным критериям, формирование нового текстового документа на основе выбранных распознанных элементов текста с учетом заданного шаблона, устанавливающего стиль оформления, и отличающийся тем, что этап комбинирования необходимого набора нейронных моделей в конвейер осуществляют путем параметризации существующих экспаундеров новыми нейронными сетями и обучающими наборами данных для формирования экспаундером нескольких решений для каждой задачи распознавания отдельных текстовых элементов, где решения представляют собой необходимые нейронные сети и наборы обучающих данных, при этом с помощью экспаундера в режиме реального времени выполняют динамическое комбинирование новых нейронных сетей и наборов обучающих данных и последующие решения задач распознавания текстовых документов или их фрагментов в параллельных потоках в многопоточной среде.

Документы, цитированные в отчете о поиске Патент 2024 года RU2821835C1

ANTON IVASCHENKO et al., "Hybridization of Intelligent Solutions Architecture for Text Understanding and Text Generation", 02.06.2021, URL: https://www.mdpi.com/2076-3417/11/11/5179
РАСПОЗНАВАНИЕ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 2017
  • Орлов Никита Константинович
  • Рыбкин Владимир Юрьевич
  • Анисимович Константин Владимирович
  • Давлетшин Азат Айдарович
RU2691214C1
ДИФФЕРЕНЦИАЛЬНАЯ КЛАССИФИКАЦИЯ С ИСПОЛЬЗОВАНИЕМ НЕСКОЛЬКИХ НЕЙРОННЫХ СЕТЕЙ 2017
  • Журавлев Алексей Алексеевич
  • Рыбкин Владимир
  • Анисимович Константин Владимирович
  • Давлетшин Азат Айдарович
RU2652461C1
ИЗВЛЕЧЕНИЕ ПОЛЕЙ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ БЕЗ ИСПОЛЬЗОВАНИЯ ШАБЛОНОВ 2019
  • Семенов Станислав Владимирович
RU2737720C1
US 11615422 B2, 28.03.2023
JP 2019204415 A, 28.11.2019
JP 2020187729 A,

RU 2 821 835 C1

Авторы

Александрова Маргарита Владимировна

Головнин Олег Константинович

Головнина Анастасия Александровна

Иващенко Антон Владимирович

Кривошеев Аркадий Владимирович

Крупин Даниил Николаевич

Ситников Павел Владимирович

Сурнин Олег Леонидович

Даты

2024-06-26Публикация

2023-07-18Подача