ОБЛАСТЬ ТЕХНИКИ
[1] Настоящее техническое решение, в общем, относится к способам обработки данных с подготовкой запросов с адаптацией к нуждам пользователя, а именно к способу и системе генерации запросов для обращения к нейросетевой языковой модели.
УРОВЕНЬ ТЕХНИКИ
[2] Языковая модель - это распределение вероятностей по последовательностям слов. Языковые модели генерируют вероятности путем обучения на корпусе текстов на одном или нескольких языках. Учитывая, что языки могут использоваться для выражения огромного множества верных предложений (так называемая цифровая бесконечность), языковое моделирование сталкивается с проблемой задания ненулевых вероятностей лингвистически верным последовательностям, которые могут никогда не встретиться в обучающих данных. Для преодоления этой проблемы было разработано несколько подходов к моделированию, таких как применение марковских цепей или использование нейронных архитектур, таких как рекуррентные нейронные сети или трансформеры.
[3] Языковые модели полезны для решения множества задач вычислительной лингвистики; от первоначальных применений в распознавании речи для того, чтобы избежать генерации бессмысленных (то есть маловероятные) последовательностей слов, до более широкого использования в машинном переводе (например, оценка переводов-кандидатов), генерации естественного языка (генерация текста, более похожего на человеческий), разметки частей речи, синтаксического анализа, оптического распознавания символов, распознавания рукописного ввода, грамматических выводов, поиска информации и других приложений.
[4] Одним из вариантов применения языковых моделей являются чат-боты. Например, ChatGPT - чат-бот с генеративным искусственным интеллектом, разработанный компанией OpenAI и способный работать в диалоговом режиме, поддерживающий запросы на естественных языках. Система способна отвечать на вопросы, генерировать тексты на разных языках, включая русский, относящиеся к различным предметным областям.
[5] При работе с подобными сервисами необходимо направлять корректные запросы для того, чтобы чат-бот смог верно оценить все вводные и дать наиболее релевантный ответ. Одним из вариантов решения вышеозначенной проблемы является обогащение запроса прикреплением к нему релевантных документов, относящихся к теме запроса, и автоматизация этого процесса.
[6] Из уровня техники известны решения компании DocuChat - чат-бот, который обучается на данных и документах клиента, и предоставляет человекочитаемые ответы на вопросы пользователя на основе информации из этих документов. Также известен ChatDOC - чат-бот, который составляет краткое описание документа в загруженном файле или в интернет-файле, а также на сайтах. К документам можно обращаться с точечными запросами (сервис предлагает подсказки).
[7] Недостатками известных из уровня техники решения являются отсутствие автоматизации генерации запросов, использующих результаты поиска информации из контекста предоставляемых или найденных документов.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[8] Данное техническое решение направлено на устранение недостатков, присущих существующим решениям, известным из уровня техники.
[9] Решаемой технической проблемой в данном техническом решении является отсутствие автоматизации генерации запросов для обращения к нейросетевой языковой модели, использующих результаты поиска информации из контекста предоставляемых или найденных документов.
[10] Основным техническим результатом, проявляющимся при решении вышеуказанной проблемы, является обеспечение автоматизации генерации запросов для обращения к нейросетевой языковой модели, использующих результаты поиска информации из контекста предоставляемых или найденных документов.
[11] Дополнительным техническим результатом, проявляющимся при решении вышеуказанной проблемы, является повышение релевантности ответов нейросетевой языковой модели при направлении сгенерированных запросов.
[12] Указанные технические результаты достигаются благодаря осуществлению способа генерации запросов для обращения к нейросетевой языковой модели, реализуемого с помощью процессора и устройства хранения данных, включающего следующие шаги:
- получают запрос пользователя для обращения к нейросетевой языковой модели и отправляют его на обработку в поисковую систему;
- найденные по результатам обработки поисковой системы релевантные объекты и первоначальный запрос пользователя используют при генерации запросов для обращения к нейросетевой языковой модели, при этом:
- формируется и отправляется в нейросетевую языковую модель системная часть запроса с указанием условий выполнения первоначального запроса пользователя;
- затем на основе найденных по результатам обработки поисковой системы релевантных объектов последовательно формируются и отправляются в нейросетевую языковую модель пользовательские части запроса, при этом последовательно нейросетевая языковая модель формирует на каждую пользовательскую часть запроса ответ, который учитывается с каждым последующим формированием и отправкой пользовательской части запроса;
- генерируют и отправляют в нейросетевую языковую модель финальную итерацию запроса для обращения к нейросетевой языковой модели, которая содержит системную часть запроса, все предыдущие сформированные пользовательские части запроса и ответы на них нейросетевой языковой модели.
[13] В одном из частных примеров осуществления способа ответы от нейросетевой языковой модели подвергаются постобработке.
[14] В другом частном примере осуществления способа используемой поисковой системой является внешняя система с обращением к ней через аппаратно-программный интерфейс.
[15] Кроме того, заявленный технический результат достигается за счет работы системы генерации запросов для обращения к нейросетевой языковой модели, содержащей:
по меньшей мере одно устройство обработки данных;
по меньшей мере одно устройство хранения данных;
по меньшей мере одну программу, где одна или более программ хранятся на одном или более устройствах хранения данных и исполняются на одном и более устройствах обработки данных, причем одна или более программ обеспечивает выполнение следующих шагов:
- получают запрос пользователя для обращения к нейросетевой языковой модели и отправляют его на обработку в поисковую систему;
- найденные по результатам обработки поисковой системы релевантные объекты и первоначальный запрос пользователя используют при генерации запросов для обращения к нейросетевой языковой модели, при этом:
- формируется и отправляется в нейросетевую языковую модель системная часть запроса с указанием условий выполнения первоначального запроса пользователя;
- затем на основе найденных по результатам обработки поисковой системы релевантных объектов последовательно формируются и отправляются в нейросетевую языковую модель пользовательские части запроса, при этом последовательно нейросетевая языковая модель формирует на каждую пользовательскую часть запроса ответ, который учитывается с каждым последующим формированием и отправкой пользовательской части запроса;
- генерируют и отправляют в нейросетевую языковую модель финальную итерацию запроса для обращения к нейросетевой языковой модели, которая содержит системную часть запроса, все предыдущие сформированные пользовательские части запроса и ответы на них нейросетевой языковой модели.
[16] В одном из частных примеров реализации системы ответы от нейросетевой языковой модели подвергаются постобработке.
[17] В другом частном примере реализации системы используемой поисковой системой является внешняя система с обращением к ней через аппаратно-программный интерфейс.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[18] Признаки и преимущества настоящего технического решения станут очевидными из приводимого ниже подробного описания и прилагаемых чертежей, на которых:
[19] фиг. 1 иллюстрирует блок-схему выполнения заявленного способа;
[20] фиг. 2 иллюстрирует пример найденной информации при поиске;
[21] фиг. 3 иллюстрирует пример ответа виртуального ассистента;
[22] фиг. 4 иллюстрирует верхнеуровневую архитектурную схему работы описанного частного варианта реализации заявленного технического решения;
[23] фиг. 5 иллюстрирует систему для реализации заявленного способа.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[24] Ниже будут описаны термины и понятия, необходимые для реализации настоящего технического решения.
[25] Запрос (или промпт) - это вопрос или утверждение, предоставляемое нейросетевой языковой модели для генерации ответа. Чтобы создать подобный запрос, пользователю нужно определить тему, категорию и структуру вопроса. От правильно составленного запроса, то есть корректного запроса, зависит то, насколько релевантной будет информация на выходе.
[26] Виртуальный ассистент - чат-бот, умеющий взаимодействовать с пользователем на любой чат-платформе (telegram, jivo, edna и т.д.), а также может включать в себя поисковую модель и генератор запросов к нейросетевой языковой модели.
[27] Заявленное техническое решение может выполняться, например системой, машиночитаемым носителем, сервером и т.д. В данном техническом решении под системой подразумевается, в том числе компьютерная система, ЭВМ (электронно-вычислительная машина), ЧПУ (числовое программное управление), ПЛК (программируемый логический контроллер), компьютеризированные системы управления и любые другие устройства, способные выполнять заданную, четко определенную последовательность операций (действий, инструкций).
[28] Под устройством обработки команд подразумевается электронный блок либо интегральная схема (микропроцессор), исполняющая машинные инструкции (программы).
[29] Устройство обработки команд считывает и выполняет машинные инструкции (программы) с одного или более устройства хранения данных, например таких устройств, как оперативно запоминающие устройства (ОЗУ) и/или постоянные запоминающие устройства (ПЗУ). В качестве ПЗУ могут выступать, но, не ограничиваясь, жесткие диски (HDD), флеш-память, твердотельные накопители (SSD), оптические носители данных (CD, DVD, BD, MD и т.п.) и др.
[30] Программа - последовательность инструкций, предназначенных для исполнения устройством управления вычислительной машины или устройством обработки команд.
[31] Термин «инструкции», используемый в этой заявке, может относиться, в общем, к программным инструкциям или программным командам, которые написаны на заданном языке программирования для осуществления конкретной функции, такой как, например, получение и обработка данных, формирование профиля пользователя, прием и передача сигналов, анализ принятых данных, идентификация пользователя и т.п. Инструкции могут быть осуществлены множеством способов, включающих в себя, например, объектно-ориентированные методы. Например, инструкции могут быть реализованы, посредством языка программирования С++, Java, Python, различных библиотек (например, Microsoft Foundation Classes) и т.д. Инструкции, осуществляющие процессы, описанные в этом решении, могут передаваться как по проводным, так и по беспроводным каналам передачи данных, например, Wi-Fi, Bluetooth, USB, WLAN, LAN и т.п.
[32] Представленный способ генерации запросов для обращения к нейросетевой языковой модели (на фиг. 1 представлена схема способа) решает задачи обеспечения автоматизации генерации запросов для обращения к нейросетевой языковой модели, использующих результаты поиска информации из контекста предоставляемых или найденных документов, и повышения релевантности ответов нейросетевой языковой модели при направлении сгенерированных запросов за счет последовательного выполнения следующих шагов:
- получают запрос пользователя для обращения к нейросетевой языковой модели и отправляют его на обработку в поисковую систему;
- найденные по результатам обработки поисковой системы релевантные объекты и первоначальный запрос пользователя используют при генерации запросов для обращения к нейросетевой языковой модели, при этом:
- формируется и отправляется в нейросетевую языковую модель системная часть запроса с указанием условий выполнения первоначального запроса пользователя;
- затем на основе найденных по результатам обработки поисковой системы релевантных объектов последовательно формируются и отправляются в нейросетевую языковую модель пользовательские части запроса, при этом последовательно нейросетевая языковая модель формирует на каждую пользовательскую часть запроса ответ, который учитывается с каждым последующим формированием и отправкой пользовательской части запроса;
- генерируют и отправляют в нейросетевую языковую модель финальную итерацию запроса для обращения к нейросетевой языковой модели, которая содержит системную часть запроса, все предыдущие сформированные пользовательские части запроса и ответы на них нейросетевой языковой модели.
[33] Генерация запросов к нейросетевой языковой модели запускается после того, как пользователь задаст вопрос, и отдельным функционалом поиска будут найдены несколько документов, в которых содержится искомая информация. Для запуска генерации запросов к нейросетевой языковой модели, на вход передаются вопрос клиента (в виде текста), а также документы или фрагменты документов.
[34] В частном примере реализации заявленного технического решения поисковая система представляет собой отдельный программный модуль, состоящий из:
- интерфейса для загрузки документов и БД для хранения документов, с помощью которого клиент может загрузить свои документы (txt, pdf, doc и др.) или указать сайт, на котором хранятся документы для дальнейшего их парсинга;
- модуля преобразования документов в векторный вид, с помощью которого документы преобразуются в числовой формат, который в дальнейшем потребуется для осуществления поиска по содержанию документов;
- модуля преобразования вопроса в векторный вид, с помощью которого вопрос преобразуется в числовой формат, который в дальнейшем потребуется для осуществления поиска ответа по содержанию документов;
- модуля поиска документов по теме и смыслу вопроса, с помощью которого осуществляется поиск вектора вопроса по векторам документов;
- оркестровщика поисковой системы, с помощью которого осуществляется инициация процесса и поочередный вызов всех систем, включая генератор запросов.
[35] Документы после загрузки клиентом в специально выделенный интерфейс преобразуются в векторный вид, после чего при поступлении вопроса - происходит поиск, а именно - сравнение вектора вопроса с векторами всех загруженных документов. В процессе поиска выбираются наиболее подходящие по теме и смыслу вопроса документы из загруженных ранее.
[36] В другом частном примере реализации заявленного технического решения используемой поисковой системой является внешняя система с обращением к ней через аппаратно-программный интерфейс.
[37] Поступивший вопрос и найденные документы в их первоначальном текстовом виде направляются в генератор запросов к нейросетевой языковой модели.
[38] При запуске генератор составляет последовательность запросов, состоящую из системного и пользовательских запросов.
Пример системного запроса:
«Отвечай как сотрудник службы поддержки авиакомпании».
Пример пользовательского запроса:
«Как провезти кошку?»
[39] В первую очередь генератор формирует и отправляет в нейросетевую языковую модель системный запрос, в котором указывается, что нейросетевая языковая модель в общении с клиентом играет определенная контекстная роль, а также указывается задача, которую необходимо выполнить - ответить на вопрос, используя документы, и другие дополнительные условия ответа.
[40] После системного запроса начинается отправка пользовательских запросов. В каждом пользовательском запросе содержится вопрос, а также очередной фрагмент документа. Пользовательский запрос отправляется для каждого фрагмента документа, которые были ранее найдены.
[41] Начиная со второго пользовательского запроса, нейросетевая языковая модель должна учитывать ответ на предыдущий пользовательский запрос, тем самым достигая суммаризации всей информации из предыдущих документов.
[42] Последний пользовательский запрос содержит в себе информацию по ответам на все предыдущие пользовательские запросы. Последний ответ от нейросетевой языковой модели учитывает в себе информацию по всем фрагментам документов, а также суммаризированную информацию от нейросетевой языковой модели по вопросу клиента. Таким образом последний ответ от нейросетевой языковой модели является финальным ответом на вопрос пользователя. Финальный ответ от нейросетевой языковую модели может быть отправлен на постобработку, после чего - конечному пользователю или сразу конечному пользователю.
[43] Постобработка ответов от нейросетевой языковой модели может включать в себя: удаление лишних пробелов, пустых ответов, лишних знаков или системных сообщений, ошибок и т.д., проверка смысла, цензурирование.
[44] В качестве примера работы частного варианта реализации заявленного технического решения приведен вариант работы с нейросетевой языковой моделью Gigachat (для реализации функционала была использована GigaChain - библиотека Python, которая позволяет упростить и автоматизировать работу с нейросетевой языковой моделью Gigachat и другими большими языковыми моделями (LLM). GigaChain является версией библиотеки LangChain, которая адаптирована для работы с русским языком).
В описываемом примере:
Виртуальный ассистент - чат-бот, умеющий взаимодействовать с пользователем на любой чат-платформе (telegram, jivo, edna и т.д.), а также включающий в себя поисковую модель, и генератор запросов к Gigachat.
Клиент - юридическое лицо, которое использует виртуального ассистента в коммерческих целях (например, авиакомпания).
Виртуальный ассистент обучается на базе документов Клиента, например загружены 1000 нормативных документов Клиента о том, как осуществляются грузоперевозки.
Пользователь - физическое лицо, обратившееся в Виртуальный ассистент Клиента с каким-то вопросом, ответ на который содержится в документах Клиента.
[45] Процесс работы выглядит следующим образом:
Предусловие: Клиент (юридическое лицо) загрузил к нам в Виртуального ассистента базу своих документов (например, 1000 документов в формате .pdf).
Инициация процесса: Пользователь задает вопрос Виртуальному ассистенту вопрос.
Исполняемый процесс:
1. Поисковая система ищет документы среди загруженных, в которых точно имеется упоминание сути вопроса, или содержится прямой ответ на вопрос.
Документы после загрузки клиентом в специально выделенный интерфейс преобразуются в векторный вид, после чего при поступлении вопроса - происходит поиск, а точнее сравнение вектора вопроса с векторами всех загруженных документов. В процессе поиска выбираются, например, до 8 наиболее подходящих по теме и смыслу вопроса документа из загруженных ранее.
Поступивший вопрос и найденные документы в их первоначальном текстовом виде направляются в генератор запросов.
2. Генератор запросов отправляет заданный вопрос Пользователя и найденные на предыдущем шаге документы (8 штук из 1000) в Gigachat:
1) генератор запросов запускается после того, как пользователь задаст вопрос, и отдельным функционалом поиска будут найдены несколько документов, в которых содержится искомая информация. Для запуска генератора запросов, на вход передаются вопрос клиента (в виде текста), а также документы или фрагменты документов (также в виде текста);
2) при запуске генератор составляет последовательность запросов, состоящую из системного и пользовательских запросов;
3) в первую очередь генератор формирует и отправляет в Gigachat системный запрос, в котором указывается, что Gigachat в общении с клиентом играет роль виртуального помощника авиакомпании, а также указывается задача, которую необходимо выполнить - ответить на вопрос, используя документы, и другие дополнительные условия ответа;
4) после системного запроса начинается отправка пользовательских запросов. В каждом пользовательском запросе содержится вопрос, а также очередной фрагмент документа. Пользовательский запрос отправляется для каждого фрагмента документа, которые были ранее найдены (на шаге 1). На данный момент максимальное количество фрагментов документов - 8, таким образом отправляется 8 пользовательских запросов в Gigachat;
5) начиная со второго пользовательского запроса, Gigachat должен учитывать ответ на предыдущий пользовательский запрос, тем самым достигая суммаризации всей информации из предыдущих документов;
6) последний пользовательский запрос содержит в себе информацию по ответам на все предыдущие пользовательские запросы. Последний ответ от Gigachat'a учитывает в себе информацию по всем фрагментам документов, а также суммаризированную информацию от Gigachat'a по вопросу клиента;
7) таким образом последний ответ от Gigachat является финальным ответом на вопрос пользователя;
8) финальный ответ от Gigachat отправляется на постобработку, после чего - конечному пользователю.
3. Финальный ответ от Gigachat направляется конечному пользователю в тот же канал, в котором пользователь задавал свой вопрос.
[46] Пример
Пользователь в чате на сайте авиакомпании задал вопрос Виртуальному ассистенту авиакомпании «Сколько стоит перевозка кошки?».
Виртуальный ассистент нашел несколько документов, в одном из которых содержится информация (изображена на фиг. 2).
Виртуальный ассистент с помощью генератора запросов отправил документы и вопрос в Gigachat (пройдя по процессу, описанному выше).
В итоге пользователь в чате на сайте авиакомпании получил ответ (изображен на фиг. 3).
На фиг. 4 изображена верхнеуровневая архитектурная схема работы описанного частного варианта реализации заявленного технического решения.
[47] В общем виде (см. фиг. 5) система генерации запросов для обращения к нейросетевой языковой модели (500) содержит объединенные общей шиной информационного обмена один или несколько процессоров (501), средства памяти, такие как ОЗУ (502) и ПЗУ (503) и интерфейсы ввода/вывода (504).
[48] Процессор (501) (или несколько процессоров, многоядерный процессор и т.п.) может выбираться из ассортимента устройств, широко применяемых в настоящее время, например, таких производителей, как: Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. Под процессором или одним из используемых процессоров в системе (500) также необходимо учитывать графический процессор, например, GPU NVIDIA с программной моделью, совместимой с CUDA, или Graphcore, тип которых также является пригодным для полного или частичного выполнения способа, а также может применяться для обучения и применения моделей машинного обучения в различных информационных системах.
[49] ОЗУ (502) представляет собой оперативную память и предназначено для хранения исполняемых процессором (501) машиночитаемых инструкций для выполнения необходимых операций по логической обработке данных. ОЗУ (502), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.). При этом в качестве ОЗУ (502) может выступать доступный объем памяти графической карты или графического процессора.
[50] ПЗУ (503) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флеш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, Blue-ray Disc, MD) и др.
[51] Для организации работы компонентов устройства (500) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (504). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, Fire Wire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.
[52] Для обеспечения взаимодействия пользователя с устройством (500) применяются различные средства (505) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тачпад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.
[53] Средство сетевого взаимодействия (506) обеспечивает передачу данных посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (506) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.
[54] Конкретный выбор элементов устройства (500) для реализации различных программно-аппаратных архитектурных решений может варьироваться с сохранением обеспечиваемого требуемого функционала. В частности, подобная реализация может быть выполнена с помощью электронных компонент, используемых для создания цифровых интегральных схем. Не ограничиваюсь, могут быть использоваться микросхемы, логика работы которых определяется при изготовлении, или программируемые логические интегральные схемы (ПЛИС), логика работы которых задается посредством программирования. Для программирования используются программаторы и отладочные среды, позволяющие задать желаемую структуру цифрового устройства в виде принципиальной электрической схемы или программы на специальных языках описания аппаратуры: Verilog, VHDL, AHDL и др. Альтернативой ПЛИС являются: программируемые логические контроллеры (ПЛК), базовые матричные кристаллы (БМК), требующие заводского производственного процесса для программирования; ASIC - специализированные заказные большие интегральные схемы (БИС), которые при мелкосерийном и единичном производстве существенно дороже. Таким образом, реализация может быть достигнута стандартными средствами, базирующимися на классических принципах реализации основ вычислительной техники.
[55] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.
Изобретение относится к способу и системе генерации запросов для обращения к нейросетевой языковой модели. Техническим результатом является повышение релевантности ответов нейросетевой языковой модели за счет итерационной генерации запросов к нейросетевой языковой модели, использующих результаты поиска информации из контекста найденных документов и предыдущие ответы нейросетевой языковой модели. Способ реализуется с помощью процессора и устройства хранения данных и содержит этапы, на которых получают запрос пользователя для обращения к нейросетевой языковой модели и отправляют его на обработку в поисковую систему; найденные по результатам обработки поисковой системы релевантные объекты и первоначальный запрос пользователя используют при генерации запросов для обращения к нейросетевой языковой модели, при этом формируется и отправляется в нейросетевую языковую модель системная часть запроса с указанием условий выполнения первоначального запроса пользователя; затем на основе найденных по результатам обработки поисковой системы релевантных объектов последовательно формируются и отправляются в нейросетевую языковую модель пользовательские части запроса, при этом последовательно нейросетевая языковая модель формирует на каждую пользовательскую часть запроса ответ, который учитывается с каждым последующим формированием и отправкой пользовательской части запроса; генерируют и отправляют в нейросетевую языковую модель финальную итерацию запроса для обращения к нейросетевой языковой модели, которая содержит системную часть запроса, все предыдущие сформированные пользовательские части запроса и ответы на них нейросетевой языковой модели. 2 н. и 4 з.п. ф-лы, 5 ил.
1. Способ генерации запросов для обращения к нейросетевой языковой модели, реализуемый с помощью процессора и устройства хранения данных, включающий следующие шаги:
- получают запрос пользователя для обращения к нейросетевой языковой модели и отправляют его на обработку в поисковую систему;
- найденные по результатам обработки поисковой системы релевантные объекты и первоначальный запрос пользователя используют при генерации запросов для обращения к нейросетевой языковой модели, при этом:
- формируется и отправляется в нейросетевую языковую модель системная часть запроса с указанием условий выполнения первоначального запроса пользователя;
- затем на основе найденных по результатам обработки поисковой системы релевантных объектов последовательно формируются и отправляются в нейросетевую языковую модель пользовательские части запроса, при этом последовательно нейросетевая языковая модель формирует на каждую пользовательскую часть запроса ответ, который учитывается с каждым последующим формированием и отправкой пользовательской части запроса;
- генерируют и отправляют в нейросетевую языковую модель финальную итерацию запроса для обращения к нейросетевой языковой модели, которая содержит системную часть запроса, все предыдущие сформированные пользовательские части запроса и ответы на них нейросетевой языковой модели.
2. Способ генерации запросов для обращения к нейросетевой языковой модели по п. 1, характеризующийся тем, что ответы от нейросетевой языковой модели подвергаются постобработке.
3. Способ генерации запросов для обращения к нейросетевой языковой модели по п. 1, характеризующийся тем, что используемой поисковой системой является внешняя система с обращением к ней через аппаратно-программный интерфейс.
4. Система генерации запросов для обращения к нейросетевой языковой модели, содержащая:
по меньшей мере одно устройство обработки данных;
по меньшей мере одно устройство хранения данных;
по меньшей мере одну программу, где одна или более программ хранятся на одном или более устройствах хранения данных и исполняются на одном и более устройствах обработки данных, причем одна или более программ обеспечивает выполнение следующих шагов:
- получают запрос пользователя для обращения к нейросетевой языковой модели и отправляют его на обработку в поисковую систему;
- найденные по результатам обработки поисковой системы релевантные объекты и первоначальный запрос пользователя используют при генерации запросов для обращения к нейросетевой языковой модели, при этом:
- формируется и отправляется в нейросетевую языковую модель системная часть запроса с указанием условий выполнения первоначального запроса пользователя;
- затем на основе найденных по результатам обработки поисковой системы релевантных объектов последовательно формируются и отправляются в нейросетевую языковую модель пользовательские части запроса, при этом последовательно нейросетевая языковая модель формирует на каждую пользовательскую часть запроса ответ, который учитывается с каждым последующим формированием и отправкой пользовательской части запроса;
- генерируют и отправляют в нейросетевую языковую модель финальную итерацию запроса для обращения к нейросетевой языковой модели, которая содержит системную часть запроса, все предыдущие сформированные пользовательские части запроса и ответы на них нейросетевой языковой модели.
5. Система генерации запросов для обращения к нейросетевой языковой модели по п. 4, характеризующаяся тем, что ответы от нейросетевой языковой модели подвергаются постобработке.
6. Система генерации запросов для обращения к нейросетевой языковой модели по п. 4, характеризующаяся тем, что используемой поисковой системой является внешняя система с обращением к ней через аппаратно-программный интерфейс.
ФОРМИРОВАНИЕ ПОИСКОВОГО ЗАПРОСА НА ОСНОВЕ КОНТЕКСТА | 2013 |
|
RU2633115C2 |
СПОСОБ СОЗДАНИЯ МОДЕЛИ АНАЛИЗА ДИАЛОГОВ НА БАЗЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ОБРАБОТКИ ЗАПРОСОВ ПОЛЬЗОВАТЕЛЕЙ И СИСТЕМА, ИСПОЛЬЗУЮЩАЯ ТАКУЮ МОДЕЛЬ | 2019 |
|
RU2730449C2 |
Прибор к маятниковому аппарату для упражнения стопы и бедра | 1932 |
|
SU38264A1 |
US 20240050003 A1, 15.02.2024 | |||
US 11960514 B1, 16.04.2024 | |||
US 20240020538 A1, 18.01.2024 | |||
US 20240126795 A1, 18.04.2024. |
Авторы
Даты
2024-09-17—Публикация
2024-04-24—Подача