Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке Российский патент 2022 года по МПК G06F40/40 

Описание патента на изобретение RU2767965C2

Область техники, к которой относится изобретение

[001] Настоящая технология относится в целом к машинному переводу и, в частности, к системе и способу перевода исходной фразы на первом языке целевой фразой на втором языке.

Уровень техники

[002] По мере увеличения количества пользователей, имеющих доступ к сети Интернет, возникает огромное число интернет-сервисов. В качестве примера таких сервисов можно привести поисковую систему (такую как поисковая система Yandex™, поисковая система Google™ и т.п.), социальную сеть (такую как сеть Facebook™), мультимедийный сервис (такой как сервис Instagram™ и сервис YouTube™) и сервис перевода (такой как приложение Yandex.Translate™). Последний сервис, в частности, полезен в качестве помощи пользователям в переводе текста (или даже аудиозаписи или живой речи) с одного естественного языка (обычно не полностью понятного пользователю) на другой (обычно понятный пользователю).

[003] Интерес к автоматическому переводу текста с одного языка на другой постоянно растет, что, в частности, обусловлено развитием компьютерных технологий. Недавние усовершенствования компьютеров в области быстрой обработки разнообразной информации при использовании меньшего объема памяти способствовали значительному развитию машинного перевода.

[004] Традиционно усилия сосредоточены на предоставлении точного перевода фраз с исходного языка на целевой язык. Тем не менее, независимо от качества перевода фразы, пользователю бывает сложно понять, как следует использовать переведенное слово. Это главным образом обусловлено важностью структуры языка, а все языки различаются по структуре. Для решения этой проблемы были приняты определенные меры по отображению вместе с переведенной фразой предложений, содержащих переведенную фразу, чтобы способствовать правильному пониманию пользователем переведенной фразы.

[005] Также были приняты меры для обеспечения лучшего понимания пользователем переведенного слова путем предоставления примеров предложений с использованием переведенного слова в составе соответствующих предложений на исходном языке.

[006] В патентной заявке CN102236643A «Processing System and Method capable of Simultaneously Displaying Multilingual Words and Example Sentences» (Inventec Corp., опубликована 9 ноября 2011 г.) описаны система для обработки информации и способ одновременного отображения слов на нескольких языках и примеров предложений, которые после получения слова на исходном языке извлекают соответствующее слово на целевом языке из первого словаря и обращаются ко второму словарю для извлечения интерпретации этого слова. После перевода примера на целевом языке на исходный язык все соответствующие результаты запроса отображаются совместно в одном окне, что упрощает понимание взаимного соответствия при запросе переведенных слов и, следовательно, повышает эффективность запроса.

[007] В патентной заявке CN104133561A «Auxiliary Information Display Method and Device based on Input Method» (Baidu Online Network Technology Beijing Co. Ltd., опубликована 5 ноября 2011 г.) описаны способ и устройство для отображения вспомогательной информации на основе способа ввода. Способ отображения вспомогательной информации включает в себя получение введенных пользователем символьных строк, распознавание слов в символьных строках согласно заранее заданным правилам, если обнаружено, что символьные строки содержат заранее заданные символы, получение относящейся к этим словам вспомогательной информации и отображение в интерфейсе сочетания вспомогательной информации и этих слов. Согласно способу отображения вспомогательной информации на основе способа ввода, пользователю нужно лишь ввести слова, чтобы получить перевод слов и примеры предложений в различных семантических условиях, и пользователь может быстро и удобно получать информацию об использовании слов во время их ввода.

Раскрытие изобретения

[008] Целью настоящей технологии является реализация усовершенствованных способа и системы для перевода исходной фразы на первом языке целевой фразой на втором языке.

[009] Безотносительно какой-либо конкретной теории, варианты осуществления настоящей технологии разработаны на основе предположения, что пользователю, использующему сервис перевода, могут быть полезными примеры предложений, содержащие переведенную фразу, вместе с предложениями на исходном языке. В известном способе для достижения этой цели требуется перевод примеров предложений обратно на исходный язык с использованием алгоритма перевода. Очевидно, что этот способ требует большого количества вычислений и, несмотря на то, что современные алгоритмы перевода обычно способны обеспечить приемлемый перевод предложений, существует риск предоставления неясного или неверного перевода этих предложений на исходный язык.

[0010] Кроме того, варианты осуществления настоящей технологии также разработаны на основе предположения разработчиков, что для ясного понимания пользователем переведенной фразы в используемом контексте желательно предоставлять примеры предложений, соответствующие уровню носителя целевого языка.

[0011] Для снижения риска предоставления неясных или неверных примеров предложений (и их перевода), предполагается, что путем построения списка параллельных предложений на исходном языке и на целевом языке, извлеченных их сформированного человеком контента, можно обеспечивать точные примеры предложений на целевом языке и на исходном языке.

[0012] Согласно первому аспекту настоящей технологии реализован компьютерный способ перевода исходной фразы с первого языка на второй язык. Способ выполняется компьютерным устройством, способным получать доступ к каталогу, содержащему набор исходных предложений на первом языке и набор целевых предложений на втором языке, при этом каждое целевое предложение, содержащееся в наборе целевых предложений, соответствует переводу исходного предложения из набора исходных предложений. Способ включает в себя получение исходной фразы, формирование алгоритмом перевода одной или нескольких целевых фраз, имеющих различные смысловые значения на втором языке, получение из каталога для каждой целевой фразы соответствующего целевого предложения, содержащего одну из целевых фраз, и выбор одной или нескольких целевых фраз и соответствующих целевых предложений для отображения.

[0013] В некоторых не имеющих ограничительного характера вариантах осуществления способ дополнительно включает в себя получение из каталога одного или нескольких исходных предложений на первом языке, каждое из которых соответствует переводу соответствующего целевого предложения, и выбор одного или нескольких исходных предложений для отображения.

[0014] В некоторых не имеющих ограничительного характера вариантах осуществления способа одна или несколько целевых фраз содержит первую целевую фразу, множество целевых предложений содержит первое предложение и второе предложение, содержащие первую целевую фразу, а получение одного или нескольких целевых предложений включает в себя получение первого предложения или второго предложения.

[0015] В некоторых не имеющих ограничительного характера вариантах осуществления способа получение первого предложения или второго предложения включает в себя ранжирование первого предложения и второго предложения и получение предложения с наибольшим рангом из числа первого предложения и второго предложения в качестве одного из целевых предложений.

[0016] В некоторых не имеющих ограничительного характера вариантах осуществления способа ранжирование первого предложения и второго предложения включает в себя определение первого набора признаков, связанных с первым предложением, который указывает на релевантность первого предложения, определение второго набора признаков, связанных со вторым предложением, который указывает на релевантность второго предложения, и ранжирование первого предложения и второго предложения на основе первого набора признаков и второго набора признаков.

[0017] В некоторых не имеющих ограничительного характера вариантах осуществления способа первый набор признаков содержит источник первого предложения и/или количество слов в первом предложении и/или параметр популярности, связанный с этим источником.

[0018] В некоторых не имеющих ограничительного характера вариантах осуществления способа каталог дополнительно содержит указание на источник для каждого из множества целевых предложений: книгу, веб-сайт или видеоматериал.

[0019] В некоторых не имеющих ограничительного характера вариантах осуществления способа выбор одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения дополнительно включает в себя выбор соответствующего указания на источник каждого целевого предложения для отображения.

[0020] В некоторых не имеющих ограничительного характера вариантах осуществления способа компьютерное устройство представляет собой сервер, соединенный с клиентским устройством через сеть связи. Получение исходной фразы включает в себя получение исходной фразы от клиентского устройства, а выбор одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения включает в себя отправку одного или нескольких целевых предложений и одной или нескольких целевых фраз клиентскому устройству для отображения.

[0021] Согласно другому аспекту настоящей технологии реализовано компьютерное устройство для перевода исходной фразы с первого языка на второй язык, способное получать доступ к каталогу, содержащему набор исходных предложений на первом языке и набор целевых предложений на втором языке, при этом каждое целевое предложение, содержащееся в наборе целевых предложений, соответствует переводу исходного предложения из набора исходных предложений. Компьютерное устройство содержит процессор, способный получать исходную фразу, формировать с использованием алгоритма перевода одну или несколько целевых фраз, имеющих различные смысловые значения на втором языке, получать из каталога для каждой целевой фразы соответствующее целевое предложение, содержащее одну из целевых фраз, и выбирать одну или несколько целевых фраз и соответствующие целевые предложения для отображения.

[0022] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства процессор дополнительно способен получать из каталога одно или несколько исходных предложений на первом языке, каждое из которых соответствует переводу соответствующего целевого предложения, и выбирать одно или несколько исходных предложений для отображения.

[0023] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства одна или несколько целевых фраз содержит первую целевую фразу, множество целевых предложений содержит первое предложение и второе предложение, содержащие первую целевую фразу, а для получения одного или нескольких целевых предложений процессор способен получать первое предложение или второе предложение.

[0024] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства для получения первого предложения или второго предложения процессор способен ранжировать первое предложение и второе предложение и получать предложение с наибольшим рангом из числа первого предложения и второго предложения в качестве одного из целевых предложений.

[0025] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства для ранжирования первого предложения и второго предложения процессор способен определять первый набор признаков, связанных с первым предложением, который указывает на релевантность первого предложения, определять второй набора признаков, связанных со вторым предложением, который указывает на релевантность второго предложения, и ранжировать первое предложение и второе предложение на основе первого набора признаков и второго набора признаков.

[0026] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства первый набор признаков содержит источник первого предложения и/или количество слов в первом предложении и/или параметр популярности, связанный с этим источником.

[0027] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства каталог дополнительно содержит указание на источник для каждого из множества целевых предложений: книгу, веб-сайт или видеоматериал.

[0028] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства для выбора одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения процессор дополнительно способен выбирать соответствующее указание на источник каждого целевого предложения для отображения.

[0029] В некоторых не имеющих ограничительного характера вариантах осуществления компьютерного устройства оно представляет собой сервер, соединенный с клиентским устройством через сеть связи. Для получения исходной фразы процессор способен получать исходную фразу от клиентского устройства, а для выбора одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения процессор способен отправлять одно или несколько целевых предложений и одну или несколько целевых фраз клиентскому устройству для отображения.

[0030] В контексте настоящего описания термин «сервер» означает компьютерную программу, выполняемую соответствующими аппаратными средствами и способную принимать запросы (например, от электронных устройств) через сеть и выполнять эти запросы или инициировать их выполнение. Аппаратные средства могут представлять собой один физический компьютер или одну компьютерную систему, что не существенно для настоящей технологии. Здесь выражение «по меньшей мере один сервер» не означает, что каждая задача (например, принятая команда или запрос) или некоторая определенная задача принимается, выполняется или запускается одним сервером (т.е. одними и теми же программными и/или аппаратными средствами). Это выражение означает, что любое количество программных средств или аппаратных средств может принимать, отправлять, выполнять или инициировать выполнение любой задачи или запроса либо результатов любых задач или запросов. Все эти программные и аппаратные средства могут представлять собой один сервер или несколько серверов, причем оба эти случая подразумеваются в выражении «по меньшей мере один сервер».

[0031] В контексте настоящего описания, если явно не указано другое, числительные «первый», «второй», «третий» и т.д. используются только для указания различия между существительными, к которым они относятся, но не для описания каких-либо определенных взаимосвязей между этими существительными. Например, должно быть понятно, что использование терминов «первый сервер» и «третий сервер» не подразумевает какого-либо определенного порядка, типа, хронологии, иерархии или классификации, в данном случае, серверов, а их использование (само по себе) не подразумевает обязательного наличия «второго сервера» в любой ситуации. Кроме того, как встречается здесь в другом контексте, ссылка на «первый» элемент и «второй» элемент не исключает того, что эти два элемента в действительности могут быть одним и тем же элементом. Таким образом, например, в некоторых случаях «первый» сервер и «второй» сервер могут представлять собой одно и то же программное и/или аппаратное средство, а в других случаях - различные программные и/или аппаратные средства.

[0032] В контексте настоящего описания, если явно не указано другое, термин «база данных» означает любой структурированный набор данных, независимо от его конкретной структуры, программного обеспечения для управления базой данных или компьютерных аппаратных средств для хранения этих данных, их применения или обеспечения их использования иным способом. База данных может располагаться в тех же аппаратных средствах, где реализован процесс, обеспечивающий хранение или использование информации, хранящейся в базе данных, либо база данных может располагаться в отдельных аппаратных средствах, таких как специализированный сервер или множество серверов.

Краткое описание чертежей

[0033] Дальнейшее описание приведено для лучшего понимания настоящей технологии, а также других аспектов и их признаков, и должно использоваться совместно с приложенными чертежами.

[0034] На фиг. 1 представлена схема системы, реализованной согласно вариантам реализации настоящей технологии, не имеющим ограничительного характера.

[0035] На фиг. 2 приведен снимок экрана сервиса перевода, реализованного в электронном устройстве из системы, представленной на фиг. 1.

[0036] На фиг. 3 приведена структура списка параллельных предложений, хранящихся в базе данных системы, представленной на фиг. 1.

[0037] На фиг. 4 представлен пример процесса перевода исходной фразы на первом языке целевой фразой на втором языке.

[0038] На фиг. 5 представлена схема входной фразы, переведенной с исходного языка на целевой язык.

[0039] На фиг. 6 приведена структура одного или нескольких предложений, содержащих первый перевод или второй перевод и полученных из базы данных системы, представленной на фиг. 1.

[0040] На фиг. 7 представлен снимок экрана графического интерфейса пользователя, реализованного согласно первому не имеющему ограничительного характера варианту осуществления настоящей технологии.

[0041] На фиг. 8 представлен снимок экрана графического интерфейса пользователя, реализованного согласно второму не имеющему ограничительного характера варианту осуществления настоящей технологии.

[0042] На фиг. 9 представлена блок-схема способа перевода исходной фразы на первом языке целевой фразой на втором языке.

[0043] Осуществление изобретения

[0044] На фиг. 1 представлена схема системы 100, пригодной для реализации вариантов осуществления настоящей технологии, не имеющих ограничительного характера. Очевидно, что система 100 приведена лишь для демонстрации варианта реализации настоящей технологии. Таким образом, дальнейшее описание системы представляет собой описание примеров, иллюстрирующих настоящую технологию. Это описание не предназначено для определения объема или границ настоящей технологии. В некоторых случаях приводятся полезные примеры модификаций системы 100. Они способствуют пониманию, но также не определяют объем или границы настоящей технологии. Эти модификации не составляют исчерпывающего перечня. Как должно быть понятно специалисту в данной области, возможны и другие модификации. Кроме того, если в некоторых случаях модификации не описаны (т.е. примеры модификаций отсутствуют), это не означает, что они невозможны и/или что это описание содержит единственно возможный вариант реализации того или иного элемента настоящей технологии. Специалисту в данной области должно быть понятно, что это не так. Кроме того, следует понимать, что система 100 в некоторых случаях может представлять собой упрощенную реализацию настоящей технологии, и что такие варианты представлены для того, чтобы способствовать лучшему ее пониманию. Специалистам в данной области должно быть понятно, что различные варианты осуществления настоящей технологии могут быть значительно сложнее.

[0045] Представленные в данном описании примеры и условный язык предназначены для обеспечения лучшего понимания принципов настоящей технологии, а не для ограничения ее объема до таких специально приведенных примеров и условий. Очевидно, что специалисты в данной области техники способны разработать различные способы и устройства, которые явно не описаны и не показаны, но реализуют принципы настоящей технологии в пределах ее существа и объема. Кроме того, чтобы способствовать лучшему пониманию, следующее описание может содержать упрощенные варианты реализации настоящей технологии. Специалисту в данной области должно быть понятно, что различные варианты осуществления данной технологии могут быть значительно сложнее.

[0046] Более того, описание принципов, аспектов и вариантов реализации настоящей технологии, а также их конкретные примеры предназначены для охвата их структурных и функциональных эквивалентов, независимо от того, известны они в настоящее время или будут разработаны в будущем. Например, специалистам в данной области техники должно быть очевидно, что любые описанные структурные схемы соответствуют концептуальным представлениям иллюстративных принципиальных схем, реализующих принципы настоящей технологии. Также должно быть очевидно, что любые блок-схемы, схемы процессов, диаграммы изменения состояния, псевдокоды и т.п. соответствуют различным процессам, которые могут быть представлены на машиночитаемом физическом носителе информации и могут выполняться компьютером или процессором, независимо от того, показан такой компьютер или процессор явно или нет.

[0047] Функции различных элементов, показанных на чертежах, включая любой функциональный блок, обозначенный как «процессор», могут быть реализованы с использованием специализированных аппаратных средств, а также аппаратных средств, способных выполнять соответствующее программное обеспечение. Если используется процессор, эти функции могут выполняться одним выделенным процессором, одним совместно используемым процессором или множеством отдельных процессоров, некоторые из которых могут использоваться совместно. В некоторых вариантах осуществления настоящей технологии процессор может представлять собой процессор общего назначения, такой как центральный процессор (CPU), или специализированный процессор, такой как графический процессор (GPU). Кроме того, явное использование термина «процессор» или «контроллер» не должно трактоваться как указание исключительно на аппаратные средства, способные выполнять программное обеспечение, и может подразумевать, помимо прочего, аппаратные средства цифрового сигнального процессора (DSP), сетевой процессор, специализированную интегральную схему (ASIC), программируемую вентильную матрицу (FPGA), ПЗУ для хранения программного обеспечения, ОЗУ и энергонезависимое ЗУ. Также могут подразумеваться другие аппаратные средства, общего назначения и/или заказные.

[0048] С учетом вышеизложенных принципов далее рассмотрены некоторые не имеющие ограничительного характера примеры, иллюстрирующие различные варианты реализации аспектов настоящей технологии.

[0049] Система содержит электронное устройство 102. Электронное устройство 102 обычно взаимодействует с пользователем (не показан) и иногда может называться «клиентским устройством». Следует отметить, что взаимодействие электронного устройства 102 с пользователем не означает необходимости указывать или предполагать какой-либо режим работы, например, вход в систему, регистрацию и т.п.

[0050] В контексте настоящего описания, если явно не указано другое, термин «электронное устройство» означает любое компьютерное аппаратное средство, способное выполнять программы, подходящие для решения соответствующей задачи. Таким образом, некоторые (не имеющие ограничительного характера) примеры электронных устройств включают в себя персональные компьютеры (настольные, ноутбуки, нетбуки и т.п.), смартфоны и планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует отметить, что в данном контексте устройство, функционирующее как электронное устройство, также может функционировать как сервер в отношении других электронных устройств. Использование выражения «электронное устройство» не исключает использования нескольких электронных устройств для приема, отправки, выполнения или инициирования выполнения любой задачи или запроса либо результатов любых задач или запросов либо шагов любого описанного здесь способа.

[0051] Электронное устройство 102 содержит энергонезависимое запоминающее устройство (ЗУ) 104. Энергонезависимое ЗУ 104 может содержать один или несколько носителей информации и в общем случае обеспечивает пространство для хранения компьютерных команд, исполняемых процессором 106. Например, энергонезависимое ЗУ 104 может быть реализовано в виде пригодной для чтения компьютером среды, включая ПЗУ, жесткие диски (HDD), твердотельные накопители (SSD) и карты флэш-памяти.

[0052] Электронное устройство 102 содержит известные в данной области техники аппаратные средства и/или программное обеспечение и/или встроенное программное обеспечение (либо их сочетание) для доступа к приложению 108 перевода. Приложение 108 перевода обеспечивает пользователю (не показан) возможность перевода текста с первого языка на второй язык (описано ниже). С этой целью приложение 108 перевода обеспечивает входную область 110 перевода и выходную область 112 перевода.

[0053] На реализацию приложения 108 перевода не накладывается каких-либо особых ограничений. В одном из примеров для доступа к приложению 108 перевода пользователь (не показан) с использованием браузерного приложения (не показано) может иметь доступ к веб-сайту, связанному с сервисом перевода (таким как Yandex.Translate™). Например, доступ к приложению 108 перевода может обеспечиваться путем ввода с клавиатуры универсального указателя ресурсов (URL, Uniform Resource Locator), связанного с сетевым ресурсом Yandex.Translate™. Очевидно, что доступ к приложению 108 перевода может обеспечиваться с использованием любого другого коммерчески доступного или проприетарного сервиса перевода.

[0054] В других не имеющих ограничительного характера вариантах осуществления настоящей технологии приложение 108 перевода может быть реализовано в виде загружаемого приложения на электронном устройстве (таком как устройство беспроводной связи или стационарное электронное устройство). Например, если электронное устройство 102 реализовано в виде портативного устройства, такого как Samsung™ Galaxy™ S9, в электронном устройстве 102 может выполняться приложение Yandex.Translate™. Очевидно, что любое другое коммерчески доступное или специализированное приложение перевода может использоваться для реализации не имеющих ограничительного характера вариантах осуществления настоящей технологии.

[0055] Электронное устройство 102 содержит пользовательский интерфейс ввода (не показан) (такой как клавиатура, сенсорный экран, мышь и т.д.) для приема вводимых пользователем данных, например, во входную область 110 перевода. На реализацию пользовательского интерфейса ввода не накладывается каких-либо особых ограничений, он зависит от реализации электронного устройства 102. Лишь в качестве примера не имеющего ограничительного характера, в тех вариантах осуществления настоящей технологии, где электронное устройство 102 реализовано в виде устройства беспроводной связи (такого как смартфон iPhone™), пользовательский интерфейс вода может быть реализован в виде программной клавиатуры (также называемой экранной или виртуальной клавиатурой). Если электронное устройство 102 реализовано в виде персонального компьютера, пользовательский интерфейс ввода может быть реализован в виде аппаратной клавиатуры.

[0056] Электронное устройство 102 соединено с сетью 114 связи линией 116 связи. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии в качестве сети 114 связи может использоваться сеть Интернет. В других вариантах осуществления настоящей технологии сеть 114 связи может быть реализована иначе, например, в виде произвольной глобальной сети связи, локальной сети связи, частной сети связи и т.д.

[0057] На реализацию линии 116 связи не накладывается каких-либо особых ограничений, она зависит от реализации электронного устройства 102. Лишь в качестве примера, не имеющего ограничительного характера, в тех вариантах осуществления настоящей технологии, где электронное устройство 102 реализовано в виде беспроводного устройства связи (такого как смартфон), линия связи (не показана) может быть реализована в виде беспроводной линии связи (такой как канал сети связи 3G, канал сети связи 4G, Wireless Fidelity или сокращенно WiFi®, Bluetooth® и т.п.). В тех примерах, где электронное устройство 102 реализовано в виде ноутбука, линия связи может быть беспроводной (такой как Wireless Fidelity или сокращенно WiFi®, Bluetooth® и т.д.) или проводной (такой как соединение на основе Ethernet).

[0058] Должно быть очевидно, что варианты реализации электронного устройства 102, линии 116 связи и сети 114 связи приведены лишь для иллюстрации. Специалисту в данной области должны быть понятны и другие конкретные детали реализации электронного устройства 102, линии 116 связи и сети 114 связи. Представленные выше примеры никак не ограничивают объем настоящей технологии.

[0059] Система 100 также содержит сервер 118, соединенный с сетью 114 связи. Сервер 118 может быть реализован в виде традиционного компьютерного сервера. В примере осуществления настоящей технологии сервер 118 может быть реализован в виде сервера Dell™ PowerEdge™, работающего под управлением операционной системы Microsoft™ Windows Server™. Очевидно, что сервер 118 может быть реализован с использованием любых других подходящих аппаратных средств и/или прикладного программного обеспечения и/или встроенного программного обеспечения либо их сочетания. В представленном не имеющем ограничительного характера варианте осуществления настоящей технологии сервер 118 реализован в виде одного сервера. В других не имеющих ограничительного характера вариантах осуществления настоящей технологии функции сервера 118 могут быть распределены между несколькими серверами.

[0060] Реализация сервера 118 хорошо известна. Вкратце, сервер 118 содержит интерфейс связи (не показан), структура и настройки которого позволяют осуществлять связь через сеть 114 связи с различными элементами (такими как электронное устройство 102 и другие устройства, которые могут быть подключены к сети 114 связи).

[0061] Сервер 118 содержит память 120 сервера, включающую в семя один или несколько носителей информации и в общем случае обеспечивающую пространство для хранения исполняемых компьютером программных команд для процессора 122 сервера. Например, память 120 сервера может быть реализована в виде машиночитаемого физического носителя информации, включая ПЗУ и/или ОЗУ. Память 120 сервера также может содержать одно или несколько устройств постоянного хранения, таких как жесткие диски (HDD), твердотельные накопители (SSD) и карты флэш-памяти.

[0062] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии сервер 118 может управляться организацией, предоставляющей упомянутое выше приложение 108 электронного перевода. Например, сервер 118 может управляться компанией Yandex LLC (ул. Льва Толстого, 16, Москва, 119021, Россия). В других вариантах осуществления изобретения сервер 118 может управляться организацией, отличной от предоставляющей упомянутое выше приложение 108 электронного перевода.

[0063] В некоторых вариантах осуществления настоящей технологии сервер 118 выполняет приложение 124 формирования перевода. Способ реализации приложения 124 формирования перевода подробно описан ниже. Здесь достаточно сказать, что приложение 124 формирования перевода способно принимать и переводить текст, введенный пользователем (не показан) во входную область 110 перевода, с первого языка на второй язык, выбираемый пользователем. Приложение 124 формирования перевода дополнительно способно отправлять сформированный перевод электронному устройству 102 для отображения пользователю электронного устройства 102 с использованием выходной области 112 перевода.

[0064] На фиг. 2 представлен снимок экрана интерфейса приложения 108 перевода с входной фразой 202 во входной области 110 перевода. В некоторых вариантах осуществления изобретения входная фраза 202 представляет собой текст на естественном языке, написанный на первом языке (в данном случае на французском). На способ ввода входного текста 202 во входную область 110 перевода не накладывается каких-либо ограничений. Например, текст может вводиться пользователем с использованием пользовательского интерфейса ввода (не показан) или путем вставки текста, скопированного в буфер обмена, например, из сетевого ресурса, такого как веб-страница (не показана). В контексте настоящего описания термин «фраза» может означать одно слово или группу слов.

[0065] Следует отметить, что входная фраза 202 (точнее, каждая буква) представлена символами «Х». Тем не менее, фактически входная фраза 202 состоит из букв или слов на определенном языке (в данном случае на французском). Например, входная фраза 202 может соответствовать слову «fier».

[0066] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии приложение 108 перевода включает в себя пользовательскую кнопку 204, позволяющую инициировать выполнение перевода входной фразы 202 на выбранный пользователем язык (в данном случае на английский), при этом перевод отображается в выходной области 112 перевода. Очевидно, что, несмотря на то, что в этом примере приложение 108 перевода переводит фразу на французском языке фразой на английском языке, такой вариант не носит ограничительного характера. Приложение 108 перевода может быть способным переводить с любого языка на любой другой язык.

[0067] Как показано на фиг. 1, сервер 118 соединен с базой 126 данных. В других не имеющих ограничительного характера вариантах осуществления изобретения база 126 данных может быть соединена с сервером 118 через сеть 114 связи. Несмотря на то, что база 126 данных схематично показана здесь как один элемент, предполагается, что база 126 данных может быть распределенной.

[0068] База 126 данных наполнена множеством параллельных предложений (отдельно не обозначены). В частности, база 126 данных содержит множество предложений на первом языке (таком как французский) и соответствующий перевод каждого из этого множества предложений на второй язык (такой как английский).

[0069] На фиг. 3 представлена структура каталога 302 параллельных предложений, хранящихся в базе 126 данных.

[0070] Каталог 302 содержит множество 304 пар предложений. Множество 304 пар предложений содержит первое множество 306 предложений на первом языке (в данном случае на французском) и второе множество 308 предложений на втором языке (в данном случае на английском). Первое множество 306 предложений и второе множество 308 предложений образуют множество 304 пар предложений так, что каждая пара из множества 304 пар предложений содержит предложение из первого множества 306 предложений и соответствующее ему параллельное предложение из второго множества 308 предложений.

[0071] Например, множество 304 пар предложений содержит пару 310 предложений. В этом примере пара 310 предложений содержит (а) первое предложение 312 на первом языке (например, на французском) и (б) второе предложение 314 на втором языке (например, на английском), представляющее собой перевод первого предложения 312.

[0072] На способ хранения и идентификации в базе 126 данных первого предложения 312 и второго предложения 314 не накладывается каких-либо ограничений. Например, оператор, связанный с приложением 124 формирования перевода, может идентифицировать и извлекать первое предложение 312 из версии веб-страницы на французском языке, а второе предложение 314 могло быть идентифицировано и извлечено путем использования версии этой веб-страницы на английском языке. Кроме того, первое предложение 312 может быть извлечено из других источников на французском языке, таких как электронная книга, фильм, телешоу и т.п., если источник ранее был переведен на английский язык, например, человеком-переводчиком, или наоборот.

[0073] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии первое множество 306 предложений извлекается из источника, имеющего уровень носителя языка и соответствующего первому множеству 306 предложений. Иными словами, с учетом того, что первое множество 306 предложений содержит предложения на французском языке, первое множество 306 предложений извлекается из источников, имеющих уровень носителя французского языка. Например, первое предложение 312 (содержащееся в первом множестве 306 предложений) может быть получено из электронной книги «Les Trois Mousquetaires» («Три мушкетера») Александра Дюма, написанной на французском языке, а второе предложение 314 соответствует переводу первого предложения 312 на английский язык.

[0074] В некоторых других не имеющих ограничительного характера вариантах осуществления настоящей технологии второе множество 308 предложений извлекается из источника, имеющего уровень носителя языка, соответствующего второму множеству 308 предложений. Иными словами, с учетом того, что второе множество 308 предложений содержит предложения на английском языке, второе множество 308 предложений извлекается из источников, имеющих уровень носителя английского языка. Например, второе предложение 314 (содержащееся во втором множестве 308 предложений) может быть получено из электронной книги «Hamlet» («Гамлет») Шекспира, написанной на английском языке, а первое предложение 312 соответствует переводу второго предложения 314 на французский язык.

[0075] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии каталог 302 дополнительно содержит указание 316 на источник, связанный с каждой парой из множества 304 пар предложений. Например, если предположить, что пара 310 предложений была извлечена из книги, то указание 316 содержит указание на книгу (например, указывается название, автор, год публикации и т.п.).

[0076] Далее более подробно описаны функции и работа различных компонентов приложения 124 формирования перевода. На фиг. 4 представлена схема приложения 124 формирования перевода для перевода входной фразы 202, полученной электронным устройством 102, например, в ответ на активацию пользователем пользовательской кнопки 204. Приложение 124 формирования перевода выполняет процедуру 402 приема, процедуру 404 получения данных и процедуру 406 отображения (или иным способом осуществляет доступ к ним).

[0077] В контексте настоящего описания термин «процедура» подразумевает подмножество компьютерных программных команд приложения 124 формирования перевода, исполняемых процессором 122 сервера с целью выполнения описанных ниже функций, связанных с различными процедурами (с процедурой 402 перевода, с процедурой 404 получения данных и с процедурой 406 отображения). Должно быть однозначно понятно, что процедура 402 перевода, процедура 404 получения данных и процедура 406 отображения показаны по отдельности и распределенным образом для удобства объяснения процесса, выполняемого приложением 124 формирования перевода. Предполагается, что некоторые или все процедуры из числа процедуры 402 перевода, процедуры 404 получения данных и процедуры 406 отображения могут быть реализованы в виде одной или нескольких комбинированных процедур.

[0078] Для лучшего понимания настоящей технологии ниже описаны функции и обрабатываемые или сохраняемые данные и/или информация процедуры 402 перевода, процедуры 404 получения информации и процедуры 406 отображения.

Процедура перевода

[0079] Процедура 402 перевода способна получать пакет 408 данных, содержащий входную фразу 202, от электронного устройства 102.

[0080] Процедура 402 перевода способна выполнять алгоритм 410 перевода (или иным способом осуществлять доступ к нему). В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 410 перевода реализован в виде модели статистического перевода на основе фраз. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 410 перевода реализован в виде модели перевода на основе нейронной сети. В дополнительных не имеющих ограничительного характера вариантах осуществления настоящей технологии алгоритм 410 перевода реализован в виде сочетания модели статистического перевода на основе фраз и модели перевода на основе нейронной сети, как описано в патентной заявке US16/031021 «Method and system of translating a source sentence in a first language into a target sentence in a second language» (поданной 10 июля 2018 г.), содержание которой полностью включено в настоящий документ посредством ссылки.

[0081] В общем случае, независимо от используемого алгоритма 410 перевода, в ответ на получение пакета 408 данных алгоритм 410 перевода способен формировать одну или несколько фраз на целевом языке (т.е. на английском).

[0082] На фиг. 5 представлена схема входной фразы 202, переводимой с исходного языка (французский) на целевой язык (английский). Например, можно предположить, что входная фраза 202 соответствует французскому слову «fier». В этом конкретном примере входная фраза 202 представляет собой омоним, т.е. входная фраза 202 совпадает по написанию с другим словом, имеющим другое значение (в этом конкретном примере она имеет два различных смысловых значения на французском языке). Соответственно, алгоритм 410 перевода перевел входную фразу 202 и сформировал первый перевод 502 («proud») и второй перевод 504 («rely»). Очевидно, что настоящая технология не ограничивается входными фразами, представляющими собой омонимы.

[0083] Как показано на фиг. 4, после формирования первого перевода 502 и второго перевода 504 процедура 402 перевода способна отправлять пакет 412 данных процедуре 404 получения данных. Пакет 412 данных содержит первый перевод 502 и второй перевод 504.

Процедура получения данных

[0084] В ответ на получение пакета 412 данных процедура 404 получения данных способна выполнять следующие функции.

[0085] Сначала процедура 404 получения данных способна обращаться к базе 126 данных и получать одно или несколько предложений для каждого перевода, содержащегося в пакете 412 данных. В частности, с учетом того, что пакет 412 данных содержит первый перевод 502 и второй перевод 504, процедура 404 получения данных сожет обратиться к базе 126 данных и получить для первого перевода 502 и второго перевода 504 одно или несколько предложений из второго множества 308 предложений, содержащих первый перевод 502 и второй перевод 504.

[0086] На фиг. 6 представлена схема одного или нескольких предложений, содержащих первый перевод 502 или второй перевод 504 и полученных из второго множества 308 предложений.

[0087] В частности, процедура 404 получения данных получила из второго множества 308 предложений два предложения, содержащие первый перевод 502, а именно: первое предложение 602 и второе предложение 604. Процедура 404 получения данных также получила из второго множества 308 предложений три предложения, содержащие второй перевод 504, а именно: третье предложение 608, четвертое предложение 608 и пятое предложение 610.

[0088] Очевидно, что только два предложения, полученные для первого перевода 502 (и три предложения для второго перевода 504), представлены на фиг. 6 исключительно для лучшего понимания. Должно быть понятно, что для первого перевода 502 могло быть получено лишь одно предложение или больше двух предложений.

[0089] Каждое полученное предложение (т.е. первое предложение 602, второе предложение 604, третье предложение 608, четвертое предложение 608 и пятое предложение 610) связано с соответствующим указанием 316 на источник. Например, если предположить, что первое предложение 602, получено из книги «The Old Man and the Sea» («Старик и море»), то указание 316 на источник содержит по меньшей мере название («The Old Man and the Sea») и/или автора (Ernest Hemingway (Эрнест Хемингуэй)) и/или дату публикации (1952). Как более подробно описано ниже, в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии указание 316 на источник может отображаться в качестве источника примеров предложений, демонстрируемых пользователю в ответ на нажатие пользователем пользовательской кнопки 204 (см. фиг. 2).

[0090] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии процедура 404 получения данных способна выполнять алгоритм 414 машинного обучения (MLA, Machine Learning Algorithm), способный ранжировать полученные предложения для первого перевода 502 и для второго перевода 504. В частности, алгоритм 414 MLA обучен ранжировать одно или несколько полученных предложений в порядке релевантности соответствующему переводу (т.е. первому переводу 502 и второму переводу 504). На способ обучения алгоритма 414 MLA не накладывается каких-либо ограничений. Например, он может быть обучен на наборе признаков, содержащем по меньшей мере одно из следующего:

- количество слов в полученном предложении;

- вид источника, связанного с полученным предложением;

- популярность (описано ниже) источника, связанного с полученным предложением.

[0091] На определение популярности источника не накладывается каких-либо ограничений. Например, сервер 118 может быть связан с журналом запросов (не показан), хранящим одну или несколько текстовых строк, представляющих собой поисковые запросы, отправленные множеством пользователей с использованием поисковой системы (такой как поисковая система Yandex™), и может определять популярность источника на основе частоты включения источника в состав поискового запроса.

[0092] В другом примере сервер 118 может быть связан с журналом поиска (не показан), хранящим одну или несколько страниц результатов поисковой системы (SERP, Search Engine Result Page), сформированных в ответ на один или несколько поисковых запросов, отправленных множеством пользователей с использованием поисковой системы, а также действия с результатами поиска, выполненные множеством пользователей, и может определять популярность источника на основе частоты включения источника в состав страниц SERP и/или выбора множеством пользователей этого источника в качестве результата поиска на странице SERP.

[0093] Затем в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии процедура 404 получения данных способна выбирать n предложений с наибольшим рангом для каждого перевода (т.е. для первого перевода 502 и для второго перевода 504). В не имеющем ограничительного характера примере процедура 404 получения данных может выбрать по два предложения с наибольшим рангом для первого перевода 502 и для второго перевода 504. Очевидно, предполагается, что процедура 404 получения данных способна выбирать больше двух предложений с наибольшим рангом или одно предложение с наибольшим рангом.

[0094] Например, можно предположить, что алгоритм 414 MLA выбрал первое предложение 602 и второе предложение 604 в качестве двух предложений с наибольшим рангом для первого перевода 502, а также четвертое предложение 608 и пятое предложение 610 в качестве двух предложений с наибольшим рангом для второго перевода 504.

[0095] Затем процедура 404 получения данных способна отправлять пакет 416 данных процедуре 406 отображения. Пакет 416 данных содержит по два предложения с наибольшим рангом для первого перевода 502 и для второго перевода 504.

Процедура отображения

[0096] В ответ на прием пакета 416 данных процедура 406 отображения способна отправлять триггер 418 электронному устройству 102 через сеть 114 связи. Триггер 418 содержит первый перевод 502, второй перевод 504, предложения с наибольшим рангом для первого перевода 502 и для второго перевода 504 и, в некоторых случаях, дополнительную информацию, описанную ниже. В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии триггер 418 вложен в сообщение объектной нотации JavaScript (JSON, JavaScript Object Notation). В качестве альтернативы, триггер 418 может быть вложен в сообщение расширяемого языка разметки (XML, Extensible Markup Language). Разумеется, что триггер 418 может быть вложен в сообщения с использованием множества других подходящих форматов.

[0097] Для объяснения представленного ниже иллюстративного примера можно предположить, что триггер 418 содержит информацию, инициирующую отображение электронным устройством 102 результата перевода пользователю, как описано ниже.

[0098] На фиг. 7 представлен снимок 700 экрана, иллюстрирующий графический интерфейс 702 пользователя (GUI, Graphical User Interface), реализованный согласно не имеющим ограничительного характера вариантам осуществления настоящей технологии и сформированный электронным устройством 102 в ответ на получение триггера 418.

[0099] В рамках этой иллюстрации можно предположить, что входная фраза 202 (см. фиг. 2), введенная пользователем, соответствует французскому слову «fier», и что пользователь нажал пользовательскую кнопку 204. Пользователю представлен интерфейс 702 GUI, снимок 700 экрана которого изображен на фиг. 7.

[0100] На снимке 700 экрана пользователю в выходной области 112 перевода показан первый перевод 502. Очевидным образом предполагается, что в выходной области 112 перевода могут быть показаны и первый перевод 502, и второй перевод 504 (или только второй перевод 504).

[0101] Ниже выходной области 112 перевода предусмотрена дополнительная выходная область 704, где первый перевод 502 и второй перевод 504 показаны в сочетании с их соответствующими предложениями (с первым предложением 602, вторым предложением 604, четвертым предложением 608 и пятым предложением 610).

[0102] С учетом того, что в некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии первое предложение 602, второе предложение 604, четвертое предложение 608 и пятое предложение 610 получены из соответствующего источника, имеющего уровень носителя английского языка, очевидно, что пользователю предоставлены действительно используемые примеры предложений на целевом языке (т.е. на английском) для первого перевода 502 и для второго перевода 504.

[0103] Например, первое предложение 602 и второе предложение 604 показаны ниже первого перевода 502. Четвертое предложение 608 и пятое предложение 610 показаны ниже второго перевода 504. Очевидно, что предложения не обязательно должны располагаться ниже первого перевода 502 и/или второго перевода 504, а могут располагаться рядом с соответствующим переводом с любой стороны. Например, первое предложение 602 и второе предложение 604 могут располагаться справа или слева от первого перевода 502.

[0104] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии предполагается, что в интерфейсе 702 GUI для первого перевода 502 и для второго перевода 504 может отображаться фонетическая транскрипция, реализованная, например, с использованием международного фонетического алфавита. На получение фонетической транскрипции для первого перевода 502 и для второго перевода 504 не накладывается каких-либо ограничений. Например, процедуре 406 отображения может быть доступно приложение словаря (не показано), из которого она может получать фонетическую транскрипцию, связанную с первым переводом 502 и со вторым переводом 504.

[0105] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии интерфейс 702 GUI содержит рядом с каждым предложением значок, указывающий на соответствующий источник. С учетом того, что источник первого предложения 602 представляет собой книгу, интерфейс 702 GUI содержит рядом с первым предложением 602 первый значок 706, соответствующий книге. Интерфейс 702 GUI также содержит рядом со вторым предложением 604 второй значок 708, соответствующий книге. Кроме того, интерфейс 702 GUI содержит рядом с четвертым предложением 608 третий значок 710, соответствующий фильму. Интерфейс 702 GUI также содержит рядом с пятым предложением 610 четвертый значок 712, соответствующий телешоу.

[0106] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии пользователь может взаимодействовать с одним из значков (т.е. с первым значком 706, вторым значком 708, третьим значком 710 и четвертым значком 712) с целью получения дополнительной информации об источнике. Например, в ответ на наведение курсора или выбор пользователем первого значка 706 может отображаться фрагмент (не показан), содержащий название, автора и год публикации.

[0107] На фиг. 8 представлен альтернативный вариант осуществления снимка 800 экрана, иллюстрирующий графический интерфейс 802 GUI, реализованный согласно не имеющим ограничительного характера вариантам осуществления настоящей технологии и сформированный электронным устройством 102 в ответ на получение триггера 418.

[0108] Для простоты элементы или функции интерфейса 802 GUI, подобные элементам или функциям интерфейса 702 GUI, имеют те же позиционные обозначения. Новые элементы или функции, не описанные для интерфейса 702 GUI, имеют другие позиционные обозначения.

[0109] В рамках этой иллюстрации можно вновь предположить, что входная фраза 202 (см. фиг. 2), введенная пользователем, соответствует французскому слову «fier» и что пользователь нажал пользовательскую кнопку 204. Пользователю представлен интерфейс 802 GUI, снимок экрана которого показан на фиг. 8.

[0110] Как и в интерфейсе 702 GUI, ниже выходной области 112 перевода предусмотрена дополнительная выходная область 704, где первый перевод 502 и второй перевод 504 показаны в сочетании с соответствующими предложениями. Например, первое предложение 602 и второе предложение 604 показаны ниже первого перевода 502. Четвертое предложение 608 и пятое предложение 610 показаны ниже второго перевода 504.

[0111] Ниже входной области 110 перевода предусмотрена дополнительная входная область 804, содержащая перевод (на французский язык) первого предложения 602, второго предложения 604, четвертого предложения 608 и пятого предложения 610.

[0112] В частности, дополнительная входная область 804 содержит первое предложение 806 перевода, соответствующее переводу первого предложения 602, второе предложение 808 перевода, соответствующее переводу второго предложения 604, третье предложение 810 перевода, соответствующее переводу четвертого предложения 608, и четвертое предложение 812 перевода, соответствующее переводу пятого предложения 610.

[0113] Очевидно, что путем показа предложений, связанных с первым переводом 502 и со вторым переводом 504, параллельно с соответствующими предложениями на исходном языке пользователю предоставлены примеры предложений на исходном языке и на целевом языке, что может способствовать лучшему восприятию пользователем первого перевода 502 и второго перевода 504.

[0114] На способ формирования первого предложения 806 перевода, второго предложения 808 перевода, третьего предложения 810 перевода и четвертого предложения 812 перевода не накладывается каких-либо ограничений.

[0115] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии в ответ на получение пакета 416 данных процедура 406 отображения может обращаться к базе 126 данных для получения из первого множества 306 предложений перевода первого предложения 602, второго предложения 604, четвертого предложения 608 и пятого предложения 610.

[0116] В некоторых не имеющих ограничительного характера вариантах осуществления изобретения также предполагается, что процедура 404 получения данных вместо процедуры 406 отображения способна получать из первого множества 306 предложений первое предложение 806 перевода, второе предложение 808 перевода, третье предложение 810 перевода и четвертое предложение 812 перевода в сочетании с первым предложением 602, вторым предложением 604, четвертым предложением 608 и пятым предложением 610.

[0117] В некоторых не имеющих ограничительного характера вариантах осуществления изобретения процедура 406 отображения может получать доступ к алгоритму 410 перевода (см. фиг. 4) и формировать первое предложение 806 перевода, второе предложение 808 перевода, третье предложение 810 перевода и четвертое предложение 812 перевода путем перевода первого предложения 602, второго предложения 604, четвертого предложения 608 и пятого предложения 610, соответственно.

[0118] Несмотря на то, что приложение 124 формирования перевода описано со ссылками на сервер 118, объем изобретения этим не ограничивается. Очевидно, что приложение 124 формирования перевода может быть реализовано и в других устройствах. В не имеющем ограничительного характера примере приложение 124 формирования перевода (как и каталог 302) может загружаться и сохраняться в электронном устройстве 102.

[0119] В различных не имеющих ограничительного характера вариантах осуществления настоящей технологии возможно отображение примеров предложений для каждой переведенной фразы.

[0120] Описанные выше архитектура и примеры позволяют выполнять компьютерный способ перевода исходной фразы с первого языка на второй язык. На фиг. 9 представлена блок-схема способа 900, выполняемого согласно не имеющим ограничительного характера вариантам осуществления настоящей технологии.

[0121] Шаг 902: получение исходной фразы.

[0122] Способ 900 начинается с шага 902, на котором процедура 402 перевода получает от электронного устройства 102 входную фразу 202, например, из пакета 408 данных.

[0123] Шаг 904: формирование алгоритмом перевода одной или нескольких целевых фраз, имеющих различные смысловые значения на втором языке.

[0124] На шаге 904 процедура 402 перевода выполняет алгоритм 410 перевода, способный перевести входную фразу на целевой язык.

[0125] Например, алгоритм 410 перевода перевел входную фразу 202 и сформировал семантически различные первый перевод 502 и второй перевод 504.

[0126] Затем процедура 402 перевода отправляет пакет 412 данных процедуре 404 получения данных. Пакет 412 данных содержит первый перевод 502 и второй перевод 504.

[0127] Шаг 906: получение из каталога для каждой целевой фразы соответствующего целевого предложения, содержащего одну из целевых фраз.

[0128] На шаге 906 в ответ на получение пакета 412 данных от процедуры 402 перевода процедура 404 получения данных обращается к базе 126 данных.

[0129] В частности, процедура 404 получения данных может получить доступ к каталогу 302, хранящемуся в базе 126 данных, и получить одно или несколько предложений для каждого перевода, содержащегося в пакете 412 данных.

[0130] Например, процедура 404 получения данных получила из второго множества 308 предложений два предложения, содержащие первый перевод 502, а именно: первое предложение 602 и второе предложение 604. С другой стороны, процедура 404 получения данных получила из второго множества 308 предложений три предложения, содержащие второй перевод 504, а именно: третье предложение 608, четвертое предложение 608 и пятое предложение 610.

[0131] В некоторых не имеющих ограничительного характера вариантах осуществления настоящей технологии процедура 404 получения данных может выполнять алгоритм 414 MLA, способный ранжировать полученные предложения для первого перевода 502 и для второго перевода 504, и выбирать n предложений с наибольшим рангом для каждого перевода.

[0132] Затем процедура 404 получения данных отправляет пакет 416 данных процедуре 406 отображения. Пакет 416 данных содержит по n предложений с наибольшим рангом для первого перевода 502 и для второго перевода 504.

[0133] Шаг 908: выбор одной или нескольких целевых фраз и соответствующих целевых предложений для отображения.

[0134] На шаге 908 процедура 406 отображения отправляет триггер 418 электронному устройству 102. Триггер 418 содержит первый перевод 502, второй перевод 504, предложения с наибольшим рангом для первого перевода 502 и для второго перевода 504, а также команды для инициирования отображения интерфейса 702 GUI или интерфейса 802 GUI.

[0135] На этом способ 900 завершается.

[0136] Специалистам в данной области техники должно быть очевидно, что по меньшей некоторые варианты осуществления настоящей технологии преследуют цель расширения арсенала средств для решения определенной технической проблемы, присущей традиционной технологии перевода, а именно: определения примеров предложений для одного или нескольких переведенных слов.

[0137] Очевидно, что не все упомянутые в данном описании технические эффекты должны присутствовать в каждом варианте осуществления настоящей технологии. Например, возможны варианты осуществления настоящей технологии, когда пользователь не получает некоторые из этих технических эффектов, или другие варианты реализации, когда пользователь получает другие технические эффекты либо технический эффект отсутствует.

[0138] Для специалиста в данной области могут быть очевидными возможные изменения и усовершенствования описанных выше вариантов осуществления настоящей технологии. Предшествующее описание приведено лишь в иллюстративных целях, а не для ограничения объема изобретения. Объем охраны настоящей технологии определяется исключительно объемом приложенной формулы изобретения.

[0139] Несмотря на то что описанные выше варианты реализации приведены со ссылкой на конкретные шаги, выполняемые в определенном порядке, должно быть понятно, что эти шаги могут быть объединены, разделены или что их порядок может быть изменен без выхода за границы настоящей технологии. Соответственно, порядок и группировка шагов не носят ограничительного характера для настоящей технологии.

Похожие патенты RU2767965C2

название год авторы номер документа
Способ и система перевода исходного предложения на первом языке целевым предложением на втором языке 2017
  • Губанов Сергей Дмитриевич
  • Дворкович Антон Александрович
  • Коварский Борис Андреевич
  • Нокель Михаил Алексеевич
  • Носков Алексей Анатольевич
  • Фролов Антон Викторович
RU2692049C1
СПОСОБЫ И СИСТЕМЫ ДЛЯ ПЕРЕВОДА С ОДНОГО ЯЗЫКА НА ДРУГОЙ 2004
  • Чжо Мин
  • Гао Цзяньфэн
RU2357285C2
СПОСОБ И СИСТЕМА ДЛЯ СОПОСТАВЛЕНИЯ ИСХОДНОГО ЛЕКСИЧЕСКОГО ЭЛЕМЕНТА ПЕРВОГО ЯЗЫКА С ЦЕЛЕВЫМ ЛЕКСИЧЕСКИМ ЭЛЕМЕНТОМ ВТОРОГО ЯЗЫКА 2016
  • Зеленков Юрий Григорьевич
RU2682002C2
Способ и система для формирования карточки объекта 2018
  • Акулов Ярослав Викторович
RU2739554C1
СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ РЕЗУЛЬТАТА ВЫПОЛНЕНИЯ ЗАДАЧИ В КРАУДСОРСИНГОВОЙ СРЕДЕ 2019
  • Федорова Валентина Павловна
  • Гусев Глеб Геннадьевич
  • Друца Алексей Валерьевич
RU2744032C2
ПОИСК ИЗОБРАЖЕНИЙ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ 2015
  • Эль-Сабан Мотаз Ахмад
  • Тавфик Ахмед Иассин
  • Чалаби Ачраф Абдел Монейм Тавфик
  • Сайед Сайед Хассан
RU2688271C2
СПОСОБ И СИСТЕМА ДЛЯ ОБУЧЕНИЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ ПРОГНОЗИРОВАНАНИЮ ОЦЕНКИ ВИДИМОСТИ 2022
  • Стебелев Максим Ильич
  • Ворожцов Артем Викторович
  • Калинин Павел Владимирович
RU2814079C1
СПОСОБ И СИСТЕМА ДЛЯ ОТОБРАЖЕНИЯ ВИДЕОКОНТЕНТА 2021
  • Плешивцев Кирилл Николаевич
  • Аббакумов Сергей Сергеевич
  • Габдрахманов Рамиль Рашитович
  • Петряев Константин Юрьевич
RU2824370C1
АДАПТИВНЫЙ МАШИННЫЙ ПЕРЕВОД 2004
  • Ричардсон Стефен Д.
  • Рашид Ричард Ф.
RU2382399C2
СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ РЕЗУЛЬТАТА ДЛЯ ЗАДАЧИ, ВЫПОЛНЯЕМОЙ В КРАУДСОРСИНГОВОЙ СРЕДЕ 2019
  • Друца Алексей Валерьевич
RU2744038C2

Иллюстрации к изобретению RU 2 767 965 C2

Реферат патента 2022 года Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке

Изобретение относится к способу и устройству для перевода исходной фразы с первого языка на второй язык. Технический результат заключается в повышении эффективности перевода текста. Способ выполняется компьютерным устройством, имеющим доступ к каталогу, содержащему набор исходных предложений на первом языке и набор целевых предложений на втором языке, при этом каждое целевое предложение, содержащееся в наборе целевых предложений, соответствует переводу исходного предложения из набора исходных предложений и включает в себя получение исходной фразы на первом языке; формирование алгоритмом перевода одной или нескольких целевых фраз на втором языке, имеющих различные смысловые значения на втором языке; получение из каталога для каждой полученной в результате перевода целевой фразы на втором языке соответствующего целевого предложения на втором языке, содержащего одну из целевых фраз; и выбор исходной фразы на первом языке, соответствующей одной или нескольких целевых фраз на втором языке и соответствующих им целевых предложений, полученных из каталога, для отображения. 2 н. и 16 з.п. ф-лы, 9 ил.

Формула изобретения RU 2 767 965 C2

1. Компьютерный способ перевода исходной фразы с первого языка на второй язык, выполняемый компьютерным устройством, имеющим доступ к каталогу, содержащему набор исходных предложений на первом языке и набор целевых предложений на втором языке, при этом каждое целевое предложение, содержащееся в наборе целевых предложений, соответствует переводу исходного предложения из набора исходных предложений, и включающий в себя:

- получение исходной фразы на первом языке;

- формирование алгоритмом перевода одной или нескольких целевых фраз на втором языке, имеющих различные смысловые значения на втором языке;

- получение из каталога для каждой полученной в результате перевода целевой фразы на втором языке соответствующего целевого предложения на втором языке, содержащего одну из целевых фраз; и

- выбор исходной фразы на первом языке, соответствующей одной или нескольких целевых фраз на втором языке и соответствующих им целевых предложений, полученных из каталога, для отображения.

2. Способ по п. 1, отличающийся тем, что дополнительно включает в себя:

- получение из каталога одного или нескольких исходных предложений на первом языке, каждое из которых соответствует переводу соответствующего целевого предложения, и

- выбор одного или нескольких исходных предложений для отображения.

3. Способ по п. 1, отличающийся тем, что:

- одна или несколько целевых фраз содержит первую целевую фразу;

- множество целевых предложений содержат первое предложение и второе предложение, содержащие первую целевую фразу; и

- получение одного или нескольких целевых предложений включает в себя получение первого предложения или второго предложения.

4. Способ по п. 3, отличающийся тем, что получение первого предложения или второго предложения включает в себя:

- ранжирование первого предложения и второго предложения и

- получение предложения с наибольшим рангом из числа первого предложения и второго предложения в качестве одного из целевых предложений.

5. Способ по п. 4, отличающийся тем, что ранжирование первого предложения и второго предложения включает в себя:

- определение первого набора признаков, связанных с первым предложением, который указывает на релевантность первого предложения;

- определение второго набора признаков, связанных со вторым предложением, который указывает на релевантность второго предложения; и

- ранжирование первого предложения и второго предложения на основе первого набора признаков и второго набора признаков.

6. Способ по п. 5, отличающийся тем, что первый набор признаков содержит источник первого предложения, и/или количество слов в первом предложении, и/или параметр популярности, связанный с этим источником.

7. Способ по п. 1, отличающийся тем, что каталог дополнительно содержит указание на источник для каждого из множества целевых предложений: книгу, веб-сайт или видеоматериал.

8. Способ по п. 7, отличающийся тем, что выбор одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения дополнительно включает в себя выбор соответствующего указания на источник каждого целевого предложения для отображения.

9. Способ по п. 1, отличающийся тем, что:

- компьютерное устройство представляет собой сервер, соединенный с клиентским устройством через сеть связи;

- получение исходной фразы включает в себя получение исходной фразы от клиентского устройства и

- выбор одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения включает в себя отправку одного или нескольких целевых предложений и одной или нескольких целевых фраз клиентскому устройству для отображения.

10. Компьютерное устройство для перевода исходной фразы с первого языка на второй язык, выполненное с возможностью доступа к каталогу, содержащему набор исходных предложений на первом языке и набор целевых предложений на втором языке, при этом каждое целевое предложение, содержащееся в наборе целевых предложений, соответствует переводу исходного предложения из набора исходных предложений, и содержащее процессор, выполненный с возможностью:

- получения исходной фразы на первом языке;

- формирования алгоритмом перевода одной или нескольких целевых фраз на втором языке, имеющих различные смысловые значения на втором языке;

- получения из каталога для каждой полученной в результате перевода целевой фразы на втором языке соответствующего целевого предложения на втором языке, содержащего одну из целевых фраз; и

- выбора исходной фразы на первом языке, соответствующей одной или нескольких целевых фраз на втором языке и соответствующих им целевых предложений, полученных из каталога, для отображения.

11. Компьютерное устройство по п. 10, отличающееся тем, что процессор дополнительно выполнен с возможностью:

- получения из каталога одного или нескольких исходных предложений на первом языке, каждое из которых соответствует переводу соответствующего целевого предложения; и

- выбора одного или нескольких исходных предложений для отображения.

12. Компьютерное устройство по п. 10, отличающееся тем, что:

- одна или несколько целевых фраз содержат первую целевую фразу;

- множество целевых предложений содержит первое предложение и второе предложение, содержащие первую целевую фразу; и

- для получения одного или нескольких целевых предложений процессор выполнен с возможностью получения первого предложения или второго предложения.

13. Компьютерное устройство по п. 12, отличающееся тем, что для получения первого предложения или второго предложения процессор выполнен с возможностью:

- ранжирования первого предложения и второго предложения и

- получения предложения с наибольшим рангом из числа первого предложения и второго предложения в качестве одного из целевых предложений.

14. Компьютерное устройство по п. 13, отличающееся тем, что для ранжирования первого предложения и второго предложения процессор выполнен с возможностью:

- определения первого набора признаков, связанных с первым предложением, который указывает на релевантность первого предложения;

- определения второго набора признаков, связанных со вторым предложением, который указывает на релевантность второго предложения;

- ранжирования первого предложения и второго предложения на основе первого набора признаков и второго набора признаков.

15. Компьютерное устройство по п. 14, отличающееся тем, что первый набор признаков содержит источник первого предложения, и/или количество слов в первом предложении, и/или параметр популярности, связанный с этим источником.

16. Компьютерное устройство по п. 10, отличающееся тем, что каталог дополнительно содержит указание на источник для каждого из множества целевых предложений: книгу, веб-сайт или видеоматериал.

17. Компьютерное устройство по п. 16, отличающееся тем, что для выбора одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения процессор дополнительно выполнен с возможностью выбора соответствующего указания на источник каждого целевого предложения для отображения.

18. Компьютерное устройство по п. 10, отличающееся тем, что:

- компьютерное устройство представляет собой сервер, соединенный с клиентским устройством через сеть связи;

- для получения исходной фразы процессор выполнен с возможностью получения исходной фразы от клиентского устройства;

- для обеспечения выбора одного или нескольких целевых предложений и одной или нескольких целевых фраз для отображения процессор выполнен с возможностью отправки одного или нескольких целевых предложений и одной или нескольких целевых фраз клиентскому устройству для отображения.

Документы, цитированные в отчете о поиске Патент 2022 года RU2767965C2

СПОСОБ И СИСТЕМА ДЛЯ СОПОСТАВЛЕНИЯ ИСХОДНОГО ЛЕКСИЧЕСКОГО ЭЛЕМЕНТА ПЕРВОГО ЯЗЫКА С ЦЕЛЕВЫМ ЛЕКСИЧЕСКИМ ЭЛЕМЕНТОМ ВТОРОГО ЯЗЫКА 2016
  • Зеленков Юрий Григорьевич
RU2682002C2
АДАПТИВНЫЙ КОНТЕКСТНО-ТЕМАТИЧЕСКИЙ МАШИННЫЙ ПЕРЕВОД 2016
  • Гольдреер Михаил Маркович
RU2628202C1
US 10061769 B2, 28.08.2018
US 6473729 B1, 29.10.2002
US 9552355 B2, 24.01.2017
US 10303761 B2, 28.05.2019
US 8386234 B2, 26.02.2013
CN 102236643 A, 09.11.2011
CN 104133561 B, 05.06.2018
JP 2004185641 A, 02.07.2004
EP 749074 B1, 29.08.2001
Колосоуборка 1923
  • Беляков И.Д.
SU2009A1
US

RU 2 767 965 C2

Авторы

Дворкович Антон Александрович

Еникеева Екатерина Владимировна

Даты

2022-03-22Публикация

2019-06-19Подача