1. Область техники
[0001] Раскрытые способ, системы и клавиатуры для ввода иероглифов предназначены для ввода китайских иероглифов упрощенного начертания на любых цифровых устройствах: компьютерах, планшетах, смартфонах, телефонах, и т.п., - способных принимать ввод текста для дальнейшей обработки и использования. Принципы настоящего изобретения также могут быть использованы и для ввода китайских иероглифов традиционного начертания, а также для ввода других, основанных на китайских иероглифах системах письма, например, японских иероглифов.
2. Предшествующий уровень техники
[0002] Существует 3 основных (по распространенности) группы способов ввода иероглифов.
[0003] 1. Рукописный. Полностью эмулирует запись иероглифа на бумаге. Иероглиф однозначно определяется последовательностью, размером и взаимным расположением стандартных черт, коих насчитывают от 32-х до 36. Чертой традиция считает элемент иероглифа, который можно изобразить не отрывая кисточки от бумаги. Например, иероглиф "一" (один) состоит из одной черты "一", иероглиф "三" (три) состоит из трех черт "一", а иероглиф "乙" (второй) состоит тоже из одной черты "乙". Машина по отдельным алгоритмам "распознает" введенный иероглиф и предлагает пользователю вариант (или варианты) для вставки в соответствующую позицию в ожидающей ввода программе (т.н. фокус ввода). Говорить о скорости рукописного ввода не приходится, ибо количество черт в иероглифе может достигать нескольких десятков, причем для корректного распознавания изображенного пользователем иероглифа требуется точность воспроизведения по трем параметрам: по последовательности ввода черт, их взаимному расположению и размеру. Понятно, скорость такого рукописного ввода иероглифов принципиально не выше скорости письма иероглифов на бумаге. Преимущество у рукописного ввода только одно: не требуется нового навыка для тех, кто уже прошел курс обучения письму на бумаге.
[0004] 2. Фонетический. Иероглиф вводится по его нормативному звучанию (например, на пекинском диалекте, на кантонском диалекте и т.д.), которое записывается либо латинскими буквами (пиньинь), либо кириллицей (палладий), либо буквами китайского фонетического алфавита (чжуинь). Существуют и другие способы записи произношения иероглифов, но они распространены слабо и принципиально не отличаются от вышеприведенных. Наиболее распространен фонетический ввод по пиньиню. К числу главных недостатков фонетического ввода следует отнести следующие два.
[0005] 1. Между иероглифом и его звучанием нет взаимно однозначного соответствия. Отдельный иероглиф может произноситься по разному (иметь до 8-ми вариантов чтения), отдельному слогу может соответствовать несколько десятков иероглифов (~25 тыс. иероглифов юникода "озвучиваются" с помощью всего 1314 слогов китайского языка, в среднем каждому слогу соответствует 19,3 иероглифа; только 57 слогов записываются одним иероглифом, а слогу "и" 4-го тона ("yì") в юникоде соответствует 337 иероглифов). Следовательно, существует проблема выбора искомого иероглифа из всех предложенных системой в ответ на ввод произношения. Понятно, что вышеуказанный выбор из возможных вариантов, снижает скорость ввода, требуя от пользователя дополнительного внимания и дополнительных манипуляций.
[0006] 2. Фонетический ввод не возможен для иероглифов, произношение которых забылось пользователем или неизвестно ему вообще, что бывает часто, например, при поиске неизвестных иероглифов в словаре.
[0007] 3. Структурные способы (англ. shape-based). Устранить недостатки фонетического ввода можно попытаться с помощью структурных способов ввода. Эти способы, основанные на анализе графической структуры иероглифа, не связаны с его произношением, следовательно, позволяют сразу устранить второй недостаток фонетических способов, т.е. позволяют вводить иероглифы с неизвестным произношением.
[0008] В первую очередь стоит отметить способы ввода иероглифов по ключам, которые полностью эмулируют поиск иероглифа в "бумажном" словаре. Ключи графически представляют собой некие отдельные компоненты иероглифов. Иероглифы во многих "бумажных" словарях индексируются по ключам, ключи в этом индексе располагаются в порядке увеличения количества черт. Поскольку ключи используются для индексирования иероглифов, они должны представлять собой отдельные, легко идентифицируемые, часто встречающиеся блоки в составе иероглифов. Чаще всего ключи расположены "в начале" иероглифа: слева или сверху (как след того, что изначально иероглифы писались сверху вниз). Часть ключей представляет собой простые черты, часть представляет собой самостоятельные иероглифы, часть ключей имеет варианты, иногда заметно отличающиеся по начертанию от основных ключей. В общем случае, варианты отличаются от ключей тем, что они в данном начертании не могут выступать в качестве отдельного иероглифа, а встречаются только в составе других иероглифов, сохраняя свое значение ключа, т.е. иероглифы, в которые входят эти варианты, в индексе находятся в той же группе иероглифов, что и иероглифы с основным ключом в своем составе. Понятно, что набор ключей привязан к конкретному словарю, и в реальности количество ключей разнится от словаря к словарю по воле составителя, и может достигать вместе с общепринятыми их вариантами почти трехсот штук. Классическим считается набор ключей Канси, существующий с 18-го века и составленный из 214 ключей. Нужно иметь ввиду, что ключи традиционно имеют смысловую компоненту: каждый из них имеет "имя" и отождествляется с некой группой явлений, действий, предметов. Эта смысловая компонента ключей широко используется в мнемотехнике для запоминания значений конкретных иероглифов, содержащих конкретный ключ. Таким образом, изучение ключей является обязательным элементом изучения иероглифики вообще.
[0009] Способы ввода по ключам используют или виртуальную клавиатуру на экране устройства, или даже рукописный ввод. В структуре иероглифа выделяется единственный компонент - его ключ, оставшаяся часть иероглифа характеризуется одним совокупным параметром - количеством черт иероглифа за исключением черт самого ключа. Таким образом, отличные от ключа компоненты иероглифа не имеют значения: ключ есть основной идентификатор иероглифа, остальные не важны. Совпадают или нет они (эти остатки) с другими ключам, их комбинацией или с их частью - не имеет никакого значения. Пользователю необходимо знать ключ для каждого иероглифа и помнить (или просчитать в уме) количество черт в остатке. Количество черт иероглифа, исключая количество черт самого ключа, является вторым обязательным параметром поиска. См., например, патент US 6809725 B1 «On screen chinese keyboard» (Jishan Zhang, 26.10.2004). На описываемой в патенте `725 виртуальной клавиатуре для ввода по ключам, они расположены по возрастанию количества черт. Пользователь изначально видит только группы ключей от 1 до 10-ти черт (последняя группа включает и все остальные ключи, имеющие более 10-ти черт), и должен указать искомую группу, после чего появляется список ключей с указанным количеством черт, из которого тоже нужно сделать выбор. Пользователь выбирает количество дополнительных черт в оставшейся части иероглифа (количество черт иероглифа, исключая черты ключа). После этого выводится список иероглифов, содержащих данный ключ и указанное количество черт в остатке. Пользователь должен выбрать из этого списка искомый иероглиф. Способ приемлем для поиска иероглифов в словаре, но как способ ввода текста не пригоден ввиду большого количества необходимых манипуляций, большого количества иероглифов-кандидатов в каждой группе "ключ-черты" и, таким образом, низкой скорости такого ввода.
[0010] Существуют также способы, использующие идею комбинации ключей. См., например, патент US 5586198 A «Method and apparatus for identifying characters in ideographic alphabet» (Lakritz David, 17.12.1996). Этот патент `198 описывает способ и устройство для идентификации символов в идеографическом алфавите, которые позволяют пользователю графически описать символ с помощью набора его компонентов. Способ использует комбинации из 82-х ключей. Источник не указывает, сколько иероглифов можно ввести с помощью таких комбинаций. Пользователь непосредственно на экране с помощью операций перемещения (drag-n-drop) компонентов располагает их в нужной последовательности. Матрица (или "канва"), где собирается иероглиф, разделена на 9 секторов, и машина "сама" учитывает взаимное расположение компонентов, поскольку "знает" в какой сектор оператор поместил конкретный компонент. Следовательно, этот способ для идентификации иероглифа кроме компонентов учитывает также и их взаимное расположение. Но описать все иероглифы с помощью такого небольшого набора компонентов практически невозможно, поэтому степень неопределенности при вводе остается высокой. Действительно, в примере на фиг. 3 патента `198 иероглиф 若 идентифицируется с помощью трех компонентов. Но точно также, с помощью тех же компонентов идентифицируются еще 4 иероглифа. При данном наборе компонентов-ключей, иероглиф 苦 не отличим для машины от иероглифа 若, например. Следовательно, идентификация неоднозначна и для ввода иероглифа требуется дополнительное внимание пользователя и дополнительная манипуляция по выбору нужного иероглифа из 5-ти предложенных. К достоинствам этого способа можно отнести использование ключей, как естественного и привычного для китайской иероглифики разделения иероглифов на компоненты.
[0011] Следующую группу структурных способов ввода для определенности будем называть способами структурного кодирования. Эти способы базируются на идее кодирования графической структуры иероглифа с помощью букв латинского алфавита. Суть их заключается в том, что вводятся некие правила декомпозиции иероглифа на "стандартные", наперед заданные компоненты. Каждый из этих компонентов ставится в соответствие определенной букве латинского алфавита и располагается на соответствующей клавише стандартной латинской клавиатуры. Пользователь нажимает последовательно клавиши, т.е. вводит некую последовательность букв, отражающую последовательность компонентов иероглифа, по этому полученному буквенному коду машина идентифицирует иероглифы и выдает список иероглифов-кандидатов, связанных с введенной последовательностью компонентов, пользователь должен тем или иным способом указать, какой из иероглифов-кандидатов нужно вставить в текст. Из способов структурного кодирования самые известные это уби (wubi) и цанцзе (Cangjie).
[0012] Способ уби [см. http://www.thefullwiki.org/Wubi_method] использует в разных реализациях от 204 до 227 компонентов, почти половина из них графически совпадает с классическими ключами Канси или их вариантами, часть представлена отдельными элементами ключей, другая часть представлена отдельными чертами (всего около 90 "не ключевых" компонентов, т.е. таких, которые графически не похожи на ключи). Все эти компоненты "привязаны" к 25-ти клавишам стандартной латинской клавиатуры, поэтому каждой клавише соответствует от 3-х до 14-ти компонентов, и, соответственно, от 3-х до 14-ти компонентов имеют одинаковый буквенный код. Логика расположения компонентов на клавиатуре, их привязка, имеет сложную структуру и связана не с удобством ввода, а с попыткой облегчить запоминание этой сложной структуры компонентов. Используемые компоненты не равнозначны. Существует 5 "базовых черт", в соответствии с которыми остальные компоненты делятся на 5 групп по первой черте каждого компонента, 25 "базовых иероглифов", которые, при этом, могут выступать также и в качестве компонентов (и тогда они вводятся по иным правилам, отличным от правил ввода базовых иероглифов), и обычные компоненты. Правила декомпозиции достаточно сложны и зависят от типа расположения компонентов в иероглифе, таких типов расположения четыре. Декомпозиция некоторых иероглифов требует учитывать взаимное расположение компонентов в виде так называемого "кода отличия". Код отличия - комбинация "номера компонента", который определяется принадлежностью компонента к одной из пяти групп базовых черт и типов взаимного расположения компонентов в иероглифе: слева-справа, сверху-снизу и смешанный тип. Поскольку базовых черт 5, кодов отличия всего 15, следовательно, 15 клавиш, кроме ввода кодов компонентов, выполняют еще и функцию ввода кодов отличия, причем этими кодами являются те же латинские буквы, которые кодируют компоненты. В некоторых ситуациях при декомпозиции важным становится еще один параметр - "последняя черта" компонента. Чтобы минимизировать использование кодов отличия, разработчики ввели для 4-х разных типов иероглифов разные правила определения этой "последней черты" иероглифа.
[0013] При вводе компонентов в основном повторяется порядок написания черт в иероглифе, но существуют некоторые исключения. Иероглифы неравнозначны по способу ввода, т.е. для разного типа иероглифов существуют разные алгоритмы ввода. Например, для ввода базовых или "заглавных" иероглифов нужно несколько раз нажать соответствующую клавишу (от двух до четырех раз). Для части иероглифов необходимо просто последовательно нажать клавиши, соответствующие компонентам искомого иероглифа. Для некоторых иероглифов необходимо ввести еще и код взаимного расположения указанных компонентов, упомянутый выше код отличия. Для некоторых иероглифов требуется ввести две буквы, а потом дополнить ввод до четырех символов клавишей L.
[0014] Все эти алгоритмические ухищрения требуются для того, чтобы для каждого иероглифа получить уникальный буквенный код, позволяющий идентифицировать его, например:
士 - fghg
十 - fgh
人 - w
员 - km
呗 - kmy
手 - rtgh
金 - qqqq
... и т.д.
[0015] Машина "работает" именно с этими кодами, выбирая нужные иероглифы по мере ввода букв. (Анализ возможностей способа основан на таблице соответствия буквенных кодов иероглифам, опубликованной в сети по адресу: http://raw.githubusercontent.com/definite/ibus-table-chinese/master/tables/wubi-jidian/wubi-jidian86.txt). При использовании такого кода, ввод иероглифа требует до четырех манипуляций (нажатий на клавиши), и только 636 иероглифов из всех возможных могут быть однозначно идентифицированы после нажатия одной или двух клавиш. В таблицу иероглифов разработчики сочли возможным добавить и многосложные слова, состоящие из двух иероглифов и целые фразы (до 9-ти иероглифов). При этом код не обеспечивает однозначной идентификации иероглифа или слова, и из всего набора 16,75% приведенных кодов соответствуют двум и более (в реальности до 45-ти) иероглифам или словам, а 44% иероглифов (или слов), однозначно не идентифицируются вообще, т.е. имеют перекрывающиеся с другими иероглифами коды, и после ввода этих кодов требуется дополнительный выбор пользователя.
[0016] В способе цанцзе (см. http://www.cocoanutstech.com/cang_jie/www.cjmember.com/the_cj_method.htm) используется 24 основных и 87 вторичных "знаков" ("signs"), итого 111 знаков. Из них 44 знака графически отличаются от ключей Канси. Основные знаки совпадают с ключами, а из вторичных некоторые графически совпадают с отдельными ключами, некоторые с их вариантами, некоторые с чертами, а небольшая часть - просто графические компоненты иероглифа, не представленные в предыдущих группах. Из 24 основных знаков лишь 13 совпадают с базовыми иероглифами уби. Среди вторичных знаков также есть совпадающие с компонентами уби, но есть и отличные. Принцип этого способа заключается, также как и в способе уби, в "привязке" знаков к кодам латинских клавиш. Для указания знаков используется 24 клавиши. На одну клавишу в цанцзе приходится от 2-х до 8-ми знаков. Даже совпадающие с уби знаки, естественно, привязаны к другим клавишам, поскольку принципы компоновки знаков на клавиатуре в этих способах разнятся. Правила декомпозиции способа цанцзе кажутся проще, чем уби, но и в этом способе приходится учитывать разные типы иероглифов: однокомпонентные, двух- и трехкомпонентные (single-units, two-units and three-units characters), - декомпозиция которых отличается друг от друга. За счет того, что количество используемых знаков почти в 2 раза меньше, чем в способе уби, и клавиш для кодировки используется на одну меньше, длина полученного буквенного кода для графически сложных иероглифов становится больше. Для ускорения ввода (уменьшения количества манипуляций) разработчики способа цанцзе добавили правила исключения некоторых знаков для уменьшения количества символов в полученном буквенном коде некоторых иероглифов. Несмотря на это, максимальное количество символов при вводе отдельного иероглифа способом цанцзе все же достигает 5-ти, и всего 238 иероглифов однозначно идентифицируются после нажатия одной или двух клавиш. При этом 22,2% иероглифов однозначно не идентифицируются. Для таких не однозначно идентифицируемых иероглифов, пользователю предлагается на выбор от 2 до 8-ми вариантов. Это, конечно, лучше, чем в способе уби, но все же взаимно однозначного соответствия между кодом и иероглифом нет. (Таблицы соответствия буквенных кодов и иероглифов см. по адресу https://en.wiktionary.org/wiki/Index:Chinese_Cangjie).
[0017] Для обоих способов характерны одни и те же недостатки: сложность правил декомпозиции, тяжеловесность и изощренность организации буквенных кодов для иероглифов, соответственно, и сложность запоминания необходимой последовательности нажатия клавиш для ввода иероглифов. Отсутствие взаимно-однозначного соответствия кодов и иероглифов требует дополнительного внимания и действий пользователя. Ограниченность поля привязки кодов (25 и 24 клавиши) приводит к тому, что число необходимых манипуляций увеличивается, скорость ввода падает. На современных устройствах с небольшим сенсорным экраном привычные преимущества клавиатуры по быстроте ввода теряются, ибо ввод на этих устройствах как правило предполагает использование лишь одной руки (вторая удерживает устройство). При этом недостатки распределения компонентов на небольшом количестве клавиш сохраняются. Это распределение неравномерно, оно совершенно не ориентировано на удобство ввода этих компонентов ни по их последовательности, ни по частоте использования, что приводит к излишним перемещениям указателя мыши или пальца на сенсорном экране, соответственно, к снижению скорости ввода.
[0018] Правила декомпозиции способов структурного кодирования имеют два аспекта. Первый, это аспект разработчика, для которого правила декомпозиции нужны для того, чтобы получить минимально возможный уникальный код для каждого иероглифа. Как описано выше, этот аспект не очень хорошо работает ввиду отсутствия взаимно однозначного соответствия кодов и иероглифов в способах и уби, и цанцзе, несмотря на их сложность, на обилие групп и типов, на многочисленные исключения. Второй аспект, это аспект пользователя, который должен знать эту сложную систему правил, соглашений и исключений для того, чтобы в точности повторить действия разработчика и прийти к тому же результату. Понятно, что в конечном итоге пользователь, независимо от правил декомпозиции, должен просто запомнить последовательность нажатия клавиш для ввода того или иного иероглифа. Во время ввода текста ему уже некогда заниматься декомпозицией. Но другого способа, кроме попыток так или иначе провести декомпозицию, получить информацию о нужной последовательности нажатия клавиш у пользователя нет, получить помощь от машины он не может. В самом процессе ввода пользователь даже не видит уже введенных им компонентов, а видит лишь набор букв, отражающий последовательность нажатых им клавиш, т.е. ввод происходит "вслепую". В обоих способах структурного кодирования вся информация по декомпозиции и сопоставлению компонентов буквенным кодам скрыты от машины, вся она сосредоточена в голове пользователя. Как уже отмечалось, машина "знает" только соответствие буквенных кодов иероглифам, полная информация о реальном графическом составе компонентов иероглифов после такого кодирования потеряна безвозвратно и не может быть восстановлена. Поэтому-то от машины невозможно ожидать помощи в ситуациях неопределенности: или пользователь ввел правильную последовательность кодов и получил на выходе искомый иероглиф, или он ошибся и получил совершенно неожиданный результат. Поэтому и возможности этих способов в поиске иероглифов по аналогии с известными, по наличию подобных блоков компонентов, просто по выборке всех иероглифов, имеющих некий конкретный компонент в начале или конце иероглифа, крайне ограничены. Искусственность выделения компонентов, отсутствие наглядности как при декомпозиции, так и при привязке компонентов к ограниченному количеству клавиш, затрудняют для пользователя освоение этих способов.
3. Задача, решаемая настоящим изобретением
[0019] Настоящий способ ввода призван обеспечить простой, наглядный и эффективный ввод наиболее часто употребляемых в современном китайском языке иероглифов. Однако, как было указано выше, принципы настоящего изобретения также могут быть использованы и для китайских иероглифов традиционного начертания, а также для других, основанных на китайских иероглифах системах письма, например, японских иероглифов. Наиболее часто употребляемыми иероглифами будем считать иероглифы, которые употребляются в современном китайском языке с частотой большей, чем один раз на миллион иероглифов текста. Частота употребления иероглифов рассчитывалась на основе ланкастерского корпуса иероглифов, составленного доктором Ричардом Сяо (R.Xiao) в 2006-ом году (http://www.lancs.ac.uk/fass/projects/corpus/data/Chinese_character_frquency_list.zip). В составе указанного ланкастерского корпуса таких иероглифов оказалось 4336. Под эффективностью ввода будем понимать величину, обратную количеству манипуляций пользователя, необходимых для однозначной идентификации иероглифа машиной. Чем больше требуется манипуляций пользователя, тем менее эффективным будем считать способ ввода. Понятно, что эффективность ввода прямо влияет на предел скорости ввода, поэтому при прочих равных условиях теоретически достижимая скорость ввода будет выше у того способа, количество манипуляций которого меньше.
[0020] Настоящий способ позволяет однозначно идентифицировать уже после двух манипуляций 72,5% используемых иероглифов (3146 иероглифов), что несравнимо больше, чем уби (651 иероглифов) и цанцзе (238 иероглифов). Максимально необходимое количество манипуляций для идентификации одного иероглифа при настоящем способе ввода равно 3, тогда как в уби - 4, в цанцзе - 5. Также стоит отметить, что описанные способы структурного кодирования после идентификации иероглифа требуют вмешательства пользователя для самого акта ввода, т.е. для переноса иероглифа в фокус ввода. Настоящий способ ввода позволяет машине отслеживать признак завершения ввода компонентов и без участия пользователя автоматически переносить идентифицированный иероглиф в фокус ввода (подробности см. далее в разделе 6). Пользователь, таким образом, "экономит" одну манипуляцию, ему нет нужды указывать машине иероглиф, который должен быть перенесен в фокус ввода. Эта ситуация реализуется при вводе 93,2% всех вводимых этим способом иероглифов. В оставшихся 6,8% случаев, когда дальнейший ввод компонентов в принципе еще возможен (т.е. признак завершения ввода не обнаружен), но требуемый пользователю иероглиф уже идентифицирован машиной, пользователь может отдельной манипуляцией отправить его в фокус ввода программы, ожидающей ввода от клавиатуры.
[0021] Эффективность ввода иероглифов, как комбинаций компонентов из фиксированного набора компонентов, зависит именно от самого этого набора, его состава и количества компонентов в нем. Поэтому, задача состоит в том, чтобы разработать такой набор компонентов, который был бы достаточно представительным, т.е. отражал все графические элементы, представленные в иероглифах; чтобы он полностью устранял неопределенность идентификации иероглифов, т.е. с его помощью была бы возможна однозначная идентификация каждого иероглифа из рассматриваемого множества; чтобы размер этого набора компонентов был обозримым, и сам он легко запоминаемым.
4. Сущность настоящего изобретения
[0022] Раскрытый в настоящем документе способ ввода, в отличие от вышеописанных способов структурного кодирования, предполагает, что система его реализующая хранит информацию о графическом составе каждого иероглифа - реальную последовательность его компонентов (далее упоминаемых как графы), а не просто связанный с иероглифами набор буквенных кодов, полученных с помощью процедуры декомпозиции. Пользователь может видеть набор графов либо на экране пользовательского устройства в виде матрицы графов (фиг. 2) виртуальной клавиатуры, либо на клавишах аппаратной клавиатуры, и может "собирать" нужный ему иероглиф из известных графов, просто указывая нужные графы в нужном порядке. Порядок следования графов в описании каждого иероглифа определяется правилами декомпозиции иероглифов. Правила декомпозиции иероглифов в настоящем изобретении предельно просты: 1) направление декомпозиции слева-сверху вправо-вниз, для охватывающих графов (т.е. таких, внутри которых располагаются другие графы) - снаружи внутрь; 2) все коллизии декомпозиции (т.е. неоднозначность описания иероглифа) разрешаются добавлением в описание иероглифа "пустого" графа-модификатора, обозначаемого в описании иероглифа знаком "*" (см. раздел 6). Пользователю нет нужды запоминать сложные правила декомпозиции, достаточно понять и помнить правило направления декомпозиции и запрет на разделение графов (см. определение графа в разделе 6). Поскольку система хранит информацию о последовательности графов каждого иероглифа, она может найти все иероглифы, удовлетворяющее и не вполне точным запросам пользователя, например, показать те (и только те) иероглифы, где указанный граф находится в первой или в любой иной позиции, или в комбинации с любым другим графом(-ами) также в любой позиции. Это обеспечивается несколькими режимами выборки иероглифов, одни из которых обеспечивают быстрый ввод, другие простой и гибкий поиск новых и неизвестных пользователю иероглифов (см. раздел 6).
[0023] Для описания графической структуры иероглифов на основании классического набора ключей Канси (с некоторыми изменениями, которые будут подробно описаны ниже в разделе 6) разработан набор графов в 200 шт. (см. таблицу 1). Ключи Канси достаточно полно охватывают графический состав иероглифов, но некоторые из них встречаются крайне редко, например, ключ 龠, одновременно являющийся и отдельным иероглифом, в составе ланкастерского корпуса иероглифов встречается с уничтожающе малой частотой 2 раза на более чем 58 млн. иероглифов как отдельный иероглиф и ни разу в составе других иероглифов. Кроме традиционных ключей Канси, в составе иероглифов встречаются "не ключевые" компоненты, т.е. такие, которые не имеют графического сходства с традиционными ключами Канси, и которые, тем не менее, достаточно точно и однозначно дискриминируют иероглифы. Для примера достаточно взглянуть на иероглифы 乙 и 乞. Верхний элемент второго иероглифа не представлен в списке ключей Канси, но именно он отличает данный иероглиф от предыдущего, являющегося как раз ключом. Как уже отмечалось выше (см. раздел 2, способ ввода по ключам), ключи Канси широко используются в традиционной иероглифике и известны практически каждому человеку, изучающему иероглифы. Это, по-сути, база традиционной иероглифики. Поэтому, чем ближе состав используемого в настоящем изобретении набора графов к ключам Канси, тем проще освоение настоящего способа ввода. В предлагаемом наборе лишь 8 графов не являются ключами Канси либо их вариантами. Следовательно, освоение такого набора для пользователя не составит труда.
[0024] На основании вышеуказанного набора графов, разработанного автором настоящего изобретения, с учетом вышеизложенных правил декомпозиции, автором изобретения была также составлена таблица описания иероглифов, в которой для каждого иероглифа описана полная последовательность составляющих его графов и указан его маркер - минимальная последовательность графов, однозначно идентифицирующая данный иероглиф среди рассматриваемого множества таковых. Порядок графов маркера сохраняет взаимное расположение их в полной последовательности графов иероглифа (как пример, часть таблицы описания иероглифов приведена в представленной ниже таблице 2). Ввод иероглифа осуществляется как выбор его из таблицы описания иероглифов по указанным пользователем параметрам: графическому составу его компонентов, т.е. той или иной последовательности графов, и изменяемым режимам выборки, которые будут подробно описаны ниже. На основе этого способа ввода разработаны клавиатуры и системы для быстрого ввода иероглифов и для облегченного поиска незнакомых иероглифов по любой комбинации его графов. Клавиатура представляет собой множество клавиш (аппаратных либо виртуальных), кодирующих графы, клавиши для ввода знаков препинания, цифр и одну или более служебных или управляющих клавиш. Для составления описанной выше таблицы описания иероглифов был использован визуальный анализ как можно большего числа иероглифов, выделение из них повторяющихся графов, и описание с помощью этих графов как можно большего числа иероглифов. При выделении повторяющихся графических элементов, за основу была взята система ключей Канси, из которой были удалены некоторые редко встречающиеся в иероглифах ключи, и в которую были добавлены некоторые не ключевые графические элементы. Также, в набор графов, полученный в результате упомянутого выделения, был включен дополнительный граф-модификатор (см. раздел 6, [0034]), не присутствующий в качестве графического элемента в составе иероглифа, но обеспечивающий в случае необходимости уникальность его описания. В результате, полученная таблица описания иероглифов включает в себя для каждого иероглифа уникальную последовательность графов, однозначно идентифицирующую каждый иероглиф из рассматриваемого множества. Причем на основе этих уникальных последовательностей для каждого иероглифа могут быть выделены более короткие последовательности графов, не теряющие уникальности при уменьшении количества графов, и включающие в себя, как правило, только первый, второй и последний графы иероглифа или, как редкое исключение, первый, второй, предпоследний и последний графы. Эти последовательности, являясь уникальными идентификаторами иероглифов, в свою очередь, могут быть использованы для выявления вышеуказанных маркеров, как минимальных последовательностей графов, достаточных для идентификации каждого иероглифа. Более подробная информация по этим аспектам настоящего изобретения приведена в разделе 6.
[0025] Расчет частот встречаемости графов в составе маркеров позволил расположить графы на клавиатуре таким образом, чтобы наиболее часто встречающиеся в составе маркеров графы были сосредоточены в центре клавиатуры, и при вводе произвольного текста требовалось бы минимальное перемещение указывающего устройства или пальцев пользователя на виртуальной клавиатуре, либо на аппаратной (см. фиг. 2-6). Предложенная схема расположения графов клавиатуры также является оригинальной и не известной из решений уровня техники для способов структурного ввода. Такая схема позволяет дополнительно повысить эффективность ввода согласно настоящему изобретению. При этом, информация о составе маркеров может быть использована для блокировки в процессе ввода бессмысленных комбинаций графов. Благодаря этому снижается количество возможных механических ошибок пользователя и облегчается освоение описываемого способа ввода (см. о блокировке клавиш в разделе 6, [0048]).
5. Краткое описание чертежей
[Фиг 1] Фиг. 1 - логическая схема системы для ввода иероглифов.
[Фиг. 2] Фиг. 2 - раскладка графов на полномерной клавиатуре согласно первому варианту осуществления настоящего изобретения.
[Фиг. 3] Фиг. 3 - раскладка графов на уменьшенной клавиатуре согласно второму варианту осуществления настоящего изобретения (начальное и альтернативное состояния).
[Фиг. 4] Фиг. 4 - раскладка графов на компактной клавиатуре согласно третьему варианту осуществления настоящего изобретения (начальное и альтернативное состояния).
[Фиг. 5] Фиг. 5 - аппаратная клавиатура для ввода иероглифов с полным набором клавиш.
[Фиг. 6] Фиг. 6 - аппаратная клавиатура с уменьшенным набором клавиш.
[Фиг. 7] Фиг. 7 - область экрана пользовательского устройства во время ввода иероглифов с помощью аппаратной клавиатуры.
[Фиг. 8] Фиг. 8 - блок-схема способа ввода иероглифов. Общая схема для всех режимов выборки кроме выборки по маркерам с блокировкой клавиш (вариант 1).
[Фиг. 9] Фиг. 9 - блок-схема способа ввода иероглифов по маркерам с блокировкой клавиш (вариант 2).
[Фиг. 10] Фиг. 10 - блокировка клавиш на уменьшенной виртуальной клавиатуре после ввода первого графа (этап S908).
[Фиг. 11] Фиг. 11 - информационное окно помощи по составу иероглифа.
6. Подробное описание вариантов осуществления настоящего изобретения
[0026] Предпочтительные варианты осуществления настоящего изобретения теперь будут описаны более подробно со ссылкой на чертежи, на которых идентичные элементы на разных фигурах, по возможности, идентифицируются одинаковыми ссылочными позициями. Эти варианты осуществления представлены посредством пояснения настоящего изобретения, которое, однако, не следует ими ограничивать. Специалисты в данной области техники поймут после ознакомления с настоящим подробным описанием и чертежами, что могут быть сделаны различные модификации и варианты.
[0027] Настоящий способ ввода иероглифов разработан для китайских иероглифов упрощенного начертания. Однако, аналогичные принципы могут быть использованы при разработке способа композиционного ввода и для традиционного начертания иероглифов, а также для других основанных на китайских иероглифах системах письма, например японских иероглифов.
[0028] Настоящий способ основан на том, что все иероглифы состоят из ограниченного набора неделимых компонентов, которые будем называть графы. Например, иероглиф 我 "я" состоит из двух графов: 手 и 戈, - а иероглиф 鹅 "гусь" состоит из трех графов: 手, 戈 и 鸟. Способ ввода согласно настоящему изобретению не предполагает никакой иерархии иероглифов, никакого различия между ними по алгоритмам обработки при вводе. При разработке данного способа учитывалось, что графы должны полностью охватывать все графическое многообразие иероглифов, т.е. иероглифы должны состоять из графов и только графов, и в состав иероглифов не должно входить ни одного элемента, не принадлежащего разработанному набору графов, разделение каждого иероглифа на графы должно быть однозначным, и последовательность графов каждого иероглифа должна быть уникальной. Исходя из этих требований, на основе ключей Канси в процессе визуального анализа рассматриваемого множества наиболее часто употребляемых иероглифов был выделен минимально-необходимый набор в составе 200 графов, который исчерпывающе перечислен вместе с вариантами начертания графов в иероглифах в представленной ниже таблице 1. Часть ключей Канси не была включена в разработанный набор графов ввиду редкости их употребления, часть не ключевых элементов, которые не имеют графического сходства с традиционными ключами Канси или их вариантами, была добавлена в набор графов в качестве отдельных графов (эти графы отмечены буквой "н" в таблице 1). Как было показано при анализе способов структурного кодирования (см., например, способ цанцзе в разделе 2), уменьшение количества компонентов ведет к удлинению кодирующей последовательности и, соответственно к снижению эффективности ввода за счет увеличения количества необходимых манипуляций при вводе. Бóльшее количество графов способно несколько уменьшить количество необходимых компонентов в описании некоторых иероглифов, но в неизбежно ограниченном пространстве экранов мобильных устройств "цена" такого увеличения снижается за счет высокой "платы за место": большой набор графов физически трудно разместить на ограниченном по размеру экране, таким образом снижается удобство для пользователя и наглядность набора графов.
[0029] Таблица 1. Разработанный автором набор графов для использования в способе, клавиатурах и системах ввода согласно настоящему изобретению.
[0030] Графы в таблице 1 расположены по мере уменьшения частоты их употребления. В первой позиции каждой строки (после номера строки) указан основной граф, а в последующих позициях, если они есть, указаны варианты начертания данного графа в разных иероглифах. Все варианты ключей Канси, включенных в набор графов, как правило, отнесены к одному и тому же графу, т.е. варианты таких ключей считаются вариантами совпадающих с ними по начертанию графов. Другими словами, если граф совпадает с ключом Канси (или с одним из его вариантов), то все остальные варианты данного ключа являются вариантами данного графа, и поэтому, как правило, в таблице 1 они сведены в одну строку. Исключение составляют 2 графа: "亻" (строка 3), выделенный в отдельный граф вариант ключа "人", и "扌" (строка 19), выделенный в отдельный граф вариант ключа "手". Разделение этих двух ключей Канси и использование их вариантов в качестве отдельных графов связано с высокой степенью неопределенности в противном случае. Например, если граф "扌" рассматривать простым вариантом графа "手" (как это делает традиция в отношении ключа "手"), то для машины иероглиф "右" и "扣" будут неотличимы, ибо последовательность графов обоих иероглифов будет одна и та же: "手" и "口" (первый граф иероглифа 右, как видно из строки 9 таблицы 1, является вариантом графа 手). То же и в отношении иероглифов "左" и "扛", и в других подобных случаях. В таблице описания иероглифов все варианты начертания графов представлены одним графом, в данном случае первым в строке таблицы 1. Совершенно понятно, что все варианты графов в этом отношении равнозначны, и с той или иной степенью удобства могут быть использованы в качестве основного в таблице описания иероглифов. Например, любой из 5-ти вариантов графа из строки 4 в таблице 1 может быть использован в качестве основного в таблице описания иероглифов. При сохранении единообразия в описании иероглифов замена вариантов начертания графов никак не влияет на работоспособность изобретения.
[0031] Правила декомпозиции иероглифов в настоящем способе ввода или при составлении описания иероглифов в таблице описания иероглифов согласно настоящему изобретению по сравнению с известными способами структурного кодирования предельно просты и состоят в следующем.
[0032] 1. Направление декомпозиции слева-сверху вправо-вниз, для охватывающих графов (т.е. таких, внутри которых располагаются другие графы) - снаружи внутрь. Например, иероглиф 国 - описывается последовательностью графов 囗 и 玉.
[0033] 2. В случае неоднозначности декомпозиции приоритет отдается варианту с меньшим количеством графов. Например, иероглиф 喜 может быть описан двумя последовательностями графов: - по этому правилу предпочтителен первый вариант.
[0034] 3. Все коллизии декомпозиции разрешаются добавлением в описание одного из иероглифов участников коллизии "пустого" графа-модификатора, обозначаемого знаком "*". (Коллизиями будем называть ситуацию, когда в результате декомпозиции не удается получить уникальную последовательность графов, т.е. два или более иероглифов имеют одну и ту же последовательность графов.) В качестве примера рассмотрим иероглифы 员 и 呗, последовательность графов которых одинакова: 口 и 贝 (см. представленную ниже таблицу 2, которая является частью составленной таблицы иероглифов и показывает, в качестве примера, описание для 23-х иероглифов). Для того, чтобы исключить неопределенность в таких случаях, в конец полной последовательности графов более редкого иероглифа (частота использования иероглифов может быть взята из ланкастерского корпуса Р. Сяо) добавляется пустой, не существующий в составе графического образа иероглифа граф-модификатор "*". Этот пустой граф добавляется в описание иероглифа для того, чтобы обеспечить уникальность последовательности его графов. Последовательность графов чаще встречающегося иероглифа 员 (yuán) будет представлена строкой "口贝", а более редкого иероглифа 呗 (bei) строкой "口贝*" (обратим внимание: "более редкого", - это важно для ускорения ввода реальных текстов, таким образом чаще употребляемые иероглифы и вводятся быстрее, и запоминаются проще). Этот же граф-модификатор "*" используется в настоящем изобретении и для решения других коллизий, например, для различения иероглифов 鸟 (niǎo) и 乌 (wū), последовательность графов которых, соответственно будет выглядеть как "鸟" и "鸟*", поскольку иероглиф 乌 (wū) используется реже. Граф-модификатор не имеет собственного графического образа в составе иероглифа, но фиксирует при этом визуальное отличие двух иероглифов, как показано в обоих примерах. Понятно, что в качестве упомянутого графа-модификатора может быть использован любой другой знак, или специальный символ, отличный от вышеупомянутого знака "*".
[0035] Таблица 2. Пример описания 23-х иероглифов в таблице описания иероглифов, составленной автором для использования в способе ввода согласно настоящему изобретению.
[0036] Описанные правила декомпозиции позволили для каждого иероглифа из рассматриваемого множества наиболее часто употребляемых иероглифов построить уникальные последовательности графов, однозначно описывающие каждый иероглиф и, таким образом, построить таблицу описания иероглифов, часть которой приведена выше в таблице 2 для 23 иероглифов. Взаимно-однозначное соответствие иероглифа и его описания с помощью последовательности графов обеспечивает однозначность идентификации любого иероглифа из данного множества. Последовательно вводя графы того или иного иероглифа, пользователь в результате запроса к данной таблице получит в конечном итоге единственный иероглиф, соответствующий данной последовательности графов. Анализ последовательности графов показал, что для однозначной идентификации иероглифа ввод полной последовательности графов избыточен, т.е. получить уникальный иероглиф можно с гораздо меньшими затратами. При этом автором настоящего изобретения был разработан алгоритм идентификации иероглифов по введенным графам. По мере ввода графов этот алгоритм извлекает иероглифы из таблицы описания иероглифов, рассматривая введенные графы в следующем порядке:
1) один введенный граф алгоритм считает первым графом общей последовательности графов;
2) два введенных графа рассматриваются последовательно как:
а) первый и последний графы общей последовательности графов или
б) первый и второй графы общей последовательности графов;
3) три введенных графа рассматриваются как:
а) первый, второй и последний графы общей последовательности графов или
б) первый, второй и третий графы общей последовательности графов;
4) четыре введенных графа рассматриваются как первый, второй, последний и предпоследний графы общей последовательности графов.
Перебор вариантов именно в такой последовательности позволяет однозначно идентифицировать все иероглифы из рассматриваемого данным способом множества. Алгоритм построен таким образом, что он возвращает список иероглифов, в котором в первой позиции списка находится иероглиф строго соответствующий введенным графам, а далее располагаются иероглифы, подобные первому по составу графов, но для однозначности идентификации требующие ввода дополнительных графов. Таким образом, будем считать однозначно идентифицированным по данному набору графов иероглиф, возвращаемый в списке иероглифов в первой позиции. В результате анализа работы этого алгоритма было обнаружено, что для однозначной идентификации почти всех иероглифов, состоящих из более чем трех графов, за исключением 42-х шт., достаточно учитывать лишь первый, второй и последний графы полной их последовательности. Эти последовательности для каждого такого иероглифа будем называть fsl-последовательностями (от англ. "first, second, last"), соответственно, алгоритм вычленения этих последовательностей будем условно называть fsl-алгоритмом. Кроме всего прочего, "fsl" ("первый, второй, последний") является удачной мнемоникой для пользователя, особенно на начальном этапе обучения, позволяющей ввести незнакомый иероглиф, еще не зная его маркера (ʺмаркерыʺ будут подробно описаны ниже в контексте режимов выборки [0040]; в качестве примера, маркеры для 23х иероглифов представлены в последнем столбце таблицы 2 выше).
[0037] Важность значения fsl-последовательностей при идентификации иероглифов вряд ли случайна. Развитие иероглифики происходило веками, и опыт многих поколений по запоминанию и использованию иероглифов привел к тому, что общая структура иероглифов как сложных графических образов постепенно, подспудно и неосознанно, приводилась в соответствие с естественными законами восприятия и распознавания сложных графических образов: целостный охват образа, разделение его на компоненты, переход снаружи внутрь. С точки зрения естественности восприятия, выделение первого и последнего компонента графического образа представляется совершенно естественным. Это подтверждается также тем, что есть иероглифы (это 40 иероглифов из упомянутых выше 42-х иероглифов), которые не поддаются идентификации по трем графам, и идентифицируются только по четырем: первому, второму, предпоследнему и последнему, - как бы охватывая периметр иероглифа и переходя внутрь его. Если же различия в структуре двух иероглифов (по-сути, двух графических образов) сосредоточены в самом их центре, то "добраться" до них через описание с помощью первого, второго и последнего графов не удается. Эти два оставшихся из 42-х иероглифов: 暖 и 暧, - каждый состоящий из 5-ти графов различаются только по среднему (третьему) графу и идентифицируются они только по первому, второму и третьему графам. Также совершенно естественным при распознавании сложных графических образов представляется выделение и фиксация неких "меток", "маркеров", характерных для данных образов, и позволяющих их идентифицировать, не обращая внимания на остальные, "незначительные" с этой точки зрения, детали. Из этих соображений был проведен дополнительный анализ fsl-последовательностей. Было замечено, что выборка иероглифов по fsl-алгоритму зачастую "срабатывает" раньше, после ввода только двух графов: первого и второго или первого и последнего, - т.е. и здесь присутствует информационная избыточность, которая может быть устранена. На основе "раннего срабатывания" fsl-алгоритма для каждого иероглифа, после обязательной проверки на уникальность, была выявлена минимальная последовательность графов, которая сохраняет взаимно-однозначное соответствие с соответствующим иероглифом, его маркер. Поскольку, в большинстве случаев fsl-алгоритм срабатывает максимально на трех графах, размер маркеров также не превышает трех графов. Для вышеупомянутых иероглифов, которые fsl-алгоритмом идентифицируются только по четырем графам, также удалось сформировать маркеры из трех графов. Таким образом, для всех иероглифов рассматриваемого множества были сформированы маркеры размером не более трех графов, что позволило организовать ввод иероглифов данного множества с помощью не более чем трех манипуляций. Стоит обратить внимание на то, что маркеры всех иероглифов в первой позиции всегда включают первый граф общей последовательности графов. Второй граф маркера это или второй или последний граф полной последовательности. Третий граф маркера это почти всегда последний граф полной последовательности, и только у девяти иероглифов третий граф маркера есть третий граф полной последовательности таковых. Именно поэтому запоминание маркеров для каждого иероглифа не составляет труда для пользователя. Последнее является дополнительным преимуществом использования настоящего изобретения.
[0038] Согласно настоящему изобретению, 72,5% всех иероглифов имеют маркеры, состоящие из одного или двух графов. А это означает, что в процессе ввода 72,5% иероглифов однозначно идентифицируются после указания только двух графов, т.е. для их идентификации достаточно двух манипуляций пользователя. Если же учесть частоту употребления этих иероглифов в реальных текстах, то оказывается, что в 80% случаев при вводе среднестатистического текста для идентификации иероглифа достаточно лишь двух манипуляций. Такого результата не достигает ни один способ, известный из уровня техники. Также ни один из известных из уровня техники способов ввода вообще не использует идею вычленения маркеров, как характерных компонентов графического образа иероглифов, и использования их для ускорения ввода иероглифов.
[0039] При вводе иероглифов по настоящему способу, выбор иероглифа, соответствующего введенным пользователем графам, осуществляется по таблице описания иероглифов в соответствии с предустановленным пользователем режимом выборки. Поскольку в таблице описания иероглифов хранится информация о полной последовательности графов для каждого иероглифа, способ может использовать различные режимы выборки в зависимости от задачи или степени подготовки пользователя. Вообще настоящий способ позволяет реализовать выборку иероглифов по любой мыслимой комбинации графов. Однако, предпочтительные варианты осуществления настоящего изобретения включат в себя нижеследующие режимы выборки:
[0040] "Свободный режим" - режим выборки всех иероглифов, в которых введенные пользователем графы встречаются в любом порядке. Режим может быть использован для ввода неизвестного пользователю иероглифа, например, с бумажного носителя, для поиска его в словаре или для того, чтобы получить справочную информацию по составу графов или маркера нужного ему иероглифа (см. описание виртуальной клавиатуры далее). Определив несколько графов искомого иероглифа, пользователь вводит их, и в возвращаемом списке иероглифов визуально находит нужный.
[0041] "Последовательный режим" - режим выборки иероглифов при котором введенные пользователем графы встречаются в последовательности графов иероглифов по порядку один за другим и не обязательно с начала иероглифа - полезный режим для поиска "по аналогии" иероглифов, имеющих общие блоки графов, которые также могут выступать и в качестве отдельных иероглифов, что, кроме прочего, позволяет отслеживать вхождение простых иероглифов в состав более сложных. Выделение сходных компонентов иероглифов - полезная процедура, она облегчает запоминание иероглифов и широко используется традицией в обучении иероглифике.
[0042] "Fsl-режим" - режим выборки иероглифов, когда введенные пользователем 3 графа система интерпретирует как первый, второй и последний графы искомого иероглифа (см. абзац [0036]). Весьма полезный способ для быстрого ввода, если пользователь на начальном этапе обучения еще не помнит маркеры. Этот режим позволяет идентифицировать большинство иероглифов (69% или 2987 шт.) после ввода не более чем двух графов и почти все (за исключением 40 шт.) после трех. Для ввода оставшихся 40 иероглифов достаточно к трем введенным уже графам добавить предпоследний граф полной последовательности (см. [0037]). А упомянутые в абзаце [0037] 2 иероглифа (暖 и暧) в этом режиме вводятся по первому, второму и третьему своим графам.
[0043] "По маркерам" - режим выборки иероглифов, когда введенные пользователем графы система интерпретирует как графы маркера и возвращает пользователю иероглифы, содержащие введенные им графы в указанном порядке в маркерах таблицы описания иероглифов. Это самый быстрый режим ввода. Как указывалось выше, 80% иероглифов среднестатистического текста на современном китайском языке в этом режиме идентифицируется уже после двух манипуляций.
[0044] Ввод по маркерам представляет пользователю еще несколько преимуществ. При вводе по маркерам можно отслеживать уже упомянутый выше признак завершения ввода. Напомню, что во всех способах ввода иероглифов сама процедура ввода разделена на 2 стадии.
[0045] 1. Процесс идентификации требуемого иероглифа по тем или иным параметрам, введенным пользователем, и представление его пользователю для ввода, а в случае неопределенности, составление списка иероглифов-кандидатов и предоставление его пользователю для выбора необходимого ему иероглифа.
[0046] 2. Непосредственный ввод искомого иероглифа-кандидата в фокус ввода программы, ожидающей ввода от клавиатуры (он выполняется пользователем "вручную", отдельной манипуляцией).
[0047] При вводе по маркерам в ответ на ввод пользователем первого графа, система возвращает список иероглифов, в котором на первом месте стоит иероглиф, маркер которого или состоит из единственного введенного графа, или начинается с введенного графа. Если возвращаемый список содержит единственный иероглиф, значит ввод графов далее не нужен. В противном случае, после ввода второго графа, единственный иероглиф в возвращаемом списке говорит о том же. После ввода третьего графа, если таковой был возможен, продолжать ввод уже бессмысленно, ибо маркеров размером больше трех графов в данном варианте композиционного ввода нет. Размер возвращаемого списка в 1 иероглиф и есть признак завершения ввода, который может быть автоматически обнаружен и использован в алгоритме ввода. После такого обнаружения вторая стадия традиционной процедуры с участием пользователя теряет смысл, без нее можно обойтись, поскольку, согласно настоящему изобретению, полученный иероглиф может быть отправлен непосредственно в фокус ввода программы, ожидающей ввода от клавиатуры, автоматически (т.е. в ответ на обнаружение признака завершения ввода, что будет дополнительно описано ниже). В процессе ввода по маркерам, ввод 93,2% иероглифов заканчивается по обнаружению признака завершения ввода. Другими словами, в 93,2% случаев способ композиционного ввода увеличивает скорость ввода за счет устранения одной манипуляции. В оставшихся 6,8% случаев, когда потенциальный ввод графов в принципе еще возможен, но требуемый пользователю иероглиф уже представлен в возвращаемом списке в первой позиции, пользователь может отдельной манипуляцией отправить его в фокус ввода программы, ожидающей ввода от клавиатуры.
[0048] Второе преимущество ввода по маркерам заключается в том, что в этом режиме, после ввода очередного графа, с помощью таблицы описания иероглифов очень просто вычислить набор возможных (или "разрешенных") для последующего ввода графов маркера и, таким образом исключить те комбинации графов, которые не встречаются в составе маркеров и в результате возвращают пустой список иероглифов. Для этого достаточно в таблице описания иероглифов выбрать те графы маркера, которые встречаются в следующей позиции маркера после введенного для иероглифов из возвращенного системой на предыдущем этапе списка иероглифов. Тогда, согласно варианту осуществления настоящего изобретения, остальные графы, не попавшие в результирующий список, на матрице графов могут быть заблокированы или переведены в неактивный режим (как показано на фиг. 10). Этот режим блокировки клавиш не только позволяет избавиться от некоторого количества механических ошибок, но также и облегчает освоение способа, предоставляя пользователю визуальную подсказку возможных вариантов непосредственно во время ввода. Это является дополнительным преимуществом использования настоящего изобретения.
[0049] И, наконец, третье преимущество заключается в том, что использование настоящего способа ввода на ранних этапах обучения способствует лучшему запоминанию иероглифов. Если способы структурного кодирования с их сложными правилами декомпозиции могут применяться лишь после того, как иероглиф уже "известен", т.е. легко отличается от других и структура его уже закреплена в памяти, то начинать писать иероглифы настоящим способом ввода можно еще на первых этапах обучения, что как раз способствует пониманию и запоминанию структуры самого иероглифа.
[0050] Поскольку по данным Р. Сяо (см. http://www.lancaster.ac.uk/fass/projects/corpus/data/top50000_Chinese_words.zip) немногим больше половины (около 54,4%) слов современного китайского языка являются двух-, трех- и многосложными (т.е. на письме состоящими из нескольких иероглифов), есть основания представить пользователю возможность вводить сразу многосложные слова, начинающиеся на введенный пользователем иероглиф. Такого рода предиктивный ввод может быть реализован в варианте осуществления настоящего изобретения добавлением в систему таблицы многосложных слов с указанием частоты их использования в языке и счетчиком их употребления. Указанный счетчик может быть выполнен с возможностью записи количества вводов некоторого конкретного слова пользователем. Тогда система сможет предъявлять пользователю для ввода по его выбору в первую очередь либо слова, наиболее часто встречающиеся в языке, либо те слова, которые он сам использует чаще.
Система для ввода иероглифов. Клавиатура для ввода иероглифов.
[0051] Система для ввода иероглифов может быть реализована для всех возможных платформ (например, но без ограничения упомянутыми, Linux, Windows, iOS, Android, BlackBerry OS). Она может содержать некоторое пользовательское устройство и реализованную в нем виртуальную клавиатуру согласно настоящему изобретению. В качестве альтернативы система может содержать некоторое пользовательское устройство и соединенную с ним аппаратную клавиатуру согласно настоящему изобретению. Упомянутым пользовательским устройством может быть, но без ограничения упомянутым, ПК, планшет, смартфон и т.п. Аппаратная клавиатура может быть подключена к пользовательскому устройству по беспроводному (Bluetooth, например) или проводному (USB, PS/2, например) интерфейсам. Аппаратная клавиатура может быть реализована в соответствии с известными технологиями как, например, мембранная, купольная, резиновая, резино-мембранная, емкостная, механическая, магнитная, проекционная, оптическая (фотоэлектрическая) клавиатура. Виртуальная клавиатура может быть реализована как экранная клавиатура.
[0052] Общая логическая схема системы для ввода иероглифов представлена на фиг. 1. В общем виде система может состоять из пользовательского устройства (102) и раскрытой в данном документе клавиатуры, которая может быть реализована либо как отдельная аппаратная клавиатура (101), либо как виртуальная (экранная) клавиатура (107). На фигуре 1 отдельная аппаратная клавиатура (101) и виртуальная клавиатура (107) показаны одновременно. Понятно, что система в других вариантах осуществления может содержать только одну клавиатуру - либо отдельную аппаратную клавиатуру (101), либо виртуальную или экранную клавиатуру (107). Пользовательское устройство (102) может содержать экран (103), блок (104) хранения данных, блок (105) обработки, устройство (106) ввода, экранную (107) клавиатуру, область (108) графов, область (109) иероглифов, область (110) слов, фокус (111) ввода программы, ожидающей ввода от клавиатуры. Клавиатура (101 или 107) содержит набор клавиш графов (не показан на фигуре 1), каждая клавиша из которого выполнена с возможностью ввода отдельного графа из набора графов, набор клавиш ввода знаков препинания и цифр (не показан на фигуре 1), составляющих знаково-цифровую панель, и набор управляющих клавиш (не показан на фигуре 1). Блок (105) обработки пользовательского устройства может быть выполнен с возможностью формирования экранной клавиатуры (107), приема сигнала(ов) от клавиатуры (аппаратной либо виртуальной), формирования запросов к таблицам и наборам, которые используются в настоящем изобретении и могут быть сохранены в блоке (104) хранения данных, который располагается в памяти (постоянной или оперативной) пользовательского устройства (102), отправки (вывода) результатов этих запросов на экран (103) пользовательского устройства, формирования и отображения, по мере необходимости, соответствующих списков в области (108) графов, области (109) иероглифов, области (110) слов и, в конечном итоге, отправки необходимого пользователю иероглифа или слова в фокус (111) ввода программы, ожидающей ввода от клавиатуры. Блок (104) хранения данных может хранить инструкции для реализации этапов способа ввода упрощенных китайских иероглифов, раскрытого в настоящей заявке. Блок (105) обработки может быть выполнен с возможностью считывания этих инструкций из блока (104) хранения данных для выполнения этапов способа ввода упрощенных китайских иероглифов, раскрытого в настоящей заявке. Также блок (105) обработки может быть реализован таким образом, что он будет способен взаимодействовать с любым другим устройством (106) ввода пользовательского устройства, например, со стандартной буквенно-цифровой клавиатурой, с любым позиционирующим устройством (мышью, трек-болом). Пример области экрана (103) пользовательского устройства (102) в процессе работы системы приведен на фиг. 7. Здесь показаны фокус (701) ввода программы, ожидающей ввода с клавиатуры, с текстовым курсором (702), отмечающим в текстовой строке позицию следующего ввода, область (703) графов, область (704) иероглифов и область (705) слов. Понятно, что расположение вышеуказанных областей экрана не обязательно является таким, как показано в иллюстративных целях на фигуре 7. Кроме того, если функция предиктивного ввода многосложных слов отключена, область (705) слов может не отображаться на экране или быть неактивной. Способ ввода будет подробно описан ниже.
[0053] Раскладка графов на клавиатуре была разработана автором настоящего изобретения на основе данных по встречаемости иероглифов в современных китайских текстах (Р. Сяо, ссылку см. ранее). Для всех иероглифов из вышеуказанной таблицы иероглифов была рассчитана частота встречаемости графов в первых двух позициях маркеров. Графы расположены на клавишах по убыванию частоты встречаемости от центра к периферии (см. фиг. 2). При этом было установлено, что первые по частоте встречаемости 100 графов (табл. 1) обеспечивают ввод 90,48% иероглифов. Другими словами, для ввода 90,48% иероглифов достаточно этих 100 графов. Это важно, ибо позволяет использовать клавиатуру для ввода на портативных устройствах с малым размером экрана, демонстрируя пользователю только первую, основную, половину набора графов, и вызывая вторую (правая часть фиг. 3) отдельной управляющей клавишей только в случае необходимости. Такая уменьшенная клавиатура может быть использована как экранная на портативных устройствах пользователя для ввода одной рукой, когда другая рука удерживает само устройство.
[0054] Виртуальная клавиатура, в зависимости от размера экрана устройства, на котором она реализована, может быть выполнена в трех форм-факторах:
[0055] 1) Полномерная, когда клавиатура в развернутом виде состоит из 10-ти рядов по 20 клавиш в каждом (20×10) для настольных ПК, ноутбуков и планшетов с экраном от 10-ти дюймов и выше (фиг. 2). Полномерная клавиатура предназначена для ввода иероглифов как одной рукой, так и двумя, как на обычной клавиатуре.
[0056] 2) Уменьшенная, в виде набора клавиш из 10-ти рядов по 10 клавиш в каждом (10×10), для пользовательских устройств с экраном от 6-ти до 10-ти дюймов (фиг. 3). По умолчанию клавиши в начальном состоянии кодируют первую половину набора графов, расположенных на клавишах по частоте встречаемости от центра к периферии, а нажатием отдельной управляющей клавиши клавиатура переводится в альтернативное состояние, в котором первая часть набора графов заменяется второй его частью, и те же клавиши отвечают за ввод графов из второй половины набора графов, которые также располагаются на клавишах по частоте встречаемости от центра к периферии. В этом варианте осуществления настоящего изобретения клавиатура выполнена с возможностью автоматического переключения вновь в начальное состояние в ответ на ввод очередного графа из второй половины набора или в ответ на следующее нажатие той же управляющей клавиши. Это позволяет достаточно быстро вводить любой(ые) граф(ы) из всего упомянутого множества в 200 графов. Ожидаемая потеря производительности за счет необходимости дополнительной манипуляции по нажатию управляющей клавиши для перевода клавиатуры в альтернативное состояние около 10% - не слишком большая плата за возможность работы на мобильном устройстве.
[0057] 3) Для пользовательских устройств с экраном менее 6-ти дюймов, разработана компактная клавиатура с набором клавиш из 5-ти рядов по 10 клавиш (10×5) (фиг. 4). В этом варианте осуществления настоящего изобретения клавиши также кодируют лишь одну половину набора графов, и для переключения в альтернативное состояние используется отдельная управляющая клавиша. При этом каждая клавиша одновременно кодирует по два графа соответствующей части набора графов: одно нажатие вводит первый граф, второе нажатие - второй, задержка первого нажатия повторяет ввод первого графа, задержка второго повторяет ввод второго графа. Клавиши графов на таком устройстве не меньше кнопок стандартной виртуальной QWERTY клавиатуры, хотя места на экране она будет занимать несколько больше, поскольку у нее на 2 ряда кнопок больше. Понятно, что скорость ввода на такой компактной клавиатуре будет ниже, чем, например, на полномерной, но навык, приобретаемый пользователем при вводе иероглифов на полномерной клавиатуре согласно настоящему изобретению повысит эффективность ввода и в этом варианте осуществления.
[0058] Аппаратная клавиатура может быть реализована в двух первых из выше описанных форм-факторов: 1) и 2) (см. фиг. 5 и фиг. 6). На аппаратной клавиатуре в уменьшенном формате может быть реализована управляющая клавиша, предназначенная для смены первой половины матрицы графов на вторую и наоборот, и действующая подобно привычной клавише Shift на стандартной клавиатуре: пока она нажата, активирована вторая половина набора графов, при отпускании ее вновь активируется первая половина набора.
[0059] Один из возможных вариантов способа ввода рассмотрим на примере работы полномерной аппаратной клавиатуры (фиг. 5). Все режимы выборки, кроме выборки по маркерам, обращаются к полной последовательности графов и работают сходным образом, блок-схема описываемого способа представлена на фигуре 8. Сначала рассмотрим ситуацию, когда кнопка-переключатель Words (504) отключена, т.е. ввод будет идти отдельными иероглифами и функция предиктивного ввода многосложных слов использоваться не будет. Пользователь вводит (S801) нажатием соответствующей клавиши в блоке клавиш графов (505) на клавиатуре нужный ему граф. Система отображает (S802) указанный граф в области (703) графов экрана пользовательского устройства, добавляя его в конец списка графов. Понятно, что после ввода первого графа и исполнения этапа S802 список графов будет состоять из единственного графа. Далее, в зависимости от установленного одного из описанных выше режимов выборки иероглифов (в данном варианте осуществления на клавиатуре это может быть выполнено кнопкой Alt Mode (513), которая переключает режимы выборки в установленном порядке и задействованный режим отображается в области уведомления на экране пользовательского устройства), и на основе списка введенных пользователем графов система формирует (S803) список иероглифов. На следующем этапе (S804) проверяют размер списка иероглифов. Если список иероглифов состоит только из одного иероглифа (Да на этапе S804), значит он идентифицирован однозначно, и обнаружен признак завершения ввода, этот иероглиф передают (S805) в фокус ввода программы, ожидающей ввода от клавиатуры, и очищают область (703) графов и область (704) иероглифов, способ ожидает ввода очередного графа для ввода следующего иероглифа. Если же список иероглифов состоит из более чем одного иероглифа (Нет на этапе S804), этот список выводят (S806) в область (704) иероглифов. Затем, нужный пользователю иероглиф в списке иероглифов может быть выбран (S807). Данный способ ввода может быть реализован так, что первая позиция списка иероглифов (первая позиция в области (704) иероглифов, в которой иероглиф может быть выделен подчеркиванием) является активной и может иметь специальное назначение для переноса иероглифов из этой позиции в фокус ввода. Иероглиф из активной позиции области иероглифов может быть отправлен в фокус ввода любой специально зарезервированной для этого клавишей (Transfer Gl (511) в показанном на фигуре 5 варианте), включая и клавиши стандартной буквенно-цифровой клавиатуры, если таковая подключена к принимающему ввод устройству, или любую клавишу мыши, не задействованную в качестве указателя, а также любым другим способом, предназначенным для переноса первого иероглифа из области иероглифов в фокус ввода. Перемещение активной позиции списка иероглифов может быть осуществлено с помощью клавиш-стрелок горизонтального направления из блока 514 со стрелками. Это позволяет выбрать любой иероглиф списка в области иероглифов для переноса его в фокус ввода, не отрываясь от клавиатуры. Понятно, выбор иероглифа в списке также может происходить указанием его пальцем или стилусом на сенсорном экране или кликом мыши. Также в данном варианте реализации настоящего способа ввода может быть предусмотрена возможность переноса иероглифа из активной позиции области иероглифов в фокус ввода путем нажатия любой клавиши из блока клавиш знаков препинания (502). При этом в фокус ввода переносится иероглиф, а после него ставится соответствующий знак препинания. Область иероглифов (704) может быть реализована с возможностью прокрутки для просмотра всего списка иероглифов, если он весь не может быть размещен в отведенном ему экранном пространстве. Если на данном этапе иероглиф выбран тем или иным из вышеописанных способов, он переносится в фокус ввода, область иероглифов и область графов очищаются (S805), система возвращается к этапу ввода графа (S801) для ввода следующего иероглифа. Если на этом этапе иероглиф не выбран, переходят к вводу следующего графа (S801). В данном варианте реализации настоящего способа ввода этап S806 может быть перемещен в позицию непосредственно после этапа S803. Это не нарушит работоспособность способа, хотя и приведет к бессмысленному выводу списка иероглифов, если он содержит единственный иероглиф.
[0060] На фиг. 5 дополнительно показаны клавиши: Clear All (506), которая выполнена с возможностью очистки области графов и области иероглифов; BackSpace (508), которая выполнена с возможностью удаления последнего символа в фокусе ввода программы, ожидающей ввода с клавиатуры; и Enter (509), которая выполнена с возможностью перевода строки в фокусе ввода программы, ожидающей ввода с клавиатуры. Нажатие клавиши-переключателя Num/? (501) меняет кодировку клавиш знаков препинания (502) так, что они кодируют не знаки препинания, а цифры, а также может включать режим подсказки. И знаки препинания, и цифры вводятся непосредственно в фокус ввода, а упомянутый режим подсказки работает следующим образом. Как уже отмечалось ранее, система дружественна к пользователю и не требует от него невозможного. Встретив незнакомый иероглиф, пользователь, не вспоминая сложные правила декомпозиции, отмечает, что в его составе есть, к примеру, граф "亻" и граф "日", переключает режим выборки иероглифов с помощью переключателя Alt Mode (513) на свободную выборку, и последовательно вводит графы "亻" и "日". В ответ на такой ввод система в области иероглифов (704) возвращает список из 10-ти иероглифов, содержащих данные графы: 但, 便, 借, 伸, 储, 倡, 鞭, 僧, 俺, 僚, - среди которых пользователь может без труда найти необходимый ему иероглиф. Теперь пользователю нужно нажать клавишу-переключатель Num/? (501), и кликнуть по искомому иероглифу мышью, например, или прикоснуться к нему пальцем или стилусом на сенсорном экране. При нажатой клавише Num/? система не отправляет иероглиф в фокус ввода, а отображает дополнительное окно (фиг. 11), в котором указан состав графов выбранного пользователем иероглифа и его маркер - вся информация о иероглифах хранится в системе и в любой момент времени доступна пользователю.
[0061] Реализация описанного ниже способа ввода с выборкой иероглифов по маркерам (см. фиг 9) несколько отличается от предыдущей реализации способа (см. фиг 8). При включении переключателя блокировки клавиш Reduct (503, фиг. 5) на этапе S901 производится предварительная подготовка клавиш графов. Поскольку графы и 舛 никогда не встречаются в первой позиции маркера, кодирующие их клавиши на клавиатуре блокируются. Далее все происходит так же как и в предыдущем варианте, включая этап S904: нажимают клавишу необходимого графа на клавиатуре (S902), отображают введенный граф в области графов 703 (S903), формируют список иероглифов (S904). Далее производится проверка на признак завершения ввода, и при его обнаружении, т.е. единственном возвращенном иероглифе (S905), этот единственный иероглиф отправляется в фокус ввода, при этом очищаются область графов и область иероглифов (этап S906), а если иероглифов в списке больше одного, это означает, что необходимо вывести список иероглифов в область иероглифов (этап S908). Предварительно, на этапе S907, разблокируют все клавиши графов на клавиатуре и формируют новый список графов, допустимых для последующего ввода, для чего для всех иероглифов, представленных в списке иероглифов, выбирают графы в позиции их маркера на одну большую, чем введено графов (например, если был введен 1 граф, нужно выбрать графы второй позиции маркера). После этого клавиши тех графов, которые не присутствуют в результирующем списке, блокируют. Этапы (S907) и (S908) можно поменять местами, на работоспособности способа это не скажется. После этого (S909) пользователю дается возможность, как и в предыдущем варианте, выбрать иероглиф или перейти к этапу ввода следующего графа (S902). Клавиатура для ввода последующего графа уже подготовлена на этапе S907.
[0062] Теперь опишем возможности режима ввода многосложных слов, который включается клавишей-переключателем Words (504). При нажатой кнопке Words после ввода каждого графа система обращается к таблице многосложных слов, и выбирает из этой таблицы слова, которые начинаются на первый иероглиф в списке предлагаемых иероглифов в области иероглифов (704), и выводит их в области слов (705). Слова в этом списке располагаются в порядке уменьшения частоты их использования. Для передачи активного, т.е. первого в списке, выделенного подчеркиванием, как и в области иероглифов, наиболее часто используемого слова, в фокус ввода достаточно нажать клавишу Transfer W (512) или, если пользователю нужно не первое слово из этого списка, он может выбрать его, сместив метку активности с помощью клавиш-стрелок вертикального направления блока 514, и отправить в фокус ввода посредством любой удобной ему манипуляции: клавишей Transfer W (512) или кликом мыши по нужному слову, или прикосновения пальцем (или стилусом) на сенсорном экране. Также, подобно описанному выше способу ввода отдельных иероглифов, клавиши знаков препинания (502) могут передавать первое слово из области слов (705) непосредственно в фокус ввода с вставкой после этого слова самого знака препинания. Поскольку список слов может быть достаточно большим, область слов (705) может быть реализована с возможностью прокрутки его содержимого. Для ускорения поиска в списке слов используется клавиша Alt Words (510). При нажатой клавише Alt Words система воспринимает введенный пользователем граф как первый граф второго иероглифа ожидаемого слова. Система выбирает из таблицы многосложных слов слова, которые начинаются на активный иероглиф списка иероглифов в области иероглифов (704), и второй иероглиф которых начинается графом, введенным при нажатой клавише Alt Words. Этого обычно достаточно, чтобы список сократился до обозримого. Каждая операция по переносу слова из списка слов в фокус ввода увеличивает на единицу счетчик использования данного слова в таблице многосложных слов. Поэтому данный вариант реализации способа композиционного ввода может быть выполнен таким образом, что пользователь может иметь возможность выбрать, в каком порядке выводить многосложные слова в области слов (705) или в порядке уменьшения частоты их использования в языке, или в порядке уменьшения их использования данным пользователем.
[0063] Режим блокировки клавиш - еще одно небольшое дополнительное преимущество использования вместо условных буквенных кодов информации о реальном составе иероглифов. Этот режим используется вместе с вводом по маркерам, как было описано выше. После каждого введенного графа, система анализирует, какие графы могут быть введены на следующем этапе ввода, и блокирует на клавиатуре клавиши тех графов, ввод которых бессмыслен. На фиг. 10 на примере уменьшенной клавиатуры показана блокировка клавиш после ввода двух графа "人". На клавиатуре оставлены активными только клавиши тех графов, которые реально встречаются в маркерах, начинающихся на уже введенный граф. Это снижает количество ошибок ввода особенно на малых экранах, и при недостаточном навыке начинающего пользователя дает ему подспудную подсказку, ограничивая его от неверных действий.
[0064] Хотя данное изобретение было описано с определенной степенью детализации, следует понимать, что настоящее раскрытие было сделано только в качестве иллюстрации и что к многочисленным изменениям в деталях конструкций, компоновке частей раскрытых систем и клавиатур для ввода иероглифов или этапах способа для ввода иероглифов можно прибегать не выходя за рамки объема изобретения, который определяется нижеследующей формулой изобретения.
название | год | авторы | номер документа |
---|---|---|---|
АРХИТЕКТУРА РАСПОЗНАВАНИЯ ДЛЯ ГЕНЕРАЦИИ АЗИАТСКИХ ИЕРОГЛИФОВ | 2008 |
|
RU2477518C2 |
СПОСОБ ИЗУЧЕНИЯ СИСТЕМЫ ПИСЬМА КИТАЙСКИМИ ИЕРОГЛИФАМИ И ОСНОВАННЫХ НА КИТАЙСКИХ ИЕРОГЛИФАХ СИСТЕМ ПИСЬМА ДРУГИХ ЯЗЫКОВ | 2006 |
|
RU2470354C2 |
СИСТЕМА УСТРАНЕНИЯ НЕОДНОЗНАЧНОСТИ С УМЕНЬШЕННОЙ КЛАВИАТУРОЙ | 1998 |
|
RU2206118C2 |
ИНТЕРФЕЙС ПРОГРАММИРОВАНИЯ ДЛЯ СЕМАНТИЧЕСКОГО МАСШТАБИРОВАНИЯ | 2011 |
|
RU2600543C2 |
СЕМАНТИЧЕСКОЕ МАСШТАБИРОВАНИЕ | 2011 |
|
RU2611970C2 |
СИСТЕМА И СПОСОБ ЗАЩИТЫ ПЕРЕДАЧИ ДАННЫХ С УСТРОЙСТВ ВВОДА | 2014 |
|
RU2568283C2 |
СИСТЕМА УСТРАНЕНИЯ НЕОДНОЗНАЧНОСТИ С УМЕНЬШЕННОЙ КЛАВИАТУРОЙ | 1998 |
|
RU2214620C2 |
АВТОМОБИЛЬНАЯ КОММУНИКАЦИОННО-РАЗВЛЕКАТЕЛЬНАЯ СИСТЕМА | 2015 |
|
RU2690208C2 |
СИСТЕМА И СПОСОБ АВТОМАТИЧЕСКОГО ЗАВЕРШЕНИЯ ФОРМУЛ ЭЛЕКТРОННОЙ ТАБЛИЦЫ | 2005 |
|
RU2406131C2 |
СПОСОБ УПРАВЛЕНИЯ ДАННЫМИ В СФОРМИРОВАННОМ КОМПЬЮТЕРНОМ ДОКУМЕНТЕ И МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ С ЗАПИСАННОЙ НА НЕМ ПРОГРАММОЙ | 2007 |
|
RU2379748C2 |
Изобретение относится к области ввода упрощенных китайских иероглифов. Технический результат заключается в повышении скорости ввода иероглифов. Способ содержит этапы, на которых: выбирают граф на матрице графов, добавляют упомянутый граф в список графов, формируют список иероглифов путем выборки их из таблицы описания иероглифов; если в списке иероглифов только один иероглиф, автоматически переносят этот иероглиф из списка иероглифов в фокус ввода ожидающей ввода программы, очищают список графов и список иероглифов и переходят к выбору графа для ввода следующего иероглифа; если в списке иероглифов более одного иероглифа, отображают список иероглифов, при этом, если искомый иероглиф располагается в первой позиции списка иероглифов, переносят этот иероглиф из списка иероглифов в фокус ввода ожидающей ввода программы, очищают список графов и список иероглифов и переходят к выбору графа для ввода следующего иероглифа; если искомый иероглиф не присутствует в первой позиции списка, переходят к выбору следующего графа или визуально находят этот иероглиф в отображенном списке иероглифов и переносят его из списка иероглифов в фокус ввода ожидающей ввода программы, очищают список графов и список иероглифов и переходят к выбору графа для ввода следующего иероглифа. 4 н. и 10 з.п. ф-лы, 11 ил., 2 табл.
1. Способ ввода иероглифов, содержащий этапы, на которых:
выбирают из набора графов граф, который составляет часть подлежащего вводу иероглифа;
включают в список графов выбранный граф, и отображают этот список графов в области графов;
формируют список иероглифов, содержащих выбранный граф, путем выборки их из таблицы описания иероглифов на основе упомянутого списка графов и в зависимости от предварительно установленного режима выборки иероглифов, при этом:
- если в списке иероглифов только один иероглиф, автоматически переносят этот иероглиф из списка иероглифов в фокус ввода ожидающей ввода программы, очищают список графов и список иероглифов и переходят к выбору графа для ввода следующего иероглифа;
- если в списке иероглифов более одного иероглифа, отображают этот список иероглифов на экране, при этом:
- если подлежащий вводу иероглиф находится в первой позиции списка иероглифов, переносят этот иероглиф из списка иероглифов в фокус ввода ожидающей ввода программы, очищают список графов и список иероглифов и переходят к выбору графа для ввода следующего иероглифа;
- если подлежащий вводу иероглиф не находится в первой позиции списка иероглифов,
- переходят к выбору следующего графа, который составляет часть упомянутого подлежащего вводу иероглифа, или
- выбирают упомянутый подлежащий вводу иероглиф в отображаемом списке иероглифов и переносят его из списка иероглифов в фокус ввода ожидающей ввода программы, очищают список графов и список иероглифов и переходят к выбору графа для ввода следующего иероглифа.
2. Способ ввода иероглифов по п. 1, в котором набор графов содержит следующие 200 графов:
при этом графы в наборе расположены в порядке уменьшения частоты их встречаемости, и графы в строках 4, 9, 12, 16, 17, 23, 25, 34, 44, 59, 62, 72, 80, 83, 84, 92, 99, 100, 101, 103, 114, 116, 127, 128, 140, 150, 152, 154 набора графов имеют более одного варианта начертания в иероглифах.
3. Способ ввода иероглифов по п. 2, при этом для каждого иероглифа в таблице описания иероглифов указаны:
- полная последовательность составляющих иероглиф графов, которая является уникальной в рамках всего множества иероглифов, внесенных в таблицу описания иероглифов, и которая однозначно идентифицирует данный иероглиф среди рассматриваемого множества иероглифов,
- маркер иероглифа как минимальная последовательность графов размером от одного до трех графов, начинающаяся с первого графа полной последовательности графов данного иероглифа, которая сохраняет уникальность в рамках всего множества иероглифов, внесенных в таблицу описания иероглифов, и которая однозначно идентифицирует данный иероглиф среди рассматриваемого множества иероглифов.
4. Способ ввода иероглифов по п. 3, при этом уникальность полной последовательности составляющих иероглиф графов в таблице описания иероглифов обеспечивается следующими правилами декомпозиции:
1) направление декомпозиции слева-сверху вправо-вниз, для охватывающих графов - снаружи-внутрь,
2) графы неделимы, т.е. разделение графов не допускается,
3) в случае неоднозначности декомпозиции приоритет отдается варианту с меньшим количеством графов,
все коллизии при декомпозиции, т.е. совпадения последовательностей составляющих иероглифы графов, полученных в соответствии с первыми тремя правилами, для двух или более иероглифов разрешаются добавлением в описание более редкого из иероглифов участников коллизии отдельного графа-модификатора, не имеющего собственного графического образа в составе иероглифа, но фиксирующего при этом визуальное отличие данных иероглифов.
5. Способ ввода иероглифов по п. 1, в котором упомянутый предварительно установленный режим выборки иероглифов выбирают из группы, состоящей по меньшей мере из:
- свободного режима, при котором из таблицы описания иероглифов выбираются все иероглифы, в которых выбранные пользователем графы встречаются в полной последовательности графов этих иероглифов в любом порядке;
- последовательного режима, при котором из таблицы описания иероглифов выбираются те иероглифы, в которых выбранные пользователем графы встречаются в полной последовательности графов этих иероглифов по порядку один за другим и необязательно с начала иероглифа;
- fsl-режима, который по мере выбора графов извлекает иероглифы из таблицы описания иероглифов, рассматривая выбираемые графы в следующем порядке:
1) один выбранный граф рассматривается как первый граф общей последовательности графов;
2) два выбранных графа рассматриваются последовательно как:
а) первый и последний графы общей последовательности графов иероглифа или
б) первый и второй графы общей последовательности графов иероглифа;
3) три выбранных графа рассматриваются как:
а) первый, второй и последний графы общей последовательности графов иероглифа или
б) первый, второй и третий графы общей последовательности графов иероглифа;
4) четыре выбранных графа рассматриваются как первый, второй, последний и предпоследний графы общей последовательности графов иероглифа;
- режима выборки по маркерам, при котором из таблицы описания иероглифов выбираются те иероглифы, маркеры которых в таблице описания иероглифов содержат выбранные графы в строгом соответствии с порядком их выбора.
6. Способ ввода иероглифов по п. 1, дополнительно содержащий этапы, на которых после формирования списка иероглифов обращаются к таблице многосложных слов, выбирают из этой таблицы слова, которые начинаются на первый иероглиф в списке иероглифов, формируют из выбранных слов список слов, отображают его на экране и выбирают в этом списке слово для переноса его в фокус ввода ожидающей ввода программы.
7. Система для ввода китайских иероглифов, содержащая:
- пользовательское устройство (102);
- аппаратную клавиатуру (101) для композиционного ввода упрощенных китайских иероглифов на упомянутом пользовательском устройстве, которая подключена к пользовательскому устройству (102) и выполнена с возможностью взаимодействия с ним,
при этом аппаратная клавиатура (101) содержит:
- набор клавиш графов, каждая клавиша которого выполнена с возможностью ввода отдельного графа из набора графов,
- набор клавиш ввода знаков препинания и цифр, составляющих знаково-цифровую панель,
- набор управляющих клавиш,
при этом пользовательское устройство (102) содержит:
- блок (104) хранения данных, выполненный с возможностью хранения инструкций для реализации этапов способа ввода иероглифов по любому из пп. 1-6, а также хранения набора графов, таблицы описания иероглифов, таблицы многосложных слов,
- блок (105) обработки, выполненный с возможностью ввода иероглифа в фокус ввода ожидающей ввода программы, выполняемой на этом пользовательском устройстве (102), посредством приема одного или более пользовательских вводов от наборов клавиш аппаратной клавиатуры и их обработки в соответствии с инструкциями, хранимыми в блоке (104) хранения данных; и
- экран (103), выполненный с возможностью отображения фокуса ввода ожидающей ввода программы, списка введенных графов, списка возвращаемых иероглифов и списка возвращаемых слов.
8. Система для ввода китайских иероглифов по п. 7, аппаратная клавиатура (101) которой выполнена в одном из 2-х форм-факторов:
- полномерная 20×10 или
- уменьшенная 10×10 с возможностью переключения частей набора графов, назначенных набору клавиш графов аппаратной клавиатуры, удержанием/отпусканием клавиши из упомянутого набора управляющих клавиш аппаратной клавиатуры.
9. Система для ввода китайских иероглифов по п. 7, в которой набор графов содержит следующие 200 графов:
при этом графы в наборе расположены в порядке уменьшения частоты их встречаемости, и графы в строках 4, 9, 12, 16, 17, 23, 25, 34, 44, 59, 62, 72, 80, 83, 84, 92, 99, 100, 101, 103, 114, 116, 127, 128, 140, 150, 152, 154 набора графов имеют более одного варианта начертания в иероглифах.
10. Система для ввода китайских иероглифов по любому из предшествующих пунктов, в которой клавиши графов в наборе клавиш графов расположены по мере уменьшения частоты встречаемости от центра к периферии.
11. Система для ввода китайских иероглифов, содержащая:
пользовательское устройство (102);
виртуальную клавиатуру (107) для ввода иероглифов на упомянутом пользовательском устройстве, которая исполняется на пользовательском устройстве и выполнена с возможностью взаимодействия с ним, причем виртуальная клавиатура содержит множество клавиш виртуальной клавиатуры, причем это множество клавиш содержит набор клавиш графов, каждая клавиша упомянутого набора выполнена с возможностью ввода отдельного графа из набора графов, набор клавиш ввода знаков препинания и цифр, составляющих знаково-цифровую панель, набор управляющих клавиш,
при этом пользовательское устройство (102) содержит:
блок (104) хранения данных, выполненный с возможностью хранения инструкций для реализации этапов способа ввода иероглифов по любому из пп. 1-6, а также хранения набора графов, таблицы описания иероглифов, таблицы многосложных слов,
блок (105) обработки, выполненный с возможностью ввода иероглифов в фокус ввода ожидающей ввода программы, выполняемой на этом пользовательском устройстве (102), посредством приема одного или более пользовательских вводов с множества клавиш виртуальной клавиатуры и их обработки в соответствии с инструкциями, хранимыми в блоке (104) хранения данных; и
экран (103), выполненный с возможностью отображения фокуса ввода ожидающей ввода программы, множества клавиш виртуальной клавиатуры, списка введенных графов, списка возвращаемых иероглифов и списка возвращаемых слов.
12. Система для ввода китайских иероглифов по п. 11, виртуальная клавиатура (107) которого выполнена в одном из 3-х форм-факторов:
- полномерная 20×10;
- уменьшенная 10×10 с возможностью переключения частей набора графов, назначенных множеству клавиш клавиатуры, нажатием клавиши из упомянутого множества клавиш виртуальной клавиатуры (107) и автоматическим возвратом в начальное состояние в ответ на ввод графа в альтернативном состоянии клавиатуры, на которое выполнено переключение нажатием упомянутой клавиши; или
- компактная 10×5 с возможностью переключения частей набора графов, назначенных множеству клавиш клавиатуры, нажатием клавиши из упомянутого множества клавиш виртуальной клавиатуры (107) и возвратом в начальное состояние в ответ на повторное нажатие упомянутой клавиши.
13. Система для ввода китайских иероглифов по любому из предшествующих пунктов, в которой клавиши графов в наборе клавиш графов расположены по мере уменьшения частоты встречаемости от центра к периферии.
14. Клавиатура для ввода иероглифов, подключаемая к или исполняемая на пользовательском устройстве, отличающаяся содержанием множества клавиш, состоящего из набора следующих 200 графов:
при этом клавиши графов в упомянутом множестве расположены по мере уменьшения частоты их встречаемости от центра к периферии,
при этом клавиатура выполнена с возможностью обнаружения признака завершения ввода некоторого иероглифа из одного или более упомянутых графов и автоматической отправки этого иероглифа в фокус ввода программы, выполняемой на пользовательском устройстве, в ответ на обнаружение такого признака.
US 6809725 B1, 26.10.2004 | |||
Пломбировальные щипцы | 1923 |
|
SU2006A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
RU 2011120873 A, 27.11.2012. |
Авторы
Даты
2018-10-29—Публикация
2017-06-15—Подача