Méthode Wubi - Wubi method

Méthode Wubi
Chinois simplifié ??
Signification littérale méthode de saisie du modèle de caractère à cinq traits
Nom chinois alternatif
Chinois simplifié ??
Signification littérale Code Wang
La disposition du clavier Wubi 98
La disposition du clavier Wubi 86 (plus courante)
Un clavier QWERTY avec des composants Wubi 86

La méthode de saisie Wubizixing ( chinois simplifié :五笔字型输入法; chinois traditionnel :五筆字型輸入法; pinyin : wǔbǐ zìxíng shūrùfǎ ; lit. « méthode de saisie du modèle de caractères à cinq traits »), souvent abrégée simplement en Wubi ou Wubi Xing , est une méthode de saisie de caractères chinois principalement destinée à la saisie de texte chinois simplifié et chinois traditionnel sur un ordinateur. Wubi ne doit pas être confondu avec la méthode Wubihua (五笔画) , qui est une méthode de saisie différente qui partage la catégorisation en cinq types de traits.

La méthode est également connue sous le nom de Wang Ma ( chinois simplifié :王码; chinois traditionnel :王碼; pinyin : Wáng mǎ ; lit. « code Wang »), du nom de l'inventeur Wang Yongmin (王永民). Il existe quatre versions de Wubi considérées comme standard : Wubi 86, Wubi 98, Wubi 18030 et Wubi New-century (la version de 3e génération). Ces trois derniers peuvent également être utilisés pour saisir du texte chinois traditionnel , bien que de manière plus limitée. Wubi 86 est la méthode de saisie basée sur la forme la plus connue et la plus utilisée pour les claviers à lettres complètes en Chine continentale . S'il est fréquemment nécessaire de saisir également des caractères chinois traditionnels, d'autres méthodes de saisie telles que CangJie ou ZhengMa peuvent être mieux adaptées à la tâche, et il est également beaucoup plus probable de les trouver sur l'ordinateur dont vous avez besoin.

La méthode Wubi est basée sur la structure des caractères plutôt que sur leur prononciation, ce qui permet de saisir des caractères même lorsque l'utilisateur ne connaît pas la prononciation, tout en n'étant pas trop étroitement liée à une variété parlée particulière de chinois . Il est également extrêmement efficace : presque tous les caractères peuvent être écrits avec au plus 4 frappes. En pratique, la plupart des caractères peuvent être écrits avec moins. Il y a des rapports de dactylographes expérimentés atteignant 160 caractères par minute avec Wubi. Ce que cela signifie dans le contexte du chinois n'est pas tout à fait le même que pour l'anglais, mais il est vrai que Wubi est extrêmement rapide lorsqu'il est utilisé par une dactylo expérimentée. La raison principale en est que, contrairement aux méthodes de saisie phonétiques traditionnelles, il n'est pas nécessaire de passer du temps à sélectionner le caractère souhaité dans une liste de possibilités homophoniques : pratiquement tous les caractères ont une représentation unique.

Comme son nom l'indique, le clavier est divisé en cinq régions. Le caractère chinois(bǐ), lorsqu'il est utilisé dans le contexte de l'écriture de caractères chinois, fait référence aux coups de pinceau utilisés dans la calligraphie chinoise. Chaque région se voit attribuer un certain type de trait.

  • Région 1 : horizontale (一)
  • Région 2 : vertical (丨)
  • Région 3 : vers le bas de droite à gauche (丿)
  • Région 4 : traits de points ou traits descendants de gauche à droite (丶)
  • Région 5 : crochet

Un inconvénient majeur de l'apprentissage de Wubi est sa courbe d'apprentissage plus raide, car en tant que système plus complexe, il faut plus de temps pour acquérir une compétence. La mémorisation et la pratique sont des facteurs clés pour une utilisation efficace.

Pour utiliser Wubi, plusieurs méthodes de saisie sont disponibles, notamment les outils de saisie Google (utilisés par Google Translate) et les options de clavier sur les appareils Mac. Les séquences Wubi peuvent être recherchées pour des caractères spécifiques en utilisant des dictionnaires en ligne .

Dans cet article, la convention suivante sera utilisée : le caractère signifiera toujours le caractère chinois, tandis que la lettre , la touche et la frappe se rapporteront toujours aux touches du clavier.

Comment ça fonctionne

Essentiellement, un caractère est décomposé en composants, qui sont généralement (mais pas toujours) les mêmes que les radicaux . Ceux - ci sont tapés dans l' ordre dans lequel ils seraient écrits à la main . Afin de s'assurer que les caractères extrêmement complexes ne nécessitent pas un nombre excessif de frappes, tout caractère contenant plus de 4 composants est saisi en tapant les 3 premiers composants écrits, suivis du dernier. De cette façon, les données de chaque caractère peuvent être saisies avec pas plus de 4 frappes.

Wubi distribue ses caractères de manière très uniforme et, en tant que tel, la grande majorité des caractères sont définis de manière unique par les 4 frappes décrites ci-dessus. On tape ensuite un espace pour déplacer le caractère du tampon d'entrée sur l'écran. Dans le cas où la représentation à 4 lettres du caractère n'est pas unique, il faut taper un chiffre pour sélectionner le caractère pertinent (par exemple, si deux caractères ont la même représentation, taper 1 sélectionnerait le premier et 2 le second). Dans la plupart des implémentations, un espace peut toujours être tapé et signifie simplement 1 dans un cadre ambigu. Un logiciel intelligent essaiera de s'assurer que le personnage dans la position par défaut est celui souhaité.

De nombreux personnages ont plus d'une représentation. C'est parfois pour faciliter l'utilisation, au cas où il y aurait plus d'un moyen évident de décomposer un personnage. Le plus souvent cependant, c'est parce que certains caractères ont une représentation courte de moins de 4 lettres, ainsi qu'une représentation "complète".

Pour les caractères avec moins de 4 composants qui n'ont pas de représentation abrégée, on tape chaque composant puis "remplit" la représentation (c'est-à-dire, tape suffisamment de frappes supplémentaires pour faire la représentation 4 frappes) en tapant manuellement les frappes du dernier composant, dans l'ordre où ils seraient écrits. S'il y a trop de traits, il faut en écrire autant que possible, mais mettre le dernier trait en dernier (cela reflète la règle de composant pour les caractères avec plus de 4 composants décrite ci-dessus).

Une fois l'algorithme compris, on peut taper presque n'importe quel caractère avec un peu d'entraînement, même si on ne l'a jamais tapé auparavant. La mémoire musculaire garantit que les dactylographes fréquents qui utilisent cette méthode n'ont pas à penser à la façon dont les caractères sont réellement construits, tout comme la grande majorité des dactylographes anglais ne pensent pas beaucoup à l'orthographe des mots lorsqu'ils écrivent.

Détails spécifiques à la mise en œuvre

De nombreuses implémentations utilisent d'autres optimisations de mots multiples. Habituellement, un digraphe couramment utilisé (mot à deux caractères) dans lequel les deux caractères ont des représentations abrégées à deux touches peut être combiné en une seule représentation à quatre touches qui génère deux caractères plutôt qu'un. Il existe également quelques raccourcis à 3 caractères , et même un un peu plus long, à motivation politique. Quelques exemples de ceux-ci sont fournis dans la section des exemples ci-dessous.

Une autre caractéristique commune est l'utilisation de la touche « z » comme caractère générique. La méthode Wubi a en fait été conçue avec cette fonctionnalité à l'esprit ; c'est pourquoi aucun composant n'est affecté à la touche z. Fondamentalement, on peut taper az lorsqu'on ne sait pas quel devrait être le composant, et la méthode de saisie aidera à le compléter. Si l'on savait, par exemple, que le caractère devrait commencer par "kt", mais n'était pas sûr de ce que le prochain composant devrait être, taper "ktz" produirait une liste de tous les caractères commençant par "kt". En pratique cependant, de nombreux moteurs de méthode de saisie utilisent une méthode de recherche tabulaire pour tous les systèmes de saisie basés sur des tableaux, y compris pour Wubi. Cela signifie qu'ils ont simplement en mémoire une grande table, associant différents caractères à leurs représentations respectives. La méthode de saisie devient alors simplement une recherche de table. Dans une telle implémentation, la touche z brise le paradigme et en tant que telle ne se trouve pas dans beaucoup de logiciels généralisés (bien que la méthode de saisie Wubi couramment trouvée dans Windows chinois implémente la fonctionnalité). Pour cette même raison, l'optimisation multi-caractères décrite dans le paragraphe précédent est également relativement rare.

Certaines méthodes de saisie, telles que xcin (que l'on trouve sur de nombreux systèmes de type UNIX), fournissent une fonctionnalité générique générique qui peut être utilisée dans tous les systèmes de saisie basés sur des tables, y compris le pinyin et pratiquement tout le reste. Xcin utilise '*' pour la saisie semi-automatique et '?' pour une seule lettre, en suivant les conventions mises au point dans l'agrégation de fichiers UNIX. D'autres implémentations ont probablement leurs propres conventions.

Subdivision du clavier

Le clavier Wubi suppose une disposition de type QWERTY , donc les utilisateurs de claviers implémentant une disposition nationalisée ou alternative (comme Dvorak ou le français AZERTY ) devront probablement effectuer un remappage pour rendre le système sain. Wubi ne positionne pas ses composants de manière arbitraire : ils sont beaucoup trop nombreux, et ce n'est qu'avec l'introduction d'une méthodologie logique que le système devient facile à apprendre.

Fondamentalement, le clavier est divisé en 5 zones, chacune représentant un trait. Ces cinq traits tombent à gauche, tombent à droite, horizontal, vertical et crochet, et les zones qui les représentent sont respectivement QWERT, YUIOP, ASDFG, HJKLM et XCVBN. Ces zones sont toutes disposées horizontalement, à l'exception de M qui n'est pas aligné avec le reste des lettres de sa zone.

D'une manière générale, le clavier peut être considéré comme divisé au centre, entre T et Y, G et H, et N et M. Les touches de chaque zone sont numérotées en s'éloignant de cette ligne de séparation : nous devrions donc en fait dire que dans la zone QWERT, T est la première lettre, R est la deuxième, et E la troisième ; dans la zone YUIOP, Y est le premier, U est le deuxième, I le troisième, etc. Pour XCVBN, N est le premier, et ainsi de suite. Dans HJKLM, considérez M comme le dernier de la série, même s'il ne se trouve pas sur la ligne.

Ceci est important car les composants de la première position auront une répétition du trait en question (le trait affecté à la zone à laquelle ils appartiennent), ceux de la seconde, deux, ceux de la troisième, trois. Les composants qui ne sont pas facilement classifiables à l'aide de ce paradigme seront placés sur la dernière lettre.

Par conséquent, on s'attendrait à ce que 一 soit situé sur G, et sur F et sur D, et c'est effectivement le cas. De même, on s'attendrait à ce que 丨 soit situé sur H, 刂 sur J et sur K. Ce modèle est valable pour toutes les zones. De plus, il s'étend à la plupart des radicaux qui semblent être constitués de trois traits de ce type, même s'ils ne le sont peut-être pas du tout. Un exemple de ceci est 中 sur K : alors qu'il n'a pas trois traits vers le bas (deux seulement), il semble en avoir trois. De plus, il est écrit à la main en écrivant d'abord un radical buccal, , puis en le coupant en deux avec un trait vertical descendant. Le radical de la bouche se trouve sur « K », ce qui rend l'affectation doublement logique. Et la romanisation pinyin de 口, kou3, commence par k, un autre aide-mémoire encodé dans le clavier Wubi.

De plus, chaque lettre de chaque zone a un composant qui lui est associé, son « composant principal ». Il s'agit généralement d'un personnage complet (à l'exception de X) à part entière. On peut toujours taper ce composant principal en tapant quatre fois la lettre sur laquelle il se trouve. Ainsi, par exemple, le composant principal de H est 目, et donc on le taperait en tapant "hhhh".

Chaque lettre a également un caractère de raccourci qui lui est associé. Dans certains cas, ce caractère est le même que le composant associé à la clé en question, et parfois non. Ce caractère de raccourci est le caractère produit lorsque l'on tape juste la lettre et rien d'autre ; ce sont tous des caractères extrêmement courants utilisés lors de la saisie du chinois.

Il est tout à fait possible qu'un certain nombre de composants ne soient pas répertoriés ci-dessous, soit à cause d'un oubli, soit parce qu'ils sont rarement utilisés, soit parce qu'il n'existe aucune représentation Unicode simple pour le composant.

Zone QWERT (en tombant à gauche)

Le composant principal de la touche Q est 金 et son caractère de raccourci est 我. Il est associé aux éléments suivants : 金, 钅, , 儿, 夕, ainsi que le crochet en haut de 饣 et 角, le radical 犭sans le trait descendant en bas à gauche (donc les caractères avec ce radical commencent par " qt", pas seulement "q"), l'entrecroisement (comme au centre de 区), le haut de 鱼 (c'est-à-dire sans le trait horizontal en bas) et les trois "pieds" (presque verticaux) dans le coin inférieur droit de 流.

Le composant principal et le caractère de raccourci de la touche W sont tous deux 人. Il est associé aux composants suivants : 人, 亻, 八, et le sommet de 癸. Alors que 人 signifie homme, il est souvent utilisé par Wubi pour construire un radical de toit, comme dans 会, "wfc". 入 n'est pas gouverné par W, bien qu'il se ressemble, et bien que 餐 ait un sommet qui ressemble vaguement au sommet de 癸, les deux ne sont pas identiques (en effet, pour taper 餐, il faut taper physiquement chaque composant sur le dessus) .

Le composant principal de la touche E est 月 et son caractère de raccourci est 有. Il est associé aux composants suivants : 月, 用, 彡, 乃, le bas de 衣 (ie, sans 亠), le haut de 孚 (ie, sans 子), 豕 (pig), le bas de 良 (ie, sans le 白), et le bas de 舟 (c'est-à-dire sans le petit point en haut). Dans ce cas, le caractère de raccourci de E ne commence même pas par un trait descendant vers la gauche, mais figure simplement en évidence un composant appartenant à E. 彡 est présenté sur ce caractère, car il s'agit du troisième caractère de la zone (à partir de T, voir dessus). Une distorsion particulière qui revient souvent est l'utilisation de E dans 且 et dans les caractères le contenant : Wubi considère cette composante comme 月 + 一.

Le composant principal de la touche R est 白 et son caractère de raccourci est 的. Il est associé aux composantes suivantes : 白, 手, 扌, 斤 (avec et sans le T), 牛 ( sans le trait vertical descendant), et bien sûr les deux traits tombant à gauche 𰀪 que l'on attendrait du second clé dans la zone (voir ci-dessus pour une explication). Méfiez-vous des variétés de où le crochet central descendant est remplacé par un coup descendant vers la gauche, comme dans 看.

Le composant principal de la touche T est 禾 et son caractère de raccourci est 和. Il est associé aux composants suivants : 禾, 竹, , 攵, 彳 et le sommet de 乞 (c'est-à-dire sans le 乙). 竹 peut également être trouvé sous sa forme plus petite (⺮). 丿 se retrouve également sur cette touche, car T est la première touche de la zone (voir ci-dessus). Cela signifie que si l'on tape un composant ou un caractère trait par trait, ils utiliseront (généralement) T pour représenter un trait tombant vers la gauche. Voir la section sur les traits d'homonymie pour plus d'informations sur les exceptions à cette règle.

Zone YUIOP (en tombant à droite)

Cette zone peut également être appelée zone de points, car son motif de Y: 讠 U: 冫 I: 氵 et O: 灬 n'est pas nécessairement constitué de traits descendants vers la droite. En fait, on pourrait soutenir que le premier trait de 灬 tombe en fait à gauche . On l'appelle la zone descendante à droite parce que les touches de cette zone, lorsqu'elles sont utilisées pour construire un caractère par trait (plutôt que par composant), représentent toutes des traits descendants à droite pour certaines configurations de caractères (voir la section sur les traits de désambiguïsation pour plus d'informations).

Le composant principal de la touche Y est 言 et son caractère de raccourci est 主. Il est associé aux composants suivants : 言, 讠, 亠, 亠 avec un en dessous, 广, 文, et 丶. Ces composants commencent tous par un coup descendant vers la droite. En général, les points en caractères chinois sont en fait à gauche coups tomber, et si la plupart du temps, l'utilisation de T est plus approprié que Y. Bien sûr, si l' on peut écrire les caractères chinois à la main, ils devraient être en mesure de dire que de choisir en rappelant comment il est écrit.

Le composant principal de la touche U est 立 et son caractère de raccourci est 产. Il est associé aux composants suivants : 立, 六, 辛, , 疒, , , les « antennes » sur le dessus de 单 (seulement deux traits : 丷), et les antennes plus un trait horizontal, comme trouvé sur le sommet de 兹. La plupart d'entre eux comportent tous deux petits traits en diagonale (门 étant l'exception évidente). Ceci est cohérent avec la place de U comme deuxième lettre dans la zone (voir ci-dessus pour une explication).

Le composant principal de la touche I est 水 et son caractère de raccourci est 不. Il est associé aux composants suivants : 水, 氵, 小, les trois traits en haut de 学 et les trois traits en haut de 当. De plus, un composant qui pourrait être décrit comme deux 冫, dos à dos, est associé à ce caractère.

Le composant principal de la touche O est 火 et son caractère de raccourci est 为. Il est associé aux composants suivants : 火, 米, et 业sans le trait horizontal inférieur — cela permet la construction de caractères tels que 严. C'est la 4ème clé dans la zone descendante droite : d'où l'inclusion de 灬.

Le composant principal de la touche P est 之 et son caractère de raccourci est 这. Il est associé aux composants suivants : 之, 辶, 廴, 冖, et 礻. Comme les composants Wubi sont tapés dans l'ordre dans lequel ils auraient besoin d'être écrits s'ils étaient écrits à la main, les composants 辶 et sont généralement tapés en dernier .

Zone ASDFG (horizontale)

  • Le caractère de raccourci de la touche A est 工.
  • Le composant principal de la touche S est 木 et son caractère de raccourci est 要.
  • Le composant principal de la touche D est 大 et son caractère de raccourci est 在.
  • Le composant principal de la touche F est 土 et son caractère de raccourci est 地. Le nom du composant principal (la terre) correspond au caractère de raccourci qui signifie la terre.
  • Le composant principal de la touche G est 王 et son caractère de raccourci est 一.

Zone HJKLM (verticale)

  • Le composant principal de la touche H est 目 et son caractère de raccourci est 上.
  • Le composant principal de la touche J est 日 et son caractère de raccourci est 是.
  • Le composant principal de la touche K est 口 et son caractère de raccourci est 中.
  • Le composant principal de la touche L est 田 et son caractère de raccourci est 国.
  • Le composant principal de la touche M est 山 et son caractère de raccourci est 同.

Zone XCVBN (crochet)

  • Le composant principal de la touche X est 纟 et son caractère de raccourci est 经.
  • Le composant principal de la touche C est 又 et son caractère de raccourci est 以.
  • Le composant principal de la touche V est 女 et son caractère de raccourci est 发.
  • Le composant principal de la touche B est 子 et son caractère de raccourci est 了.
  • Le composant principal de la touche N est 已 et son caractère de raccourci est 民.

Coups d'homonymie

Les frappes du clavier sont divisées en 5 zones

Zones Lettre
1 GFDSA
2 HJKLM
3 TREWQ
4 YUIOP
5 NBVCX


Zones Accident vasculaire cérébral Forme
1 ?? Gauche-Droite (Horizontal)
2 ?? Haut-Bas (Vertical)
3 ?? Tomber à gauche
4 ?? Tomber à droite
5 ?? Accrocher

Exemples

Caractères avec 4 composants ou moins (mais pas besoin de traits)

Exemple 1 : 请 Constitué de trois composants : y (讠, radical #10), g (王*, radical 89), e (月, radical 118) -> 请

Personnages avec plus de 4 composants

Exemple 2 : 遗

Se compose de cinq composants : k (口), h (丨), g (一), m (贝), p (辶) -> khgp ->遗 ( vous n'avez pas besoin du type m )

Caractères avec moins de 4 composants (nécessitant des traits)

Exemple 3a : 文: D'abord, vous tapez la touche avec le symbole dessus, qui se trouve être 'Y'. Ensuite, vous tapez le premier composant, qui est également 'Y' pour le trait , puis un 'G' pour le trait ,et puisque vous avez maintenant déjà trois traits, vous tapez le dernier trait, qui se trouve également être un 捺, en arrivant au code clé 'YYGY' pour le caractère complet.

Exemple 3b : Le code de ce caractère est 'GGLL'. Comme auparavant, vous tapez d'abord la clé du caractère, qui est « G », puis le premier trait de ce caractère, qui est également un « G ». Parce qu'il s'agit de toutes les informations nécessaires, le L est utilisé comme remplissage jusqu'à ce que vous atteigniez 4 lettres. Notez que le « 一 » est également le caractère de raccourci pour « G » (ce qui en fait un seul trait dans la pratique).

Exemple 3c : 广: Le code de ce caractère est 'YYGT'. Dans un premier temps, vous tapez la clé où se trouve ce caractère, qui est un 'Y'. Ensuite, vous tapez un trait 点, qui est également sur « Y ». Le suivant sera le trait 横 sur 'G', et le dernier sera le , sur 'T'.

Caractères nécessitant des traits de désambiguïsation

Exemple 4 : 等

Se compose de trois composants : t (竹), f (土), f (寸),

Traits de désambiguïsation : le dernier trait est 丶 et le caractère est avec une structure de haut en bas (42,u) -> 等

Poème

Un poème a été fait comme un mnémonique pour le clavier Wubi, associant quelques caractères à chaque touche. Le premier caractère est le composant principal clé correspondant, tandis que les suivants sont des composants ou des caractères associés.

version 1986

G11王旁青头戋五一

F12土士二干十寸雨

D13大犬三羊古石厂

S14木丁西

A15工戈草头右框七

H21目具上止卜虎皮

J22日早两竖与虫依

K23口与川,字根稀

L24田甲方框四车力

M25山由贝,下框几

T31禾竹一撇双人立,反文条头共三一

R32白手看头三二斤

E33月彡(衫)乃用家衣底

W34人和八,登祭头

Q35金勺缺点无尾鱼,犬旁留义儿一点夕,氏无七

Y41言文方广在四一,高头一捺谁人去

U42立辛两点六门疒(病)

I43水旁兴头小倒立

O44火业头,四点米

P45之宝盖,摘示衣

N51已半巳满不出己,左框折尸心和羽

B52子耳了也框向上

V53女刀九臼山朝西

C54又巴马,丢矢矣

X55慈母无心弓和匕,幼无力

version 1998

G11

F12

D13

S14

A15

H21

J22

K23

L24

M25 

T31

R32

E33

W34

Q35

Y41

U42

I43

O44

P45

N51

B52

V53

C54

X55

Version du nouveau siècle (3e génération)

G11 

F12

D13 

S14 

A15

H21 

J22 

K23

L24 

M25

T31 

R32 

E33 

W34 

Q35

Y41 

U42 

I43 

O44 

P45

N51 

B52 

V53 

C54 

X55

Dans les medias

En 2020, l'histoire de Wubi a été présentée dans un épisode de Radiolab intitulé "The Wubi Effect".

Notes et références

Liens externes