ASMO 449 - ASMO 449
Alias (s) | iso-ir-89 |
---|---|
Standard | ASMO 449, ISO 9036 |
Classification | Encodage 7 bits, modification ISO 646 non latine avec ordre des lettres naturelles |
succédé par | ASMO 708 (ISO-8859-6) |
ASMO 449 est un jeu de caractères codés à 7 bits , désormais obsolète sur le plan technologique , pour encoder la langue arabe .
Histoire
Ce jeu de caractères a été conçu par l' Organisation arabe de normalisation et de métrologie, aujourd'hui disparue , en 1982 pour être la norme à 7 bits à utiliser dans les pays arabophones. La conception de ce jeu de caractères est dérivée de la norme ISO 646 7 bits (version de 1973) mais avec des modifications adaptées à la langue arabe. Dans les points de code allant de 0x41 à 0x72 (hexadécimal), les lettres latines ont été remplacées par des lettres arabes. Les signes de ponctuation qui étaient identiques dans les écritures latine et arabe sont restés les mêmes, mais là où ils différaient (virgule, point-virgule, point d'interrogation), les signes latins ont été remplacés par des signes arabes. Seules les lettres nominales sont codées, pas de formes préformées des lettres, un traitement de mise en forme est donc nécessaire pour l'affichage. Ce jeu de caractères n'est pas bidirectionnel et a été conçu pour être utilisé dans l'écriture de droite à gauche. Par conséquent, les signes de ponctuation symétriques ("(", ")", "<", ">", "[", "]", "{" et "}") apparaissent à l'envers (")", "(", ">", "<", "]", "[", "}" et "{").
L'ASMO 449 a été inscrite au registre international des jeux de caractères codés sous le nom IR 089 en 1985 et approuvée en tant que norme ISO sous le nom ISO 9036:1987 Traitement de l'information - Jeu de caractères codés arabes à 7 bits pour l'échange d'informations .
Jeu de caractères
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
NOUS 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
¤ 00A4 |
% 0025 |
& 0026 |
« 0027 |
) 0029 |
( 0028 |
* 002A |
+ 002B |
، 060C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
؛ 061B |
> 003E |
= 003D |
< 003C |
؟ 061F |
4_ 64 |
@ 0040 |
ء 0621 |
آ 0622 |
أ 0623 |
ؤ 0624 |
إ 0625 |
ئ 0626 |
ا 0627 |
ب 0628 |
ة 0629 |
ت 062A |
ث 062B |
ج 062C |
ح 062D |
خ 062E |
د 062F |
5_ 80 |
ذ 0630 |
ر 0631 |
ز 0632 |
س 0633 |
ش 0634 |
ص 0635 |
ض 0636 |
ط 0637 |
ظ 0638 |
ع 0639 |
غ 063A |
] 005D |
\ 005C |
[ 005B |
^ 005E |
_ 005F |
6_ 96 |
0640 |
ف 0641 |
ق 0642 |
ك 0643 |
ل 0644 |
م 0645 |
ن 0646 |
ه 0647 |
و 0648 |
ى 0649 |
ي 064A |
064B |
064C |
064D |
064E |
064F |
7_ 112 |
0650 |
0651 |
0652 |
} 007D |
| 007C |
{ 007B |
~ 007E |
DEL 007F |
Lettre Nombre Ponctuation symbole Autre Indéfini
Il existe une variante, parfois nommée ASMO 449+, qui ajoute les caractères NBSP dans 0x75, "ﹳ" dans 0x76, "لآ" dans 0x77, "لأ" dans 0x78, "لإ" dans 0x79 et "لا" dans 0x7A.
Relation avec d'autres jeux de caractères
ASMO 449 est un jeu de caractères 7 bits. Bien que certains encodages allouent ce jeu de caractères à 7 bits dans la partie supérieure du jeu de caractères à 8 bits, il ne faut pas le confondre avec ASMO 708 . Dans les jeux de caractères qui attribuent l'ASMO 449 (ou une variante de celui-ci) dans la partie supérieure du jeu de caractères 8 bits, l'existence de caractères apparemment répétés est due au fait que les caractères de la partie inférieure sont pour -right script tandis que les caractères dans la partie supérieure sont pour le script de droite à gauche. Lorsque ASMO 449 (ou une variante de celui-ci) est alloué à la partie supérieure du jeu de caractères 8 bits, il comporte des chiffres arabes .
- Al-Arabi ajoute les caractères NBS dans 0xF5, "-" dans 0xF6, "÷" dans 0xF7, "×" dans 0xF8, "« "dans 0xF9 et" »" dans 0xFA, et remplace "ـ" par "` "; ce jeu de caractères est parfois appelé Page de code 768 (pas une page de code IBM officielle).
- Le DEC/8/ASMO de DEC a le même répertoire et la même séquence de caractères arabes mais les disloque.
- L' arabe-8 de HP est également basé sur ASMO 449;
- MacArabic d'Apple ajoute des caractères français, allemands et espagnols dans leurs points de code typiques de MacRoman , et ajoute des lettres pour le persan et l'ourdou.
- MacFarsi d'Apple remplace les chiffres arabes de MacArabic par des chiffres persans.
- La table de codes 7 de MARC-8 alloue ASMO 449 dans la partie inférieure du jeu de caractères à 8 bits et alloue la partie supérieure avec l'extension arabe ( ISO 11822 / IR 224).
- La page de codes 709 de Microsoft , pour MS-DOS, ajoute des caractères français et allemands dans leurs points de code typiques de la page de codes 437 .
Les références
Liens externes
- giconv une interface graphique vers une version patchée de libiconv qui recode ASMO449+ en UTF-8
- ISO 9036:1987 Traitement de l'information — Jeu de caractères codés arabes à 7 bits pour l'échange d'informations