Windows-1256 - Windows-1256
MIME / IANA | fenêtres-1256 |
---|---|
Pseudo(s) | cp1256 ( page de codes 1256) |
Langue(s) | Arabe , Persan , Ourdou , Anglais , Français (sauf les majuscules avec signes diacritiques) |
Créé par | Microsoft |
Standard | Norme de codage WHATWG |
Classification | ASCII étendu , Windows-125x |
Windows-1256 est une page de codes utilisée sous Microsoft Windows pour écrire l' arabe et d'autres langues utilisant l'écriture arabe , comme le persan et l' ourdou .
Cette page de codes n'est pas compatible avec les encodages ISO-8859-6 et MacArabic .
Windows-1256 code toutes les lettres abstraites de l'alphabet arabe de base, pas toutes les formes visuelles concrètes de variantes de formes de lettres isolées, initiales, médiales, finales ou ligaturées (c'est-à-dire qu'il code des caractères, pas des glyphes). Les lettres arabes dans la gamme C0-FF sont dans l'ordre alphabétique arabe, mais certains caractères latins sont intercalés parmi eux. Il s'agit de certains caractères latins Windows-1252 utilisés pour le français , car cette langue européenne a une certaine importance historique dans les anciennes colonies françaises d'Afrique du Nord comme le Maroc et l' Algérie . Cela a permis de mélanger le texte français et arabe lors de l'utilisation de Windows 1256 sans avoir besoin de changer de page de code (cependant, les lettres majuscules avec signes diacritiques n'étaient pas incluses).
IBM utilise la page de codes 1256 ( CCSID 1256, le signe euro CCSID étendu 5352 et le CCSID étendu 9448) pour Windows-1256.
Unicode est préféré à Windows 1256 dans les applications modernes, en particulier sur Internet ; ce qui signifie l' encodage UTF-8 dominant pour les pages Web (voir aussi le script arabe en Unicode , pour une couverture complète, contrairement à par exemple Windows 1256 ou ISO-8859-6 qui ne couvrent pas les extras). Moins de 0,1 % de toutes les pages Web utilisent Windows-1256 en septembre 2019.
Jeu de caractères
Étant donné que la page de code d' origine laissait 9 valeurs (octets) marquées comme « NON UTILISÉES » dans la spécification d'origine, ces octets ont été utilisés plus tard pour les caractères supplémentaires nécessaires pour le script perso-arabe (pour les langues persane et ourdou ), plus le signe de l' euro .
Le tableau suivant montre la version étendue de Windows-1256. Chaque caractère est affiché avec son équivalent Unicode et son code décimal.
Ici, chaque lettre arabe est représentée sous une forme isolée. Les formes réelles des lettres à l'intérieur des mots arabes sont rendues par une combinaison de règles logicielles et une prise en charge appropriée des polices.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UNE | _B | _C | _RÉ | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
BF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
NOUS 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
Un 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
je 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
un 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
je 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
avec 0077 |
x 0078 |
et 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
€ 20AC |
پ 067E |
, 201A |
ƒ 0192 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
02C6 |
‰ 2030 |
ٹ 0679 |
< 2039 |
Œ 0152 |
چ 0686 |
ژ 0698 |
ڈ 0688 |
9_ 144 |
گ 06AF |
' 2018 |
' 2019 |
" 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
ک 06A9 |
™ 2122 |
ڑ 0691 |
› 203A |
œ 0153 |
ZWNJ 200C |
ZWJ 200D |
ں 06BA |
A_ 160 |
NBSP 00A0 |
, 060C |
¢ 00A2 |
£ 00A3 |
¤ 00A4 |
¥ 00A5 |
| 00A6 |
§ 00A7 |
¨ 00A8 |
© 00A9 |
ھ 06BE |
« 00AB |
¬ 00AC |
TIMIDE 00AD |
® 00AE |
¯ 00AF |
B_ 176 |
° 00B0 |
± 00B1 |
² 00B2 |
³ 00B3 |
´ 00B4 |
μ 00B5 |
¶ 00B6 |
· 00B7 |
ļ 00B8 |
¹ 00B9 |
; 061B |
» 00BB |
¼ 00BC |
½ 00BJ |
¾ 00BE |
? 061F |
C_ 192 |
ہ 06C1 |
ء 0621 |
آ 0622 |
أ 0623 |
ؤ 0624 |
إ 0625 |
ئ 0626 |
ا 0627 |
ب 0628 |
ة 0629 |
ت 062A |
ث 062B |
ج 062C |
ح 062D |
خ 062E |
د 062F |
D_ 208 |
ذ 0630 |
ر 0631 |
ز 0632 |
س 0633 |
ش 0634 |
ص 0635 |
ض 0636 |
× 00D7 |
ط 0637 |
ظ 0638 |
ع 0639 |
غ 063A |
0640 |
ف 0641 |
ق 0642 |
ك 0643 |
E_ 224 |
à 00E0 |
ل 0644 |
â 00E2 |
م 0645 |
ن 0646 |
ه 0647 |
و 0648 |
ç 00E7 |
è 00E8 |
é 00E9 |
ê 00EA |
ë 00EB |
ى 0649 |
ي 064A |
î 00EE |
ï 00EF |
F_ 240 |
064B |
064C |
064D |
064E |
ô 00F4 |
064F |
0650 |
÷ 00F7 |
0651 |
ù 00F9 |
0652 |
û 00FB |
ü 00FC |
LRM 200E |
RLM 200F |
ے 06D2 |
Lettre Nombre Ponctuation symbole Autre Indéfini