ISO/CEI 8859 - ISO/IEC 8859
Standard | ISO/CEI 8859 |
---|---|
Classification | ASCII étendu 8 bits , ISO 4873 niveau 1 |
S'étend | US-ASCII |
Précédé par | ISO 646 |
succédé par | ISO/CEI 10646 ( Unicode ) |
Autre(s) encodage(s) associé(s) | ISO/CEI 10367 , Windows-125x |
ISO/IEC 8859 est une série conjointe de normes ISO et IEC pour les codages de caractères 8 bits . La série de normes se compose de parties numérotées, telles que ISO/IEC 8859-1 , ISO/IEC 8859-2 , etc. Il y a 15 parties, à l'exclusion de l' ISO/IEC 8859-12 abandonnée . Le groupe de travail ISO maintenant cette série de normes a été dissous.
ISO/IEC 8859 parties 1, 2, 3 et 4 étaient à l'origine la norme Ecma International ECMA-94 .
introduction
Alors que les modèles de bits des 95 caractères ASCII imprimables sont suffisants pour échanger des informations en anglais moderne , la plupart des autres langues qui utilisent des alphabets latins ont besoin de symboles supplémentaires non couverts par l'ASCII. ISO/IEC 8859 a cherché à remédier à ce problème en utilisant le huitième bit dans un octet de 8 bits pour permettre des positions pour 96 autres caractères imprimables. Les premiers encodages étaient limités à 7 bits en raison des restrictions de certains protocoles de transmission de données, et en partie pour des raisons historiques. Cependant, plus de caractères étaient nécessaires que ne pouvait en contenir un seul codage de caractères à 8 bits, de sorte que plusieurs mappages ont été développés, dont au moins dix adaptés à divers alphabets latins.
Les parties de la norme ISO/IEC 8859 ne définissent que des caractères imprimables, bien qu'elles distinguent explicitement les plages d'octets 0x00–1F et 0x7F–9F en tant que « combinaisons qui ne représentent pas des caractères graphiques » (c'est-à-dire qui sont réservées pour être utilisées comme caractères de contrôle ) conformément avec ISO/CEI 4873 ; ils ont été conçus pour être utilisés en conjonction avec une norme distincte définissant les fonctions de contrôle associées à ces octets, comme l' ISO 6429 ou l' ISO 6630 . À cette fin, une série de codages enregistrés auprès de l' IANA ajoutent l' ensemble de contrôle C0 (caractères de contrôle mappés sur les octets 0 à 31) de l' ISO 646 et l' ensemble de contrôle C1 (caractères de contrôle mappés sur les octets 128 à 159) de l'ISO 6429, résultant en des cartes de caractères complètes de 8 bits avec la plupart, sinon la totalité, des octets attribués. Ces ensembles ont ISO-8859- n comme nom MIME préféré ou, dans les cas où un nom MIME préféré n'est pas spécifié, leur nom canonique. De nombreuses personnes utilisent les termes ISO/IEC 8859- n et ISO-8859- n de manière interchangeable. ISO/IEC 8859-11 n'a pas obtenu un tel jeu de caractères, probablement parce qu'il était presque identique à TIS 620 .
Personnages
La norme ISO/IEC 8859 est conçue pour un échange d'informations fiable, pas de typographie ; la norme omet les symboles nécessaires à une typographie de haute qualité, tels que les ligatures facultatives, les guillemets bouclés, les tirets, etc. En conséquence, les systèmes de composition de haute qualité utilisent souvent des extensions propriétaires ou idiosyncratiques en plus des normes ASCII et ISO/IEC 8859 , ou utilisez Unicode à la place.
Une règle inexacte basée sur l'expérience pratique stipule que si un caractère ou un symbole ne faisait pas déjà partie d'un jeu de caractères informatique largement utilisé et n'était pas non plus généralement fourni sur les claviers de machines à écrire pour une langue nationale, il n'y était pas entré. Les guillemets doubles « et » utilisés pour certaines langues européennes ont été inclus, mais pas les guillemets doubles directionnels « et » utilisés pour l'anglais et certaines autres langues.
Le français n'a pas obtenu ses ligatures œ et Œ parce qu'elles pouvaient être tapées comme « oe ». De même, Ÿ , nécessaire pour le texte en majuscules, a également été supprimé. Bien que sous des points de code différents, ces trois caractères ont ensuite été réintroduits avec ISO/IEC 8859-15 en 1999, qui a également introduit le nouveau caractère de signe euro €. De même, le néerlandais n'a pas obtenu les lettres ij et IJ , car les néerlandophones s'étaient habitués à les taper en deux lettres à la place.
Roumaine n'a pas obtenu d' abord son Þ / ş et Ţ / ţ ( avec virgule ) lettres, parce que ces lettres ont été initialement unifiée avec Þ / ş et Ţ / ţ ( cédille ) par le Consortium Unicode , compte tenu des formes avec des virgules dessous pour être variantes de glyphes des formes avec cédille. Cependant, les lettres avec une virgule explicite ci-dessous ont été ajoutées plus tard à la norme Unicode et sont également dans ISO/IEC 8859-16 .
La plupart des codages ISO/IEC 8859 fournissent les signes diacritiques requis pour diverses langues européennes utilisant l'écriture latine. D'autres proposent des alphabets non latins : grec , cyrillique , hébreu , arabe et thaï . La plupart des encodages ne contiennent que des caractères d'espacement , bien que ceux en thaï, en hébreu et en arabe contiennent également des caractères de combinaison .
La norme ne prévoit aucune disposition pour les écritures des langues d'Asie de l'Est ( CJK ), car leurs systèmes d'écriture idéographique nécessitent plusieurs milliers de points de code. Bien qu'il utilise des caractères latins, le vietnamien ne tient pas non plus dans 96 positions (sans utiliser de combinaisons diacritiques comme dans Windows-1258 ). Chaque alphabet syllabique japonais (hiragana ou katakana, voir Kana ) conviendrait, comme dans JIS X 0201 , mais comme plusieurs autres alphabets du monde, ils ne sont pas codés dans le système ISO/IEC 8859.
Les parties de l'ISO/CEI 8859
L'ISO/CEI 8859 est divisée en les parties suivantes :
Partie | Nom | Révisions | Autres normes | La description |
---|---|---|---|---|
Partie 1 |
Latin-1 Europe occidentale |
1987 , 1998 | ECMA-94 ( 1985 , 1986) | Peut-être la partie la plus largement utilisée de la norme ISO/IEC 8859, couvrant la plupart des langues d'Europe occidentale : danois (partiel), néerlandais (partiel), anglais , féroïen , finnois (partiel), français (partiel), allemand , islandais , irlandais , italien , norvégien , portugais , rhéto-roman , gaélique écossais , espagnol , catalan et suédois . Des langues d'autres parties du monde sont également couvertes, notamment : l' albanais d' Europe de l'Est , l' indonésien d' Asie du Sud-Est , ainsi que les langues africaines, l' afrikaans et le swahili .
Une modification de DEC MCS ; la première version standard (1985) au niveau de l'ECMA manquait du signe temporel et de la division obelus , qui ont été ajoutés l'année suivante. Le manque signe euro et le capital Ÿ sont dans la version révisée ISO / CEI 8859-15 (voir ci - dessous). Le jeu de caractères IANA correspondant est ISO-8859-1. |
Partie 2 |
Latin-2 Europe centrale |
1987 , 1999 | ECMA-94 (1986) | Prend en charge les langues d'Europe centrale et orientale qui utilisent l'alphabet latin, notamment le bosniaque , le polonais , le croate , le tchèque , le slovaque , le slovène , le serbe et le hongrois . Le signe euro manquant se trouve dans la version ISO/IEC 8859-16. |
Partie 3 |
Latin-3 Europe du Sud |
1988 , 1999 | Turc , Maltais et Espéranto . Largement remplacé par ISO/IEC 8859-9 pour le turc. | |
Partie 4 |
Latin-4 Europe du Nord |
1988 , 1998 | estonien , letton , lituanien , groenlandais et sami . | |
Partie 5 | Latin/Cyrillique | 1988 , 1999 | ECMA-113 (1988, 1999) | Couvre principalement les langues slaves qui utilisent un alphabet cyrillique , notamment le biélorusse , le bulgare , le macédonien , le russe , le serbe et l' ukrainien (partiel). |
Partie 6 | Latin/Arabe | 1987 , 1999 | ASMO 708 (1986) / ECMA-114 (1986, 2000) | Couvre les caractères les plus courants de la langue arabe . Ne prend pas en charge d'autres langues utilisant l' écriture arabe . Doit être BiDi et jointure cursive traitée pour l'affichage. |
Partie 7 | latin/grec | 1987 , 2003 | ELOT 928 (1986) / ECMA-118 (1986) | Couvre la langue grecque moderne ( orthographe monotone ). Peut également être utilisé pour le grec ancien écrit sans accents ou en orthographe monotone, mais il manque les signes diacritiques pour l' orthographe polytonique . Ceux-ci ont été introduits avec Unicode. Mise à jour 2003 pour ajouter le signe euro , drachme signe et l' espacement IOTA SOUSCRIT . |
Partie 8 | Latin/Hébreu | 1988 , 1999 | ECMA-121 (1987, 2000) / SI 1311 ( 2002 ) | Couvre l' alphabet hébreu moderne tel qu'il est utilisé en Israël. En pratique, deux encodages différents existent, l'ordre logique (doit être traité par BiDi pour l'affichage) et l'ordre visuel (de gauche à droite) (en effet, après traitement bidi et saut de ligne). Mise à jour 1999 pour ajouter LRM et RLM . Mise à jour au niveau de la norme nationale en 2002 pour ajouter des signes d'euro et de shekel et plus d'effecteurs de format bidirectionnel ; les ajouts de 2002 n'ont jamais été intégrés dans la version standard ISO. |
Partie 9 |
Latin-5 Turc |
1989 , 1999 | ECMA-128 (1988, 1999) | Largement identique à ISO/IEC 8859-1, remplaçant les lettres islandaises rarement utilisées par des lettres turques . |
Partie 10 |
Latin-6 Nordique |
1992 , 1998 | ECMA-144 (1990, 1992, 2000) | Un réarrangement de Latin-4. Considéré plus utile pour les langues nordiques. Les langues baltes utilisent davantage le latin-4. |
Partie 11 | Latin/Thaï | 2001 | TIS-620 (1986, 1990) | Contient les caractères nécessaires à la langue thaï . Première révision établie en 1986 au niveau de la norme nationale en tant que TIS 620 . Élevé au statut de norme ISO dans le cadre de la norme ISO 8859 en 2001, avec l'ajout d'un espace insécable . |
|
Latin/Devanagari | N / A | - | Le travail de fabrication d'une partie de 8859 pour Devanagari a été officiellement abandonné en 1997. ISCII et Unicode/ISO/IEC 10646 couvrent Devanagari. |
Partie 13 |
Bordure Baltique Latin-7 |
1998 | - | Ajout de quelques caractères pour les langues baltes qui manquaient dans Latin-4 et Latin-6. Lié au Windows-1257 publié précédemment . |
Partie 14 |
Latin-8 Celtique |
1998 | - | Couvre les langues celtiques telles que le gaélique et la langue bretonne . Les lettres galloises correspondent à la précédente (1994) ISO-IR-182 . |
Partie 15 | Latin-9 | 1999 | - | Une révision de 8859-1 qui supprime certains symboles peu utilisés, en les remplaçant par le signe euro € et les lettres © , š , Ž , ž , Œ , œ et Ÿ , qui complète la couverture française , finlandaise et estonienne . |
Partie 16 |
Latin-10 Europe du Sud-Est |
2001 | RS 14111 (1998) | Destiné à l' albanais , croate , hongrois , italien , polonais , roumain et slovène , mais aussi finnois, français, allemand et gaélique irlandais (nouvelle orthographe). L'accent est mis davantage sur les lettres que sur les symboles. Le signe de la devise est remplacé par le signe de l' euro . |
Chaque partie de l'ISO/CEI 8859 est conçue pour prendre en charge des langues qui s'empruntent souvent les unes aux autres, de sorte que les caractères nécessaires à chaque langue sont généralement pris en charge par une seule partie. Cependant, certains caractères et combinaisons de langues ne sont pas acceptés sans transcriptions. Des efforts ont été faits pour rendre les conversions aussi fluides que possible. Par exemple, l'allemand a tous ses sept caractères spéciaux aux mêmes positions dans toutes les variantes latines (1–4, 9, 10, 13–16), et dans de nombreuses positions, les caractères ne diffèrent que par les signes diacritiques entre les ensembles. En particulier, les variantes 1 à 4 ont été conçues conjointement et ont la propriété que chaque caractère codé apparaît soit à une position donnée, soit pas du tout.
Table
Binaire | oct | déc | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | dix | 11 | 13 | 14 | 15 | 16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1010 0000 | 240 | 160 | A0 | Espace insécable (NBSP) | |||||||||||||||
1010 0001 | 241 | 161 | A1 | ?? | UNE | ?? | UNE | ?? | ' | ?? | UNE | ?? | " | ?? | ?? | UNE | |||
1010 0010 | 242 | 162 | A2 | ?? | ?? | ?? | ?? | ' | ?? | ?? | ?? | ?? | ?? | ?? | ?? | une | |||
1010 0011 | 243 | 163 | A3 | £ | ?? | £ | ?? | ?? | £ | G | ?? | £ | ?? | ||||||
1010 0100 | 244 | 164 | A4 | ?? | ?? | ?? | € | ?? | JE | ?? | ?? | ?? | € | ||||||
1010 0101 | 245 | 165 | A5 | ?? | ?? | JE | ?? | ?? | ?? | JE | ?? | „ | ?? | ?? | „ | ||||
1010 0110 | 246 | 166 | A6 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | RÉ | ?? | |||||
1010 0111 | 247 | 167 | A7 | § | ?? | § | ?? | § | |||||||||||
1010 1000 | 250 | 168 | A8 | ?? | ?? | ?? | ?? | ?? | Ø | ?? | ?? | ||||||||
1010 1001 | 251 | 169 | A9 | © | ?? | JE | ?? | ?? | © | ?? | ?? | © | |||||||
1010 1010 | 252 | 170 | AA | ?? | ?? | ?? | ?? | ?? | × | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||
1010 1011 | 253 | 171 | UN B | « | ?? | G | G | ?? | « | ?? | ?? | « | ré | « | |||||
1010 1100 | 254 | 172 | CA | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||
1010 1101 | 255 | 173 | UN D | Trait d'union souple (SHY) | ?? | TIMIDE | |||||||||||||
1010 1110 | 256 | 174 | AE | ® | ?? | ?? | ?? | ® | ?? | ?? | ® | ?? | |||||||
1010 1111 | 257 | 175 | UN F | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||
1011 0000 | 260 | 176 | B0 | ° | ?? | ° | ?? | ° | F | ° | |||||||||
1011 0001 | 261 | 177 | B1 | ± | une | ?? | une | ?? | ± | une | ?? | ± | F | ± | |||||
1011 0010 | 262 | 178 | B2 | ² | ?? | ² | ?? | ?? | ² | ?? | ?? | ² | G | ² | ?? | ||||
1011 0011 | 263 | 179 | B3 | ?? | ?? | ?? | ?? | ?? | ?? | g | ?? | ?? | g | ?? | ?? | ||||
1011 0100 | 264 | 180 | B4 | ´ | ?? | ?? | ´ | je | ?? | " | ?? | ?? | |||||||
1011 0101 | 265 | 181 | B5 | µ | ?? | µ | je | ?? | ?? | µ | je | ?? | µ | ?? | µ | " | |||
1011 0110 | 266 | 182 | B6 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||
1011 0111 | 267 | 183 | B7 | · | ?? | · | ?? | ?? | · | ?? | · | ?? | · | ||||||
1011 1000 | 270 | 184 | B8 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||||
1011 1001 | 271 | 185 | B9 | ?? | ?? | je | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | è | |||
1011 1010 | 272 | 186 | BA | º | ?? | ?? | ?? | ?? | ?? | º | ?? | ?? | ?? | ?? | º | ?? | |||
1011 1011 | 273 | 187 | BB | » | ?? | g | g | ?? | ?? | » | ?? | ?? | » | ?? | » | ||||
1011 1100 | 274 | 188 | avant JC | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||
1011 1101 | 275 | 189 | BD | ½ | ?? | ½ | ?? | ?? | ½ | ?? | ?? | ½ | ?? | œ | |||||
1011 1110 | 276 | 190 | ÊTRE | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||
1011 1111 | 277 | 191 | BF | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||
1100 0000 | 300 | 192 | C0 | UNE | ?? | UNE | UNE | ?? | ?? | UNE | UNE | ?? | UNE | UNE | |||||
1100 0001 | 301 | 193 | C1 | UNE | ?? | ?? | ?? | UNE | ?? | JE | UNE | ||||||||
1100 0010 | 302 | 194 | C2 | UNE | ?? | ?? | ?? | UNE | ?? | UNE | UNE | ||||||||
1100 0011 | 303 | 195 | C3 | UNE | UNE | UNE | ?? | ?? | ?? | UNE | ?? | ?? | UNE | UNE | |||||
1100 0100 | 304 | 196 | C4 | UNE | ?? | ?? | ?? | UNE | ?? | UNE | |||||||||
1100 0101 | 305 | 197 | C5 | UNE | ?? | ?? | UNE | ?? | ?? | ?? | UNE | ?? | UNE | ?? | |||||
1100 0110 | 306 | 198 | C6 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||
1100 0111 | 307 | 199 | C7 | Ç | JE | ?? | ا | ?? | Ç | JE | ?? | ?? | Ç | ||||||
1100 1000 | 310 | 200 | C8 | È | ?? | È | ?? | ?? | ?? | ?? | È | ?? | ?? | ?? | È | ||||
1100 1001 | 311 | 201 | C9 | É | ?? | ?? | ?? | É | ?? | É | |||||||||
1100 1010 | 312 | 202 | Californie | Ê | ?? | Ê | ?? | ?? | ?? | ?? | Ê | ?? | ?? | ?? | Ê | ||||
1100 1011 | 313 | 203 | CB | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||||
1100 1100 | 314 | 204 | CC | JE | ?? | JE | ?? | ?? | ?? | ?? | JE | ?? | ?? | G | JE | ||||
1100 1101 | 315 | 205 | CD | JE | ?? | ?? | ?? | JE | ?? | ?? | JE | ||||||||
1100 1110 | 316 | 206 | CE | JE | ?? | ?? | ?? | JE | ?? | JE | JE | ||||||||
1100 1111 | 317 | 207 | FC | JE | RÉ | JE | JE | ?? | ?? | ?? | JE | ?? | ?? | JE | |||||
Binaire | oct | déc | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | dix | 11 | 13 | 14 | 15 | 16 | |
1101 0000 | 320 | 208 | J0 | RÉ | ?? | ?? | un | ?? | ?? | G | RÉ | ?? | ?? | ?? | RÉ | ||||
1101 0001 | 321 | 209 | D1 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||
1101 0010 | 322 | 210 | D2 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||
1101 0011 | 323 | 211 | D3 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||||
1101 0100 | 324 | 212 | D4 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||||
1101 0101 | 325 | 213 | D5 | ?? | ?? | G | ?? | e | ?? | ?? | ?? | ?? | ?? | ||||||
1101 0110 | 326 | 214 | D6 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||||||
1101 0111 | 327 | 215 | D7 | × | ?? | ?? | ?? | × | ?? | ?? | × | ?? | × | ?? | |||||
1101 1000 | 330 | 216 | D8 | Ø | ?? | G | Ø | et | ?? | ?? | Ø | ?? | ?? | Ø | ?? | ||||
1101 1001 | 331 | 217 | D9 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||
1101 1010 | 332 | 218 | AD | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||||
1101 1011 | 333 | 219 | BD | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||||
1101 1100 | 334 | 220 | CC | ?? | ?? | ?? | ?? | ?? | |||||||||||
1101 1101 | 335 | 221 | JJ | ?? | ?? | ?? | н | ?? | JE | ?? | ?? | ?? | ?? | ||||||
1101 1110 | 336 | 222 | DE | E | ?? | ?? | ?? | о | ?? | ?? | E | ?? | ?? | E | ?? | ||||
1101 1111 | 337 | 223 | DF | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||||||
1110 0000 | 340 | 224 | E0 | une | ?? | une | une | р | ?? | ?? | ?? | une | une | ?? | une | une | |||
1110 0001 | 341 | 225 | E1 | une | с | ?? | ?? | ?? | une | ?? | je | une | |||||||
1110 0010 | 342 | 226 | E2 | une | т | ?? | ?? | ?? | une | ?? | une | une | |||||||
1110 0011 | 343 | 227 | E3 | une | une | une | ?? | ?? | ?? | ?? | une | ?? | ?? | une | une | ||||
1110 0100 | 344 | 228 | E4 | une | ?? | ل | ?? | ?? | une | ?? | une | ||||||||
1110 0101 | 345 | 229 | E5 | une | ?? | ?? | une | ?? | ?? | ?? | ?? | une | ?? | une | ?? | ||||
1110 0110 | 346 | 230 | E6 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||
1110 0111 | 347 | 231 | E7 | ç | je | ?? | ?? | ?? | ?? | ç | je | ?? | ?? | ç | |||||
1110 1000 | 350 | 232 | E8 | è | è | è | è | ?? | ?? | ?? | ?? | è | è | ?? | è | è | |||
1110 1001 | 351 | 233 | E9 | é | ?? | ?? | ?? | ?? | é | ?? | é | ||||||||
1110 1010 | 352 | 234 | EA | ê | ?? | ê | ?? | ?? | ?? | ?? | ?? | ê | ?? | ?? | ?? | ê | |||
1110 1011 | 353 | 235 | CE | ë | ?? | ?? | ?? | ?? | ë | ?? | ?? | ë | |||||||
1110 1100 | 354 | 236 | CE | je | ?? | je | ?? | ?? | ?? | ?? | ?? | je | ?? | ?? | g | je | |||
1110 1101 | 355 | 237 | DE | je | ?? | ?? | ?? | ?? | je | ?? | ?? | je | |||||||
1110 1110 | 356 | 238 | EE | je | ?? | ?? | ?? | ?? | je | ?? | je | je | |||||||
1110 1111 | 357 | 239 | EF | je | ré | je | je | ?? | ?? | ?? | ?? | je | ?? | ?? | je | ||||
1111 0000 | 360 | 240 | F0 | ré | ?? | ?? | ?? | ?? | ?? | ?? | g | ré | ?? | ?? | ?? | ré | ?? | ||
1111 0001 | 361 | 241 | F1 | ñ | ?? | ñ | ?? | ?? | ?? | ?? | ?? | ñ | ?? | ?? | ?? | ñ | ?? | ||
1111 0010 | 362 | 242 | F2 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||
1111 0011 | 363 | 243 | F3 | ó | ?? | ?? | ?? | ?? | ó | ?? | ó | ||||||||
1111 0100 | 364 | 244 | F4 | ô | ?? | ?? | ?? | ô | ?? | ?? | ô | ||||||||
1111 0101 | 365 | 245 | F5 | ?? | ?? | g | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||||
1111 0110 | 366 | 246 | F6 | ö | ?? | ?? | ?? | ö | ?? | ö | |||||||||
1111 0111 | 367 | 247 | F7 | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | |||||
1111 1000 | 370 | 248 | F8 | ?? | ?? | g | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ?? | ||||
1111 1001 | 371 | 249 | F9 | ù | ?? | ù | ?? | ?? | ?? | ?? | ù | ?? | ?? | ?? | ù | ||||
1111 1010 | 372 | 250 | FA | ú | ?? | ?? | ?? | ú | ?? | ?? | ú | ||||||||
1111 1011 | 373 | 251 | FB | û | ?? | û | ?? | ?? | û | ?? | ?? | û | |||||||
1111 1100 | 374 | 252 | FC | ü | ?? | ?? | ü | ü | |||||||||||
1111 1101 | 375 | 253 | FD | ?? | ?? | ?? | § | ?? | LRM | je | ?? | ?? | ?? | ?? | |||||
1111 1110 | 376 | 254 | EF | e | ?? | ?? | ?? | ?? | ?? | RLM | ?? | e | ?? | ?? | e | ?? | |||
1111 1111 | 377 | 255 | FF | ?? | ?? | ?? | ?? | ?? | ' | ?? | |||||||||
Binaire | oct | déc | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | dix | 11 | 13 | 14 | 15 | 16 |
À la position 0xA0, il y a toujours l'espace insécable et 0xAD est principalement le trait d'union souple , qui ne s'affiche qu'aux sauts de ligne . Les autres champs vides sont soit non affectés ou que le système utilisé n'est pas en mesure de les afficher.
Il y a nouveaux ajouts en tant que versions ISO/IEC 8859-7:2003 et ISO/IEC 8859-8:1999 . LRM signifie marque de gauche à droite (U+200E) et RLM signifie marque de droite à gauche (U+200F).
Relation avec Unicode et l'UCS
Depuis 1991, le Consortium Unicode travaille avec l'ISO et la CEI pour développer la norme Unicode et ISO/IEC 10646 : le jeu de caractères universel (UCS) en tandem. Les éditions les plus récentes de la norme ISO/IEC 8859 expriment les caractères en termes de leurs noms Unicode/UCS et de la notation U+nnnn , ce qui fait que chaque partie de la norme ISO/IEC 8859 est un schéma de codage de caractères Unicode/UCS qui mappe un très petit sous-ensemble du UCS en octets simples de 8 bits. Les 256 premiers caractères d'Unicode et de l'UCS sont identiques à ceux d'ISO/IEC-8859-1 ( Latin-1 ).
Les jeux de caractères à un octet comprenant les parties de l'ISO/CEI 8859 et leurs dérivés ont été privilégiés tout au long des années 1990, ayant l'avantage d'être bien établis et plus facilement implémentés dans le logiciel : l'équation d'un octet à un caractère est simple et adéquate pour la plupart des applications monolingues, et il n'y a pas de combinaison de caractères ni de variantes de formes. Au fur et à mesure que les systèmes d'exploitation compatibles Unicode se sont répandus, ISO/IEC 8859 et d'autres codages hérités sont devenus moins populaires. Alors que les vestiges de la norme ISO 8859 et des modèles de caractères à un octet restent ancrés dans de nombreux systèmes d'exploitation, langages de programmation, systèmes de stockage de données, applications réseau, matériel d'affichage et logiciels d'application pour l'utilisateur final, la plupart des applications informatiques modernes utilisent Unicode en interne et reposent sur la conversion. tables à mapper vers et depuis d'autres encodages, si nécessaire.
Statut actuel
La norme ISO/IEC 8859 a été maintenue par le comité technique mixte ISO/IEC 1, sous-comité 2, groupe de travail 3 (ISO/IEC JTC 1/SC 2/WG 3). En juin 2004, le GT 3 a été dissous et les tâches d'entretien ont été transférées au SC 2 . La norme n'est pas actuellement mise à jour, car le seul groupe de travail restant du sous-comité , le GT 2, se concentre sur le développement du jeu de caractères codés universel d'Unicode .
La norme de codage WHATWG , qui spécifie les codages de caractères autorisés dans HTML5 que les navigateurs compatibles doivent prendre en charge, comprend la plupart des parties de la norme ISO/IEC 8859, à l'exception des parties 1, 9 et 11, qui sont plutôt interprétées comme Windows-1252 , Windows-1254 et Windows-874 respectivement. Les auteurs de nouvelles pages et les concepteurs de nouveaux protocoles sont invités à utiliser UTF-8 à la place.
Voir également
- Liste des jeux de caractères informatiques
- Jeu de caractères RPL (un sur-jeu ISO 8859-1 sur les calculatrices HP, également appelé "ECMA-94")
- DEC Jeu de caractères multinational (MCS)
- Jeu de caractères de remplacement national du DEC (NRCS)
Remarques
Les références
- Les versions publiées de chaque partie de l'ISO/IEC 8859 sont disponibles, moyennant des frais, sur le site du catalogue ISO et sur la boutique en ligne IEC .
- Les versions PDF des versions finales de certaines parties de l'ISO/IEC 8859 telles que soumises à l'ISO/IEC JTC 1/SC 2/WG 3 pour examen et publication sont disponibles sur le site Web du WG 3 :
- ISO/CEI 8859-1:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 1 : Alphabet latin n° 1 (projet du 12 février 1998, publié le 15 avril 1998)
- ISO/CEI 8859-4:1998 -
- ISO/CEI 8859-7:1999 - Jeux de caractères graphiques codés sur un seul octet, Partie 7 : alphabet latin/grec (projet du 10 juin 1999 ; remplacé par ISO/CEI 8859-7:2003, publié le 10 octobre 2003)
- ISO/CEI 8859-10:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 10 : alphabet latin n° 6 (projet du 12 février 1998, publié le 15 juillet 1998)
- ISO/CEI 8859-11:1999 - Jeux de caractères graphiques codés sur un octet à 8 bits, Partie 11 : Jeu de caractères latins/thaï (projet du 22 juin 1999 ; remplacé par ISO/CEI 8859-11:2001, publié le 15 décembre 2001)
- ISO/CEI 8859-13:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 13 : alphabet latin n° 7 (projet du 15 avril 1998, publié le 15 octobre 1998)
- ISO/CEI 8859-15:1998 - Jeux de caractères graphiques codés sur un seul octet, Partie 15 : alphabet latin n° 9 (projet du 1er août 1997 ; remplacé par ISO/CEI 8859-15:1999, publié le 15 mars , 1999)
- ISO/CEI 8859-16:2000 - Jeux de caractères graphiques codés sur un seul octet, Partie 16 : alphabet latin n° 10 (projet du 15 novembre 1999 ; remplacé par ISO/CEI 8859-16:2001, publié le 15 juillet) , 2001)
- Norme ECMA-94 : Jeux de caractères graphiques codés sur un seul octet 8 bits - Alphabets latins n° 1 à n° 4 2e édition (juin 1986)
- Norme ECMA-113 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/cyrillique 3e édition (décembre 1999)
- Norme ECMA-114 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/arabe 2e édition (décembre 2000)
- Norme ECMA-118 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/grec (décembre 1986)
- Norme ECMA-121 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin/hébreu 2e édition (décembre 2000)
- Norme ECMA-128 : Jeux de caractères graphiques codés sur un octet à 8 bits - Alphabet latin n° 5 2e édition (décembre 1999)
- Norme ECMA-144 : Jeux de caractères codés à un octet 8 bits - Alphabet latin n° 6 3e édition (décembre 2000)