ISO/CEI 646 - ISO/IEC 646

Famille de codage ISO 646
ISO-646-infobox.svg
Invariant ISO 646. Les nœuds Bowen rouges (⌘) désignent les points de code nationaux. D'autres caractères rouges sont modifiés dans des modifications mineures notables.
Standard ISO/CEI 646, UIT T.50
Classification Codage latin de base 7 bits
Précédé par US-ASCII
succédé par ISO 8859 , ISO 10646
Autre(s) encodage(s) associé(s) DEC NRCS , World System Teletext
Adaptations à d' autres alphabets :
ELOT 927 , Symbol , KOI-7 , SRPSCII et MAKSCII , ASMO 449 , SI 960

ISO/IEC 646 est le nom d'un ensemble de normes ISO , décrit comme Technologies de l' information — Jeu de caractères codés ISO 7 bits pour l'échange d'informations et développé en coopération avec l' ASCII au moins depuis 1964. Depuis sa première édition en 1967, il a spécifié un Code de caractères à 7 bits duquel sont dérivées plusieurs normes nationales.

ISO/IEC 646 a également été ratifiée par l' ECMA en tant qu'ECMA-6 . La première version de l'ECMA-6 avait été publiée en 1965, sur la base des travaux effectués par le comité technique de l'ECMA TC1 depuis décembre 1960.

Les caractères du jeu de caractères de base ISO/IEC 646 sont des caractères invariants . Étant donné que cette partie de l'ISO/CEI 646, c'est-à-dire le jeu de caractères invariant partagé par tous les pays, ne spécifiait que les lettres utilisées dans l' alphabet latin de base ISO , les pays utilisant des lettres supplémentaires devaient créer des variantes nationales de l'ISO 646 pour pouvoir utiliser leur scripts natifs. Étant donné que la transmission et le stockage des codes à 8 bits n'étaient pas standard à l'époque, les caractères nationaux devaient être adaptés aux contraintes de 7 bits, ce qui signifie que certains caractères qui apparaissent en ASCII n'apparaissent pas dans d'autres variantes nationales de l'ISO 646. .

Histoire

Premier ASCII ( ASA X3.4 : 1963)

ISO/IEC 646 et son prédécesseur ASCII ( ASA X3.4 ) ont largement approuvé la pratique existante concernant les codages de caractères dans l' industrie des télécommunications .

US-ASCII ou ISO 646:US

Comme l'ASCII ne fournissait pas un certain nombre de caractères nécessaires pour les langues autres que l'anglais, un certain nombre de variantes nationales ont été faites pour remplacer certains caractères moins utilisés par des caractères nécessaires. En raison de l'incompatibilité des différentes variantes nationales, une version de référence internationale (IRV) de l'ISO/CEI 646 a été introduite, dans une tentative de restreindre au moins l'ensemble remplacé aux mêmes caractères dans toutes les variantes. La version originale (ISO 646 IRV) ne différait de l' ASCII que par ce point de code 0x24, le signe dollar ASCII ($) a été remplacé par le symbole monétaire international (¤). La version finale 1991 du code ISO 646:1991 est également connue sous le nom de ITU T.50 , International Reference Alphabet ou IRA, anciennement International Alphabet No. 5 (IA5). Cette norme permet aux utilisateurs d'exercer les 12 caractères variables (c'est-à-dire deux caractères graphiques alternatifs et 10 caractères définis au niveau national). Parmi ces exercices, ISO 646:1991 IRV (International Reference Version) est explicitement défini et identique à ASCII .

La série de normes ISO 8859 régissant les codages de caractères 8 bits remplace la norme internationale ISO 646 et ses variantes nationales, en fournissant 96 caractères supplémentaires avec le bit supplémentaire et évitant ainsi toute substitution de codes ASCII. La norme ISO 10646 , directement liée à Unicode , remplace tous les ensembles ISO 646 et ISO 8859 avec un ensemble unifié de codages de caractères utilisant une valeur 21 bits plus grande.

ISO 646:JP

Un héritage d'ISO/IEC 646 est visible sur Windows, où dans de nombreux paramètres régionaux d'Asie de l'Est, le caractère barre oblique inverse utilisé dans les noms de fichiers est rendu par ¥ ou d'autres caractères tels que . Malgré le fait qu'un code différent pour ¥ était disponible même sur la page de codes 437 de l' IBM PC d'origine , et qu'un code distinct à deux octets pour ¥ est disponible dans Shift JIS (bien que cela utilise souvent un mappage alternatif ), autant de texte a été créé avec le code de barre oblique inverse utilisé pour ¥ (en raison du fait que Shift_JIS est officiellement basé sur ISO 646:JP, bien que Microsoft le mappe en ASCII) que même les polices Windows modernes ont jugé nécessaire de rendre le code de cette façon. Une situation similaire existe avec et EUC-KR . Un autre héritage est l'existence de trigraphes dans la langue de programmation C .

Normes publiées

  • ISO/R646-1967
  • ISO 646 : 1972
  • ISO 646:1983
  • ISO/CEI 646:1991
  • ECMA-6 (1965-04-30), première édition
  • ECMA-6 (1967-06), deuxième édition
  • ECMA-6 (1970-07), troisième édition
  • ECMA-6 (1973-08), quatrième édition
  • ECMA-6 (1984-12, 1985-03), cinquième édition
  • ECMA-6 (1991-12, 1997-08), sixième édition

Mise en page de la page de codes

Le tableau suivant montre le jeu de caractères ISO/IEC 646 Invariant. Chaque caractère est affiché avec le code hexadécimal de son équivalent Unicode . Les points de code nationaux sont grisés avec le caractère ASCII qui est remplacé. Une case épaisse indique un caractère qui, dans certaines régions, pourrait être combiné avec un caractère précédent en tant que signe diacritique à l'aide du caractère de retour arrière , ce qui peut affecter le choix du glyphe .

En plus des restrictions d'ensemble invariantes, 0x23 est limité à # ou £ et 0x24 est limité à $ ou ¤ dans ECMA-6:1991, équivalent à ISO 646:1991. Cependant, ces restrictions ne sont pas suivies par toutes les variantes nationales.

ISO/CEI 646(-INV)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UNE _B _C _RÉ _E _F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
BF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SYN
0016
ETB
0017
CAN
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
NOUS
001F
2_
32
SP
0020
!
0021
"
0022
#
 
$
 
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
 
Un
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Je
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
 
\
 
]
 
^
 
_
005F
6_
96
`
 
un
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
je
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
avec
0077
x
0078
et
0079
z
007A
{
 
|
 
}
 
~
 
DEL
007F

  Lettre  Nombre  Ponctuation  symbole  Autre  Indéfini

Familles d'encodage associées

Jeu de caractères de remplacement national

Le jeu de caractères de remplacement national ( NRCS ) est une famille de codages à 7 bits introduite en 1983 par DEC avec la série VT200 de terminaux informatiques. Il est étroitement lié à l'ISO 646, étant basé sur un sous-ensemble invariant similaire de l'ASCII, différant en ce qu'il est conservé $comme invariant mais pas _(bien que la plupart des variantes NRCS conservent le _, et soient donc conformes à l'ensemble invariant ISO 646). La plupart des variantes du NRCS sont étroitement liées aux variantes nationales ISO 646 correspondantes lorsqu'elles existent, à l'exception de la variante néerlandaise .

Télétexte du système mondial

La norme européenne de télécommunications ETS 300 706, « Enhanced Teletext Specification » définit des ensembles de codes latin, grec, cyrillique, arabe et hébreu avec plusieurs variantes nationales pour le latin et le cyrillique. Comme NRCS et ISO 646, au sein des variantes latines, la famille d'encodages connue sous le nom d' ensemble G0 est basée sur un sous-ensemble invariant similaire de l'ASCII, mais ne retient $ni l' un ni l' autre _comme invariant. Contrairement au NRCS, les variantes diffèrent souvent considérablement des variantes nationales ISO 646 correspondantes.

Codes et descriptions des variantes

ISO 646 variantes nationales

Certaines variantes nationales de l'ISO 646 sont les suivantes :

Code ISO-IR ISO ESC Approuvé Norme nationale La description
Californie 121 ESC 2/8 7/7 ISO 646 CSA Z243.4-1985-1 Canada (alternative n° 1, avec "î")
( français , classique) ( page de code 1020 )
CA2 122 ESC 2/8 7/8 ISO 646 CSA Z243.4-1985-2 Canada (alternative n° 2, avec « É »)
( français , orthographe réformée)
CN 57 ESC 2/8 5/4 ? GB/T 1988-80 République populaire de Chine (latin de base)
UC 151 ESC 2/8 2/1 4/1 ISO 646 NC 99-10:81 / NC NC00-10:81 Cuba ( espagnol )
DANO 9-1 ESC 2/8 4/5 SIS ? NATS-DANO Norvège et Danemark (textes journalistiques). Le point de code invariant 0x22 est affiché sous la forme «, (comparer "dans l'IRV). Il est cependant toujours considéré comme un guillemet double. Accompagne SEFI (NATS-SEFI).
DE 21 ESC 2/8 4/11 ISO 646 DIN 66003 Allemagne ( allemand ) ( page de code 1011 , 20106 )
NSP - ? DS 2089 Danemark ( danois ) ( page de code 1017 )
ES 17 ESC 2/8 5/10 ECMA Olivetti Espagnol (international) ( page de code 1023 )
ES2 85 ESC 2/8 6/8 ECMA IBM Espagne ( basque , castillan , catalan , galicien ) ( page de code 1014 )
FI dix ISO 646 SFS 4017 Finlande (version de base) ( Page de code 1018 )
FR 69 ESC 2/8 6/6 ISO 646 AFNOR NF Z 62010-1982 France ( Français ) ( Page de code 1010 )
FR1 25 ECHAP 2/8 5/2 ISO 646 AFNOR NF Z 62010-1973 France (obsolète depuis avril 1985) ( page de code 1104 )
FR 4 ESC 2/8 4/1 ISO 646 BS 4730 Royaume-Uni ( anglais ) ( page de code 1013 )
HU 86 ESC 2/8 6/9 ISO 646 MSZ 7795/3 Hongrie ( hongrois )
C'EST À DIRE 207 ? NSAI 433:1996 Irlande ( irlandais )
INV 170 ESC 2/8 2/1 4/2 ISO 646 ISO 646 : 1983 Sous-ensemble invariant
(VIR) 2 ESC 2/8 4/0 ISO 646 ISO 646:1973 Version de référence internationale. 0x7E comme surligne (ISO-IR-002).
? ? ISO 646 ISO 646 : 1983 Version de référence internationale. 0x7E en tant que tilde ( Page de code 1009 , 20105 ).
La version internationale de référence ISO 646:1991 correspond à la variante américaine (voir ci-dessous).
EST ? ? ? Islande ( islandais )
CE 15 ESC 2/8 5/9 ECMA UNI 0204-70 / Olivetti ? Italien ( page de code 1012 )
JP 14 ESC 2/8 4/10 ISO 646 JIS C 6220:1969-ro Japon ( Romaji ) ( Page de code 895 ). Également utilisé comme code à 8 bits avec le jeu supplémentaire Katakana correspondant .
JP-OCR-B 92 ESC 2/8 6/14 ISO 646 JIS C 6229-1984-b Japon ( OCR- B)
KR - ? KS C 5636-1989 Corée du Sud
TA - ? ? Malte ( maltais , anglais )
Pays-Bas - ECMA IBM Pays-Bas ( néerlandais ) ( page de code 1019 )
NON 60 ESC 2/8 6/0 ISO 646 NS 4551 version 1 Norvège ( page de code 1016 )
NO2 61 ESC 2/8 6/1 ISO 646 NS 4551 version 2 Norvège (obsolète depuis juin 1987) ( page de code 20108 )
PL - BN-74/3101-01 Pologne (le polonais a 18 lettres avec des signes diacritiques, mais seulement 9 lettres minuscules sont normalisées pour des raisons d'espace de code.
TP 16 ESC 2/8 4/12 ECMA Olivetti Portugais (international)
PT2 84 ESC 2/8 6/7 ECMA IBM Portugal ( portugais , espagnol ) ( page de code 1015
SE dix ESC 2/8 4/7 ISO 646 SEN 850200 Annexe B, SIS 63 61 27 Suède ( suédois de base ) ( page de code 1018 , D47)
SE2 11 ESC 2/8 4/8 ISO 646 SEN 850200 Annexe C, SIS 63 61 27 Suède ( suédois étendu pour les noms) ( page de code 20107 , E47)
SEFI 8-1 ESC 2/8 4/3 SIS NATS-SEFI Suède et Finlande (textes journalistiques). Accompagne DANO (NATS-DANO).
T.61-7bit 102 ESC 2/8 7/5 ? UIT / CCITT T.61 Recommandation Internationale ( Télétex ). Également utilisé avec le jeu supplémentaire correspondant sous forme de code à 8 bits.
TW - ? SNC 5205-1996 République de Chine ( Taïwan )
États-Unis / (IRV) 6 ESC 2/8 4/2 ISO 646 ANSI X3.4-1968 et ISO 646:1983 (également IRV dans ISO/IEC 646:1991) États-Unis ( ASCII , page de code 367 , 20127 )
YU 141 ESC 2/8 7/10 ISO 646 JUS I.B1.002 ( YUSCII ) ex-Yougoslavie ( croate , slovène , serbe , bosniaque )
INIS 49 ESC 2/8 5/7 AIEA INIS Sous-ensemble IRV ISO 646

Produits dérivés nationaux

Certains jeux de caractères nationaux existent également qui sont basés sur ISO 646 mais ne suivent pas strictement son jeu invariant (voir aussi § Dérivées pour les autres alphabets ) :

Jeu de caractères ISO-IR ISO ESC Approuvé Norme nationale La description
BS_viewdata 47 ESC 2/8 5/6 Bureau de poste britannique Visualiser les données et le télétexte . Le carré Viewdata (⌗) a remplacé le trait de soulignement normalement invariant (_) qui ne peut pas être affiché sur le matériel cible. Il s'agit en fait de l'encodage du WST_Engl de Microsoft.
GR / grec7 88 ESC 2/8 6/10 ? HOS ELOT 927 Grèce (retiré en novembre 1986). Utilise des lettres grecques à la place des lettres romaines et n'est donc pas à proprement parler une variante ISO 646.
grec7-vieux 18 ESC 2/8 5/11 ECMA ? Ensemble graphique grec. Concept similaire à greek7 , mais utilise un mappage différent des lettres. De plus, les majuscules suivent les minuscules.
Latino-grec 19 ESC 2/8 5/12 ECMA ? Graphiques combinés latino-grec (majuscules uniquement). Suit greek7-old , mais inclut les majuscules latines sans modification, et les majuscules grecques sur les minuscules latines.
Latin-grec-1 27 ESC 2/8 5/5 ECMA Honeywell-Taureau Graphiques mixtes latino-grec (majuscules grecques uniquement). Unifie visuellement les capitales grecques avec les capitales latines lorsque cela est possible, et ajoute les capitales grecques restantes. Contrairement aux autres versions grecques, toutes les lettres latines de base restent intactes. Remplace cependant la ponctuation invariante ainsi que les caractères nationaux et n'est donc toujours pas à proprement parler une variante ISO 646.
suisse - ECMA Olivetti Suisse ( français , allemand ) ( page de code 1021 ) Le point de code invariant 0x5F est modifié de _à è. Est une variante DEC NRCS , étroitement liée à la norme ISO 646, mais n'a pas d'équivalent entièrement conforme à la norme ISO 646.

Caractères de contrôle

Toutes les variantes répertoriées ci-dessus sont uniquement des jeux de caractères graphiques et doivent être utilisées avec un jeu de caractères de contrôle C0 tel que répertorié dans le tableau suivant :

ISO-IR ISO ESC Approuvé La description
1 ESC 2/1 4/0 ISO 646 Contrôles ISO 646 ("contrôles ASCII")
7 ESC 2/1 4/1 ISO 646 Contrôles des journaux scandinaves (NATS)
26 ESC 2/1 4/3 ISO 646 Contrôles IPTC

Jeux de caractères supplémentaires associés

Le tableau suivant répertorie les jeux de caractères graphiques supplémentaires définis par la même norme que les variantes ISO 646 spécifiques. Ceux-ci seraient sélectionnés à l'aide d'un mécanisme tel que le décalage sortant ou le super décalage NATS (équipe unique), ou en définissant le huitième bit dans les environnements où il était disponible :

ISO-IR ISO ESC Norme nationale La description
8-2 ESC 2/8 4/4 NATS-SEFI-ADD Code supplémentaire utilisé avec NATS-SEFI.
9-2 ESC 2/8 4/6 NATS-DANO-ADD Code supplémentaire utilisé avec NATS-DANO.
13 ESC 2/8 4/9 JIS C 6220:1969-jp Katakana , utilisé comme code supplémentaire avec ISO-646-JP.
103 ESC 2/8 7/6 Recommandation UIT / CCITT T.61 , ensemble supplémentaire Code supplémentaire utilisé avec T.61.

Tableau comparatif des variantes

Les détails des changements pour certaines de ces variantes sont donnés dans le tableau suivant. Les affectations de caractères inchangées dans toutes les variantes répertoriées (c'est-à-dire qui restent les mêmes que l'ASCII) ne sont pas affichées.

Pour faciliter la comparaison, les variantes détaillées comprennent les variantes nationales de l'ISO 646, la série de jeux de caractères de remplacement nationaux (NRCS) étroitement liés de DEC utilisés sur les terminaux VT200 , la série de codage de télétexte European World System définie dans ETS 300 706, et quelques autres étroitement liés. codages basés sur ISO 646. Les tableaux de codes individuels sont liés à partir de la deuxième colonne. Les cellules avec un fond non blanc soulignent les différences par rapport à l' US-ASCII (également le sous-ensemble latin de base de l'ISO/IEC 10646 et de l'Unicode).

Plusieurs caractères peuvent être utilisés comme caractères de combinaison , lorsqu'ils sont précédés ou suivis d' une commande de retour arrière C0 . Ceci est attesté dans les tableaux de codes pour IRV, GB, FR1, CA et CA2, qui notent que "',^se comporteraient comme la tréma , l' accent aigu , la cédille et le circonflexe (plutôt que des guillemets , une virgule et une pointe de flèche vers le haut ) lorsqu'ils sont précédés ou suivis par un retour arrière. Le caractère tilde (~) a également été introduit comme un signe diacritique (˜). Cette méthode de codage est née à l' ère de la machine à écrire/ télétype où l'utilisation du retour arrière surestimait un glyphe, et peut être considérée comme obsolète .

Plus tard, lorsque les jeux de caractères plus larges ont été mieux acceptés, ISO 8859 , les jeux de caractères spécifiques aux fournisseurs et finalement Unicode sont devenus les méthodes préférées de codage de la plupart de ces variantes.

Code de variante Tableau des codes Caractères pour chaque jeu de caractères compatible ou dérivé ISO 646 / NRCS
États-Unis / IRV (1991) ISO-IR-006 ! " # $ & : ? @ [ \ ] ^ _ ` { | } ~
Anciennes versions de référence internationales
IRV (1973) ISO-IR-002 ! " # ?? & : ? @ [ \ ] ^ _ ` { | } ??
IRV (1983) CP01009 ! " # ?? & : ? @ [ \ ] ^ _ ` { | } ~
Sous-ensembles invariants et autres IRV
INV ISO-IR-170 ! "     & : ?           _          
INV ( NRCS ) --- ! "   $ & : ?                      
INV ( Télétexte ) ETS WST ! "     & : ?                      
Sous-ensemble INIS ISO-IR-049 $ : [ ] |
T.61 ISO-IR-102 ! " # ?? & : ? @ [   ]   _     |    
de l'Asie de l'Est
JP ISO-IR-014 ! " # $ & : ? @ [ ?? ] ^ _ ` { | } ??
JP-OCR-B ISO-IR-092 ! " # $ & : ? @ [ ?? ] ^ _   { | }  
KR (KS X 1003) ! " # $ & : ? @ [ ?? ] ^ _ ` { | } ??
CN ISO-IR-057 ! " # ?? & : ? @ [ \ ] ^ _ ` { | } ??
TW (CNS 5205) ! " # $ & : ? @ [ \ ] ^ _ ` { | } ??
britannique et irlandais
FR ISO-IR-004 ! " £ $ & : ? @ [ \ ] ^ _ ` { | } ??
GB ( NRCS ) CP01101 ! " £ $ & : ? @ [ \ ] ^ _ ` { | } ~
Afficher les données ISO-IR-047 ! " £ $ & : ? @ ?? ½ ?? ?? ?? ?? ?? ?? ??
C'EST À DIRE ISO-IR-207 ! " £ $ & : ? ?? É JE ?? UNE _ ó é je ú une
Italophone ou francophone
CE ISO-IR-015 ! " £ $ & : ? § ° ç é ^ _ ù une ?? è je
Informatique ( Télétexte ) ETS WST ! " £ $ & : ? é ° ç ?? ?? ù une ?? è je
FR (1983) ISO-IR-069 ! " £ $ & : ? une ° ç § ^ _ µ é ù è ??
FR (1973) ISO-IR-025 ! " £ $ & : ? une ° ç § ^ _ ` é ù è ??
Télétexte FR ETS WST ! " é je & : ? une ë ê ù je ?? è une ô û ç
Californie ISO-IR-121 ! " # $ & : ? une une ç ê je _ ô é ù è û
CA2 ISO-IR-122 ! " # $ & : ? une une ç ê É _ ô é ù è û
Francophone-germanophone
swi ( NRCS ) CP01021 ! " ù $ & : ? une é ç ê je è ô une ö ü û
germanophone
DE ISO-IR-021 ! " # $ & : ? § UNE ?? ?? ^ _ ` une ö ü ??
Nordique (orientale) et baltique
FI / SE ISO-IR-010 ! " # ?? & : ? @ UNE ?? UNE ^ _ ` une ö une ??
SE2 ISO-IR-011 ! " # ?? & : ? É UNE ?? UNE ?? _ é une ö une ü
SE ( NRCS ) CP01106 ! " # $ & : ? É UNE ?? UNE ?? _ é une ö une ü
FI ( SNRC ) CP01103 ! " # $ & : ? @ UNE ?? UNE ?? _ é une ö une ü
SEFI (NATS) ISO-IR-008-1 ! " # $ & : ?   UNE ?? UNE _ une ö une
EE ( Télétexte ) ETS WST ! " # ?? & : ? ?? UNE ?? ?? ?? ?? ?? une ö ?? ü
LV / LT ( Télétexte ) ETS WST ! " # $ & : ? ?? ?? ?? ?? è ?? ?? une ?? ?? je
Nordique (occidental)
NSP CP01017 ! " # ?? & : ? @ ?? Ø UNE ?? _ ` ?? ?? une ü
NSP/NON ( SNRC ) CP01105 ! " # $ & : ? UNE ?? Ø UNE ?? _ une ?? ?? une ü
DK/NO-alt ( NRCS ) CP01107 ! " # $ & : ? @ ?? Ø UNE ^ _ ` ?? ?? une ~
NON ISO-IR-060 ! " # $ & : ? @ ?? Ø UNE ^ _ ` ?? ?? une ??
NO2 ISO-IR-061 ! " § $ & : ? @ ?? Ø UNE ^ _ ` ?? ?? une |
DANO (NATS) ISO-IR-009-1 ! « » $ & : ?   ?? Ø UNE _ ?? ?? une
EST ! " # ?? & : ? E \ ?? ?? _ e | ?? ö
hispanophone
ES ISO-IR-017 ! " £ $ & : ? § ?? ?? ?? ^ _ ` ° ñ ç ~
ES2 ISO-IR-085 ! " # $ & : ? · ?? ?? Ç ?? _ ` ´ ñ ç ??
UC ISO-IR-151 ! " # ?? & : ? @ ?? ?? ] ?? _ ` ´ ñ [ ??
Hispanophone-Lusophone
Télétexte ES/PT ETS WST ! " ç $ & : ? ?? une é je ó ú ?? ü ñ è une
Lusophone
TP ISO-IR-016 ! " # $ & : ? § UNE Ç ?? ^ _ ` une ç ?? °
PT2 ISO-IR-084 ! " # $ & : ? ´ UNE Ç ?? ^ _ ` une ç ?? ~
PT ( SNRC ) --- ! " # $ & : ? @ UNE Ç ?? ^ _ ` une ç ?? ~
grec
Latin-GR mixte ISO-IR-027 ?? " ?? ?? & ?? ?? ?? ?? ?? ?? ?? ?? ` { | } ??
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 et ISO-IR-019 remplacent les lettres romaines par des lettres grecques et sont détaillées dans un tableau séparé .
Slave (écriture latine)
YU ISO-IR-141 ! " # $ & : ? ?? ?? ?? ?? ?? _ ?? ?? ?? ?? è
Télétexte YU ETS WST ! " # ?? & : ? ?? ?? ?? ?? ?? ë è ?? ?? ?? ??
Télétexte YU-alt ETS WST ! " # $ & : ? ?? ?? ?? ?? ?? ë è ?? ?? ?? ??
CS/CZ/SK ( Télétexte ) ETS WST ! " # ?? & : ? è ?? ?? ?? je ?? é une ?? ú ??
PL BN-74/3101-01 ! " # & : ? ?? ?? \ ?? ?? _ une ó ?? ?? ??
Télétexte PL ETS WST ! " # ?? & : ? une ?? ?? ?? ?? ó ?? ?? ?? ?? ??
Les adaptations de l'écriture cyrillique remplacent les lettres romaines et sont détaillées dans un tableau séparé
Autre
Pays-Bas CP01019 ! " # $ & : ? @ [ \ ] ^ _ ` { | } ??
NL NRCS CP01102 ! " £ $ & : ? ?? ?? ½ | ^ _ ` ?? ?? ?? ´
HU ISO-IR-086 ! " # ?? & : ? UNE É ?? ?? ^ _ une é ö ü ??
TA ! " # $ & : ? @ g ?? ?? ^ _ ?? G ?? ?? ??
RO ( Télétexte ) ETS WST ! " # ?? & : ? ?? UNE ?? UNE JE je ?? une ?? une je
TR ( Télétexte ) ETS WST ! " TL g & : ? JE ?? ?? Ç ?? G je ?? ö ç ü

Dérivés pour d'autres alphabets

Certains jeux de caractères à 7 bits pour les alphabets non latins sont dérivés de la norme ISO 646 : ils ne constituent pas eux-mêmes ISO 646 en raison de ne pas suivre ses points de code invariants (remplacent souvent les lettres d'au moins une casse), en raison de la prise en charge de différentes alphabets pour lesquels l'ensemble des points de code nationaux ne fournit pas suffisamment d'espace de codage. Les exemples comprennent:

  • Turkmène 7 bits (ISO-IR-230).
  • Grec 7 bits.
    • Dans ELOT 927 (ISO-IR-088), l' alphabet grec est mappé par ordre alphabétique (sauf pour le sigma final) aux positions 0x61-0x71 et 0x73-0x79, au-dessus des lettres minuscules latines.
    • ISO-IR-018 mappe l'alphabet grec sur les deux lettres en utilisant un schéma différent (pas dans l'ordre alphabétique, mais en essayant si possible de faire correspondre les lettres grecques sur les lettres romaines qui correspondent dans un certain sens), et ISO-IR-019 mappe le grec alphabet majuscule sur les lettres minuscules latines en utilisant le même schéma que ISO-IR-018.
    • La moitié inférieure du codage des caractères de la police Symbol utilise son propre schéma pour mapper les lettres grecques des deux cas sur les lettres romaines ASCII, essayant également de mapper les lettres grecques sur les lettres romaines qui correspondent dans un certain sens, mais prenant des décisions différentes à cet égard (voir tableau ci-dessous). Il remplace également les points de code invariants 0x22 et 0x27 et cinq points de code nationaux par des symboles mathématiques. Bien qu'il ne soit pas destiné à être utilisé dans la composition de la prose grecque, il est parfois utilisé à cette fin.
    • ISO-IR-027 (détaillé dans le tableau ci-dessus plutôt que ci-dessous) inclut l'alphabet latin inchangé, mais ajoute quelques lettres majuscules grecques qui ne peuvent pas être représentées avec des homoglyphes en écriture latine ; bien qu'il soit explicitement basé sur ISO 646, certains d'entre eux sont mappés à des points de code qui sont invariants dans ISO 646 (0x21, 0x3A et 0x3F), et ce n'est donc pas une véritable variante ISO 646.
    • L' encodage World System Teletext pour le grec utilise encore un autre schéma de mappage des lettres grecques par ordre alphabétique sur les lettres ASCII des deux cas, notamment plusieurs lettres avec signes diacritiques.
  • Cyrillique 7 bits
    • KOI-7 ou Short KOI, utilisé pour le russe . Les caractères cyrilliques sont mappés aux positions 0x60-0x7E, au-dessus des lettres minuscules latines, correspondant aux lettres homologues dans la mesure du possible (où в est mappé sur w, pas sur v). Remplacée par les variantes KOI-8 .
    • SRPSCII et MAKSCII , variantes cyrilliques de YUSCII (la variante latine est YU/ISO-IR-141 dans le tableau ci-dessus), utilisées respectivement pour le serbe et le macédonien . Largement homologue à la variante latine de YUSCII (suivant les règles digraphia serbe ), à l'exception de Љ (lj), Њ (nj), Џ (dž) et ѕ (dz), qui correspondent aux digrammes en orthographe latine et sont mappés sur des lettres qui ne sont pas utilisées en serbe ou en macédonien (q, w, x, y).
    • Les ensembles G0 pour les encodages télétexte du système mondial pour le russe/bulgare et l'ukrainien utilisent des ensembles G0 similaires à KOI-7 avec quelques modifications. L'ensemble G0 correspondant pour le cyrillique serbe utilise un schéma basé sur l'encodage du télétexte pour le serbo-croate et le slovène en écriture latine , par opposition au YUSCII sensiblement différent.
  • Hébreu 7 bits, SI 960 . L' alphabet hébreu est mappé aux positions 0x60-0x7A, au-dessus des lettres latines minuscules (et accent grave pour aleph). L'hébreu 7 bits était toujours stocké dans l'ordre visuel. Ce mappage avec le bit de poids fort, c'est-à-dire avec les lettres hébraïques dans 0xE0–0xFA, est ISO 8859-8 . L'encodage World System Teletext pour l'hébreu utilise les mêmes mappages de lettres, mais utilise BS_Viewdata comme codage de base (alors que SI 960 utilise US-ASCII) et inclut un signe shekel à 0x7B.
  • Arabe 7 bits, ASMO 449 (ISO-IR-089). L' alphabet arabe est mappé aux positions 0x41-0x5A et 0x60-0x6A, au-dessus des lettres latines majuscules et minuscules.

Une comparaison de certains de ces encodages est ci-dessous. Un seul cas est affiché, sauf dans les cas où les cas sont mappés à des lettres différentes. Dans de tels cas, le mappage avec le plus petit code est affiché en premier. Des transcriptions possibles sont données pour certaines lettres ; lorsque cela est omis, la lettre peut être considérée comme correspondant à la lettre romaine sur laquelle elle est mappée.

Anglais
( ASCII )
Alphabets cyrilliques alphabet grec hébreu
Semi-translittératif Naturellement commandé
Russe
( KOI-7 )
Russe,
Bulgare
( WST
RU/BG
)
Ukrainien
( WST UKR )
Serbe
( SRPSCII )
Macédonien
( MAKSCII )
Serbe,
Macédonien
( WST SRP )
Grec
( Symbole )
Grec
(IR-18)
Grec
( ELOT 927 )
Grec
( WST EL )
Hébreu
( SI 960 )
@
`
(ju/ju) (ju/ju) (ju/ju) (ž) (ž) (č)
~
´
`
@
`
ΐ
ΰ
(ʾ/ʔ)
UNE ?? (a/á) ?? ?? ?? ?? ?? ?? ?? ?? (b)
B ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? (g)
C (c/ts) (c/ts) (c/ts) (c/ts) (c/ts) (c/ts) (ch/kh) (ps) (g) (g) (d)
?? ?? ?? ?? ?? ?? ?? ?? ?? ?? (h)
E (je/je) (je/je) (e) (e) (e) (e) ?? ?? ?? ?? (w)
F ?? ?? ?? ?? ?? ?? (ph/f) (ph/f) (z) (z) (z)
g ?? ?? ?? ?? ?? ?? ?? ?? (ē) (ē) (ch/kh)
H (h/kh/ch) (h/kh/ch) (h/kh/ch) (h/kh/ch) (h/kh/ch) (h/kh/ch) (ē) (ē) (e) (e) (tt)
je ?? ?? (y) ?? ?? ?? ?? ?? ?? ?? (j/a)
J (j/a) (j/a) (j/a) (j/a) (j/a) (j/a) (th)
ϕ (ph/f)
(x/k)   (k) (k finale)
K ?? ?? ?? ?? ?? ?? ?? ?? ?? (je) ??
L ?? ?? ?? ?? ?? ?? ?? ?? ?? (m) ??
M ?? ?? ?? ?? ?? ?? ?? ?? ?? (n) ם (m finale)
N ?? ?? ?? ?? ?? ?? ?? ?? ?? (x/k) (m)
O ?? ?? ?? ?? ?? ?? ?? ?? (x/k) ?? (n finale)
P ?? ?? ?? ?? ?? ?? ?? ?? (o) ?? (n)
Q (ja/ya) (ja/ya) (ja/ya) (lj/ly) (lj/ly) (Ḱ/kj) (e) ( je ) (p) (r) (s)
R ?? ?? ?? ?? ?? ?? ?? ?? ?? ʹ
ς (s finale)
(ʽ/ŋ)
S ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? (p finale)
T ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? (p)
U ?? ?? ?? ?? ?? ?? ?? (e) ?? ?? (ṣ/ts final)
V (ž) (ž) (ž) ?? ?? ?? (s final)
ϖ (p)
(ō) (f/ph) (f/ph) (ṣ/t)
W (v) (v) (v) (nj/ny/ñ) (nj/ny/ñ) (ǵ/gj) (ō) (s finale) (s finale) (ch/kh) (q)
X (') (') (') (dž) (dž) (lj/ly) ?? (ch/kh) (ch/kh) (ps) (r)
Oui (y/ı) (″/ǎ/ŭ) (je) (dz) (dz) (nj/ny/ñ) (ps) (u) (ps) (ō) (š/sh)
Z ?? ?? ?? ?? ?? ?? ?? ?? (ō) ?? (t)
[
{
(š/sh) (š/sh) (š/sh) (š/sh) (š/sh) (ć) [
{
᾿̃
῾̃
[
{
?? [
{
\
|
(e) (e) (je/je) (đ/dj) (ǵ/gj) (ž)
|

(H)
\
|
Ü
¼
\
|
]
}
(šč) (šč) (šč) (ć) (Ḱ/kj) (đ/dj) ]
}
'
῾'
]
}
e
ύ
]
}
^
~
(č) (č) (č) (č) (č) (š/sh)
~
~
¨
^
Þ
Ohm
^
_ (″) (y/ı) (ji/yi) _ _ (dž) _ _ _ ?? _

Voir également

Notes de bas de page

Les références

Lectures complémentaires

Liens externes