Reconnaissance optique de caractères (bloc Unicode) - Optical Character Recognition (Unicode block)
Reconnaissance optique de caractères | |
---|---|
Gamme | U + 2440..U + 245F (32 points de code) |
Avion | BMP |
Scripts | Commun |
Jeux de symboles | Contrôles OCR |
Attribué | 11 points de code |
Inutilisé | 21 points de code réservés |
Historique des versions Unicode | |
1,0,0 (1991) | 11 (+11) |
Remarque : |
La reconnaissance optique de caractères est un bloc Unicode contenant des caractères de signal pour les normes OCR et MICR .
Bloquer
Tableau des codes du Consortium Unicode officiel de reconnaissance optique de caractères (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | UNE | B | C | ré | E | F | |
U + 244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
U + 245x | ||||||||||||||||
Remarques |
Sous-titres
Le bloc de reconnaissance optique de caractères comporte trois sous-titres informels (regroupements) dans sa collection de caractères: OCR-A, MICR et OCR.
OCR-A
Le sous-titre OCR-A contient six caractères tirés de la police OCR-A décrite dans la norme ISO 1073-1: 1976: U + 2440 ⑀ OCR HOOK , U + 2441 ⑁ OCR CHAIR , U + 2442 ⑂ OCR FORK , U + 2443 ⑃ FOURCHE INVERSÉE OCR , U + 2444 ⑄ BOUCLE DE CEINTURE OCR , et U + 2445 T NŒUD PAPILLON OCR . Le nœud papillon OCR reçoit l' alias informatif «astérisque unique».
MICR
Le sous-titre MICR contient quatre caractères de ponctuation pour les identifiants de chèque bancaire , tirés de la police de reconnaissance de caractères à encre magnétique E-13B (codifiée dans la norme ISO 1004: 1995): U + 2446 ⑆ OCR BRANCH BANK IDENTIFICATION , U + 2447 ⑇ OCR AMOUNT OF CHECK , U + 2448 ⑈ OCR DASH et U + 2449 ⑉ NUMÉRO DE COMPTE CLIENT OCR .
Les deux derniers caractères sont mal nommés: leurs noms ont été changés par inadvertance lorsqu'ils ont été nommés dans la (première) édition de 1993 de l' ISO / CEI 10646 , une erreur qui était présente depuis Unicode 1.0.0. Bien que leurs noms formels restent inchangés en raison de la politique de stabilité Unicode, ils ont tous deux des alias normatifs corrigés : U + 2448 ⑈ est MICR ON US SYMBOL et U + 2449 ⑉ est MICR DASH SYMBOL (la norme note que "les noms de caractères Unicode incluent plusieurs malentendus ").
Ces symboles avaient auparavant été codés par le codage ISO-IR-98 défini par ISO 2033 : 1983, dans lequel ils étaient simplement nommés SYMBOLE UN à SYMBOLE QUATRE . Les quatre caractères ont des alias informatifs dans les graphiques Unicode: "transit", "amount", "on us" et "dash" respectivement.
OCR
Le sous-titre OCR se compose d'un seul caractère: U + 244A ⑊ OCR DOUBLE BACKSLASH .
L'histoire
Les documents Unicode suivants enregistrent l'objectif et le processus de définition de caractères spécifiques dans le bloc de reconnaissance optique de caractères:
Version | Points de code finaux | Compter | ID L2 | ID WG2 | Document |
---|---|---|---|---|---|
1.0.0 | U + 2440..244A | 11 | (être déterminé) | ||
L2 / 10-416R |
Moore, Lisa (2010-11-09), "Consensus 125-C39", UTC # 125 / L2 # 222 Minutes , Créer deux alias formels, U + 2448 MICR ON US SYMBOL et U + 2449 MICR DASH SYMBOL pour Unicode 6.1. |
||||
N4103 | "T.3. Reconnaissance optique de caractères", compte rendu non confirmé de la réunion 58 du GT 2 , 03/01/2012 | ||||