Reconnaissance optique de caractères (bloc Unicode) - Optical Character Recognition (Unicode block)

Reconnaissance optique de caractères
Gamme U + 2440..U + 245F
(32 points de code)
Avion BMP
Scripts Commun
Jeux de symboles Contrôles OCR
Attribué 11 points de code
Inutilisé 21 points de code réservés
Historique des versions Unicode
1,0,0 (1991) 11 (+11)
Remarque :

La reconnaissance optique de caractères est un bloc Unicode contenant des caractères de signal pour les normes OCR et MICR .

Bloquer


Tableau des codes du Consortium Unicode officiel de reconnaissance optique de caractères (PDF)
  0 1 2 3 4 5 6 7 8 9 UNE B C E F
U + 244x
U + 245x
Remarques
1. ^ À partir de la version Unicode 13.0
2. ^ Les zones grises indiquent des points de code non attribués

Sous-titres

Le bloc de reconnaissance optique de caractères comporte trois sous-titres informels (regroupements) dans sa collection de caractères: OCR-A, MICR et OCR.

OCR-A

Le sous-titre OCR-A contient six caractères tirés de la police OCR-A décrite dans la norme ISO 1073-1: 1976: U + 2440 OCR HOOK , U + 2441 OCR CHAIR , U + 2442 OCR FORK , U + 2443 FOURCHE INVERSÉE OCR , U + 2444 ⑄ BOUCLE DE CEINTURE OCR , et U + 2445 T NŒUD PAPILLON OCR . Le nœud papillon OCR reçoit l' alias informatif «astérisque unique».

MICR

Le sous-titre MICR contient quatre caractères de ponctuation pour les identifiants de chèque bancaire , tirés de la police de reconnaissance de caractères à encre magnétique E-13B (codifiée dans la norme ISO 1004: 1995): U + 2446 OCR BRANCH BANK IDENTIFICATION , U + 2447 OCR AMOUNT OF CHECK , U + 2448 OCR DASH et U + 2449 NUMÉRO DE COMPTE CLIENT OCR .

Les deux derniers caractères sont mal nommés: leurs noms ont été changés par inadvertance lorsqu'ils ont été nommés dans la (première) édition de 1993 de l' ISO / CEI 10646 , une erreur qui était présente depuis Unicode 1.0.0. Bien que leurs noms formels restent inchangés en raison de la politique de stabilité Unicode, ils ont tous deux des alias normatifs corrigés : U + 2448 ⑈ est MICR ON US SYMBOL et U + 2449 ⑉ est MICR DASH SYMBOL (la norme note que "les noms de caractères Unicode incluent plusieurs malentendus ").

Ces symboles avaient auparavant été codés par le codage ISO-IR-98 défini par ISO 2033 : 1983, dans lequel ils étaient simplement nommés SYMBOLE UN à SYMBOLE QUATRE . Les quatre caractères ont des alias informatifs dans les graphiques Unicode: "transit", "amount", "on us" et "dash" respectivement.

OCR

Le sous-titre OCR se compose d'un seul caractère: U + 244A OCR DOUBLE BACKSLASH .

L'histoire

Les documents Unicode suivants enregistrent l'objectif et le processus de définition de caractères spécifiques dans le bloc de reconnaissance optique de caractères:

Version Points de code finaux Compter  ID L2  ID WG2 Document
1.0.0 U + 2440..244A 11 (être déterminé)
L2 / 10-416R Moore, Lisa (2010-11-09), "Consensus 125-C39", UTC # 125 / L2 # 222 Minutes , Créer deux alias formels, U + 2448 MICR ON US SYMBOL et U + 2449 MICR DASH SYMBOL pour Unicode 6.1.
N4103 "T.3. Reconnaissance optique de caractères", compte rendu non confirmé de la réunion 58 du GT 2 , 03/01/2012

Références