Code télégraphique - Telegraph code

Un code télégraphique est l'un des codages de caractères utilisés pour transmettre des informations par télégraphie . Le code Morse est le plus connu de ces codes. La télégraphie fait généralement référence au télégraphe électrique , mais les systèmes télégraphiques utilisant le télégraphe optique étaient utilisés avant cela. Un code se compose d'un certain nombre de points de code , chacun correspondant à une lettre de l'alphabet, un chiffre ou un autre caractère. Dans les codes destinés aux machines plutôt qu'aux humains, des points de code pour les caractères de contrôle , tels que le retour chariot , sont nécessaires pour contrôler le fonctionnement du mécanisme. Chaque point de code est composé d'un certain nombre d'éléments disposés de manière unique pour ce caractère. Il existe généralement deux types d'éléments (un code binaire), mais plusieurs types d'éléments ont été utilisés dans certains codes non destinés aux machines. Par exemple, le code Morse américain avait environ cinq éléments, plutôt que les deux (point et tiret) du code Morse international .

Les codes destinés à l'interprétation humaine ont été conçus de manière à ce que les caractères qui se produisent le plus souvent aient le moins d'éléments dans le point de code correspondant. Par exemple, le code Morse pour E , la lettre la plus courante en anglais, est un seul point (   ▄  ), tandis que Q est   ▄▄▄ ▄▄▄ ▄ ▄▄▄  . Ces dispositions signifiaient que le message pouvait être envoyé plus rapidement et qu'il faudrait plus de temps pour que l'opérateur se fatigue. Les télégraphes ont toujours été exploités par des humains jusqu'à la fin du XIXe siècle. Lorsque les messages télégraphiques automatisés sont arrivés, les codes avec des points de code de longueur variable n'étaient pas pratiques pour la conception des machines de l'époque. Au lieu de cela, des codes avec une longueur fixe ont été utilisés. Le premier d'entre eux était le code Baudot , un code à cinq bits . Baudot n'a qu'assez de points de code à imprimer en majuscules . Les codes ultérieurs avaient plus de bits ( ASCII en a sept) afin que les majuscules et les minuscules puissent être imprimées. Au-delà de l'ère du télégraphe, les ordinateurs modernes nécessitent un très grand nombre de points de code ( Unicode a 21 bits) afin que plusieurs langues et alphabets ( jeux de caractères ) puissent être traités sans avoir à modifier l'encodage des caractères. Les ordinateurs modernes peuvent facilement gérer des codes de longueur variable tels que UTF-8 et UTF-16 qui sont maintenant devenus omniprésents.

Codes télégraphiques manuels

Codes télégraphiques optiques

Code Chappe c. 1794

Avant le télégraphe électrique, une méthode largement utilisée pour construire des réseaux télégraphiques nationaux était le télégraphe optique consistant en une chaîne de tours à partir de laquelle des signaux pouvaient être envoyés par sémaphore ou volets de tour en tour. Celui-ci a été particulièrement développé en France et a eu ses débuts pendant la Révolution française . Le code utilisé en France était le code Chappe, du nom de Claude Chappe l'inventeur. L' Amirauté britannique utilisait également le télégraphe sémaphore, mais avec son propre code. Le code britannique était forcément différent de celui utilisé en France car le télégraphe optique britannique fonctionnait différemment. Le système Chappe avait des bras mobiles, comme s'il agitait des drapeaux comme dans le sémaphore de drapeau . Le système britannique utilisait une série de volets qui pouvaient être ouverts ou fermés.

Code Chappe

Le système Chappe consistait en une grande poutre pivotante (le régulateur) avec un bras à chaque extrémité (les indicateurs) qui pivotait autour du régulateur à une extrémité. Les angles que ces composants étaient autorisés à prendre étaient limités à des multiples de 45° pour faciliter la lisibilité. Cela a donné un espace de code de 8 × 4 × 8 points de code , mais la position de l'indicateur en ligne avec le régulateur n'a jamais été utilisée car il était difficile de distinguer l'indicateur replié sur le dessus du régulateur, laissant un espace de code de 7 × 4×7 = 196 . Les symboles étaient toujours formés avec le régulateur sur la diagonale inclinée à gauche ou à droite (oblique) et n'étaient acceptés comme valides que lorsque le régulateur se déplaçait en position verticale ou horizontale. L'oblique gauche était toujours utilisé pour les messages, l'oblique droite était utilisée pour le contrôle du système. Cela a encore réduit l'espace de code à 98, dont quatre ou six points de code (selon la version) étaient des caractères de contrôle , laissant un espace de code pour le texte de 94 ou 92 respectivement.

Le système Chappe transmettait principalement des messages à l'aide d'un livre de codes contenant un grand nombre de mots et de phrases définis. Il a été utilisé pour la première fois sur une chaîne expérimentale de tours en 1793 et ​​mis en service de Paris à Lille en 1794. Le livre de code utilisé si tôt n'est pas connu avec certitude, mais un livre de code non identifié au Musée de la poste de Paris peut avoir été pour le Système Chappe. La disposition de ce code en colonnes de 88 entrées a conduit Holzmann & Pehrson à suggérer que 88 points de code auraient pu être utilisés. Cependant, la proposition en 1793 était de dix points de code représentant les chiffres 0-9, et Bouchet dit que ce système était encore utilisé jusqu'en 1800 (Holzmann et Pehrson ont mis le changement à 1795). Le livre de code a été révisé et simplifié en 1795 pour accélérer la transmission. Le code était en deux divisions, la première division était de 94 caractères alphabétiques et numériques plus quelques combinaisons de lettres couramment utilisées. La deuxième division était un livre de code de 94 pages avec 94 entrées sur chaque page. Un point de code a été attribué pour chaque numéro jusqu'à 94. Ainsi, seuls deux symboles devaient être envoyés pour transmettre une phrase entière - les numéros de page et de ligne du livre de codes, contre quatre symboles utilisant le code à dix symboles.

En 1799, trois divisions supplémentaires ont été ajoutées. Ceux-ci avaient des mots et des phrases supplémentaires, des lieux géographiques et des noms de personnes. Ces trois divisions nécessitaient l'ajout de symboles supplémentaires devant le symbole de code pour identifier le bon livre. Le code a été révisé à nouveau en 1809 et est resté stable par la suite. En 1837, un système de codage uniquement horizontal a été introduit par Gabriel Flocon qui ne nécessitait pas le déplacement du lourd régulateur. Au lieu de cela, un indicateur supplémentaire a été fourni au centre du régulateur pour transmettre cet élément du code.

Code Chappe c. 1809

Code Edelcrantz

Edelcrantz codepoint 636, qui décode la devise du Telegraph Corps; Passa väl upp ("Soyez sur vos gardes")

Le système Edelcrantz a été utilisé en Suède et était le deuxième plus grand réseau construit après celui de la France. Le télégraphe se composait d'un ensemble de dix volets. Neuf d'entre eux ont été disposés dans une matrice 3×3. Chaque colonne de volets représentait un chiffre octal codé en binaire avec un volet fermé représentant "1" et le chiffre le plus significatif en bas. Chaque symbole de transmission télégraphique était donc un nombre octal à trois chiffres. Le dixième volet était un extra-large en haut. Sa signification était que le point de code devait être précédé de "A".

Une utilisation de l'obturateur "A" était qu'un point de code numérique précédé de "A" signifiait ajouter un zéro (multiplier par dix) au chiffre. Des nombres plus grands pourraient être indiqués en suivant le chiffre avec le code pour les centaines (236), les milliers (631) ou une combinaison de ceux-ci. Cela nécessitait moins de symboles à transmettre que d'envoyer tous les chiffres zéro individuellement. Cependant, le but principal des points de code « A » était de créer un livre de codes de messages prédéterminés, un peu comme le livre de codes Chappe.

Les symboles sans "A" étaient un grand ensemble de chiffres, de lettres, de syllabes et de mots communs pour faciliter le compactage du code . Vers 1809, Edelcrantz a introduit un nouveau livre de codes avec 5 120 points de code, chacun nécessitant une transmission à deux symboles pour être identifié.

Alphabet d'Edelcrantz
UNE B C E F g H je J K L M N O P Q R S T
003 026 ?? 055 112 125 162 210 254 ?? 274 325 362 422 450 462 ?? 500 530 610
U V W X Oui Z UNE UNE ?? 1 2 3 4 5 6 7 8 9 00 000
640 650 ?? 710 711 712 713 723 737 001 002 004 010 020 040 100 200 400 236 631

Il y avait de nombreux points de code pour la correction d'erreurs (272, erreur), le contrôle de flux et les messages de supervision. Habituellement, les messages devaient être transmis tout le long de la ligne, mais il y avait des circonstances où des stations individuelles devaient communiquer directement, généralement à des fins de gestion. La situation la plus courante et la plus simple était la communication entre des stations adjacentes. Les points de code 722 et 227 ont été utilisés à cette fin, pour attirer l'attention de la station suivante vers ou loin du soleil respectivement. Pour les stations plus éloignées, les points de code 557 et 755 respectivement ont été utilisés, suivis de l'identification des stations demandeuses et cibles.

Perruque

La signalisation par drapeau était largement utilisée pour la signalisation point à point avant le télégraphe optique, mais il était difficile de construire un réseau national avec des drapeaux portatifs. L'appareil mécanique beaucoup plus grand des tours télégraphiques sémaphores était nécessaire pour qu'une plus grande distance entre les liaisons puisse être atteinte. Cependant, un vaste réseau de drapeaux à main a été construit pendant la guerre de Sécession . C'était le système wig-wag qui utilisait le code inventé par Albert J. Myer . Certaines des tours utilisées étaient énormes, jusqu'à 130 pieds, pour obtenir une bonne portée. Le code de Myer ne nécessitait qu'un seul indicateur utilisant un code ternaire . C'est-à-dire que chaque élément de code consistait en l'une des trois positions de drapeau distinctes. Cependant, les points de code alphabétiques ne nécessitaient que deux positions, la troisième position n'étant utilisée que dans les caractères de contrôle . L'utilisation d'un code ternaire dans l'alphabet aurait entraîné des messages plus courts car moins d'éléments sont nécessaires dans chaque point de code, mais un système binaire est plus facile à lire à longue distance car moins de positions de drapeau doivent être distinguées. Le manuel de Myer décrit également un alphabet codé ternaire avec une longueur fixe de trois éléments pour chaque point de code.

Codes télégraphiques électriques

Cooke et Wheatstone et d'autres premiers codes

Code Cooke et Wheatstone à 1 aiguille (C&W1)

De nombreux codes différents ont été inventés au début du développement du télégraphe électrique . Pratiquement chaque inventeur a produit un code différent pour s'adapter à leur appareil particulier. Le premier code utilisé commercialement sur un télégraphe électrique était le code à cinq aiguilles du télégraphe Cooke et Wheatstone (C&W5). Cela a été utilisé pour la première fois sur le Great Western Railway en 1838. C&W5 avait l'avantage majeur que le code n'avait pas besoin d'être appris par l'opérateur ; les lettres pouvaient être lues directement sur le panneau d'affichage. Cependant, il avait l'inconvénient de nécessiter trop de fils. Un code à une aiguille, C&W1, a été développé et ne nécessitait qu'un seul fil. C&W1 a été largement utilisé au Royaume-Uni et dans l'Empire britannique.

Code Morse américain

Certains autres pays ont utilisé C&W1, mais ce n'est jamais devenu une norme internationale et généralement chaque pays a développé son propre code. Aux États-Unis, le code Morse américain a été utilisé, dont les éléments étaient constitués de points et de tirets distingués les uns des autres par la longueur de l'impulsion de courant sur la ligne télégraphique. Ce code a été utilisé sur le télégraphe inventé par Samuel Morse et Alfred Vail et a été utilisé pour la première fois commercialement en 1844. Morse avait initialement des points de code uniquement pour les chiffres. Il prévoyait que les numéros envoyés par télégraphe seraient utilisés comme index d'un dictionnaire avec un ensemble limité de mots. Vail a inventé un code étendu qui comprenait des points de code pour toutes les lettres afin que n'importe quel mot souhaité puisse être envoyé. C'est le code de Vail qui est devenu le morse américain. En France, le télégraphe utilisait le télégraphe Foy-Breguet , un télégraphe à deux aiguilles qui affichait les aiguilles en code Chappe, le même code que le télégraphe optique français, qui était encore plus largement utilisé que le télégraphe électrique en France. Pour les Français, cela avait le grand avantage de ne pas avoir besoin de recycler leurs opérateurs dans un nouveau code.

Normalisation—Code Morse

Code Morse International

En Allemagne en 1848, Friedrich Clemens Gerke a développé une version fortement modifiée du morse américain pour une utilisation sur les chemins de fer allemands. Le morse américain avait trois longueurs différentes de tirets et deux longueurs différentes d'espace entre les points et les tirets dans un point de code. Le code Gerke n'avait qu'une longueur de tiret et tous les espaces inter-éléments dans un point de code étaient égaux. Gerke a également créé des points de code pour les lettres tréma allemandes , qui n'existent pas en anglais. De nombreux pays d'Europe centrale appartenaient à l'Union télégraphique germano-autrichienne. En 1851, l'Union décide d'adopter un code commun à tous ses pays afin que les messages puissent être envoyés entre eux sans que les opérateurs aient besoin de les recoder aux frontières. Le code Gerke a été adopté à cet effet.

En 1865, une conférence à Paris a adopté le code Gerke comme norme internationale, l'appelant International Morse Code . Avec quelques changements très mineurs, c'est le code Morse utilisé aujourd'hui. Les instruments à aiguilles télégraphiques Cooke et Wheatstone étaient capables d'utiliser le code Morse car les points et les tirets pouvaient être envoyés sous forme de mouvements gauche et droit de l'aiguille. À cette époque, les instruments à aiguilles étaient fabriqués avec des butées qui faisaient deux notes distinctement différentes lorsque l'aiguille les frappait. Cela a permis à l'opérateur d'écrire le message sans regarder l'aiguille, ce qui était beaucoup plus efficace. C'était un avantage similaire au télégraphe Morse dans lequel les opérateurs pouvaient entendre le message du clic de l'armature du relais. Néanmoins, après la nationalisation des sociétés de télégraphe britanniques en 1870, le General Post Office a décidé de normaliser le télégraphe Morse et de se débarrasser des nombreux systèmes différents hérités des sociétés privées.

Aux États-Unis, les sociétés de télégraphe ont refusé d'utiliser le morse international en raison du coût de la reconversion des opérateurs. Ils se sont opposés aux tentatives du gouvernement d'en faire une loi. Dans la plupart des autres pays, le télégraphe était contrôlé par l'État, de sorte que le changement pouvait simplement être mandaté. Aux États-Unis, il n'y avait pas une seule entité qui dirigeait le télégraphe. Il s'agissait plutôt d'une multiplicité d'entreprises privées. Cela a obligé les opérateurs internationaux à maîtriser les deux versions de Morse et à recoder à la fois les messages entrants et sortants. Les États-Unis ont continué à utiliser le morse américain sur les lignes fixes (la radiotélégraphie utilisait généralement le morse international) et cela est resté le cas jusqu'à l'avènement des téléimprimeurs qui nécessitaient des codes entièrement différents et rendaient la question sans objet.

Vitesse de transmission

Une page du livre de code télégraphique chinois

La vitesse d'envoi dans un télégraphe manuel est limitée par la vitesse à laquelle l'opérateur peut envoyer chaque élément de code. Les vitesses sont généralement indiquées en mots par minute . Les mots n'ont pas tous la même longueur, donc compter littéralement les mots obtiendra un résultat différent selon le contenu du message. Au lieu de cela, un mot est défini comme cinq caractères dans le but de mesurer la vitesse, quel que soit le nombre de mots réellement contenus dans le message. Le code Morse, et de nombreux autres codes, n'ont pas non plus la même longueur de code pour chaque caractère du mot, introduisant à nouveau une variable liée au contenu. Pour surmonter cela, la vitesse de l'opérateur transmettant à plusieurs reprises un mot standard est utilisée. PARIS est classiquement choisi comme cette norme car c'est la longueur d'un mot moyen en Morse.

En morse américain, les caractères sont généralement plus courts que le morse international. Cela est dû en partie au fait que le morse américain utilise plus d'éléments de points et en partie au fait que le tiret le plus courant, le tiret court, est plus court que le tiret morse international - deux éléments de points contre trois éléments de points de long. En principe, le morse américain sera transmis plus rapidement que le morse international si toutes les autres variables sont égales. En pratique, il y a deux choses qui nuisent à cela. Premièrement, le morse américain, avec environ cinq éléments de codage, était plus difficile à obtenir le bon timing lorsqu'il était envoyé rapidement. Les opérateurs inexpérimentés étaient susceptibles d'envoyer des messages brouillés, un effet connu sous le nom de porc Morse . La deuxième raison est que le morse américain est plus sujet aux interférences intersymboles (ISI) en raison de la plus grande densité de points rapprochés. Ce problème était particulièrement grave sur les câbles télégraphiques sous-marins , rendant le morse américain moins adapté aux communications internationales. La seule solution qu'un opérateur avait immédiatement à portée de main pour faire face à l'ISI était de ralentir la vitesse de transmission.

Encodages de caractères de langue

Le code Morse pour les alphabets non latins , tels que l' écriture cyrillique ou arabe , est obtenu en construisant un codage de caractères pour l'alphabet en question en utilisant les mêmes ou presque les mêmes points de code que ceux utilisés dans l' alphabet latin . Les syllabaires , comme le katakana japonais , sont également traités de cette façon ( code Wabun ). L'alternative consistant à ajouter plus de points de code au code Morse pour chaque nouveau caractère entraînerait des transmissions de code très longues dans certaines langues.

Les langues qui utilisent des logogrammes sont plus difficiles à manipuler en raison du nombre beaucoup plus important de caractères requis. Le code télégraphique chinois utilise un livre de codes d'environ 9 800 caractères (7 000 lors de son lancement initial en 1871) auxquels est attribué un numéro à quatre chiffres. Ce sont ces chiffres qui sont transmis, le code Morse chinois est donc entièrement composé de chiffres. Les numéros doivent être recherchés à l'extrémité de réception, ce qui rend le processus lent, mais à l'époque où le télégraphe était largement utilisé, les télégraphes chinois qualifiés pouvaient se rappeler plusieurs milliers de codes communs de mémoire. Le code télégraphique chinois est toujours utilisé par les forces de l'ordre car il s'agit d'une méthode non ambiguë d'enregistrement des noms chinois dans des écritures non chinoises.

Codes télégraphiques automatiques

Code Baudot

Le code Baudot d'origine

Les premiers télégraphes d'impression ont continué à utiliser le code Morse, mais l'opérateur n'a plus envoyé les points et les tirets directement avec une seule clé. Au lieu de cela, ils utilisaient un clavier de piano avec les caractères à envoyer marqués sur chaque touche. La machine a généré le point de code Morse approprié en appuyant sur la touche. Un tout nouveau type de code a été développé par Émile Baudot , breveté en 1874. Le code Baudot était un code binaire à 5 bits, avec les bits envoyés en série . Le fait d'avoir un code de longueur fixe a grandement simplifié la conception de la machine. L'opérateur a saisi le code à partir d'un petit clavier de piano à 5 touches, chaque touche correspondant à un bit du code. Comme Morse, le code Baudot a été organisé pour minimiser la fatigue de l'opérateur avec les points de code nécessitant le moins d'appuis sur les touches affectées aux lettres les plus courantes.

Les premiers télégraphes d'impression nécessitaient une synchronisation mécanique entre la machine émettrice et réceptrice. Le télégraphe d'impression Hughes de 1855 y parvint en envoyant un tiret Morse à chaque tour de la machine. Une solution différente a été adoptée en liaison avec le code Baudot. Des bits de démarrage et d'arrêt ont été ajoutés à chaque caractère lors de la transmission, ce qui a permis une communication série asynchrone . Ce schéma de bits de démarrage et d'arrêt a été suivi sur tous les codes télégraphiques majeurs ultérieurs.

Code Murray

Sur les lignes télégraphiques très fréquentées, une variante du code Baudot était utilisée avec du ruban de papier perforé . C'était le code Murray, inventé par Donald Murray en 1901. Au lieu de transmettre directement à la ligne, les touches de l'opérateur perçaient des trous dans la bande. Chaque rangée de trous sur la bande avait cinq positions possibles à percer, correspondant aux cinq bits du code Murray. La bande a ensuite été passée dans un lecteur de bande qui a généré le code et l'a envoyé sur la ligne télégraphique. L'avantage de ce système était que plusieurs messages pouvaient être envoyés à la ligne très rapidement à partir d'une seule bande, faisant une meilleure utilisation de la ligne qu'une opération manuelle directe.

Murray a complètement réorganisé l'encodage des caractères pour minimiser l'usure de la machine puisque la fatigue de l'opérateur n'était plus un problème. Ainsi, les jeux de caractères des codes Baudot et Murray originaux ne sont pas compatibles. Les cinq bits du code Baudot sont insuffisants pour représenter toutes les lettres, chiffres et signes de ponctuation requis dans un message texte. De plus, des caractères supplémentaires sont nécessaires en imprimant des télégraphes pour mieux contrôler la machine. Des exemples de ces caractères de contrôle sont le saut de ligne et le retour chariot . Murray a résolu ce problème en introduisant des codes de décalage . Ces codes demandent à la machine réceptrice de changer le codage des caractères en un jeu de caractères différent. Deux codes de décalage ont été utilisés dans le code Murray; décalage des chiffres et décalage des lettres. Un autre caractère de contrôle introduit par Murray était le caractère de suppression (DEL, code 11111) qui perforait les cinq trous de la bande. Son objectif était de supprimer les caractères erronés de la bande, mais Murray a également utilisé plusieurs DEL pour marquer la frontière entre les messages. Le fait de percer tous les trous a fait une perforation qui était facile à déchirer en messages séparés à l'extrémité de réception. Une variante du code Baudot-Murray est devenue une norme internationale comme International Telegraph Alphabet no. 2 (ITA 2) en 1924. Le "2" dans ITA 2 est dû au fait que le code Baudot original est devenu la base de ITA 1. ITA 2 est resté le code télégraphique standard utilisé jusqu'aux années 1960 et était toujours utilisé dans des endroits bien au-delà de cette date. .

Le code ITA 2, sous sa forme de ruban perforé

L'ère de l'informatique

Le téléimprimeur a été inventé en 1915. Il s'agit d'un télégraphe d'impression avec un clavier semblable à une machine à écrire sur lequel l'opérateur tape le message. Néanmoins, les télégrammes ont continué à être envoyés en majuscules uniquement parce qu'il n'y avait pas de place pour un jeu de caractères en minuscules dans les codes Baudot-Murray ou ITA 2. Cela a changé avec l'arrivée des ordinateurs et le désir d'interfacer des messages générés par ordinateur ou des documents composés par traitement de texte avec le système télégraphique. Un problème immédiat était l'utilisation de codes de décalage qui a causé une difficulté avec le stockage informatique du texte. Si une partie d'un message, ou un seul caractère, était récupéré, il n'était pas possible de dire quel décalage d'encodage devait être appliqué sans rechercher dans le reste du message le dernier contrôle de décalage. Cela a conduit à l'introduction du code TeleTypeSetter (TTS) à 6 bits . Dans TTS, le bit supplémentaire a été utilisé pour stocker l'état de décalage, évitant ainsi le besoin de caractères de décalage. TTS a également été d'une certaine utilité pour les téléimprimeurs ainsi que pour les ordinateurs. La corruption d'un code de lettre transmis par TTS a simplement entraîné l'impression d'une lettre erronée, ce qui pourrait probablement être corrigé par l'utilisateur destinataire. D'un autre côté, la corruption d'un caractère de décalage ITA 2 a entraîné la confusion de tout le message à partir de ce point jusqu'à l'envoi du caractère de décalage suivant.

ASCII

Dans les années 1960, l'amélioration de la technologie des téléimprimeurs signifiait que les codes plus longs étaient loin d'être un facteur aussi important dans les coûts des téléimprimeurs qu'ils l'étaient autrefois. Les utilisateurs d'ordinateurs voulaient des caractères minuscules et des signes de ponctuation supplémentaires et les fabricants de téléscripteurs et d'ordinateurs souhaitaient se débarrasser d'ITA 2 et de ses codes de décalage. Cela a conduit l' American Standards Association à développer un code à 7 bits, l'American Standard Code for Information Interchange ( ASCII ). La forme finale de l'ASCII a été publiée en 1964 et elle est rapidement devenue le code de téléimprimeur standard. ASCII était le dernier code majeur développé explicitement avec l'équipement de télégraphie à l'esprit. La télégraphie a rapidement décliné par la suite et a été largement remplacée par les réseaux informatiques , en particulier Internet dans les années 1990.

Graphique de code ASCII.svg

ASCII avait plusieurs fonctionnalités destinées à faciliter la programmation informatique. Les caractères des lettres étaient dans l'ordre numérique du point de code, de sorte qu'un tri alphabétique pouvait être réalisé simplement en triant les données numériquement. Le point de code pour les lettres majuscules et minuscules correspondantes ne différait que de la valeur du bit 6, permettant de trier un mélange de casses par ordre alphabétique si ce bit était ignoré. D'autres codes ont été introduits, notamment l' EBCDIC d' IBM dérivé de la méthode de saisie de la carte perforée , mais c'est l'ASCII et ses dérivés qui l'ont emporté en tant que lingua franca de l'échange d'informations informatiques.

Extension ASCII et Unicode

L'arrivée du microprocesseur dans les années 1970 et de l' ordinateur personnel dans les années 1980 avec leur architecture 8 bits a fait de l' octet 8 bits l'unité standard de stockage informatique. L'emballage de données 7 bits dans un stockage 8 bits n'est pas pratique pour la récupération de données. Au lieu de cela, la plupart des ordinateurs stockaient un caractère ASCII par octet. Cela laissait un peu plus qui ne faisait rien d'utile. Les fabricants d'ordinateurs ont utilisé ce bit dans l'ASCII étendu pour surmonter certaines des limitations de l'ASCII standard. Le principal problème était que l'ASCII était adapté à l'anglais, en particulier à l'anglais américain, et qu'il manquait les voyelles accentuées utilisées dans d'autres langues européennes telles que le français. Des symboles monétaires pour d'autres pays ont également été ajoutés au jeu de caractères. Malheureusement, différents fabricants ont implémenté différents ASCII étendus, ce qui les rend incompatibles entre les plates - formes . En 1987, l' Organisation internationale de normalisation a publié la norme ISO 8859-1 , pour un codage de caractères à 8 bits basé sur l'ASCII à 7 bits qui a été largement adoptée.

Les codages de caractères ISO 8859 ont été développés pour les écritures non latines telles que le cyrillique , l' hébreu , l' arabe et le grec . Cela restait problématique si un document ou des données utilisaient plus d'un script. Plusieurs commutateurs entre les codages de caractères étaient nécessaires. Cela a été résolu par la publication en 1991 de la norme pour Unicode 16 bits , en développement depuis 1987. Unicode a maintenu les caractères ASCII aux mêmes points de code pour la compatibilité. En plus de la prise en charge des écritures non latines, Unicode a fourni des points de code pour les logogrammes tels que les caractères chinois et de nombreux caractères spécialisés tels que les symboles astrologiques et mathématiques. En 1996, Unicode 2.0 autorisait les points de code supérieurs à 16 bits ; jusqu'à 20 bits et 21 bits avec une zone d'utilisation privée supplémentaire. Unicode 20 bits prenait en charge les langues éteintes telles que l' écriture italique ancienne et de nombreux caractères chinois rarement utilisés.

Code international des signaux (radiotélégraphe)

En 1931, le Code international des signaux , créé à l'origine pour la communication des navires en signalant à l'aide de drapeaux, a été élargi en ajoutant une collection de codes à cinq lettres à utiliser par les opérateurs radiotélégraphiques.

Comparaison des codes

Comparaison des codes de drapeau

Tableau 1
Code Un
N
B
O
C
P
D
Q
E
R
F
S
G
T
H
U
Je
V
J
W
K
X
L
Y
M
Z
Type de données Remarques Réf
Perruque Myer à 2 éléments 11
22
1221
12
212
2121
111
2122
21
122
1112
121
1122
1
211
221
2
2111
2211
2212
1212
1211
112
222
2112
1111
Série, longueur variable 1=drapeau à gauche, 2=drapeau à droite
Morse international en notation drapeau 12
21
2111
222
2121
1221
211
2212
1
121
1121
111
221
2
1111
112
11
1112
1222
122
212
2112
1211
2122
22
2211
Série, longueur variable 1=drapeau à gauche, 2=drapeau à droite
Morse américain en notation drapeau 12
21
2111
131
1131
11111
211
1121
1
1311
121
111
221
2
1111
112
11
1112
2121
122
212
1211
2+
11311
22
11131
Série, longueur variable 1=drapeau à gauche, 2=drapeau à droite, 3=drapeau levé
Perruque Myer à 3 éléments 112
322
121
223
211
313
212
131
221
331
122
332
123
133
312
233
213
222
232
322
323
321
231
111
132
113
Série, 3 éléments 1=drapeau à gauche, 2=drapeau à droite, 3=drapeau levé

Remarques sur le tableau 1

Comparaison des codes d'aiguille

Tableau 2
Code Un
N
B
O
C
P
D
Q
E
R
F
S
G
T
H
U
Je
V
J
W
K
X
L
Y
M
Z
Type de données Remarques Réf
Schilling 1 aiguille (1820) Schilling 1 aiguille horizontale.svg Série, longueur variable C'est le premier code à utiliser un seul circuit.
Gauss et Weber 1 aiguille (1833) Gauss & Weber horizontal.svg Série, longueur variable
Cooke et Wheatstone 5 aiguilles (1838) C&W5 horizontal.svg Parallèle, 5 éléments
Cooke et Wheatstone 2 aiguilles C&W2 horizontal.svg Série-parallèle, longueur variable
Cooke et Wheatstone 1 aiguille (1846) C&W1 horizontal.svg Série, longueur variable
Highton 1 aiguille Highton1 horizontal.svg Série, longueur variable
Morse comme code d'aiguille Aiguille morse horizontale.svg Série, longueur variable Aiguille à gauche = point
Aiguille à droite = tiret
Code Foy-Breguet
(2 aiguille)
Foy-Breguet horizontal.svg Parallèle, 2 éléments

Remarques sur le tableau 2

Une autre représentation des codes d'aiguille consiste à utiliser le chiffre « 1 » pour l'aiguille à gauche et « 3 » pour l'aiguille à droite. Le chiffre "2", qui n'apparaît pas dans la plupart des codes, représente l'aiguille en position verticale neutre. Les points de code utilisant ce schéma sont marqués sur la face de certains instruments à aiguilles, en particulier ceux utilisés pour la formation.

Comparaison des codes point-tiret

Tableau 3
Code Un
N
B
O
C
P
D
Q
E
R
F
S
G
T
H
U
Je
V
J
W
K
X
L
Y
M
Z
Type de données Remarques Réf
Steinheil (1837)












Série, longueur variable
Steinheil (1849)   ▄▄▄ ▄ ▄▄▄ 
  ▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ ▄▄▄ 
  ▄▄▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ ▄ 
  ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄▄▄ 
  ▄▄▄ ▄▄▄ 
  ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄▄▄ ▄ 
  ▄ ▄▄▄ 
  ▄ ▄▄▄ ▄ 
  ▄ 
  ▄▄▄ ▄ ▄ 
  ▄ 
  ▄ ▄▄▄ ▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ 
  ▄ ▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ 
Série, longueur variable
Bain (1843)   ▄▄▄ 
  ▄ ▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ ▄ 
  ▄▄▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄ ▄▄▄ 
  ▄ ▄▄▄ 
  ▄▄▄ ▄ ▄▄▄ ▄ 
  ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄▄▄ ▄▄▄ ▄▄▄ 
  ▄▄▄ ▄ ▄ 
  ▄▄▄ ▄ ▄ 
  ▄▄▄ ▄ ▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ 
  ▄▄▄ ▄ 
  ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄▄▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄▄▄ ▄ ▄ ▄▄▄ 
  ▄ ▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ 
  ▄▄▄ ▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ ▄▄▄ 
Série, longueur variable
Morse (vers 1838)   ▄ ▄ ▄ 
  ▄▄▄ ▄ 
  ▄ ▄ ▄ ▄ 
  ▄ ▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄ ▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄▄▄ ▄ 
  ▄ 
  ▄ ▄ 
  ▄ ▄ ▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ 
  ▄▄▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ 
  ▄▄▄▄ 
  ▄ ▄▄▄ 
  ▄ ▄ 
  ▄ ▄▄▄ ▄ 
Série, longueur variable
Morse (vers 1840)
(morse américain)
  ▄ ▄▄▄ 
  ▄▄▄ ▄ 
  ▄▄▄ ▄ ▄ ▄ 
  ▄ ▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄ ▄ 
  ▄ ▄ 
  ▄ ▄ ▄▄▄ ▄ 
  ▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄▄▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄ ▄ 
  ▄ ▄ ▄ ▄▄▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ 
  ▄ ▄▄▄ ▄ ▄ 
  ▄▄▄▄ 
  ▄ ▄ ▄ ▄ 
  ▄▄▄ 
  ▄ ▄ ▄ ▄ 
Série, longueur variable
Gerke (1848)
(morse continental)
  ▄ ▄▄▄ 
  ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄ ▄▄▄ ▄ ▄ ▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄ ▄ ▄ ▄ 
  ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ ▄▄▄ 
  ▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄▄▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄ ▄ 
  ▄ ▄ ▄ ▄▄▄ 
  ▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ 
  ▄ ▄ ▄▄▄ ▄ ▄ ▄ 
  ▄▄▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ ▄ ▄ 
  ▄▄▄ 
  ▄ ▄▄▄ ▄▄▄ ▄ ▄ 
Série, longueur variable
Morse international
(1851)
  ▄ ▄▄▄ 
  ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄▄▄ ▄▄▄ ▄ 
  ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ ▄▄▄ 
  ▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄▄▄ ▄ 
  ▄ ▄ ▄ 
  ▄▄▄ ▄▄▄ ▄ 
  ▄▄▄ 
  ▄ ▄ ▄ 
  ▄ ▄ ▄▄▄ 
  ▄ ▄ 
  ▄ ▄ ▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ ▄▄▄ 
  ▄ ▄▄▄ 
  ▄▄▄ ▄ ▄ ▄▄▄ 
  ▄▄▄ ▄ ▄ 
  ▄▄▄ ▄ ▄▄▄ ▄▄▄ 
  ▄▄▄ ▄▄▄ 
  ▄▄▄ ▄ ▄ 
Série, longueur variable

Remarques sur le tableau 3

Lorsqu'ils sont utilisés avec un télégraphe d'impression ou un enregistreur à siphon , les " tirets " des codes point-tiret sont souvent de la même longueur que le " point ". En règle générale, la marque sur la bande pour un point est faite au-dessus de la marque pour un tiret. Un exemple de ceci peut être vu dans le code Steinheil de 1837, qui est presque identique au code Steinheil de 1849, sauf qu'ils sont représentés différemment dans le tableau. Le code Morse international était couramment utilisé sous cette forme sur les câbles télégraphiques sous-marins .

Comparaison des codes binaires

Tableau 4
Code Un
N
B
O
C
P
D
Q
E
R
F
S
G
T
H
U
Je
V
J
W
K
X
L
Y
M
Z
Type de données Remarques Réf
Baudot et ITA 1 01
1E
0C
07
0D
1F
0F
1D
02
1C
0E
14
0A
15
0B
05
06
17
09
16
19
12
1B
04
1A
13
Série, 5 bits
Baudot–Murray et ITA 2 03
0C
19
18
0E
16
09
17
01
0A
0D
05
1A
10
14
07
06
1E
0B
13
0F
1D
12
15
1C
11
Série, 5 bits
ASCII 41/61
4E/6E
42/62
4F/6F
43/63
50/70
44/64
51/71
45/65
52/72
46/66
53/73
47/67
54/74
48/78
55/75
49/69
56/76
4A/6A
57/77
4B/6B
58/78
4C/6C
59/79
4D/6D
5A/7A
Série, 7 bits

Tableau 4 remarques

Voir également

Les références

Bibliographie

  • Beauchamp, Ken, Histoire de la télégraphie , IET, 2001 ISBN  0852967926 .
  • Bouchet, Olivier, Communications optiques sans fil , Wiley, 2012 ISBN  1848213166 .
  • Bright, Charles Tilston , Submarine Telegraphs , Londres : Crosby Lockwood, 1898 OCLC  776529627 .
  • Burns, Russel W., Communications: An International History of the Formative Years , IEE, 2004 ISBN  0863413277 .
  • Calvert, James B., "The Electromagnetic Telegraph" , consulté et archivé le 13 octobre 2019.
  • Chesnoy, Jose, Undersea Fiber Communication Systems , Academic Press, 2002 ISBN  0-08-049237-1 .
  • Coe, Lewis, The Telegraph : Une histoire de l'invention de Morse et de ses prédécesseurs aux États-Unis , McFarland, 2003 ISBN  0-7864-1808-7 .
  • Edelcrantz, Abraham Niclas, Afhandling om Telegrapher ("Un traité sur les télégraphes"), 1796, tel que traduit au ch. 4 de Holzmann & Pehrson.
  • Gerke, Friedrich Clemens, Der praktische Telegraphist, oder, Die electro-magnetische Telegraphie , Hoffmann und Campe, 1851 OCLC  162961437 .
  • Gillam, Richard, Unicode démystifié , Addison-Wesley Professional, 2003 ISBN  0201700522 .
  • Gollings, Gus, "Encodage de script multilingue", ch. 6 po, Cope, Bill ; Gollings, Gus, Production de livres multilingues , Common Ground, 2001 ISBN  186335073X .
  • Guillemin, Amédée, Les Applications des Forces Physiques , Macmillan and Company, 1877 OCLC  5894380237 .
  • Hallas, Stuart, M., "The Single Needle Telegraph" , consulté et archivé le 5 octobre 2019.
  • Highton, Edward, The Electric Telegraph : son histoire et ses progrès , J. Weale, 1852 OCLC  999489281 .
  • Holzmann, Gérard J.; Pehrson, Björn, The Early History of Data Networks , Wiley, 1995 ISBN  0818667826 .
  • Huurdeman, Anton A., L'histoire mondiale des télécommunications , John Wiley & Sons, 2003 ISBN  0471205052 .
  • Johnson, Rossiter (éd), Universal Cyclopædia and Atlas , vol. 10, D. Appleton and Company, 1901 LCCN  05-9702 .
  • Kieve, Jeffrey L., The Electric Telegraph: A Social and Economic History , David et Charles, 1973 OCLC  655205099 .
  • King, Thomas W., Modern Morse Code in Rehabilitation and Education , Allyn et Bacon, 2000 ISBN  0205287514 .
  • Lyall, Francis, Communications internationales : l'Union internationale des télécommunications et l'Union postale universelle , Routledge, 2016 ISBN  1-317-114345 .
  • Maver, William, Jr., American Telegraphy and Encyclopedia of the Telegraph , Maver Publishing Company, 1909 OCLC  499312411 .
  • Mullaney, Thomas S., "Souveraineté sémiotique: Le code télégraphique chinois de 1871 dans une perspective historique", pp. 153-184 dans, Jing Tsu; Elman, Benjamin A. (eds), Science and Technology in Modern China, 1880s-1940s , BRILL, 2014 ISBN  9004268782 .
  • Myer, Albert J., Une nouvelle langue des signes pour les sourds-muets , Jewett, Thomas & Co., 1851 OCLC  1000370390 .
  • Myer, Albert J., A Manual of Signals , D. van Nostrand, 1866 OCLC  563202260 .
  • Myer, Albert J., A Manual of Signals , D. van Nostrand, 1872 OCLC  682033474 .
  • Noll, A. Michael, L'évolution des médias , Rowman & Littlefield, 2007 ISBN  0742554821 .
  • Raykoff, Ivan, « Piano, télégraphe, machine à écrire : Écouter le langage du toucher », ch. 8 po, Colligan, Colette (éd) ; Linley, Margaret (ed), Media, Technology, and Literature in the Nineteenth Century , Routledge, 2016 ISBN  131709865X .
  • Salomon, David, Compression de données : la référence complète , Springer Science & Business Media, 2007 ISBN  1846286034 .
  • Shaffner, Taliaferro Preston, The Telegraph Manual , Pudney & Russell, 1859 OCLC  258508686 .
  • Shiers, George, The Electric Telegraph: An Historical Anthology , Arno Press, 1977 OCLC  838764933 , y compris des réimpressions de parties de,
  • Toncich, Dario J., Communications de données et mise en réseau pour les industries manufacturières , Chrystobel Engineering, 1993 ISBN  0646105221 .
  • Wrixon, Fred B., Codes, Ciphers, Secrets and Cryptic Communication , Black Dog & Leventhal Publishers, 2005 ISBN  1579124852 .
  • Wyatt, Allen L., Using Assembly Language , Que Corporation, 1887 ISBN  0880222972 .

Liens externes