Lecteur d'écran - Screen reader

Exemple d'une personne utilisant un lecteur d'écran affichant des documents inaccessibles, lisibles et accessibles.

Un lecteur d'écran est une forme de technologie d' assistance ( TA ) qui restitue le contenu du texte et des images sous forme de sortie vocale ou en braille. Les lecteurs d'écran sont essentiels pour les personnes aveugles et utiles aux personnes malvoyantes , analphabètes ou ayant des difficultés d'apprentissage . Les lecteurs d'écran sont des applications logicielles qui tentent de transmettre ce que les personnes ayant une vue normale voient sur un écran à leurs utilisateurs via des moyens non visuels, comme la synthèse vocale , des icônes sonores ou un appareil braille . Pour ce faire, ils appliquent une grande variété de techniques qui incluent, par exemple, l'interaction avec des API d'accessibilité dédiées , l'utilisation de diverses fonctionnalités du système d'exploitation (telles que la communication inter-processus et l'interrogation des propriétés de l' interface utilisateur ) et l'utilisation de techniques d' accrochage .

Microsoft Windows systèmes d' exploitation ont inclus le Narrateur Microsoft lecteur d'écran depuis Windows 2000 , bien que des produits distincts tels que Freedom Scientific est disponible dans le commerce JAWS lecteur d'écran et ZoomText agrandisseur d'écran et la libre et open source lecteur d'écran NVDA par NV accès sont plus populaires pour cette système opérateur. Apple Inc. est macOS , iOS et tvOS comprennent VoiceOver comme un lecteur d'écran intégré, tandis que Google 's Android fournit le lecteur d'écran Talkback et son Chrome OS peut utiliser ChromeVox. De même, les appareils basés sur Android d'Amazon fournissent le lecteur d'écran VoiceView. Il existe également des lecteurs d'écran gratuits et open source pour les systèmes Linux et Unix , tels que Speakup et Orca .

Les types

Ligne de commande (texte)

Dans les premiers systèmes d'exploitation , tels que MS-DOS , qui utilisaient des interfaces de ligne de commande ( CLI ), l'affichage à l'écran consistait en des caractères mappés directement sur un tampon d'écran en mémoire et une position de curseur . La saisie se faisait au clavier. Toutes ces informations pourraient donc être obtenues à partir du système soit en accrochant le flux d'informations autour du système et en lisant le tampon d'écran, soit en utilisant une prise de sortie matérielle standard et en communiquant les résultats à l'utilisateur.

Dans les années 1980, le Centre de recherche pour l'éducation des malvoyants ( RCEVH ) de l' Université de Birmingham a développé un lecteur d'écran pour BBC Micro et NEC Portable.

Graphique

Modèles hors écran

Avec l'arrivée des interfaces utilisateur graphiques ( GUI ), la situation s'est compliquée. Une GUI a des caractères et des graphiques dessinés sur l'écran à des positions particulières, et par conséquent il n'y a pas de représentation purement textuelle du contenu graphique de l'affichage. Les lecteurs d'écran ont donc été contraints d'employer de nouvelles techniques de bas niveau, rassemblant les messages du système d'exploitation et les utilisant pour construire un « modèle hors écran », une représentation de l'affichage dans laquelle le contenu textuel requis est stocké.

Par exemple, le système d'exploitation peut envoyer des messages pour dessiner un bouton de commande et sa légende. Ces messages sont interceptés et utilisés pour construire le modèle hors écran. L'utilisateur peut basculer entre les commandes (telles que les boutons) disponibles à l'écran et les légendes et le contenu des commandes seront lus à haute voix et/ou affichés sur un écran braille actualisable .

Les lecteurs d'écran peuvent également communiquer des informations sur les menus, les commandes et d'autres constructions visuelles pour permettre aux utilisateurs aveugles d'interagir avec ces constructions. Cependant, le maintien d'un modèle hors écran est un défi technique important ; accrocher les messages de bas niveau et maintenir un modèle précis sont deux tâches difficiles.

API d'accessibilité

Les concepteurs de systèmes d'exploitation et d'applications ont tenté de résoudre ces problèmes en fournissant aux lecteurs d'écran des moyens d'accéder au contenu de l'affichage sans avoir à maintenir un modèle hors écran. Celles-ci impliquent la fourniture de représentations alternatives et accessibles de ce qui est affiché sur l'écran accessible via une API . Les API existantes incluent :

Les lecteurs d'écran peuvent interroger le système d'exploitation ou l'application pour savoir ce qui est actuellement affiché et recevoir des mises à jour lorsque l'affichage change. Par exemple, un lecteur d'écran peut être informé que le focus actuel est sur un bouton et la légende du bouton à communiquer à l'utilisateur. Cette approche est considérablement plus simple pour les développeurs de lecteurs d'écran, mais échoue lorsque les applications ne sont pas conformes à l' API d' accessibilité : par exemple, Microsoft Word n'est pas conforme à l' API MSAA , les lecteurs d'écran doivent donc toujours conserver un modèle hors écran pour Word. ou trouver un autre moyen d'accéder à son contenu. Une approche consiste à utiliser les messages du système d'exploitation et les modèles d'objet d'application disponibles pour compléter les API d' accessibilité .

On peut supposer que les lecteurs d'écran peuvent accéder à tout le contenu d'affichage qui n'est pas intrinsèquement inaccessible. Les navigateurs Web, les traitements de texte, les icônes, les fenêtres et les programmes de messagerie ne sont que quelques-unes des applications utilisées avec succès par les utilisateurs de lecteurs d'écran. Cependant, selon certains utilisateurs, l'utilisation d'un lecteur d'écran est considérablement plus difficile que l'utilisation d'une interface graphique, et de nombreuses applications ont des problèmes spécifiques résultant de la nature de l'application (par exemple des animations) ou du non-respect des normes d'accessibilité de la plate-forme (par exemple Microsoft Word et accessibilité active).

Programmes et applications auto-vocaux

Certains programmes et applications intègrent une technologie de sonorisation à côté de leur fonctionnalité principale. Ces programmes sont appelés auto-voix et peuvent être une forme de technologie d' assistance s'ils sont conçus pour éliminer le besoin d'utiliser un lecteur d'écran.

Basé sur le cloud

Certains services téléphoniques permettent aux utilisateurs d'interagir à distance avec Internet. Par exemple, TeleTender peut lire des pages Web par téléphone et ne nécessite pas de programmes ou d'appareils spéciaux du côté de l'utilisateur.

Basé sur le Web

Un développement relativement nouveau dans le domaine est celui des applications Web telles que Spoken-Web qui agissent comme des portails Web, gérant le contenu comme les mises à jour, la météo, les articles scientifiques et commerciaux pour les utilisateurs d'ordinateurs malvoyants ou aveugles. D'autres exemples sont ReadSpeaker ou BrowseAloud qui ajoutent une fonctionnalité de synthèse vocale au contenu Web. Le public principal de ces applications est celui qui a des difficultés à lire en raison de troubles d'apprentissage ou de barrières linguistiques. Bien que les fonctionnalités restent limitées par rapport aux applications de bureau équivalentes, le principal avantage est d'augmenter l'accessibilité desdits sites Web lorsqu'ils sont consultés sur des machines publiques où les utilisateurs n'ont pas la permission d'installer des logiciels personnalisés, donnant aux gens une plus grande « liberté d'itinérance ».

Avec le développement des smartphones , la possibilité d'écouter des documents écrits (contenus web textuels, documents PDF , e-mails etc.) en conduisant ou lors d'une activité similaire de la même manière qu'écouter de la musique, bénéficiera à un public beaucoup plus large que personnes malvoyantes. Les exemples les plus connus sont Siri pour iOS , et Google Now et Iris pour Android . Avec la sortie du Galaxy S III , Samsung a également introduit un assistant personnel intelligent similaire appelé S Voice . Sur le système d'exploitation BlackBerry 10 , leur smartphone Z30 dispose également de fonctionnalités d'interaction vocale, similaires aux autres systèmes d'exploitation mobiles .

Cette fonctionnalité dépend de la qualité du logiciel mais aussi d'une structure logique du texte. L'utilisation de titres, la ponctuation, la présence d'attributs alternatifs pour les images, etc. sont cruciales pour une bonne vocalisation. De plus, un site Web peut avoir une belle apparence en raison de l'utilisation d'un positionnement bidimensionnel approprié avec CSS, mais sa linéarisation standard, par exemple en supprimant tout CSS et Javascript dans le navigateur, peut ne pas être compréhensible.

Personnalisation

La plupart des lecteurs d'écran permettent à l'utilisateur de choisir si la plupart des signes de ponctuation sont annoncés ou ignorés en silence. Certains lecteurs d'écran peuvent être adaptés à une application particulière par le biais de scripts . L'un des avantages des scripts est qu'ils permettent de partager les personnalisations entre les utilisateurs, augmentant ainsi l'accessibilité pour tous. JAWS bénéficie d'une communauté active de partage de scripts, par exemple.

Verbosité

La verbosité est une fonctionnalité du logiciel de lecture d'écran qui prend en charge les utilisateurs d'ordinateurs malvoyants. Les commandes de verbosité de la parole permettent aux utilisateurs de choisir le nombre de commentaires vocaux qu'ils souhaitent entendre. Plus précisément, les paramètres de verbosité permettent aux utilisateurs de construire un modèle mental des pages Web affichées sur leur écran d'ordinateur. Sur la base des paramètres de verbosité, un programme de lecture d'écran informe les utilisateurs de certains changements de formatage, comme le début et la fin d'un cadre ou d'un tableau, l'endroit où des graphiques ont été insérés dans le texte ou lorsqu'une liste apparaît dans le document.

Langue

Certains lecteurs d'écran peuvent lire du texte dans plusieurs langues , à condition que la langue du matériel soit encodée dans ses métadonnées .

Certains programmes de lecture d'écran incluent également la verbosité de la langue, qui détecte automatiquement les paramètres de verbosité liés à la langue de sortie vocale. Par exemple, si un utilisateur naviguait vers un site Web basé au Royaume-Uni, le texte serait lu avec un accent anglais .

Voir également

Les références

Liens externes