<<

Etude des différentes approches d’accès à pour les non-voyants

Siwar Farhat(1) (2) , Yacine Bellik(2) , Thierry Ducros(1) , Françoise Néel(2) , Daniel Teil(2)

(1) TECHNIBRAILLE ZAE, 4, rue Léon Blum, 91120 Palaiseau Tél. : (33) (1)-69-19-47-57 Fax : (33) (1)-69-32-11-05 (2) LIMSI-CNRS B.P. 133, 91403 Orsay Tél. : (33) (1)-69-85-80-64 Fax: (33) (1)-69-85-80-88

E-mail:[email protected], [email protected], [email protected], [email protected], [email protected]

Résumé L’accès à Internet représente une opportunité intéressante pour les non-voyants et leur permet de profiter d’un nombre important de ressources et d’informations mises à la disposition de tous, telles que les pages HTML (HyperText Markup Language), le courrier électronique et le téléchargement de fichiers. Les documents HTML utilisent abondamment les possibilités multimédia, des ordinateurs actuels. Ils peuvent donc intégrer du texte, des images, des animations, des fichiers audio, vidéo, etc. Le fait que les pages HTML exploitent ces caractéristiques multimédia pose un problème d’accès pour les non-voyants. Afin de permettre à un non-voyant d’accéder aux pages HTML, des méthodes efficaces d’interaction et de présentation de l’information électronique doivent être développées. Le but de cet article est de décrire et d'analyser les différentes approches et méthodes adoptées pour faciliter l’accès par des non-voyants au réseau Internet. Suite à cette étude de l’existant, nous décrirons l'approche que nous sommes actuellement en train d'explorer et qui consiste en fait, à combiner de manière harmonieuse deux approches existantes afin de pouvoir extraire un maximum d'informations pertinentes pour l'utilisateur aveugle, tout en offrant une interface non-visuelle conviviale. Ce projet entre dans le cadre d’une collaboration entre la société TECHNIBRAILLE et le LIMSI-CNRS.

Mots-Clés Interface non visuelle; Accès à internet; Non-voyant.

Abstract By providing access to numerous services and resources such as HTML (Hyper Text Markup Language) pages, E-mail and file downloading, the Internet network offers interesting opportunities for blind people. HTML documents, however, make an extensive use of multimedia features in the form of text, images, animations, audio-files, etc. which cannot be fully interpreted by blind people. To allow blind people an easy access to the Internet and all available resources, efficient interaction techniques and electronic data presentation methods must be investigated and developed. In this paper several existing solutions are illustrated and discussed. A specific approach combining two methods is under study and aims at extracting most information. This project is carried on within the framework of a collaborative work between an industrial partner TECHNIBRAILLE and a research laboratory LIMSI-CNRS.

1. Introduction L'accès aux documents est l'une des tâches les plus courantes que nous effectuons quotidiennement. Le fait que les documents ont tendance aujourd'hui à être disponible de plus en plus sous forme électronique, ouvre pour les non-voyants une porte vers un colossal volume de connaissances. Ainsi, le nouveau support d'information que constitue le CD-ROM permet de stocker sur un espace de quelques centimètres cubes (disque de 12 cm de diamètre et 3 mm d'épaisseur) plus de 600 méga-octets de caractères, ce qui équivaut à des millions de pages braille qui nécessiteraient une étagère d'un kilomètre de longueur pour les stocker [Burger 92]. Aujourd'hui et grâce au Web, Internet qui était surtout accessible aux laboratoires de recherche et aux universités, connaît une expansion de plus en plus importante au sein des entreprises et parmi les particuliers. La quantité d’information ainsi disponible sur le réseau des réseaux devient de ce fait plus en plus importante. Toutefois, les documents disponibles sur le Web intègrent des informations de différents types (textes, images, sons, vidéos,...). Ceci rend d’autant plus difficile la restitution de ces informations à un utilisateur aveugle, et nécessite l’utilisation de techniques adaptées pour lui permettre une navigation simple dans un espace complexe d’informations. Dans cette article, nous passons en revue les différentes approches et méthodes adoptées pour faciliter l’accès par des non-voyants au réseau Internet. Suite à cette étude de l’existant et à une analyse comparative, nous décrirons l'approche que nous sommes actuellement entrain d'explorer et qui consiste en fait, à combiner de manière harmonieuse deux approches existantes afin de pouvoir extraire un maximum d'informations pertinentes pour l'utilisateur aveugle, tout en offrant une interface non-visuelle conviviale.

2. Les approches existantes L’étude de l’existant a permis de révéler trois approches principales permettant l’accès à Internet pour des non-voyants :

 La première approche (approche dédiée) consiste à développer des navigateurs dédiés spécialement aux non-voyants, l’interface non-visuelle étant conçue de manière à être la plus conviviale possible pour un utilisateur aveugle.  La seconde (approche générique) est fondée sur l’utilisation de "lecteurs d’écran" (Screen Readers) permettant l'accès à un système graphique de manière générale. Le lecteur d'écran est alors utilisé sur un navigateur visuel traditionnel tel que , ou [DosLynx 95].  La troisième approche (approche intermédiaire) enfin, est une extension de la précédente. Elle consiste à utiliser un "serveur de relais" (proxy server) permettant la transformation du contenu de la page HTML de manière à la rendre plus facilement lisible par un utilisateur aveugle, avant qu’elle ne soit envoyée au navigateur traditionnel.

Dans la suite, nous décrivons ces trois approches en donnant des exemples de projets aboutis ou en cours de développement.

2 2.1. L'approche dédiée Cette approche consiste à développer des navigateurs spécifiques adaptés au handicap de l’utilisateur. Ces navigateurs effectuent aussi bien l'interprétation que la présentation des pages HTML téléchargées. Après avoir effectué une analyse lexico-syntaxique, ils construisent des structures de données qui seront exploitées par le navigateur. La présentation du contenu de ces structures de données peut alors dépendre du profil de l’utilisateur.

Il existe plusieurs projets et/ou logiciels qui permettent l’accès à Internet selon cette approche. On peut citer à titre d'exemple, le projet Avanti [Avanti 96], pwWebSpeak [pwWebSpeak 96] [Hakkinen 97] et le projet Smart-Net [Vigouroux 97] [Truillet 97]. Bien que l'approche de base adoptée dans ces différents systèmes soit la même, il faut cependant noter que chaque système possède certaines caractéristiques propres. Par exemple, pwWebSpeak est un navigateur réellement dédié aux utilisateurs aveugles alors que le projet Avanti se veut être plus générique en offrant une interface adaptative, permettant des présentations différentes selon les caractéristiques de l'utilisateur. PwWebSpeak fournit un ensemble de commandes permettant à l'utilisateur plusieurs types de navigation : navigation par caractère, par mot, par paragraphe ou par lien. Il permet de comptabiliser le nombre de liens hypertextes présents dans une page donnée, le nombre d’images, etc. Il reconnaît les tableaux et les images mais pas les cadres, ni les applets Java . L'architecture de pwWebSpeak est donnée dans la figure 1.

Figure 1 : Architecture du système pwWebSpeak [pwWebSpeak 96]

Le projet Avanti quant à lui, vise le développement et l’évaluation de systèmes d’information hypermédia distribués capables de s'adapter à différents profils d’utilisateurs (touristes, citoyens, handicapés visuels...). Selon le profil utilisateur, le système fournira une interface adaptée à ses besoins (système adaptatif). Mais il offre également la possibilité à l’utilisateur de changer certaines caractéristiques du modèle d’écran dans le but d’adapter le comportement du système selon ses préférences (système adaptable). La figure 2 présente l'architecture adoptée dans ce projet.

3

Figure 2 : Architecture adoptée dans le projet Avanti [Fink 97]

Le système SMART enfin, a pour objectif de permettre l'accès pour des non-voyants à des documents, en substituant à la modalité visuelle des modalités sonores et/ou tactiles (présentation multimodale). Il offre des fonctions de consultation et d'édition (lecture rapide, pose d'annotations, …) similaires aux fonctions utilisées par les voyants. Le système SMART n'est pas seulement multimodal, il est aussi multilingue. Cet aspect est rendu possible grâce à l'utilisation de systèmes de synthèse à partir de textes, français, anglais, espagnols ou allemands. Toutefois SMART n'utilise que des documents HTML disponibles en local sur le disque dur et il ne reconnaît pas non plus les cadres, les applet JAVA ou le code JAVASCRIPT.

2.2. L'approche générique Cette approche est la plus simple des trois approches décrites car elle ne nécessite pas de conception ou de développement spécifique. Un lecteur d'écran traditionnel tels que Jaws[Jaws 96], WinDots [WinDots 97] permettant l'accès à un système graphique (Windows) de manière générale est utilisé. Ce lecteur d'écran permet alors d'accéder à la fenêtre d'un navigateur visuel tel que Netscape ou Internet Explorer de la même manière qu'aux autres applications (Word, gestionnaire de fichiers, etc.). Toutefois ces lecteurs d'écran n'arrivent pas encore à reconnaître tous les éléments possibles d'une page HTML, tels qu'ils sont présentés par les navigateurs visuels classiques. Pour cette raison, il existe maintenant des navigateurs visuels dont le code source est en libre accès. Il est alors possible de modifier ce code source de manière à rendre le navigateur plus compatible avec le lecteur d'écran. Mais en général, ces codes sources servent plutôt comme point de départ pour le développement d'un navigateur dédié.

Ainsi, le logiciel est à la fois un navigateur et un éditeur WYSIWYG de pages Web, développé à Grenoble par une équipe de l’INRIA [LeMonde 98] [Amaya 97] à la demande du Consortium (W3C). Amaya supporte la totalité de la spécification HTML 3.2. Toutefois, il ne gère ni le courrier électronique ni l’accès aux groupes de discussions

4 (newsgroups). C'est un outil uniquement tourné vers le Web. Il comporte un analyseur HTML spécifique et son éditeur produit des documents strictement conformes à la norme HTML. Le code source est intégralement disponible. Ainsi on peut le modifier et l’adapter à des usages spécifiques.

Pour des raisons de simplicité d'utilisation (et parfois de coût...), certains utilisateurs aveugles préfèrent continuer à utiliser un lecteur d'écran sous Ms-Dos plutôt que sous Windows. Afin de pouvoir accéder à Internet, il devient alors nécessaire de disposer d'un navigateur sous Ms- Dos. Lynx et Bobcat [Bobcat 97] sont précisément des navigateurs textuels destinés à Ms-Dos (Lynx est également disponible sous ). L’affichage de pages HTML se fait en mode caractères. La présence des images est simplement indiquée par le mot [image] entre crochets. Lynx associe pour chaque "frame" différentes pages HTML. Il remplace une image cliquable par un lien hypertexte. Lynx a été développé en utilisant une librairie appelée [LibWWW 97] mise à la disposition des développeurs par le consortium W3C. LibWWW est une bibliothèque de fonctions destinée à développer des applications Internet. Elle contient une API écrite en C.

2.3. L'approche intermédiaire Cette approche se situe entre les deux approches précédentes. Elle consiste à opérer certaines transformations sur la page HTML avant qu'elle ne soit reçue par un navigateur traditionnel. Un lecteur d'écran est alors utilisé pour accéder au navigateur selon l'approche générique. Naturellement les transformations opérées sur la page HTML sont choisies de manière à rendre la page plus lisible et plus rapidement consultable par un utilisateur aveugle. La transformation de la page s'opère sur un serveur de relais (proxy server ).

WAB (W3 Access for the Blind) [ETH 97] [Perrochon 95] est un système qui utilise cette approche. La figure 3 en décrit le principe. En général, les modifications apportées à la page HTML originale concernent le rajout d'informations permettant d'identifier les liens (par exemple, rajout du mot "link" avant le lien), les niveaux de titres, les images, les objets interactifs (boutons, cases à cocher, boîte à liste, etc.). L'utilisateur aveugle peut ainsi percevoir certains éléments même si le lecteur d'écran ne les reconnaît pas. Une liste de tous les liens est également souvent rajoutée à la nouvelle page HTML.

Figure 3 : Principe de l'approche intermédiaire[Perrochon 97]

5 3. Comparaison des trois approches La création d’un navigateur dédié aux non-voyants représente une démarche intéressante. A partir de la page HTML, un interpréteur récupère les informations nécessaires à la constitution d’un modèle d’écran à partir de la structure logique des pages,. Ce modèle sera alors exploité par le système dédié afin de restituer l’information d’une manière adaptée. Par exemple, des techniques d’interaction multimodale peuvent ainsi être exploitées par le système de manière optimale [Bellik 95] [Vigouroux 97]. Cette méthode permet de modifier le contenu de la page HTML selon certaines règles ergonomiques, d’ajouter et/ou de supprimer des informations pour faciliter la navigation à l’utilisateur non voyant. En raison de la prise en charge par le navigateur du processus d'interprétation, il s'ensuit une dépendance du système par rapport à la norme HTML. Il faut alors mettre à jour le navigateur à chaque évolution de la norme. De plus cette approche nécessite l’interprétation directe à partir du code source des langages JavaScript et VbScript ainsi que des applets JAVA. L’apparition de Java et ActiveX rend l’analyse des pages HTML difficile, puisqu’il faudrait non seulement analyser le code HTML standard, mais aussi le code introduit par JavaScript et VbScript.

La seconde approche qui consiste à utiliser un filtre général [Farhat 97], comme les lecteurs d’écran, permet d’éviter le problème de l'interprétation de Java puisque cette tâche est effectuée par le navigateur visuel utilisé (Netscape, Internet Explorer, etc.). En revanche, elle crée une forte dépendance vis-à-vis du système d’exploitation. En effet, les lecteurs d’écrans développés sous un environnement précis ne peuvent être réutilisés sous un autre environnement différent. Par exemple, les outils existants pour Windows 3.11 ne peuvent être repris sous qu’après avoir réécrit le code dans le nouvel environnement. Par ailleurs, les outils qui commencent à fonctionner sous Windows 95 comportent encore un certain nombre de lacunes. Ils ne peuvent pas reconnaître tous les composants graphiques de l’interface. Ce qui ne permet pas aux utilisateurs aveugles de percevoir tous les éléments pertinents présents dans une page Web. Au-delà de ces problèmes techniques, se posent des problèmes d’ordre ergonomique, la généricité de la solution se faisant aux dépens de la qualité d’adaptation. Au lieu de focaliser l’utilisateur aveugle sur des éléments pertinents de la page HTML, cette méthode le noie dans une foule d’informations (d’embellissement) pas nécessairement utiles pour un utilisateur aveugle.

La troisième approche enfin, essaye justement de remédier à ce dernier inconvénient en traitant la page HTML originale de manière à produire une nouvelle page dont l'organisation et le contenu sont plus adaptés à une consultation non-visuelle. Mais ceci implique un passage obligatoire par le serveur de relais. Par exemple, si le serveur de relais se trouve aux Etats- Unis alors que l'utilisateur se trouve en France et que la page consultée se trouve également en France, un aller-retour des informations entre la France et les Etats-Unis est nécessaire.

4. Approche proposée L'approche que nous explorons dans notre projet, consiste en fait à combiner de manière judicieuse les deux premières approches présentées afin de pouvoir récupérer un maximum d'informations pertinentes pour l'utilisateur aveugle, tout en offrant une interface non-visuelle conviviale. Un système couplant un navigateur dédié et un filtre général permettra de résoudre les problèmes d’accès aux "applets" Java et aux composants ActiveX difficilement interprétables à partir des pages HTML. Le modèle d'écran ainsi construit sera plus complet qu'un modèle d'écran traditionnel car il puisera ses informations à partir de deux sources : le filtre général et le code source HTML. L'utilisation d'un filtre suppose naturellement l'utilisation en plus du navigateur dédié, d'un navigateur visuel. Ceci pose des problèmes de

6 synchronisation entre les deux navigateurs lorsque l'utilisateur aveugle active des commandes de navigation. Des problèmes de même nature se posent entre l’interpréteur et le filtre. La mise en correspondance entre le filtrage de ce qui est visible à l’écran et de ce qui est interprété au niveau du code HTML n'est pas une tâche simple. La figure 4 décrit le principe de notre approche.

Serveur Page HTML Web

Interpréteur Navigateur Visuel

Modèle d'écran Filtre

Navigateur dédié

Terminal Braille, Synthèse de la parole Reconnaissance vocale Clavier standard

UTILISATEUR

Figure 4 : Principe de l'approche en cours d'étude

Le filtre général, qui joue le rôle d’un inspecteur d’actions et d’événements, peut être implémenter en utilisant des bibliothèques telles que Microsoft Active Accessibility (MSAA) kit [MSAA 97] et/ou Java Accessibility Api [JFC 97]. Certains éditeurs de logiciels utilisent le kit de développement MSAA pour développer leur « Screen Reader » (Windots). Java Accessibility Api est mise à la disposition des développeurs en Java par Sun Microsystems [Java 98]. Cette librairie permet aux développeurs de rendre leurs applications écrites en Java accéssibles aux non-voyants. Il est également possible grâce à cette libraire de développer un lecteur d’écran. Ainsi IBM a annoncé le 23 octobre 1997, l’existence d’un prototype appelé "JavaLive" [IBM 97], qui permet aux non-voyants d’accéder à Internet. Il permet de lire les informations affichées à l’écran avec une synthèse de la parole. C’est le premier lecteur d'écran développé complètement en Java en utilisant la librairie Java Accessibility Api.

7 5. Conclusion Dans cette article nous avons passé en revue les différentes méthodes utilisées pour permettre l'accès à internet aux non-voyants. Une analyse comparative nous a permis de montrer les lacunes de chaque approche. Suite à cette analyse nous avons proposé une approche combinée qui devrait permettre de combler ces lacunes. Cette approche combinée est en cours d'exploration, dans le cadre d'une collaboration entre le LIMSI-CNRS et TECHNIBRAILLE. Parallèlement, à ce travail, la définition d’une méthode quantitative d’évaluation des navigateurs WWW pour non-voyants est également en cours. Elle repose sur une analyse statistique du contenu des pages Web disponibles sur internet. Cette méthode d'évaluation sera appliquée aux outils existants ou en cours de développement et permettra de les classer de manière précise les uns par rapport aux autres et de révéler les problèmes que ces navigateurs n’arrivent pas à résoudre et les éléments d'une page HTML qu'ils n'arrivent pas à reconnaître. Ceci nous permettra alors d’orienter nos efforts vers la résolution de ces problèmes.

Références [Amaya 97] « An introduction to Amaya », in http://www.w3j.com/6/s2.vatton.html [Avanti 96] AT & HCI Lab, « Developpement of Application Accessible to An unified », http://www.ics.forth.gr/proj/rti/html/ui4all_of_applications_accessible_to_all.html [Bellik 95] Y. Bellik, « Interfaces Multimodales : concepts, modèles et architectures », Thèse de doctorat en Informatique de l’Université de PARIX XI, 30 Mai 1995 [Burger 92] D. Burger, J. Suchard, P. Barker, J. C. Martin, "Methods for Improving Computer Access for the Visually Impaired" Proceedings of 14th Annual International Conference of IEEE-EMBS, 1992, pp. 1535-1537. [Bobcat 97] « What is bobcat », http://www.fdisk.com/doslynx/bobcat.htm [DosLynx 95] DosLynx v0.8 Alpha Release Information, in ftp://ftp2.cc.ukans.edu/pub/DosLynx/ readme.htm [ETH 95] ETH, « Wab User Manuel », http://www.inf.ethz.ch/departement/IS/ea/blinds/user_man.html. [Farhat 97] S. Farhat, « Outil d’adaptation d’interfaces graphiques pour les non voyants », Thèse de doctorat en Informatique de l’Université de PARIS VII, 26 Mai 1997 [Fink 97] J. Fink, A. Nill, « Adaptivity and User Modeling Within the AVANTI Project » http ://zeus.gmd.de/hci/projects/avanti/publications/www5-w6.html [Hakkinen 97] M. Hakkinen, « pwWebSpeak: User Interface Design of an Accessible Web Browser », http://www.prodworks.com/webpaper.htm [IBM 97] « IBM Creates New Java Technology to help Blind Computer Users Access the

8 Internet », October 1997, in http://Internet.ibm.com/news/2d12.html

[Jaws 96] « Jaws for Windows », User’s Manuel, Hencer-Joyce Inc. December 1996 [JFC 97] « Java Accessibility Api », in http://java.sun.com/products/jfc/ [LeMonde 98] « Amaya, la troisième voie », http://www.lemonde.fr/multimedia/sem0498/1034.htm [LibWWW 97] « W3C Library Interfaces », in http://www.w3.org/Library/User/Guide/Overview.html [MSAA 97] « Microsoft Active Accessibility Software Developpement Kit », User’s Manuel, May 1997 [Perrochon 95] L. Perrochon, A. Kennel, « World Wide Web Access for Blind People », IEEE Symposium on Data Highway, Bern, October 1995 [Perrochon 97] L. Perrochon, A. Kennel, « WAB : World Wide Web Access for Blind People », http://www.inf.ethz.ch/departement/IS/ea/blinds [pwWebSpeak 96] The productivity Works, « pwWebSpeak Overwiew »,in http//www.prodworks.com/pwwovw.htm [Truillet 97] P. Truillet, B. Oriola, N. Vigouroux « Multimodal Presentation as a Solution to Access a Structured Document », http://hyperg.bab.cinvestav.mx:8000/posters/758/758_post.htm [Vigouroux 97] N.Vigouroux, P. Truillet, « Les projets SMART/ SMART/NET », http//www.irit.fr/ACTIVITES/EQ_IHMPT/participants/truillet/smart.html [WinDots 97] « WinDots », User’s Manuel, F.H Papenmeir, October 1997

9