Le codage informatique de l’écriture arabe : d’ASMO 449 à Unicode et ISO/CEI 10646 Rachid Zghibi Département documentation Université Paris 8 Maison des Sciences de l’Homme Paris Nord 4, rue de la Croix Faron, Plaine Saint-Denis F-93210 Saint-Denis
[email protected] RÉSUMÉ. Le traitement de l’écriture arabe par le standard Unicode et la norme ISO/CEI 10646 constitue l’objet de cet article. Nous présentons d’abord les principaux problèmes liés au codage informatique de l’écriture arabe, puis nous montrons comment Unicode résout ces problèmes. ABSTRACT. The present paper deals with the treatment of arabic script by the Unicode and ISO/CEI 10646. First, we shall outline the principal problems related to the encoding of arabic script. Then we shall show how Unicode resolves this problems. MOTS-CLÉS : écriture arabe, Unicode, ISO/CEI 10646, codage. KEYWORDS: arabic script, Unicode, ISO/CEI 10646, encoding. Document numérique. Volume 6 – n° 3-4/2002, pages 155 à 182 Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur dn.revuesonline.com 156 DN – 6/2002. Unicode, écriture du monde ? 1. Écriture arabe 1.1.Origine L’arabe fait partie des langues chamito-sémitique et plus précisément, à l’intérieur de cet ensemble, du groupe des langues sémitiques. Ce groupe se divise en sémitique oriental (avec l’akkadien), sémitique occidental ou du nord (cananéen, phénicien, hébreu, araméen) et sémitique méridional. L’arabe relève de ce dernier groupe avec l’éthiopien et le sud-arabique. À la différence d’autres nations, comme les anciens égyptiens, les babyloniens et les chinois dont les systèmes d’écriture remontent à des milliers d’années, l’écriture arabe n’est apparue qu’au VIe siècle.