G. Kourilsky G. Grégory Kourilsky

L’écriture tham du : rencontre du sac du rencontre : Laos du tham L’écriture

L’écriture tham du Laos

L’informatisation d’une langue (ou d’une écriture) est souvent considérée Rencontre du sacré et de la technologie par les linguistes et les informaticiens d’un point de vue exclusivement technique. Dans les pays industrialisés, nous nous sommes habitués à ne plus voir l’écriture que comme un outil de transcription d’une langue. Mais il est d’autres cultures, dont certaines sont dites « minoritaires », qui lui ont maintenue une dimension paralittéraire, voire une haute valeur spirituelle. C’est le cas des bouddhistes lao dont l’écriture tham, employée presque exclusivement pour noter les textes religieux, dispose d’un caractère efficace.

Le passage, au sein de certaines de ces cultures, du traditionnel au technologique s’opère le plus souvent sans les transitions que nous avons connues en Occident. Ainsi, les voyageurs ont pu observer des groupes de populations adopter aisément le téléphone portable ou la technologie Internet alors que l’électricité leur était inaccessible quelques années auparavant. Ces changements et adaptations ne se font pas sans modifier plus ou moins profondément ces sociétés. delatechnologie et ré L’écriture tham du Laos, que l’on trouve essentiellement dans les manuscrits anciens sur feuilles de latanier (bailaan), s’inscrit dans cette problématique, avec les besoins de répondre aux nécessités des projets de conservation et de diffusion du patrimoine littéraire lao (recensement des manuscrits, publications, etc.), et dans la perspective d’une adhésion au mouvement international de normalisation du codage de « toutes les écritures du monde », incarné par le consortium Unicode.

La présente étude se propose de réfléchir, en prenant en compte des données historiques, linguistiques et socioreligieuses, à la question de l’intégration à un standard informatique mondial d’une écriture que l’on peut qualifier de sacrée, et d’en proposer des éléments de réponse théoriques et pratiques.

Collection Cahiers spéciaux de Péninsule

L’ÉCRITURE THAM DU LAOS :

RENCONTRE DU SACRÉ ET DE LA TECHNOLOGIE

£àxS%Dµl˜SàËSiÙ bèÛškà*>nvijAkA*etàËonoljI

Éléments historiques, linguistiques, sociologiques et pratiques pour l’informatisation d’une écriture bouddhique majeure d’Asie du Sud-Est

GRÉGORY KOURILSKY

4

NOTE DE L'AUTEUR

Le présent ouvrage est un mémoire de DREA soutenu en 2005 à l’Institut National des Langues et Civilisations Orientales, sous la direction de Vincent Berment (GETA-CLIPS & INALCO) et de Lamvieng Inthamone (INALCO). Je remercie vivement le Directeur de Péninsule, Jacques Népote, pour y avoir vu un intérêt suffisant pour une publication et ses nombreux conseils, la Rédactrice en chef, Marie- Sybille de Vienne, pour ses judicieux avis éditoriaux, et le Rédacteur-gérant, Geoffroi Crunelle, pour sa disponibilité et sa compétence pour la mise en forme d’un manuscrit présentant autant de difficultés techniques.

5

REMERCIEMENTS

À l’heure où ce travail s’achève, je tiens à exprimer ma profonde reconnaissance à Vincent Berment, sans qui cette étude n’aurait pas vu le jour et n’aurait pu même, à dire vrai, être envisagée. Malgré ses nombreuses et accaparantes activités professionnelles et universitaires, il a bien voulu consacrer son précieux temps libre pour m’enseigner les techniques informatiques, relire à plusieurs reprises mon manuscrit, répondre à mes interrogations, orienter ma bibliographie et surtout m’apporter un soutien moral permanent. Puisse-t-il croire en ma sincère et durable amitié.

Je remercie également Lamvieng Inthamone, mon professeur de lao à l’Inalco depuis 1999, qui m’a toujours encouragé à poursuivre les études universitaires quand les contraintes de la vie quotidienne ont pu me faire hésiter, et m’a fait bénéficier de son savoir et de sa confiance.

Qu’il me soit permis de remercier également tous ceux qui, à un moment ou à un autre, ont bien voulu répondre aux questions parfois triviales d’un novice. J’ai été agréablement surpris de l’accueil chaleureux des chercheurs qui tous ont répondu avec un intérêt systématique, parfois même avec bonne humeur, en tout cas toujours favorablement à mes demandes.

Je pense en premier lieu à Michel Lorrillard qui, malgré la distance qui nous sépare et son temps pris par des publications en préparation, m’a toujours étonné par sa disponibilité et sa gentillesse. Sans lui, un certain nombre de sources me seraient demeurées inconnues ou au mieux inaccessibles, ainsi que des données récentes qui ont invalidé celles que j’avais pu collecter dans des documents plus anciens.

Anatole-Roger Peltier a également toujours répondu amicalement à mes questions, et son travail novateur de publications en écritures tham, yuon et khün ainsi que ses encouragements ont été un précieux soutien. Que des bun lui soient accordés pour les ouvrages qu’il a eu l’extrême obligeance de me faire parvenir depuis Chiang Mai.

Quant à Michel Antelme, son intérêt et ses encouragements ont constitué un appui des plus solides, et son œil infaillible a été indispensable pour vérifier tout ce qui concerne la langue et l’écriture khmères dans ces pages. Je le remercie également d’avoir bien voulu accepter d’être membre du jury de soutenance.

Ma gratitude va enfin à tous les chercheurs, enseignants ou passionnés qui m’ont apporté leur aide et leur concours pour ce modeste travail : Josiane Cauquelin, Tai Luc Nguyen Tan, Michel Ferlus, Olivier de Bernon, Louis Gabaude, Maurice Bauhanh, Jacqueline Filliozat, Khin Sok, Xavier Dupré, Hubert Défossez, Balbir, David Wharton, Patrice Ladwig, Magda Danish et le Consortium Unicode, et enfin Christophe Chudy pour l’illustration de la couverture.

ຂອບໃຈພັນລະຍາດວງລັດຕະນາທີ່ໃຫ້ການສະໜັບສະໜູນສົ່ງເສີມກໍາລັງໃຈໃນວຽກງານນີ້ແລະຊ່ອຍເຫືຼອ ແບບຢ່າງຕ່າງໆ §§§

6 TABLE DES MATIÈRES

INTRODUCTION ...... 11 QU’EST-CE QUE L’ÉCRITURE THAM ? ...... 11 UN SYSTÈME D’ÉCRITURE MAL DOTÉ INFORMATIQUEMENT ...... 12 PROBLÉMATIQUE ET ORGANISATION ...... 14 1 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM...... 17 1.1 GÉNÉRALITÉS ...... 17 1.1.1 Usage du tham au Laos ...... 17 1.1.2 Aperçu de la filiation de l’écriture tham ...... 20 1.2 UNE ÉCRITURE RÉPANDUE ...... 23 1.2.1 Localisation géographique ...... 23 1.2.2 Données épigraphiques ...... 26 1.2.3 Les manuscrits bouddhiques du Laos...... 27 1.2.4 L’enseignement du tham au Laos ...... 30 1.3 UN OUTIL LINGUISTIQUE ...... 33 1.3.1 Des carences phonétiques de la langue lao pour la notation du ...... 33 1.3.2 La réforme de l’alphabet lao pour la notation du pali...... 35 1.3.3 Un soupçon de tham dans l’écriture lao « laïque »...... 38 1.4 LA FONCTION RELIGIEUSE DU THAM ...... 40 1.4.1 Données sur l’introduction du bouddhisme au Laos...... 40 1.4.2 Bouddhisme et écritures en Asie du Sud-Est (et en Haute Asie) ...... 42 1.4.3 Une écriture sacrée...... 45 CONCLUSION À LA PREMIÈRE PARTIE ET NOUVELLES HYPOTHÈSES ...... 50 2 SYSTÈMES D'ÉCRITURE...... 55 2.1 PRÉCISIONS SUR LES GRAPHIES ADOPTÉES ...... 55 2.2 LISTE DES CARACTÈRES ...... 57 2.3 PROPRIÉTÉS DE L’ÉCRITURE THAM POUR LA NOTATION DU PALI (P-THAM)...... 61 2.3.1 Consonnes p-tham et classement consonantique...... 61 2.3.2 Voyelles indépendantes p-tham ...... 63 2.3.3 Voyelles dépendantes p-tham ...... 64 2.3.4 Système de conjonction des consonnes p-tham ...... 65

2.3.5 Un cas particulier : la forme subjointe de la consonne xº...... 69 2.3.6 Consonnes de forme subjointe (et leurs graphies) ...... 70 2.3.7 Consonnes à l'initiale et en finale...... 71 2.3.8 Géminées...... 72 2.3.9 Glyphe syllabique p-tham...... 72 2.4 PROPRIÉTÉS DE L'ÉCRITURE THAM POUR LA NOTATION DU LAO (L-THAM)...... 74 2.4.1 Consonnes l-tham ...... 74 2.4.2 Voyelles l-tham ...... 77 2.4.3 Consonnes l-tham de forme subjointe et leurs graphies...... 79 2.4.4 Règle de souscription et suscription des consonnes l-tham ...... 81 2.4.5 Contractions et glyphes syllabiques l-tham...... 84 2.4.6 Graphies vocaliques particulières...... 86 2.4.7 Accents tonals ...... 87 2.5 AUTRES CARACTÈRES THAM ...... 89 2.5.1 Cardinaux ...... 89 2.5.2 Ponctuation...... 89 2.6 PARENTÉS SCRIPTURALES ...... 90 2.7 TRANSCRIPTIONS ...... 95

7 TABLE DES MATIÈRES

2.7.1 Transcription en alphabet phonétique international et en caractères romanisés... 95 2.7.1.1 Transcription des consonnes...... 96 2.7.1.2 Transcription des voyelles ...... 99 2.7.2 Transcriptions en caractères lao...... 101 2.7.2.1 Transcription des consonnes...... 101 2.7.2.2 Transcription des voyelles ...... 104 CONCLUSION À LA DEUXIÈME PARTIE ET PERSPECTIVES ...... 106 3 VERS UN TRAITEMENT INFORMATIQUE DE L'ÉCRITURE THAM ...... 107 3.1 GÉNÉRALITÉS ...... 107 3.1.1 Données techniques ...... 107 3.1.2 Polices existantes...... 108 3.2 RÉALISATION INFORMATIQUE 1 : LA POLICE THAMSTANDARD ...... 112 3.2.1 Détermination des éléments minima de saisie...... 112 3.2.2 Constitution d’un clavier virtuel...... 116 3.2.3 Inconvénients d'ordre ergonomique ...... 121 3.3 PRINCIPES DU STANDARD UNICODE...... 123 3.3.1 Introduction au standard Unicode et à la norme ISO 10646 ...... 123 3.3.2 Considérations générales sur Unicode...... 126 3.3.2.1 Caractères abstraits et glyphes...... 126 3.3.2.2 Caractères combinatoires et diacritiques ...... 128 3.3.2.3 Ordre logique ...... 129 3.3.2.4 Séquences équivalentes...... 131 3.3.3 Cas de codage Unicode pour des écritures de l’Inde et de l’Asie du Sud-Est ...... 131 3.3.3.1 Devanagari (0900-097F)...... 132 3.3.3.2 Tamoul (0B80-0BFF)...... 134 3.3.3.3 Thaï (0E00-0E7F)...... 134 3.3.3.4 Lao (0E80-0EFF)...... 136 3.3.3.5 Birman () (1000-109F)...... 140 3.3.3.6 Khmer (1780-17FF)...... 143 3.3.3.7 Tibétain (0F00-0FFF)...... 150 3.3.3.8 Tai le (Dehong dai) (1950-197F)...... 152 3.3.3.9 Quelques écritures proposées...... 153 3.3.3.10 Bilan sur Unicode ...... 155 3.4 PROPOSITION DE CODAGE DE L’ÉCRITURE THAM...... 159 3.4.1 Pour un codage Unicode de l’écriture tham ...... 159 3.4.2 Zone d’usage privé (E000-F8FF)...... 162 3.4.3 Consonnes (F000-F01F)...... 162 3.4.4 Signe divers (F020)...... 164 3.4.5 Consonnes seules spécifiques à la notation du lao (F021-F026)...... 164 3.4.6 Consonnes composées spécifiques à la notation du lao...... 165 3.4.7 Voyelles indépendantes pali (F027-F02C)...... 167 3.4.8 Idiographèmes vocaliques (F02D-F041)...... 168 3.4.9 Signes de rendu (F042-F043)...... 177 3.4.10 Accents tonals (F044-F047)...... 177 3.4.11 Ponctuation (F048-F04B)...... 178 3.4.12 Chiffres tham (F04C-F055)...... 179 3.4.13 Glyphes syllabiques (F056-F057)...... 180 3.4.14 Zone de code tham (proposition)...... 181 3.5 RENDU DES CONSONNES DE FORME SUBJOINTE ET DES GLYPHES DIVERS ...... 185 3.5.1 Problématique...... 185

8 TABLE DES MATIÈRES

3.5.2 Méthode de rendu des consonnes subjointes p-tham...... 185

3.5.3 Cas particulier : forme subjointe du caractère F004 x LETTRE THAM NGA...... 187 3.5.3.1 Analyse du problème ...... 187 3.5.3.2 Méthode manuelle...... 188 3.5.3.3 Méthode automatique ...... 189 3.5.3.4 Comparaison des deux méthodes et choix effectué...... 192

3.5.4 Cas de la forme subjointe de la consonne F01A r LETTRE THAM RA...... 193 3.5.4.1 Analyse du problème ...... 193 3.5.4.2 Ordre « graphique » ...... 193 3.5.4.3 Ordre « logique » ou « phonétique »...... 194 3.5.4.4 Comparaison des deux méthodes et choix effectué...... 195 3.5.5 Cas particuliers des géminées ...... 197

3.5.6 Méthode de saisie et de rendu du glyphe syllabique ) ...... 198 3.5.7 Méthode de saisie et de rendu des consonnes de forme subjointe l-tham ...... 200 3.5.7.1 Analyse du problème ...... 200 3.5.7.2 Rendu des consonnes subjointes l-tham par deux polices distinctes ...... 202 3.5.7.3 Rendu des consonnes subjointes l-tham par une logique linguistique...... 204 3.5.7.4 Rendu des consonnes subjointes l-tham par deux caractères de rendu...... 216 3.5.7.5 Comparatif des trois modes de rendu proposés et choix effectué...... 219 3.6 RÉALISATION INFORMATIQUE 2 : CONSTITUTION D’UN CLAVIER THAM « UNICODE » ...... 220 PREMIER BILAN SUR UN SYSTÈME THAM « UNICODE »...... 225 CONCLUSION GÉNÉRALE...... 227 APPENDICES...... 231 GLOSSAIRE ...... 245 RÉFÉRENCES BIBLIOGRAPHIQUES ...... 247 ANNEXES ...... 259

9

INTRODUCTION

QU’EST-CE QUE L’ÉCRITURE THAM ?

L'ordonnance royale n°10 de 1949 du Royaume du Laos1 avait pour objet de « fixer l’écriture laotienne d’usage courant » d’après les réflexions d’une commission nommée ad hoc l’année précédente. Parmi les quatre articles qui constitutent cette ordonnance, il est fait mention de deux écritures : « l’alphabet de l’écriture laotienne » (article 1) et « l’écriture THAM » (article 3). Parmi la multitude de systèmes d’écriture employés par les populations diverses vivant sur le territoire laotien, le gouvernement royal avait donc estimé qu’il était nécessaire de prendre en considération ces deux écritures qui transcrivent la langue nationale, et qui détiennent donc un caractère « officiel » qui les distingue de toutes les autres.

Moins connue que l’écriture lao (ou « laotienne »2) proprement dite dont l’usage est courant, le tham est employé presque exclusivement pour noter les textes bouddhiques. Cette écriture, d’origine indienne et vraisemblablement adoptée par les Lao aux environs du début du XVIe siècle d’après un modèle établi par les Môn du Lanna, est employée pour transcrire deux langues, le pali (langue du bouddhisme theravŒda) et le lao3, avec des règles et certains caractères spécifiques pour la notation de chacune de ces langues. L’écriture tham est considérée comme sacrée et son emploi est essentiellement réservé aux bonzes et aux lettrés.

L’exemple ci-dessous donnera un aperçu rapide de l’aspect de l’écriture tham qui note ici une phrase en pali, et de sa différence par rapport à l’écriture lao.

Écriture tham : nemAtsBgvetAçrHetASµASdÏs (4) Transcription en écriture _ _ lao (Phouy)5 : naomtàSSaBaxavaotCaraHaotSàmmASàmBuDDàSSa | Transcription en écriture nam¯tassa bhagavat¯ arahat¯ sammŒsambuddhassa. latine6

1 On trouvera une copie de l'ordonnane royale n°10 de 1949 en annexe (voir également IRC, 1990b, p. 22). 2 Cf. glossaire en fin d’ouvrage pour les conventions terminologiques. 3 Et non exclusivement le pali, comme il a été écrit parfois. 4 « Je salue le Bienheureux, le Vénérable, le Parfaitement éveillé » (trad. F. Bizot et F. Lagirarde (1996)). 5 S. Viravongs a établi un autre système de transcription, qui donne : nomts_s|cvotRrhotsm_masm_PuT_$s_s 6 Cf. infra, 2.7. 11 INTRODUCTION

On qualifie parfois d’« écritures tham » l’ensemble des écritures yuon (Nord de la Thaïlande), khün (région de Kengtung en Birmanie), lü (région des Sipsongpanna de Chine et Nord

Laos) et tham du Laos (PELTIER, 1996, p. 83), en ajoutant l’adjectif ethnonyme correspondant (« tham lao », « tham yuon7 », « tham lü », etc.), car celles-ci sont toutes issues d’un même prototype (infra, 1.1.2) et « parce qu'il [ce type d'écriture] est surtout conservé pour noter les textes religieux » (LAGIRARDE, 1994, p. 63, note 1). Afin de ne pas alourdir la rédaction, nous considérerons ici que le terme « écriture tham » s’applique uniquement au tham du Laos. Quant à l’appellation « tham Isan », celle-ci désigne simplement l’écriture tham employée dans la région dite « Isan »8, qui comprend toute la région du Nord-Est du territoire thaïlandais et qui fut partie intégrante du Laos jusqu’au XIXe siècle9.

Précisons enfin que l’écriture tham est désignée par des termes qui varient selon les auteurs : tham Lan Xang (du nom de l’ancien royaume du Laos), dham (A.R. Peltier, respectant l'étymologie), dam (S. Phinith), tham des pagodes (T. Guignard, 1912), dham brah chao,

« l’écriture du Buddha » comme l’appellent les Khün (PELTIER, 2000b), etc. Nous emploierons quant à nous le terme tham conformément à son appellation et sa prononciation actuelle au Laos10

11 NàgS%Dàm /m`;MrL;9sç`l/ , « les lettres tham », autrement dit « l’alphabet tham ».

UN SYSTÈME D’ÉCRITURE MAL DOTÉ INFORMATIQUEMENT

Parmi ces deux écritures mentionnées par l’ordonnance royale n°10, le lao et le tham, seule la première a fait l'objet de traitements informatiques dignes de ce nom, notamment par la création de nombreuses polices de caractères, de traitements de textes et d'une intégration dans le système mondial de normalisation qu’est Unicode. Quant à la seconde, il n’est pas exagéré de dire qu’elle a été presque totalement délaissée.

Si l’on se base sur « l’indice sigma », système d’évaluation du niveau de l’informatisation des langues (que l’on peut appliquer aux écritures) imaginé par V. Berment (BERMENT, 2004, p. 20),

7 Ou « tham Lanna ». Cf. infra, 1.1.2. 8 Le lecteur pourra comparer les manuels d’enseignement du tham de Phouy (PHOUY, 1943a et 1943b) et l’ouvrage traitant de l’écriture tham Isan de N. Limsamphan (LIMSAMPHAN, 1983). 9 « En 1893 (...) l’anglais Scott et le français Pavie se sont mis d’accord pour que le fleuve [c.a.d. le Mékong] serve de limite aux sphères d’influence de leurs pays respectifs et que le Siam serve d’état-tampon sauvant ce dernier de la colonisation. » (PHINITH, SOUK-ALOUN, THONGCHANH, 1998, p. 75). 10 Terminologie également employée par L. Finot (1917, 1956) et P.B. Lafont (1961). 11 Le terme NàgS% /m`;MrL;9/ (litt. « peau ») tient son origine d'une ancienne tradition au Laos (et aussi au Cambodge, cf. BECCHETTI, 1994, p. 48) d'inscrire des caractères sur de la peau d'animal (IRC,1988, p. 2). 12 INTRODUCTION on trouve une note quasi-nulle de 0,91/20 pour le tham (voir ci-dessous). À titre de comparaison, l’indice sigma du khmer est estimé à 6,14/20, celui du birman à 5,46/20 et celui du lao à 8,7/20 (ibid., p. 20-22).

Tableau d’évaluation du niveau d’informatisation du tham (« indice σ »)

Criticité C Note N Note pondérée Services/ ressources k k (0 à 10) (/20) (CkNk) Traitement du texte Saisie simple 4 2 8 Visualisation / impression 3 7 21 Recherche et replacement 3 0 0 Sélection du texte 3 0 0 Tri lexicographique 2 0 0 Correction orthographique 3 0 0 Correction gramaticale 1 0 0 Correction stylistique 2 0 0 Traitement de l'oral Synthèse vocale 1 0 0 Reconnaissance de la parole 1 0 0 Traduction Traduction automatisée 3 0 0 ROC Reconnaissance optique de 2 0 0 caractères Ressources Dictionnaire bilingue 3 0 0 Dictionnaire d'usage 1 0 0 Total 32 29 Moyenne (/20) 0,91

S’il est vrai que des efforts ont été effectués dans le développement informatique de nombreuses écritures d’Asie, y compris les écritures employées par des communautés ethniques dites minoritaires (tai dam, tai neua, karen, etc.), force est de constater que l’écriture tham n’en pas bénéficié, hormis les quelques polices que nous mentionnerons au chapitre 3.1.2. Pourquoi des dizaines de polices lao (et plusieurs applications) ont-elles été créées à travers le monde, et presque aucune en tham ?

13 INTRODUCTION

PROBLÉMATIQUE ET ORGANISATION

À cette question, trois réponses nous ont souvent été données, mais celles-ci ne nous semblent guère satisfaisantes, voire allant à l’encontre de la réalité : (1) L’écriture tham serait archaïque et très peu répandue, particulièrement aujourd’hui où seule une minorité de bonzes et de lettrés en auraient encore l’usage. En somme, cette écriture serait davantage un témoignage de l’histoire qu’une écriture vivante, (2) L’écriture tham ne présenterait plus l’avantage exclusif de transcrire le pali dans la mesure où l’écriture lao, avec l’ajout de lettres complémentaires (infra, 1.3.2) ou de signes diacritiques12, est aujourd’hui en mesure de noter les textes religieux, y compris ceux rédigés en pali. De ce fait, les publications en tham n’auraient pas d’intérêt, (3) Cette écriture possèderait un système d’écriture trop complexe, pas vraiment fixé (infra, 2), et sa mise en œuvre informatique aurait découragé les bonnes volontés, à plus forte raison que si le tham, en tant qu’écriture religieuse, est inconnu de la majorité des laïcs laotiens, il l’est a fortiori des concepteurs de polices informatiques.

La présente étude a deux objets. Le premier est de démontrer que ces trois hypothèses sont soit fausses, soit insuffisantes pour expliquer le caractère peu doté informatiquement de l’écriture tham. Pour cela, nous dresserons une synthèse des connaisances concernant cette écriture qui pourront invalider ou préciser ces hypothèses. Nous serons alors en mesure d’apporter des nouveaux éléments de réponse. Le deuxième objet est de constituer les premières bases pour remédier à ce caractère peu doté en créant des polices de caractères tham et en jetant les premières bases d’une mise en œuvre de systèmes plus complexes.

Par ce travail, nous souhaitons mettre à la disposition de chacun, religieux, chercheur, étudiant ou simple curieux, un outil de connaissance, de traitement et de diffusion de l'écriture tham, indispensable à l’accès et à la préservation de ce qui constitue l'essentiel du corpus littéraire lao et, par extension, une des clefs de la compréhension du bouddhisme au Laos.

Nous écrirons les mots pali-sanskrits en italique. La translittération romanisée sera conforme à la tradition maintenue dans les publications en langues occidentales depuis l’adoption du système de transcription du sanskrit au 10e Congrès des orientalistes (1894), à l’exception des mots entrés

12 Voir notamment le système adopté par S. Souvanni pour les entrées de son dictionnaire pali-lao (cf. Références bibliographiques). 14 INTRODUCTION dans l’usage courant de la langue française qui seront écrits sans distinction de style (par exemple « Bouddha », « devanagari », etc.).

Exemple : pŒÂibhŒsŒ, « langue pali ».

Les mots lao, siamois, khmer ou appartenant à des langues d’Asie autres que le pali ou le sanskrit, seront notés à l’aide de l’alphabet phonétique internationale (API). La transcription du lao suivra précisément les règles établies par L. Inthamone13. Ces mots seront écrits entre barres obliques.

Exemple : BASAlAv /oç`9r`;9k`9v/, « langue lao ».

Afin de ne pas alourdir la rédaction, nous omettrons le signe >qui marque l’arrêt glottal des voyelles brèves lao. Ainsi, nous noterons /jD/ et non /jD>/ pour transcrire le mot lao Eka. Le cas échéant, les transcriptions en écriture lao des mots écrits en caractères tham (pali ou lao) seront notés entre crochets et conformément au système de transcription établi par Phouy14. Ce système suit l’étymologie (infra, 2.7) et marque d’un point souscrit les phonèmes pali inexistant en langue lao.

Exemples : ’ [kug]

K“ [KànDa_ ]

Nous emploierons les abréviations suivantes : sk. pour « langue sanskrite », p. pour « langue pali », k. pour « langue khmère », t. pour « langue thaï (siamoise) », l. pour « langue lao ».

L’écriture lao sera parfois qualifiée de « laïque » pour éviter la confusion avec l’écriture tham qui, somme toute, est toute autant « lao ». Nous considérerons les mots pali, lao, tai, thaï, yuon, khün et lü comme invariables.

Les caractères tham figurant dans ces pages sont issus de la police ThamStandard (format TrueType) mise au point par nos soins dans le cadre de notre étude et dont les détails relatifs à sa conception seront décrits en 3.2.

13 Cf. INTHAMONE, 1987, p. 10-16. 14 Cf. PHOUY, 1943b, p. 40-43, et infra, 1.7. 15

16

1 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

1.1 GÉNÉRALITÉS

1.1.1 Usage du tham au Laos

Le terme tham est une adaptation en langue lao du mot pali dhamma (sk. dharma), « doctrine » ou « loi » c’est-à-dire, dans l’acception en lao, la doctrine bouddhique15. En effet, les mots lao empruntés au sanskrit ou au pali subissent souvent une double altération, la première par apocope ou aphérèse, et la seconde par dévoisement de certaines occlusives sonores (dont les aspirées) qui sont pour beaucoup inconnues dans le répertoire phonologique du lao. Les Lao ne semblent néanmoins avoir adopté l’appellation tham pour désigner l’écriture bouddhique qu’à partir e du XIX siècle (PHIMMASONE, 1971, p. 11).

Cette extrapolation par métonymie du terme dhamma, passant du sens de doctrine à celui de texte, n’est pas sans rappeler le glissement sémantique dont a fait l’objet le mot pŒÂi lui-même. En effet, pŒÂi signifie (en langue pali) littéralement « ligne », ou « texte ». Par extension, on utilise ce terme pour désigner la langue magadhi, la langue courante employée dans la région de Magadha, au

centre de l’Inde à l’époque du Bouddha Çakyamuni (NARADA, 1952, p. 3) et employé par celui-ci pour son enseignement16. Peu à peu, le terme pŒÂi en est venu à désigner le Canon bouddhique de courant theravŒda (les « textes »), pour finalement adopter une acception plus générale, au fil des ans, à savoir la langue dans laquelle les textes bouddhiques avaient été écrits, devenue une véritable linga franca entre les pays theravŒda (id.)

L'écriture tham est employée spécifiquement pour écrire les textes religieux, en lao ou en pali, cette dernière étant la langue du tipiÊaka (« trois corbeilles »17), c’est-à-dire le corpus des textes bouddhiques du courant theravŒda. Nous verrons au chapitre 1.3.1 que le tham a été adopté par les

15 On retrouve ailleurs le terme tham (ou dham) dans d’autres acceptions, comme chez les Khün de Birmanie, où celui- ci désigne des romans classiques « plus ou moins teintés de bouddhisme » (PELTIER, 2000b, p.193). Ces romans relèvent néanmoins du même champ religieux puisque l’auteur note que « le roman, appelé aussi dham, est censé être l’enseignement du Bouddha. Il ne peut donc être lu que par un moine (bhikkhu) ou un novice (samanera) » (ibid., p. 194, note 3). 16 En réalité « la langue du canon theravada est une version d'un dialecte du centre indo-aryen, pas le maghadi, créé par une homogénéisation des dialectes dont se servait le Bouddha pour enseigner oralement » (PALI TEXT SOCIETY, 2004, p.4) [en anglais] . 17 Les « trois corbeilles » sont les trois grands groupes de textes du canon pali : la vinayapiÊaka (règles monastiques), la suttapiÊaka (l’enseignement du Bouddha) et l’AbhidhammapiÊaka (commentaires). Voir CORNU, 2001, p. 106-107. L’importance que prend le canon pali dans le bouddhisme theravŒda fait que celui-ci est parfois appelé « Bouddhisme pali ». 17 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Bouddhistes laophones en raison de l’insuffisance de l’alphabet lao pour noter correctement la langue pali. Pour des raisons religieuses que nous verrons plus en détail au chapitre 1.4.3, l’écriture tham est considérée par les Laotiens comme une écriture sacrée (LAFONT, 1961, BIZOT, LAGIRARDE, 1996). Ce double emploi de la notation du vernaculaire et du pali se rencontre parfois au sein d'un même texte et il n’est pas rare de rencontrer des manuscrits sur feuilles de latanier18 ou des textes lapidaires passer aisément d’une langue à l’autre. Le plus souvent, il s’agit de textes pali glosés phrase par phrase en lao. On appelle nissaya les textes rédigés dans ce style (PELTIER, 1994, p. 84). Si le fait qu'une même écriture note plusieurs langues dans un pays ne fait évidemment pas cas d'exception19, il est plus rare de rencontrer une telle situation de « double symétrie » que l'on rencontre au Laos20. Traditionnellement, le rapport entre langue et écriture au Laos peut être schématisé ainsi :

Langue Écriture

lao lao

pali tham

Mais à partir de la fin des années 1930 et pendant toute la période d'influence de l'Institut Bouddhique de Vientiane, le schéma devient parfaitement symétrique puisqu’avec l'ajout de consonnes supplémentaires, l'écriture lao pouvait à son tour noter le pali (infra, 1.3.2) :

Langue Écriture

lao lao

pali tham

Pour la notation des textes religieux, quatre configurations sont donc possibles au Laos : (1) En langue lao notée en caractères lao, (2) En langue lao notée en caractères tham, (3) En langue pali notée en caractères tham, (4) En langue pali notée en caractères lao.

18 Voir infra, 1.2.3. 19 C'est le cas notamment des écritures siamoise, khmère, tibétaine, etc. 20 Une nuance toutefois : des divergences apparaissent tant dans l’usage de certains caractères (en raison de la différence du système phonologique entre les deux langues) (infra, 1.3.1) que dans le système d’écriture lui-même (notamment dans l’emploi des consonnes souscrites et suscrites) (infra, 2.4.4). 18 Généralités

Les configurations les plus fréquemment rencontrées sont les cas (2) et (3), car les réformes de l'Institut Bouddhique n'ont été appliquées que pendant la relativement brève existence de l'Institut lui-même et ne lui a pas survécu, et par le fait que le cas (1) s'applique surtout à des œuvres extra-canoniques.

Il faut noter que l'appellation textes religieux ou littérature religieuse reste, du moins au Laos et peut-être dans toute la péninsule indochinoise, à redéfinir puisqu'il est parfois malaisé de distinguer ce que les auteurs appellent « littérature extracanonique » (FINOT, 1917) de la littérature profane. En effet, on trouve parmi d'autres exemples des récits tirés de jŒtaka21 qui alimentent le corpus lao avec abondance, et qui sont parfois si éloignés du texte pali dont ils s'inspirent que le lecteur est bien en peine d'y déceler la part religieuse.

Ainsi du roman classique La fille aux cheveux parfumés, traduit et annoté par A.R. Peltier22, rédigé en caractères tham (bien que l'on trouve des versions similaires dans d’autres écritures telles le yuon, le lü, le khün et le siamois), qui nécessite un décodage des figures narratives si l'on veut le recadrer dans un propos bouddhique, tant sont détournées les références à la doctrine au profit de croyances populaires et de l’attrait du merveilleux. Il en est de même pour la fameuse fable épique Sin Xay, récemment rééditée à Vientiane dans une traduction en français dont la première version, avant celle versifiée de Pangkham, est un roman en prose écrit en caractère tham (BOUNYAVONG, 2003, p. 3) dont l’auteur est demeuré inconnu.

Enfin, selon P. Phimmasone, les romans classiques du Laos « tirent leur origine des Textes bouddhiques [et] furent tout d’abord composés en caractères tham et en prose pour l’enseignement religieux. » (PHIMMASONE, 1956, p. 1012), et de citer les célèbres Champa si ton, Bouddhasa et Ousaparot qu’il présente comme étant les premiers romans écrits en tham : « Ces romans en prose, nés de la littérature bouddhique, précédèrent donc le roman en vers, transcrits en caractères lao. Tandis que le premier avait pour objectif exclusif l’enseignement religieux, le second aurait été d’un emploi courant » (id.).

Ces quelques exemples mettent en évidence la pertinence de la nuance soulevée par P.M. Gagneux : « La tradition veut que, dès les origines, écriture tham et écriture ‘laïque’ aient été parfaitement distinctes, aussi bien que dans leur forme, ce qui est évident, que dans leur utilisation, ce qui l’est beaucoup moins » (GAGNEUX, 1983, p.79).

21 JŒtaka, terme pali-sanskrit qui désigne les récits des vies antérieures du Bouddha Gotama, dans le canon pali. 22 Cf. Références bibliographiques. 19 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

1.1.2 Aperçu de la filiation de l’écriture tham

Les écritures d’origine indienne d’Asie du Sud-Est (thaï, lao, khmère, môn, birmane, tham, yuon, lü, khün, shan, etc.) dérivent toutes indirectement de l’écriture brahmi (sk. brŒhm´). Cette écriture était répandue dans tout l’empire Maurya (Inde, IVe siècle avant notre ère). Le terme brŒhm´ viendrait de la tradition selon laquelle on attribue l’invention de l’écriture au Dieu Brahma, tradition rapportée par les voyageurs chinois et arabes au cours du premier millénaire de notre ère

(PINAULT, 2001, p. 99). Cette écriture est parfois appelée gandhari, du nom de l’ancienne région du Gandhara (région qui s’étendait de part et d’autre de la frontière de l’Afghanistan et du Pakistan actuel) où était utilisée originellement cette écriture.

Les écritures indiennes sont apparues en Asie du Sud-Est dès les premiers siècles de l’ère chrétienne, « majoritairement à partir des formes méridionales dérivées de la brahmi, notamment la grantha du début de la dynastie pallava » (ibid., p.104). Cette parenté avec la brahmi n’est cependant pas toujours évidente si l'on considère les différences graphiques que l’on peut observer entre les écritures lao, khmère, môn, devanagari, etc., différences qui seraient dues « soit au matériel employé, soit au caractère des langues notées » (FÉVRIER, 1984, p. 359-360).

Beaucoup de zones d’ombre demeurent encore aujourd’hui sur les origines et filiations qui relient les différentes écritures d’origine indienne d’Asie du Sud-Est. Il est certes fréquent de distinguer deux traditions d’écriture en Asie du Sud-Est continentale et dérivant de la brahmi23 : la 24 e tradition khmère et la tradition môn (FERLUS, 1988, p.13). L’écriture khmère est attestée dès le VI e e siècle (FÉVRIER, 1984, p. 361) et les premières traces de l’écriture môn datent également du VI -VII siècle (FERLUS, 1988, p.1). Les deux écritures employées par les Lao du Laos (le lao « laïc » et le tham) relèveraient de traditions différentes, à savoir l’écriture môn pour le tham et l’écriture khmère pour le lao « laïc ». En fait, cette division peut être nuancée dans la mesure où il apparaît que l’écriture fakkham, de laquelle dérive l’écriture lao « laïque », présente des similitudes avec le tham (notamment dans les graphies des consonnes th, ¶h, ph, f, —, h, et de certaines formes souscrites) et ne relève donc pas exclusivement de la tradition khmère. Et s’il ne fait aucun doute que l’écriture tham relève de la tradition môn, rien aujourd’hui ne permet de déterminer si cette filiation s’est réalisée directement ou par l’intermédiaire d’un ou plusieurs prototypes dont les traces resteraient à découvrir.

23 Pour un aperçu des différentes graphies notant les consonnes des écritures dérivant de la brahmi, voir infra, 2.6. 24 Appelée parfois peguan ou talaing. 20 Généralités

Les Môn qui vivaient dans les provinces du nord de l’actuelle Thaïlande25 ont adapté leur alphabet pour transcrire correctement le pali (infra, 1.4.1). Cette nouvelle écriture a donné une forme primitive de l’écriture yuon, en usage dans l’ancien royaume du Lanna, raison pour laquelle on appelle également cette écriture « tham Lanna ». Celle-ci a donné naissance aux écritures khün (région de Kengtung, Birmanie), lü (Tai des Sipsongpanna, Chine), tham du Laos et du pays Isan26 et yuon moderne (Nord de la Thaïlande). Il est fort probable qu’au départ ces dénominations regroupaient une écriture unique, et c’est sans doute pour cette raison qu’« il est difficile de faire une distinction entre les graphies [tham, yuon], khün et lü sur des manuscrits datant de plus de cent cinquante ans » (PELTIER, 2000a, p. 35, note 1). Mais l’adaptation pour la notation des langues vernaculaires par des locuteurs de groupes ethniques distincts a peut-être été la cause des sensibles évolutions de ces écritures indépendamment les unes des autres. Les locuteurs des langues lao, thaï27 lü, thaï khün et yuon ont en effet ajouté des caractères à leurs écritures pour noter les sons propres de leur langue qui ne figuraient pas dans le répertoire du pali28. En 1955, l’écriture lü, qui par décision des autorités chinoises du Xishuanbanna (Sipsongpanna) devenait l’écriture des communications officielles, a même subi une réforme qui a imposé les notations des tons sur la ligne d’écriture, pour des raisons notamment de facilité typographique29. Quant à l’écriture tham du Laos, « il apparaît à peu près sûr qu’elle fut introduite e au [Lan Xang] au courant du XV siècle » (LORRILLARD, 1995), même si les premiers témoignages épigraphiques sont légèrement plus tardifs (infra, 1.2.2). Malgré la diversité des graphies, celle-ci a certainement peu évolué depuis un demi-siècle, du moins en ce qui concerne la notation de la langue pali. Et c’est bien là que réside la particularité du tham puisque les Laotiens, qui possédaient vraisemblablement déjà leur écriture30 (l’écriture lao « laïque »), tout en conservant le système d’écriture tham original pour la notation du pali, ont adapté parallèlement un système d’écriture tham spécifique pour noter leur propre langue. La distinction entre la notation du pali et du lao en caractères tham est très visible dans l’emploi des signes vocaliques et des signes consonantiques souscrits et suscrits. Au Laos, nous pouvons alors parler d’une écriture tham à deux systèmes, ce que nous décrirons plus en détail au chapitre 2.

25 Aux XIIIe et XIVe siècles, le royaume du Lanna (« le million de rizières ») était peuplé en majorité de Yuon (ou « Thaï du Nord ») mais aussi de Môn (GALLAND, 1998, p. 33) qui y ont vraisemblablement introduit le bouddhisme de courant theravŒda. 26 Comme mentionné en introduction, nous considérerons, sauf mention contraire, l’écriture tham du Laos et l’écriture tham Isan comme relevant d’une écriture unique. 27 Pour la distinction thaï/ tai, cf. glossaire en fin d’ouvrage. 28 Pour une comparaison entre les répertoires consonantiques pali et lao, cf. infra, 1.3.1. 29 Imitant ainsi les réformes de l’écriture shan de Birmanie (ces informations sur la réforme de l’écriture tai lü nous ont été aimablement communiquées par T.L. Nguyen Tan). 30 L’inscription de la grotte de Nang An, dans la région de Louang Prabang, « le plus ancien témoignage épigraphique e d’une langue thaï-lao relevé à ce jour au Laos » semble datée du XIV siècle (FERLUS, 1995b, p. 114). Voir aussi LORRILLARD, 2004. 21 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Extraits de nissaya

Texte en tham

Texte en yuon

Texte en lü

Texte en khün

(A.R. Peltier, 1996, p. 83-84)

22 Une écriture répandue

1.2 UNE ÉCRITURE RÉPANDUE

1.2.1 Localisation géographique

La carte ci-dessous donne une idée approximative de la localisation des langues thaï. Ces langues sont notées avec des écritures appartenant à des « familles » diverses. Les populations figurant sur la carte qui utilisent des écritures issues du tham Lanna sont : − les Lao (écriture tham), − Les Siamois de la région del’Isan (écriture tham), − Les Yuon (écriture yuon ou tham Lanna), − Les Tai lü (écriture lü non réformée), − Les Tai khün (écriture khün).

Précisons qu’il faut distinguer les populations Shan et Tai khün bien que celles-ci soient confondues sur la carte. Les deux populations emploient des langues tai-kadai, mais leurs écritures n’ont pas la même origine : l’écriture khün est apparentée au tham Lanna tandis que l’écriture shan provient « d’un prototype originaire d’une forme ancienne de l’écriture birmane » (FERLUS, 1988, p. 10).

Localisation des populations de langue thaï dans la péninsule indochinoise

(V. Berment, 2004, p. 75)

23 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Si on prend en compte le fait que les écritures tham, lü, yuon et lü (non réformée) présentent peu de différences entre elles (supra, 1.1.2) à tel point qu’un lecteur familier de l’une d’elle pourra déchiffrer les trois autres, on constatera que les individus capables de lire l’écriture tham sont présents sur une surface géographique assez vaste qui comprend quatre pays : − le Laos : écriture tham, yuon (présence d’une communauté Tai yuon), lü (communauté Tai lü dans la région de Muang Sing), − la Thaïlande : écriture tham (Région de l’Isan), écriture yuon (Nord, ancien royaume du Lanna), − la Chine : écriture lü (province des Sipsongpanna), − la Birmanie : écriture khün (région de Kengtung dans les États Shan), écriture lü (importante minorité lü vers la frontière chinoise).

Il est cependant difficile d’évaluer le nombre de personnes qui peuvent lire ces écritures puisque leur utilisation n’est pas homogène parmi les populations lao, thaï, khün et lü.

Au Laos, qui compte environ 6 millions d’habitants, le nombre d’individus pouvant lire le tham est restreint. Seuls les bonzes (surtout les Vénérables mais aussi des plus jeunes) et certains lettrés sont en mesure de le déchiffrer. Le projet lao-allemand de recensement et de préservation des manuscrits sur feuilles de latanier (infra, 1.2.3) a recensé 2800 temples bouddhiques (l. vàd /u`s/) dans les 18 provinces du pays (KULTURHILFE-PROJEKT ERHALTUNG LAOTISHER HANDSCHRIFFTEN, 2000). Même s’il est aventureux d’avancer des chiffres sans vérification, on peut supposer qu’au moins un moine au sein des temples les plus modestes est en mesure de lire le tham, tandis que dans les temples plus importants (situés dans les grandes villes comme Louang Prabang ou Vientiane) le tham peut être connu par une demi-douzaine de bonzes. À ces religieux faut-il ajouter les bonzes défroqués initiés au tham et certains lettrés.

En Thaïlande, les réformes du roi Rama V (1868-1910) ont imposé l’utilisation de l’écriture siamoise et été la cause de l’abandon progressif des écritures tham (dans l’Isan) et yuon (dans le Nord)31. Malgré tout, l’écriture yuon subsiste aujourd’hui, surtout par sa présence dans les textes bouddhiques ou pour des motifs qui tiennent davantage de la décoration que des nécessités pour la transcription du thaï, aujourd’hui l’apanage de l’écriture siamoise (KAROONBOONYANAN,

KOANANTAKOOL, 2000). En dehors des moines et de quelques chercheurs, peu de personnes parmi les quelques 6 millions d’individus Tai yuon savent lire l’écriture yuon, qui toutefois est enseignée

31 Nous remercions L. Gabaude pour ces informations. 24 Une écriture répandue dans deux établissements universitaires (l’Université de Chiang Mai et l’Université Ratjabhat de Chiang Mai) (id.) et bien sûr dans les pagodes. On peut constater un certain regain d’intérêt dans la région pour la culture traditionnelle yuon, y compris l’écriture, comme en témoignent les nombreux sites internet consacrés à la culture yuon. Quant à la région de l’Isan, celle-ci est peuplée d’environ 18 millions de laophones, qui ont plus ou moins conservé une culture lao. La réforme de Rama V a également érodé cette culture, mais les temples ont conservé des manuscrits rédigés en tham, ce qui fait que des bonzes continuent à le lire et à le transmettre. L’usage du tham en Isan est, tout comme au Laos, limité aux religieux bouddhistes.

En Birmanie, les Tai khün (région de Kengtung) emploient quant à eux l’écriture khün à la fois pour les textes religieux et dans les applications courantes. L’écriture khün a longtemps été la seule écriture en usage dans les états de Kengtung, localisation de l’ancien royaume tai de Tungburi qui avait tissé des liens très étroits avec le Lanna, notamment en adoptant son écriture. À l’époque moderne, et surtout depuis le rattachement en 1959 des États de Kengtung à la Birmanie, l’écriture birmane s’est peu à peu imposée parmi la population par l’intermédiaire de l’enseignement du birman dans les écoles publiques. Cependant, « soucieux de préserver le patrimoine culturel, les moines ont continué à l’enseigner [l’écriture khün] dans les monastères (...). D’ailleurs la graphie khün, dont l’utilisation est admise par la Constitution de l’Union Birmane, figure en bonne place aux côtés du birman sur les pancartes ou banderoles placées aux carrefours de la ville » (PELTIER, 1996a, p. 16-17). La réactualisation en 1996 par A.R. Peltier du manuel Khün Reader, initialement publié dans les années 40 et qui avait permis une première vague d’alphabétisation dans les écoles laïques, ainsi que le vif succès dont le manuel bénéficie, témoignent d’une certaine vigueur actuelle de l’écriture khün.

Enfin, environ 1,2 millions d’individus Tai lü vivent dans la province chinoise des Xishuanbanna (Sipsongpanna, Yunnan). On en compte également 200 000 en Birmanie et 125 000 au Laos (CHAZEE, 1995, p. 48). Si la plupart d’entre eux sont capables de lire l’écriture lü réformée, le nombre de locuteurs capables de lire l’ancienne l’écriture n’est pas établi avec précision. La réforme de 1955 a apporté suffisamment de modifications pour qu’on ne puisse affirmer avec certitude que l’intégralité de la population, notamment les plus jeunes, puisse déchiffrer l’ancienne écriture (qui demeure néanmoins encore utilisée). Cependant, sur un total de plus d’un million et demi d’individus Tai lü répartis sur l’ensemble de la région, même une faible minorité de connaisseurs de l’écriture ancienne viendrait renforcer de manière conséquente les rangs des membres de la « famille tham ».

25 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Les écritures apparentées au tham Lanna sont donc répandues sur une aire géographique assez vaste et regroupant quatre pays (Laos, Thaïlande, Birmanie, Chine). Cependant, sa représentation quantitative est difficile à évaluer et concerne essentiellement des religieux (Thaïlande, Laos), des minorités (Thaïlande, Birmanie) ou des personnes ayant reçu leur éducation avant certaines réformes nationales (Chine). On peut néanmoins constater que ces écritures constituent une part importante des patrimoines culturels respectifs de ces pays. Si seule une fraction minoritaire de ces populations est à même de lire ces écritures, l'importance et la présence de celles-ci dans leurs champs culturels est incontestable.

1.2.2 Données épigraphiques

Nous ne prétendrons évidemment pas traiter intégralement l’épigraphie du tham au Laos. Nous nous bornerons à énumérer les traces épigraphiques qui nous ont paru importantes, en partant des témoignages d’écriture môn, qui est indirectement à l’origine du tham (supra, 1.1.2). Nous conseillerons au lecteur curieux de l’épigraphie laotienne de se reporter à l’ensemble des travaux de

P.M. Gagneux et de M. Lorrillard.

Bien que le témoignage le plus ancien de l'écriture môn se trouve en Thaïlande en deux e e fragments d’inscriptions trouvés près de Nakorn Pathom et datés des VI -VII siècles (FERLUS, 1988, p. 8), des traces de cette écriture apparaissent à une époque ancienne au Laos, dans la région de Vientiane, notamment avec la stèle de Ban Tha Lat (Musée Ho Phra Keo) (LORRILLARD, 2004, p. e 4) qu’E. Guillon date du VIII siècle (GUILLON, 1974). Une autre inscription (Dan Sung, nord de Vientiane) dont l'écriture, proche de la Pallava, n'a pas encore été étudiée, est peut être antérieure à la précédente (LORRILLARD, op. cit.).

La trace la plus ancienne d’une écriture issue du tham Lanna est une inscription de 5 lignes datée de 1376 (Sukhothai) dont la majeure partie de la cinquième ligne est en pali notée en caractère tham Lanna (yuon), le reste étant écrit en écriture de Sukhothai (FERLUS, 1995, p.101). Le deuxième témoignage est une inscription trouvée à Chiang Mai et datée de 1465. Cette inscription en caractères yuon note du pali et pour la première fois du siamois. Notons que le pali a toujours été noté en écriture yuon dans le Nord de la Thaïlande.

Au Laos même, « une inscription sur un Bouddha louang-prabannais daté de 1487, semble

être au Laos le plus ancien témoignage de cette écriture » (LORRILLARD, 1995) mais ce Bouddha

26 Une écriture répandue semble avoir été perdu. On trouve également à cette période des traces de l’alphabet tham dans la région de Vientiane : P.M. Gagneux mentionne une inscription datée de 1491 figurant sur le socle du Bouddha n° 28 du Vat Sisaket, bien que seulement 23 caractères aient pu y être identifiés

(GAGNEUX, 1983, p. 82). Cependant ces témoignages doivent être pris avec précaution puisque les statues, par essence mobiles, ont très probablement été apportées d’ailleurs, notamment du Lanna32. La première inscription tham dont on peut certifier l'origine laotienne avec certitude est l'inscription sur la stèle du Vat Savanthevalok de Louang Prabang. Elle date de 1527 et la langue employée est le lao33. Signalons aussi le socle d'une grande statue du Bouddha (1,20 m de haut) qui, bien que située en Thaïlande (monastère de Wat Phra That Panom, à Nakorn Panom), révèle son origine à l'est du Mékong par deux lettres lao qui suivent les caractères tham (PELTIER, 2000a, p. 34). La fameuse Jinakalamali, chronique de Chiang Mai écrite en 1527, indique que le roi du Lanna aurait envoyé 60 volumes du Canon pali au Laos en 1523, ce qui laisse entendre que le tham était bien répandu au moins à la date de la composition de la chronique. Nous n'ignorerons pas la stèle de Dan Sai « qui fait état d’un accord en 1560 entre les royaumes d’Ayudhya [Ayuthya] et du Lan Xang pour la délimitation des frontières, [et] atteste que le dham [tham] est d’un usage courant au Laos au XVIe siècle » (id.). Signalons enfin l’inscription (1566) du That Louang dont les dix premières lignes sont en pali (id.), l’alphabet épigraphique de 1615 relevé sur le Bouddha n° 149 du Vat Sisaket, et celui de 1707 relevé sur le trône n° 91 du Vat Ho Phra Kèo.

Plus récemment, on trouvait au Vat Vixun, aujourd’hui détruit, une stèle datée de 1836 avec 34 une inscription en caractères tham remarquable par le fait que les tons étaient notés (PHIMMASONE, 1971, p. 16). Cette inscription indiquait la création d'une bibliothèque bouddhique de 2 825 manuscrits à Muong Prê, sur la rive droite du Mékong.

1.2.3 Les manuscrits bouddhiques du Laos

En dehors des inscriptions lapidaires, l’écriture tham est au Laos surtout employée pour inscrire les textes religieux manuscrits. Ceux-ci sont inscrits sur des feuilles de latanier (Corypha Lecomtei), variété de palmier utilisée également pour la fabrication des manuscrits au Cambodge

(BECCHETTI, 1994, p. 57). L’emploi de feuilles de palmier, appelées ôles (ou olles) par francisation

32 Nous remercions M. Lorrillard pour cette information. 33 Id. note précédente. 34 Rappelons que, même en écriture lao, les tons ne furent notés de manière systématique qu’à partir d’une période e récente, c’est-à-dire au cours du XX siècle (GAGNEUX, 1983, p.76, et infra, 2.4.7). 27 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM du terme tamoul ôlei (feuille), comme matériau de base pour les manuscrits provient d’une tradition indienne attestée à partir du 1er siècle A.D.35 où, en plus de la feuille de palmier, été employés l’écorce de bouleau et le liber d’agalloche (PINAULT, 2001, p. 93). Cette tradition se retrouve dans toutes les populations d’obédience theravŒda, qui utilisent différentes variétés de palmier : talipot (Corypha umbraculifera L.) au Sri Lanka, palmier à sucre (Borassus flabellifer L.) en Birmanie, etc. e (BECCHETTI, op. cit). Au Cambodge, les manuscrits sur ôles sont attestés au moins depuis le XIII siècle (ibid., p. 47-48). Au Laos et en Thaïlande, ils sont appelés bailaan (l. qblAn /a`ik`9m/).

Nous ne reviendrons pas sur le processus de fabrication des ôles qui a fait l’objet de descriptions très complètes36. Nous rappellerons simplement que chaque feuille mesure de 50 à 60 cm de longueur pour une largeur de 4 à 6 cm et que, tout comme les manuscrits indiens, les lignes d’écriture sont parallèles à la longueur et sont en général au nombre de quatre par feuille (cinq au

Cambodge). Celles-ci sont inscrites de chaque côté (recto-verso) et regroupées en PUk /oçtÌ9j/ ou « liasse » dont chacune comprend un nombre variable de feuillets, pouvant aller de quelques uns

37 jusqu’à plus d’une centaine . Plusieurs liasses peuvent être réunies en màd /l`s/ « paquet ».

Manuscrit lao (PUk /oçtÌ9j/)

(Source : http://www.pnm.my/motw/laos/manus.htm)

35 Une tradition évoque la première mention des manuscrits sur feuilles de latanier lors du 3e concile bouddhique (dit e Concile de PŒÊaliputra), c’est-à-dire au 3 siècle avant notre ère (IRC, 1988, p. 1). Ce troisième concile n’est cependant pas attesté historiquement avec certitude (CORNU, 2001, p. 140), et nous ne le mentionnons ici qu’à titre indicatif. 36 Notamment BECCHETTI (1994 et http://classes.bnf.fr/dossisup/supports/14art.htm) et FELS (DE), 1993, p. 27-36. 37 Les copieurs de manuscrits ont parfois tendance à partager un « phuk » en deux pour doubler leur gain, car le travail se paie souvent au « phuk » (A.R. Peltier, communication pesonnelle). 28 Une écriture répandue

Feuilles de latanier (qblAn /a`ik`9m/) extraites d’un manuscrit

(Source : http://echo.mpiwg-berlin.mpg.de/content/buddhism/fplf)

Les manuscrits sur feuilles de latanier sont extrêmement répandus dans tout le Laos, comme en témoignent les inventaires qui ont pu être réalisés à différents moments du XXe siècle au sein des bibliothèques des temples du pays38. Le récent projet lao-allemand de recensement et de préservation des manuscrits du Laos39, débuté en 1992, a permis de dénombrer en l’an 2000 pas moins de 30 000 titres répartis sur un total de 260 000 fascicules dans 530 bibliothèques de temples situés dans douze provinces (KULTURHILFE-PROJEKT ERHALTUNG LAOTISHER HANDSCHRIFFTEN, 2000) dont Vientiane, Louang Prabang, Sayabouri, Oudomxay, Louang Namtha, Phongsaly et

Bokèo (BIBLIOTHÈQUE NATIONALE DU LAOS, 1999). Quand on sait que 1700 bibliothèques ont été dénombrées parmi les 2 800 temples du Laos (supra, 1.2.1), on peut imaginer le nombre de manuscrits qu’il reste à recenser40. On peut également mentionner les 6 000 manuscrits de la collection de la Bibliothèque nationale du Laos (Vientiane)41.

Si les bailaan constituent la partie la plus importante du corpus lao écrit en caractères tham, il ne faut cependant pas oublier d’autres supports sur lesquels ont pu être inscrits des textes 42 religieux en tham, notamment les papiers de mûrier (REINHORN, 1980, p. 6), de bananier (LAFONT, 1961, p. 402), voire même le papier ordinaire.

38 Mentionnons LAFONT, 1965, IRC, 1988 et CŒDÈS, 1966. 39 « Preservation of Lao Manuscripts Project ». Ce projet, mené par le professeur H . Hundius, se veut la réplique du « Preservation of Northern Thaï Manuscripts Project » entrepris quelques années plus tôt par le Centre de promotion de l’art et de la culture de l’Université de Chiang Mai, avec le soutien du gouvernement allemand. 40 Un article du journal francophone Le Rénovateur (7/01/2005) indique, pour l’année 2004, 360 000 manuscrits recensés dans 830 pagodes visitées. Faute de temps, nous n’avons pu obtenir la vérification de ces données. Le plus important est de toute façon d’avoir un ordre de grandeur. 41 http://www.alia.au/~wsmith/the_national_library.htm. 42 Les feuilles de mûrier (l. SA /r`;9/) permettent une préservation sur un plus long terme (mille ans au dire de certains...) (BIBLIOTHÈQUE NATIONALE DU LAOS, 1999). 29 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Premières pages du nidana-sutta sur papier

(Source : http://echo.mpiwg-berlin.mpg.de/content/buddhism/fplf)

Les efforts manifestes au Laos, tant de la part des organisations occidentales que de celle des autorités locales, dénotent d’une conscience de l’importance de la préservation des éléments littéraires, comme le montrent les divers travaux, passés ou actuels, de recensement et de restauration des manuscrits sur feuilles de latanier.

1.2.4 L’enseignement du tham au Laos

L’enseignement du tham a deux objets : premièrement l’enseignement aux moines de la lecture des textes religieux, deuxièmement la préservation et la diffusion du dhamma par la copie des manuscrits. Dans les deux cas les initiés au tham feront donc, en règle générale, un usage « passif » de cette écriture, dans la mesure où il s’agira rarement de composer des textes nouveaux. Les lettres tham sont aussi utilisées dans la composition de diagrammes de protection que nous évoquerons au chapitre 1.4.3. Traditionnellement, l’écriture tham n’est guère enseignée que dans les pagodes où « un enseignement spécifiquement religieux est resté l’apanage des moines » (CONDOMINAS, 1998, p. 43). L’apprentissage du tham se fait donc en parallèle avec celui du bouddhisme d’une part, du pali d’autre part. En effet, si nous avons vu que la littérature bouddhique alternait harmonieusement entre pali et lao (supra, 1.1.1), la connaissance du pali est indispensable pour l'étude des textes canoniques. 30 Une écriture répandue

L’écriture tham n’ayant jamais été réellement fixée, les règles d’écritures varient d’une région à l’autre, d’un monastère à l’autre, voire même d’un manuscrit à l’autre. Il a donc fallu attendre 1943 pour que l’Institut Bouddhique en établisse une codification (GAGNEUX, 1983, p.77). C’est ce système d’écriture tham codifié que l’on trouve dans le premier manuel d’enseignement du tham, publié en deux tomes cette même année par le lettré Phouy (son nom honorifique est Phay Louang Maha Sena)43. P.M. Gagneux signale cependant la publication antérieure, en 1936, d’un alphabet tham illustré par Thit Phou, artiste de Louang Prabang (id.)44.

Plus récemment, quelques tentatives ponctuelles ont été effectuées pour développer l’enseignement du tham en dehors des pagodes. C’est ainsi que, dans les années soixante, l’écriture tham était enseignée dans certains lycées de la capitale45. En outre, l’édition après la révolution de 1975 de la série de manuels scolaires BASAlAv màDjzmpIDI ‘ [langue lao, 4e année de cours élémentaire]46 consacre un chapitre au tham, reprenant presque mot pour mot le manuel de Phouy (sans d’ailleurs qu’il en soit fait mention). L’intégration de ce chapitre dans un manuel scolaire reflète la volonté des autorités laotiennes de cette époque de vulgariser le tham dans un cadre d’enseignement laïc. Bien que ces efforts semblent avoir été par la suite abandonnés, il est aujourd’hui question d’une volonté du gouvernement d’une remise en place d’un enseignement du pali et du bouddhisme (et du tham ?) au sein du système d’éducation (BIBLIOTHÈQUE NATIONALE DU

LAOS, 1999). Mais il est encore tôt pour se prononcer quant à la réalité d’un tel projet.

Quant aux publications rédigées en caractères tham, celles-ci semblent avoir été le fait exclusif de l’Institut Bouddhique47 qui a édité un petit nombres d’ouvrages aujourd’hui malheureusement très difficiles à trouver.

Si l’écriture tham du Laos n’a pas fait l’objet d’études particulières en dehors de celles déjà citées48, l’épigraphie du « tham Isan », c’est-à-dire le tham pratiqué dans la partie Nord-Est de la Thaïlande, a été étudiée par N. Limsamphan (vydKiTii, vulko [L’écriture tham Isan], 1983).

43 PHOUY EbÛhYnwv hYnC&AnNàgS%Dàm KYnepànBAµAlAv [Apprendre rapidement à lire les caractères tham dans les textes lao] et EbÛhYnwv hYnC&AnNàgS%Dàm KYnepànBAµAbAlI [Apprendre rapidement à lire les caractères tham dans les textes pali] (Cf. Références bibliographiques). 44 N’ayant pas eu accès à cet ouvrage, nous ne pouvons préciser quel modèle l’auteur avait pu suivre. 45 Notamment l’école Fa Ngum de Vientiane. 46 Par P. Chanthaphaiboun (Cf. Références bibliographiques). 47 L’Institut Boudhique d’Indochine, dont l’administration était basée à Phnom-Penh, a été fondé le 25 janvier 1930 sous l’égide de l’EFEO et la responsabilité en fut confiée à S. Karpelès, Secrétaire générale de l’Institut. En 1931, un centre d’activité fut créé à Vientiane puis à Luang Prabang. Après l’indépendance, les responsables laotiens ont repris en main l’Institut qui fut rebaptisé Institut Bouddhique du Royaume (PHIMMASONE, 1956, p.1107). 48 Phouy (1943), A.R. Peltier (2000b), T. Chanthaphaiboun (non daté). 31 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

D’après les graphies figurant dans cette étude, on voit que le tham Isan ne présente pas de différence avec le système d’écriture décrit par Phouy dans ses manuels mises à part certaines influences yuon49. L’écriture yuon, ou « tham Lanna » semble quant à elle avoir été davantage étudiée. Signalons notamment N. Prongthura, vydKiTii,]kook [L’écriture tham lanna] (1984), et plusieurs éditions occidentales dont W.A. Briggs, First Lessons in the Study of the Laos Language, R. Davies, A Northern Thaï Reader, et H. Hundius, Phonologie und Schrift des Nordthai50. Si l’objectif de ces publications n’est pas toujours l’enseignement, celles-ci n’en constituent pas moins un intérêt pédagogique.

L’ouvrage déjà mentionné d’A.R. Peltier, Khün Reader (1996), semble être le seul manuel consacré à l’apprentissage de l’écriture khün. Enfin, nous mentionnerons le manuel d’apprentissage des langues et écritures lü et yuon par Le Capitaine Salar dont la date de publication est inconnue51, et une étude sur la langue et l’écriture lü de T.L. Nguyen Tan (à paraître).

L’enseignement du tham au Laos reste certes relativement marginal puisque celui-ci est réservé aux religieux. Cependant, cet enseignement est régulier et ne semble pas avoir fléchi au fil des ans malgré les circonstances historiques. Le peu de manuels ou de publications en tham ne doit pas amener à conclure que cette écriture n’a plus vocation à être transmise : d’une part, cela est une conséquence directe de l’absence d’outils de typographie dédiés au tham et ne relève pas obligatoirement d’un déni d’intérêt ; d’autre part il ne faut pas oublier la dimension non académique d’une grande partie de la culture lao (littéraire, religieuse, rituelle) et de sa transmission. Le tham se transmet de maître à élève, à l’intérieur des pagodes. Des études ultérieures pourront permettre d’évaluer si le nombre de moines connaissant le tham aujourd’hui est constant, en diminution ou en augmentation. Pour le moment, nous ne pouvons qu’affirmer que cette écriture continue d’être enseignée52.

49 Notamment dans la notation du /t9/ ou de certaines formes souscrites. Une influence yuon très prononcée est également manifeste dans des manuscrits du Nord Laos, particulièrement ceux de la région de Louang Prabang. 50 Cf. Références bibliographiques pour les ouvrages cités dans ce paragraphe. 51 EbbS&CnC&AnBAS&Alé%eelajvnEpຼCCkepànBAS&AlAvnZ (sic) (Cf. Ref. bibliographiques). 52 Il existe de surcroît quelques lettrés, notamment des anciens bonzes, qui délivrent un enseignement à des chercheurs, asiatiques ou occidentaux. C’est le cas notamment du Conservateur de la collection des manuscrits sur feuilles de latanier de la Bibliothèque nationale de Vientiane. Ces cas étant isolés, nous n’en avons pas tenu compte ici. Par contre, cela indique que les Lao ne voient pas d’inconvénient à ce que le tham soit enseigné en dehors d’un cadre religieux, et à des fins non exclusivement religieuses. 32 Un outil linguistique

1.3 UN OUTIL LINGUISTIQUE

1.3.1 Des carences phonétiques de la langue lao pour la notation du pali

Nous avons évoqué le fait que l'écriture lao laïque, tout comme la plupart des systèmes d'écriture d'Asie du Sud-est, dérive indirectement de l'écriture pallava de l'Inde du sud (supra, 1.1.2). Mais si « l'ensemble des symboles est resté en usage (…), les langues locales n'[ont] retenu que ceux qui notaient leurs sons propres » (FERLUS, 1988, p. 1). Or l'ensemble des « sons propres » de la langue lao diffère de celui de la langue pali sur bien des points. En particulier, les répertoires consonantiques des deux langues ne concordent pas, comme le montrent les tableaux ci-dessous.

NB : le signe _ indique les phonèmes manquants au répertoire consonantique du lao pour noter le pali. Inversement, les caractères surlignés en gris représentent les phonèmes du répertoire lao inexistants en pali.

Répertoire consonantique du pali

sourdes sonores non- aspirées non- aspirées nasales liquides spirantes sifflantes aspirées aspirées gutturales j jç f fç M g

palatales b bç Y Yç I i

cérébrales ¥ ¥ç Ö Öç ® q+û

dentales s sç c cç m k r

labiales o oç a aç l

labio-dentale u

53 (spéciale) (×)

semi- voyelles

(D’après DUROISELLE, 1997, p. 4)

53 La consonne nasale finale ×, n’ayant pas une valeur univoque, est indiquée selon le système de translittération du pali. Cf. détails page suivante 33 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Répertoire consonantique54 du lao

Sourdes sonores non- aspirées non- aspirées nasales liquides spirantes sifflantes aspirées aspirées gutturales j jç _ _ M > g

palatales b _ _ _ I i

cérébrales _ _ _ _ _ q, _

dentales s sç c _ m k r

labiales o oç a _ l v

labio-dentale u e

(spéciale) _

semi- voyelles

En comparant les deux systèmes consonantiques, on constate qu’il manque 14 phonèmes au laotien pour prononcer la totalité des phonèmes consonantiques pali : le lao, tout comme le siamois, ignore plusieurs occlusives sonores (dont certaines, comme la consonne g, qui se sont dévoisées avec le temps en sourdes aspirées), la série des cérébrales55 et les chuintantes. À l'inverse, le lao fait usage de phonèmes consonantiques inexistants en pali (f, w,ü>). Le cas du × est particulier puisqu’il s’agit d’une consonne nasale (appelée en pali niggah´ta56) employée uniquement en finale et dont la prononciation au Laos est similaire au º /M/. Le niggah´ta a donc ici la même valeur phonétique que la consonne g /M/. Mais comme sa prononciation varie selon les régions ou les écoles (infra, 2.3.1) et que cette lettre est réellement considérée comme une consonne à part entière en pali, on peut regarder le niggah´ta comme faisant défaut au répertoire lao.

Les locuteurs bouddhistes de langue lao ont bien dû pallier ces carences consonantiques pour transcrire correctement les textes pali57. C’est pour cette raison qu’ils ont adopté l’écriture tham Lanna, comme l’avaient fait avant eux les Yuon (ou les Môn) du Lanna pour pallier les carences consonantiques de leur langue.

54 Les phonèmes indiqués ici correspondent bien à des valeurs strictement consonantiques, sans tenir compte des tons impliqués par telle ou telle classe de consonne. Par exemple, les consonnes lao K /jç;/ et x /jç/ sont toutes les deux représentées ici par le même phonème kh. Nous verrons plus en profondeur les problèmes liés aux différentes transcriptions infra, 2.7. 55 Appelées parfois rétroflexes ou cacuminales. « Lors de la production de ce type d’occlusion, la pointe de la langue se courbe vers le haut en s’appuyant sur la palais antérieur » (FERLUS, 1995, p. 104). 56 L. nikxaHid /mhjjç`ghs/. 57 En revanche, le lao, riche en voyelles, comporte tous les phonèmes vocaliques du pali (et bien davantage). Cf. infra, 2.4.2. 34 Un outil linguistique

1.3.2 La réforme de l’alphabet lao pour la notation du pali

Pour répandre davantage la langue pali au Laos, certains lettrés ont tenté de réformer l’écriture lao afin que celle-ci puisse transcrire l’ensemble des phonèmes de la langue du Canon. À l’initiative de l’Institut Bouddhique de Vientiane, et avec l’accord du Conseil académique bouddhique (l. BudDabàndidtaSaBA /oçtssç`a`mchss`r`oç`9/) présidé par le prince Phetsarath

58 (ENFIELD, 1999, p. 264), le célèbre lettré S. Viravongs a tenté d’imposer une réforme de l’écriture lao « laïque » en introduisant les consonnes manquantes à l’alphabet pour lire le pali (IRC, 1990, p. 249), auxquelles s'ajoutent deux autres consonnes pour lire le sanskrit. Ces consonnes regroupent sous le nom de tzvlAvqM& /sv`k`9vl`Ái/ (« nouvelles lettres lao ») (IVARSSON, 1999, p. 72) la série des cinq consonnes cérébrales, les occlusives sonores aspirées et les chuintantes. Les graphies de ces consonnes s’inspirent des lettres équivalentes tham ou siamoises selon les cas. Le signe diacritique nikkhahit (p. niggah´ta) a également été ajouté. Cette réforme amena S.Viravongs à publier sa Grammaire pali59 en 1938 et 1939, rédigée en langue lao et en écriture « laïque » agrémentée des nouveaux caractères.

L’idée était donc de rendre accessible les textes bouddhiques de langue pali à un ensemble plus vaste de la population qui en majeure partie ignorait le tham, et aussi d’éviter que les moines lao se rendent de l’autre côté du Mékong pour apprendre le pali (id.). Il ne « restait plus » alors qu’à apprendre la langue du Canon. Par contre, le tham demeurait en usage dans les pagodes.

58 Appelé au Laos Maha Sila Viravongs (« Maha » étant un titre religieux honorifique dont sont attitrés les anciens bonzes vénérables ayant enseigné le pali). 59 S. Viravongs, Grammaire pali, tome 1 & tome 2 (en lao). Cf. Références bibliographiques. 35 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Système consonantique lao d’après la réforme de l'Institut Bouddhique60

k K c % C k k kh g gh º rang ka [ vàk]

j j c ` ch z j * jh ' — rang ca [ vàk]

@ @ Ê 7 Êh V ¶ & ¶h + ö rang Êa [ vàk]

t t t D th T d $ dh n n rang ta [ vàk]

p p p B ph P b | bh m m rang pa [ vàk]

y r l v s h # R y r l v s h  °× rang a [ vàk]

(Tableau inspiré de VIRAVONGS, 1938, p. 18-19)

Les treize caractères surlignés en gris sont les consonnes pali ajoutées par l’Institut Bouddhique. Les autres font partie de l’alphabet lao d’avant la réforme. Les caractères \ et ^ sont employés pour transcrire les lettres sanskrites § et · et ne figurent donc pas au tableau61.

Il est important de préciser que dans la perspective de la lecture d’un texte rédigé en langue pali, certains de ces caractères, s’ils renvoient à des consonnes existantes dans l’alphabet lao, doivent être lus (théoriquement) selon la lecture correcte du pali et non selon la prononciation laotienne actuelle62. C’est pourquoi les treize signes consonantiques ajoutés à l’alphabet lao ne correspondent pas exactement aux quatorze phonèmes consonantiques (niggah´ta compris) manquants au répertoire consonantique du lao (supra, 1.3.1). Ainsi : c - devra se lire /f/ (ce signe existe dans l’alphabet lao d’avant la réforme avec la valeur /jç/), z - devra se lire /Y/ (ce signe existe dans l’alphabet lao d’avant la réforme avec la valeur /r/),

60 Les translittérations de ce tableau correspondent aux valeurs étymologiques de la langue pali, et non aux valeurs phonétiques de la langue lao. Voir page suivante. 61 On retrouve ces consonnes en écriture siamoise sous la forme L § et K ·. 62 Sur l’évolution de la prononciation des phonèmes consonantiques lao, voir infra, 2.7.2. 36 Un outil linguistique

T - devra se lire /c/ (ce signe existe dans l’alphabet lao d’avant la réforme avec la valeur /sç/), P - devra se lire /a/ (ce signe existe dans l’alphabet lao d’avant la réforme avec la valeur /oç/)

(VIRAVONGS, 1938, p. 25-26) y - devra se lire /i/ (ce signe existe dans l’alphabet lao d’avant la réforme avec la valeur /I/)

Inversement, l’Institut Bouddhique a ajouté le signe nikkhahit ° × (de valeur /M/ au Laos) C alors que le phonème /M/ existait déjà et a été maintenu. De plus, dans un texte pali, le signe vocalique a /a/ sera omis et chaque consonne lao non accompagnée d’un signe vocalique devra être lue avec la voyelle inhérente /a/63.

S’ajoutent à cet alphabet des signes diacritiques nécessaires à l’écriture de la langue pali : _ − Le phintu [BinDu] indique que la consonne a perdu sa voyelle inhérente (ibid, p. 3). Exemple : tam_Pp+_+e se lit tamPApG++e tŒmbapaööi

− Le yŒmkŒra [jAmkAr]64 ´ qui surplombe deux consonnes indique que celles-ci sont liées lors de la prononciation et que la première de ces consonnes se lit avec un /`/ très bref (id.).

RP_yapaTO RGPPyapaTGC 65 Exemple : ´ se lit abbayŒpŒha×

Pour des raisons notamment politiques66, cette réforme a rencontré peu de succès, comme en témoigne le peu de traces qu’il en reste aujourd’hui. On peut cependant trouver encore quelques exemplaires d'ouvrages publiés par l'Institut Bouddhique avant sa disparition67.

63 La valeur véritable du a inhérent, en Inde, se rapprocherait plutôt du /?/. Cependant au Laos le a inhérent se prononce bien /`/, de même qu’en Thaïlande et au Cambodge. Pour l’ensemble de ce travail, nous appliquerons donc cette dernière valeur. 64 Ancienne écriture. Nous avons choisi de garder ici l’orthographe de S. Viravongs dans la Grammaire pali. On écrirait aujourd’hui jAmakAn /I`9l`j`9m/. 65 Ces deux derniers exemples sont donnés par S. Viravongs (VIRAVONGS, 1938, p. 6). 66 L’orthographe de la langue lao a fait l’objet de grands débats depuis les années 1930 jusqu'en 1975 (et même encore aujourd’hui) entre les partisans d’une orthographe dite « étymologisante » en usage dans les zones gouvernementales et prétendue plus rigoureuse, et ceux d’une orthographe dite « phonétique » appliquée dans les zones contrôlées par les Pathet lao (INTHAMONE, 1987, p. 158), jugée moins élitiste et plus accessible à la population. Le fait que l’écriture siamoise avait déjà acquis les caractères manquants pour noter les origines sanskrites et pali a joué en la défaveur des partisans de l’orthographe étymologisante : les révolutionnaires lao tenaient avant tout à se démarquer de leur voisin (ENFIELD, 1999, p. 266) et ont adopté depuis 1975 l’écriture dite « phonétique » (i.e. les mots sont lus tels qu’ils sont écrits, sans ambiguïté. Pour donner une idée de comparaison, nous dirons que le français a une orthographe étymologisante et l’italien une orthographe phonétique). Pour les raisons de l’échec de la réforme tentée par S. Viravongs, voir également IVARSSON, 1999. 67 Exemples : Catalogue des Manuscrits du Tripitaka d’après le catalogue de la bibliothèque de Vajiranana, Bangkok [banzEPrAitS~pEdJk] ; Dhammapada [TGmmAbJT] ; Grammaire pali [balegvy_yakr+] de S. Viravongs, etc. 37 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

1.3.3 Un soupçon de tham dans l’écriture lao « laïque »

Si les consonnes supplémentaires proposées par S. Viravongs n’ont pu s’imposer que dans une période relativement brève (supra, 1.1.1), on peut constater une présence sporadique de lettres tham dans certains écrits profanes notés en écriture lao laïque édités avant 197568. En effet, « emportés sans doute par leur savoir ou par un certain ‘snobisme’, les graveurs de jadis ont souvent utilisé des lettres tham dans les inscriptions en écriture ‘laïque’ (...), le contraire, c’est-à-dire des lettres ‘laïques’ dans une inscription tham est beaucoup plus rare » (GAGNEUX, 1983, p.80).

P. M. Gagneux indique la présence des graphies tham x º, X —, D dh, B bh et t t dans certains textes laïcs notés en écriture lao (GAGNEUX, 1983, p.80). À l’inverse, il a pu observer les consonnes lao d et p dans des textes notés en tham (id.).

On relève notamment comme emprunts réguliers à l’écriture tham :

− la forme ancienne de l’interrogatif et particule de négation sous la forme (PHINITH, bO& bO&ÍÍÍÍ 1987, p. 80), 69 − la forme ancienne de Cj (/ni/) notée Ö (ibid., p. 83), 70 − les graphies dites tzvHCWj /sv`gnÌÌi/ employées dans la notation des consonnes géminées pour écrire les mots dérivés du pali (ibid., p. 74). On « suspend » la deuxième lettre de la géminée qui prend alors la forme souscrite de la consonne tham équivalente :

n** au lieu denn /mm/,

m;;;; au lieu de mm /ll/ (Exemple : DàmadA;;;; , au lieu de DZmadA /sç`ll`c`9/, « habituel »), tööö ö au lieu de tt /ss/,

BÛÛÛ au lieu de BB /oog/,

D ÏÏÏÏ au lieu deDD /ssg/ (Exemple : BuDaSàkrAdÏÏÏÏ , au lieu de BuDDaSàkrAd /oçtssç`r`jq`9s/, « ère bouddhique »).

Ces graphies hoi ne semblent cependant pas attestées dans l’épigraphie (GAGNEUX, 1983, p. 82).

68 Dès 1975, P. Vongvichit, pilier de la révolution lao, a pu imposer à l’ensemble du pays sa réforme de l’orthographe mise au point dès 1967. Il s’agissait entre autres de purger la langue lao de toute trace du vocabulaire royal et de l’influence de la langue et de l’écriture siamoises. Cela a dérivé sur la chasse aux étymologies pali-sanskrites très présentes dans l’orthographe siamoise (ENFIELD, 1999). Les « fantaisies » inspirées du tham sont devenues proscrites, bien que l’écriture tham elle-même ne semble pas avoir été l’objet d’une quelconque prohibition. 69 Pour l’évolution de l’écriture de ce phonème, voir infra, 2.1. 70 Du mot lao HWCj /gNÌ9i/, « accrocher » ou « suspendre ». 38 Un outil linguistique

− les graphies notant les consonnes médianes dans l'écriture lao archaïque, qui trouvent leur origine tant dans l'écriture tham que dans l'écriture khmère :

71 ໦.r. Exemple : ສຶກ໦າ .rLjr`9., « études »

72 ໧ .r. Exemple : ວົງ໧າ .unMr`9., « lignée » Y .i. Exemple : BYAjAm .oç`I`9I`9l., « essayer » ໥ .k. Exemple : ສ໥າດ .r`k`Ì9s., « intelligent »

(Exemples tirés de REINHORN, 1980, p. 9)

La présence de lettres tham dans les textes écrits en lao reste un fait peu fréquent et qui se manifeste souvent dans la notation des termes du champ lexical religieux, eux-mêmes très majoritairement dérivés du pali ou du sanskrit. Aujourd’hui, la présence de graphies tham dans les textes notés en écriture lao est considérée comme un archaïsme. Il semble même que beaucoup des graphies que nous avons mentionnées étaient déjà perçues comme tel à la date de la composition de certains manuscrits anciens73. Mais ce phénomène indique que le tham a franchi les enceintes des pagodes et que, si la majorité de la population n'est pas à même de déchiffrer un texte rédigé dans cette écriture, la présence de certaines lettres tham a été avant 1975 un fait relativement familier.

71 Étymologiquement · du sanskrit (mais lu /s/ au Laos). 72 Étymologiquement § du sanskrit (mais lu /s/ au Laos). 73 Ainsi des Chroniques royales de Louang Prabang, étudiées par S. Phinith qui note que les graphies inspirées du tham « n’étaient plus utilisées depuis au moins quarante ans [à la date de la composition du manuscrit, c’est-à-dire vers 1870] - néanmoins quelques rares lettrés en faisaient encore usage - et (...) étaient devenues totalement incompréhensibles par les jeunes qui ignoraient le dam [tham] » (PINITH, 1987, p. 3). 39 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

1.4 LA FONCTION RELIGIEUSE DU THAM

1.4.1 Données sur l’introduction du bouddhisme au Laos

Le tham est fondamentalement lié à la tradition religieuse au Laos. Il peut donc être utile de rappeler certaines données relatives à l’introduction de la religion bouddhique sur le territoire lao.

Officiellement, le bouddhisme lao est de courant theravŒda, qui se veut le représentant du « Bouddhisme des origines » parce que ses adeptes reconnaissent comme conforme à l’enseignement du Bouddha uniquement ce qui figure dans les « trois corbeilles » (p. tipiÊaka) qui constituent le Canon pali (CORNU, 2001, p. 603).

L’introduction du bouddhisme au Laos fut longtemps attribuée à la venue au Lan Xang d’un groupe de religieux venus d’Angkor, sous le règne du roi Fa Ngum (1353-1371), celui-ci étant censé avoir été élevé à la cour du Cambodge. À la suite d’un comportement despotique de Fa Ngum, le souverain d’Angkor aurait envoyé une délégation de religieux bouddhistes menée par le Prah MahŒ Pasaman Chao, accompagnés du Canon pali et de la fameuse statue du Phra Bang, afin de ramener le roi lao dans le droit chemin bouddhique. Ces données reposent sur le contenu de la charte figurant sur la stèle de fondation du Vat Phra Keo (1602). Mais la crédibilité de cette charte a été maintes fois remise en question, notamment par le fait que « la tradition relative à Fa Ngum [est] la seule, dans les documents historiques du Laos, à mentionner d’une façon explicite le Cambodge »

(LORRILLARD, 2001, p. 20). Il apparaît alors que cette tradition « doit beaucoup plus à des procédés littéraires qu’à une mémoire exacte des événements » (ibid., p. 24). Ajoutons que la statue du Phra Bang semble relever, au niveau artistique, de la tradition de Lopburi tout autant que de la tradition khmère (GITEAU, p. 147, note 17). D’une manière générale, il paraît douteux que la doctrine du Bouddha ait été ignorée jusqu’au XIVe siècle dans une région « qui fut d’abord une zone d’influence mône puis khmère, [et qui] était entouré[e] de pays où le bouddhisme était pratiqué et même florissant » (LAFONT, 1987, p. 516).

De nombreux travaux ont démontré que le bouddhisme était connu au Laos bien avant la venue de cette hypothétique délégation venue d’Angkor. Une ambiguïté ressort particulièrement d’une ligne de la charte qui mentionne que « la religion bouddhique n’était pas encore bien connue dans le royaume » (LÉVY, 1952, p. 419). En effet, il a été plus généralement admis que « ce sont les Môn qui ont joué dans l’ouest de la péninsule, pendant les premiers siècles de l’ère chrétienne, le rôle de récepteurs et de propagateurs des éléments essentiels de la civilisation indienne. (...) [et]

40 La fonction religieuse du tham c’est surtout le bouddhisme Theravada d’expression pâlie qui a exercé son influence en pays môn »

(COEDÈS, 2001, p. 73). Malgré des données encore imprécises, l’adoption par les Thaï du nord d’un bouddhisme theravŒda môn a été clairement établie. Ce bouddhisme relève d’une tradition syncrétique dont les pratiques se distinguent de l’orthodoxie mahŒvihŒravŒsin de Ceylan74, si bien qu’on a pu parler de « theravŒda tantrique » (BIZOT, 1993, p. 17). C’est-à-dire que les bouddhistes môn, à cette époque, employaient bien la langue pali, mais que le Canon lui-même n’était pas forcément connu dans son intégralité. Or, l’influence d’un bouddhisme môn au Laos par l’intermédiaire du Lanna est perceptible dès le XIIe siècle par trois facteurs : littéraire, géographique et artistique.

Littéraire, car « le patrimoine littéraire lao, tel qu’il est conservé actuellement, montre une très grande affinité de culture avec celui des textes [tai] du Nord » (LORRILLARD, 2001, p. 27). Cela est vrai tant au niveau du corpus que des parentés scripturales entre les écritures des régions du Lanna et du Nord-Laos (tham).

Artistique, car des statues datées des XIe-XIIe siècle découvertes dans la région de Louang

Prabang dénotent, de par leur style, d’une influence môn indiscutable (LÉVY, 1952, p. 419), et le Lanna est le territoire le plus proche du Laos d’où auraient pu venir des Môn (ou des statues môn).

Géographique, car les reliefs (plis orientés est-ouest) favorisent une communication est- ouest bien plus que sud-nord, situation qui n’est pas rééquilibrée par le Mékong. Le fleuve n’est pas en effet une voie de communication conséquente, surtout en saison sèche. Au contraire, « comme le Mékong unit plus qu'il ne sépare les régions naturelles à cheval sur son cours, relations et échanges qui ne pouvaient se développer entre le nord et le sud, se sont orientés est-ouest et ouest-est » 75 (PHINITH, 1987, p. 24) , notamment entre la région de Louang Prabang et le Lanna. Ce facteur permet notamment d’éclaircir les facteurs littéraires (LAFONT, 1965, p. 430) et artistiques décrits précédemment.

74 Cette dernière commença à s’étendre progressivement en Asie du Sud-Est à partir du XVe siècle, avant d’être imposée comme seule orthodoxie valable par Bangkok dans les zones sous influence siamoise (BIZOT, 1993, p. 22). La réforme de Bangkok, lancée au XIXe siècle, a certainement eu des répercussions, au moins indirectes, au Laos. Une grande partie du pays était en effet soumis au Siam depuis la chute de Vientiane en 1828. Ces répercussions restent à étudier. 75 Le manuscrit étudié par S. Phinith mentionne d’ailleurs que « le Bouddha venait de l'ouest lorsqu'il arriva à hlvn brahpan [Louang Prabang], ce que ne manqueront pas de relever les adversaires de la thèse officiellement admise, qui défendent l'idée d'une pénétration du bouddhisme au lan2 jan2 [Lan Xang] suivant un axe ouest-est » (PHINITH, 1987, p. 11). 41 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

P.B. Lafont explique alors les mentions tardives du Bouddhisme au Laos dans les chroniques d’une part par une volonté des chroniqueurs d’attribuer à Fa Ngum l’introduction de la religion bouddhique, ajoutant ainsi à la grandeur du souverain fondateur ; mais surtout, il souligne le fait que ces chroniques ne traitent que des Thaï lao, groupe ethnolinguistique auquel appartenait Fa Ngum et ses sujets avant la fondation du Lan Xang. Ainsi, « ce n’est plus la négation d’une présence bouddhique au Laos antérieurement à la mission du Prah MahŒ Pasaman Chao que l’on y découvre, mais l’affirmation qu’il ne pénétra vraiment les masses tay lao qu’à partir de cette

époque » (LAFONT, 1987, p. 520).

En résumé, nous pouvons affirmer que : − Le bouddhisme fut introduit en territoire lao bien avant Fa Ngum, au moins à partir du XIIe siècle, − Il le fut certainement à partir du Lanna et par l’intermédiaire des Môn, et cette introduction a touché d’abord la région Nord du Laos, − Ce bouddhisme n’était pas nécessairement conforme à l’orthodoxie cinghalaise et porte des traces extérieures au tipiÊaka voire au theravŒda (mahayaniques, tantriques, hindoues, etc.).

Les écrits bouddhiques lao rédigés en tham ne doivent pas être systématiquement assimilés au Canon pali. Si les éléments du tipiÊaka représentent un pan essentiel de la littérature religieuse, cette dernière ne saurait s’y limiter, et de nombreuses études restent à entreprendre dans l’étude des textes bouddhiques du Laos. Comme nous allons le voir, c’est aussi en raison de ce caractère « extra-cinghalais » que le tham a une fonction qui dépasse le simple outil de transcription du pali.

1.4.2 Bouddhisme et écritures en Asie du Sud-Est (et en Haute Asie)

En intégrant la nuance qui vient d'être exposée ci-dessus, nous admettrons que les pays de la péninsule indochinoise, hormis le , sont à majorité bouddhistes de courant theravŒda76. L’attachement au tipiÊaka et à son exclusive légitimité rend la langue dans laquelle celui-ci a été rédigé, le pali, d’une importance capitale. Composé à Ceylan à la fin du Ier siècle avant notre ère, le tipiÊaka le fut en écriture cinghalaise car le pali n’a pas d’écriture qui lui soit propre

(FILLIOZAT, 1948, p. 299). Par conséquent, les nombreuses traductions dont il a fait l’objet à travers

76 Il existe bien entendu des communautés pratiquant le theravŒda dans des pays d’Asie du Sud-Est non considérés comme theravŒda. C’est le cas du Vietnam, à majorité mahayaniste et confucianiste, où une petite minorité khmère résidant dans le delta du Mékong et le long de la frontière cambodgienne est demeurée d’obédience theravŒda (LAFONT, 1976, p. 353). Mais dans la mesure où ces communautés restent minoritaires, nous ne les considérons pas comme relevant des pays dit theravŒda. 42 La fonction religieuse du tham le monde, et notamment en Asie du Sud-Est, le furent « dans les écritures des pays où il s’est répandu » (LAFONT, 1961, p. 395). Nous passerons brièvement en revue trois traditions d’écriture spécifiquement utilisée pour l’emploi des textes bouddhiques dans la péninsule indochinoise et en Haute Asie : la tradition môn, la tradition khmère, et la tradition tibétaine77.

Il est donc admis que ce furent les Môn qui, les premiers, diffusèrent le bouddhisme theravŒda en Thaïlande du Nord et au Laos (supra, 1.3.2). Parallèlement, « ils donnèrent aux Thaïs le droit en même temps que l’écriture, l’alphabet « yuon » y;r » (BIZOT, 1995, p. 13) ou « tham

Lanna »78. Cet alphabet, prototype ancien du yuon actuel (supra, 1.1.2), avait été conçu par les Môn e 79 eux-mêmes au XIV siècle pour une lecture correcte du pali (FERLUS, 1995, p. 109) . La vocation première des écritures dérivant du tham Lanna (les écritures khün, lü, tham du Laos et du pays Isan) est la même, c’est-à-dire la notation du pali. Si les Tai khün et les Tai lü ont par la suite adapté le tham Lanna pour noter parallèlement des textes laïcs dans leurs propres langues, ces écritures ont une vocation religieuse qu’elles ont conservée jusqu’à aujourd’hui.

L’usage d’une écriture dérivée du tham Lanna ne s’est pas imposé jusqu’au Cambodge où les textes littéraires et religieux en pali, notamment les manuscrits sur feuilles de latanier, sont notés en écriture mèl (k. mUl, « rond »), tandis que l’aksar jr´eº (k. GkSreRC{g, « alphabet incliné ») est utilisé pour noter les textes laïcs80. Cependant, ce qui sépare l’écriture mèl de l’écriture jr´eº est davantage d’ordre stylistique, puisque toute personne pouvant lire les caractères jr´eº pourra déchiffrer, même si cela ne se fera pas toujours sans quelque difficulté, les caractères mèl. Seules certaines graphies et ligatures sont spécifiques au mèl 81. L’écriture mèl est également attestée en

Thaïlande (Centre) sous le nom d’écriture khom (t. -v, /jçN9l/), du terme vieux môn qui signifie « en-dessous » ou « en aval » et qui désignait jadis les populations khmères. Les caractères khom sont identiques aux caractères mèl 82 et leur emploi est le même qu’au Cambodge, c’est-à-dire la

77 Bien que les Tibétains, outre la langue vernaculaire, emploient surtout le sanskrit et non pas le pali dans les textes religieux. 78 Par la suite, les Thaï du Nord ont adapté cet alphabet pour la notation de leur langue (id.). 79 « Au XIVe siècle, un modèle d'écriture môn du nord de la Thaïlande a été restauré dans ses valeurs étymologiques pour la notation correcte du pali dans un but religieux. Il en dérivera le groupe très homogène des écritures dites tham notant des langues thaï : tham des pagodes (Laos), tham lanna, lü et khün. » (FERLUS, 1999, p.10). 80 Les caractères mèl sont également employés pour noter, outre les textes bouddhiques en pali, des formules médico- magiques, les imprimés pour indiquer des titres ou des noms de personnes (KHIN, 2002, p.71). 81 Pour un aperçu des différentes graphies des caractères mèl, voir BIBLIOTHÈQUE ROYALE DU CAMBODGE, 1937. 82 « Il est devenu impossible de départager les manuscrits cambodgiens de souche certaine, des manuscrits copiés au Siam : ils offrent la même présentation matérielle et la même écriture (mèl et kham [khom] sont deux appellations différentes pour des graphies) » (FILLIOZAT, 2000, p. 452). Une nuance toutefois : certaines graphies n’apparaissent que dans le khom de Thaïlande, comme par exemple le  souscrit (communication personnelle de M. Antelme). 43 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

83 notation des textes pali, que ceux-ci soient inscrits sur ôles ou sur des livres dépliants (HERBERT,

MILNER, 1989, p. 28).

Enfin, bien que le Tibet ne fasse pas partie de l'Asie du Sud-Est et que le bouddhisme qui y est pratiqué s'inscrive dans un courant différent (sk. vajrayŒna, « véhicule adamantin »), nous mentionnerons l'écriture tibétaine qui présente des points communs avec les écritures précédemment évoquées. Au VIIe siècle, par décret du roi tibétain Songtsen Gampo, des lettrés partirent en Inde étudier les langues et la grammaire à des fins religieuses. Le système d’écriture tibétain créé suite à ce voyage fut utilisé pour diffuser le bouddhisme (de langue sanskrite) dans le 84 royaume , et a permis « notamment de traduire les textes bouddhiques » (DORJE, TOURNADRE, 2002, p. 29). Tout comme le tham, cette écriture a donc dès le départ une vocation religieuse, et permet à la fois de représenter la langue vernaculaire et la langue du bouddhisme (dans ce cas, le sanskrit). À l’instar des écritures précédentes, le tibétain dérive des écritures indiennes, mais plus particulièrement de la variante gupta utilisée en Inde du Nord (id.). Pour transcrire le sanskrit, les Tibétains ont recours à des signes supplémentaires, dont les lettres rétroflexes qui n’existent pas dans la langue vernaculaire.

On constate que dans un vaste espace géographique, les adeptes du bouddhisme n’ont pas hésité à inventer des écritures (tibétain, tham Lanna) ou à en spécifier les usages (mèl ou khom) pour la notation et la diffusion des écrits bouddhiques, que ceux-ci soient rédigés en langue sanskrite ou pali. Cette corrélation bouddhisme-écriture confère à ces alphabets une dimension toute particulière, plaçant ces « écritures bouddhiques » à un niveau différent d’un simple système de transcription d’une langue, comme peut l’être par exemple l’écriture lao. En effet les bouddhistes qui font usage des écritures yuon, khün, lü, tham ou mèl 85 « ont placé les lettres au centre de manipulations rituelles et symboliques » (BIZOT, 2001, p. 149), c’est-à-dire que les lettres elles- mêmes ont une fonction religieuse et une portée symbolique, voire magique. Cette dimension semble éloignée de l’orthodoxie cinghalaise.

83 Cf. supra, 1.2.3. 84 Pour un aperçu des différentes phases de diffusion du Bouddhisme au Tibet, voir P. Cornu, 2001, p. 613-619. 85 Nous ne nous pencherons pas précisément sur l’écriture du Tibet que nous n’avons évoquée qu’à titre indicatif, afin de montrer l’étendue géographique de l’interraction bouddhisme-écriture. 44 La fonction religieuse du tham

1.4.3 Une écriture sacrée

Nous avons vu que dans la tradition indienne l’invention de l’écriture, en l’occurrence la brŒhm´, était attribuée au Dieu Brahma (supra, 1.1.2). Parce que cette écriture notait « la langue de Brahma, donc le sanskrit, langue des brahmanes cultivés du Nord-Ouest du sous-continent indien »

(PINAULT, 2001, p. 99), celle-ci revêtait un caractère sacré. Dès l’apparition de l’écriture, « l’expression de la loi (…) est désormais confiée à l’écriture, et non plus à la parole » (ibid., p. 115).

Le bouddhisme ne s’est pas éloigné de cette conception, comme le montrent les paroles attribuées au Bouddha lui-même au cours de son parinibbŒna 86: « Chaque lettre [des Écritures] doit être considérée comme égale à une représentation du Buddha, c’est pourquoi l’homme sage doit copier ou faire copier le Tipitaka (…). Ceux qui écrivent une lettre du Tipitaka, comme ceux qui confectionnent une image du Buddha, renaissent dans les paradis avec la beauté corporelle, radieux comme le soleil (…). Ceux qui écrivent eux-mêmes, paient d’autres qu’ils font écrire, et ceux qui les encouragent seront dans le futur les sages disciples du Vainqueur Metteyya » (FILLIOZAT, 2000, p. 454, note 38). On observe donc une dimension sacrée dont bénéficient les lettres87 qui notent les textes du Canon, que l’on retrouve parfois jusque dans la langue. Ainsi, en khmer par exemple, « le spécificateur88 pour les caractères d'écriture est le même que celui qui désigne les statues de 89 Bouddha, les moines ou les personnes de sang royal : Gg< aºg » (BECCHETTI, 1994, p. 53) .

Ce caractère sacré apparaît notamment dans un texte relevé par L. Finot90 et étudié plus récemment par F. Bizot et F. Lagirarde, le saddavimala91. Ce texte bouddhique très particulier appartient à « un même fonds commun ancien, avec, comme au Cambodge et en Thaïlande, des développements originaux propres aux communautés du cru » (BIZOT, LAGIRARDE, 1996, p. 25). Cette édition traduite et commentée du saddavimala nous révèle un aspect « linguistico-religieux » lié aux lettres puisqu'il s'agit dans ce texte d'interpréter de manière ésotérique l’emploi des mots et

86 Le parinibbŒna « désigne habituellement le moment de la cessation des cinq agrégats d’existence lors de la mort du Bouddha ou d’un arhat » (CORNU, 2001, p. 428). 87 Nous verrons que les manuscrits eux-mêmes, support des écritures, bénéficient également de ce caractère sacré. 88 M. Reinhorn définit un spécificateur comme « un hypéronyme [Terme dont le sens inclut le sens d’autres termes, qui sont ses hyponymes (Littré)](...) qui sert à spécifier les hyponymes dans un énoncé » (REINHORN, 1980, p. 64). Par exemple dans la locution eh%CnSCgLàg /gL`9mrN;9Mk`M/ « deux maisons », Làg /k`M/ est le spécificateur de eh%Cn /gL`9m/, « maison » (et SCg /rN;9M/, « chiffre deux »). 89 Précisons que l’assertion de C. Becchetti n’est valable que pour les lettres mèl et lorsque celles-ci sont employées dans un contexte religieux, comme par exemple dans les yantra. Dans un contexte laïc, on utilsera tY /st?/. 90 FINOT, 1917. 91 Terme que les deux auteurs ont traduit en français « La pureté par les mots ». Cf. Références bibliographiques. 45 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM des syllabes, non pas tant du point de vue de leur sens que de celui de leur prononciation, car c'est celle-ci qui leur donne une efficacité rituelle.

Le texte nous révèle que certaines syllabes possèdent ontologiquement une fonction et une efficacité religieuses à la condition que celles-ci soient prononcées d'une manière correcte. « [Le contenu du saddavimala] nous enseigne que la pureté du fidèle passe par la connaissance des syllabes, lesquelles sont régies par les règles du pali » (ibid., p. 36). C'est donc l'usage non seulement du pali, mais du système phonologique du pali, qui est nécessaire pour l'accès au nibbŒna. Pour sortir du sa×sŒra (i.e. le cycle des renaissances), la connaissance de la doctrine et les pratiques méditatives seules restent insuffisantes : « il faut encore connaître l'alphabet et apprendre les sons purs, qui seuls conduisent au [nibbŒna] » (ibid., p. 37). On ne peut à ce propos que relever le cas du nikkhahit (p. niggah´ta), finale nasalisée translittérée ×, dont la prononciation altérée (selon les critères de certaines sectes) a pu être un facteur d’invalidation des ordinations monastiques (BIZOT, 1988, p. 49-51). Plus prosaïquement, nous dirons que le saddavimala induit que la pratique de la langue commune (en l'occurrence le lao, mais aussi le siamois ou toute autre langue dont le système phonologique ne correspondrait pas avec celui du pali) ne permet pas une pratique religieuse correcte ni une progression spirituelle suffisante pour parvenir à l'éveil. L'écriture tham, qui comprend les 33 signes consonantiques nécessaires à la prononciation correcte du pali, mérite donc sa dénomination d’« écriture sacrée » puisqu'elle permet de transcrire l'Enseignement du dhamma92 dans sa langue originale, et donc de le lire et le réciter correctement. L'écriture tham, loin de se limiter à un apport pratique d'ordre phonétique ou phonologique, dispose par conséquent d’une fonction hautement religieuse, spirituelle et de nature efficace.

Les lettres tham trouvent aussi leur efficacité en tant que représentations graphiques dont la disposition sous forme de signes combinatoires peuvent constituer des mantra93 ou des éléments de diagrammes de protection (yantra) (BIZOT, 2001, p.151). On retrouve cette notion d’efficacité magique dans l’utilisation que font les religieux indochinois et tibétains des lettres mèl, yuon, khün, lü et tibétaine94, que celles-ci soient inscrites sur des manuscrits, des plaques de métal ou de bois, des pièces de tissus ou encore tatouées sur la peau.

92 Il nous semble important de souligner que, en Thaïlande et au Laos, ce problème de prononciation n’était pas pris à la légère : au XIXe siècle, des moines lao ou siamois qui se rendaient à Bangkok devaient parfois défroquer et recevoir une nouvelle ordination en cas de prononciation défectueuse de la langue du dhamma. Cet attachement à la prononciation correcte du pali préfigure la réforme Siºhalapakkha (BIZOT, 1995, p. 65). 93 « Formule sacrée qui protège l’esprit du pratiquant » (CORNU, 2001, p. 355). 94 Prenons bien garde ici de ne pas confondre les fonctions de ces agencements graphiques de lettres. Nous mettons simplement en parallèle l’existence de ces diagrammes par les religieux bouddhistes de ces populations. 46 La fonction religieuse du tham

Mantra khmer disposé selon un enchevêtrement de lettres mèl :

na m¯ bu ddhŒ ya (BIZOT, 2001, p. 149)

Mantra tibétain de KŒlacakra (« La roue du temps ») en style läntsa :

(DORJE, TOURNADRE, 2002, p. 57)

GŒthŒ 95 lao en lettres tham sous forme de yantra :

(MONASTÈRE PHONE PHRA NAO, 1965, couverture)

95 GŒthŒ est traduit « cœur de stance » par L. Gabaude. Ceux-ci sont assimilables à des formules magiques (GABAUDE, 1988, p. 246, note 6).

47 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

Cette fonction religieuse des caractères se retrouve jusque dans les manuscrits eux-mêmes. Ceux-ci relèvent également d’une dimension sacrée, au même titre que l’écriture tham, ce qui implique une corrélation étroite entre le manuscrit en tant qu’objet et les caractères. La dévotion dont le manuscrit fait l’objet est perceptible dès la fabrication de celui-ci : une fois l’arbre choisi pour l’extraction des feuilles, une cérémonie d’offrandes aux génies de la forêt est accomplie

(BECCHETTI, 1994, p. 57). Le processus de fabrication achevé, on entreprend pour la recopie du manuscrit une cérémonie appelée au Laos SaLCgNàgS% /r`kN;9MM`Mrt;9/ (IRC, 1988, p. 2) (« célébration des lettres » ou « célébration du support [de l’écrit] »). On manipule le manuscrit avec soin et respect et la lecture se fait selon une certaine codification ; il convient même d’élever le manuscrit au-dessus de la tête avant la lecture (id.). La conservation des manuscrits doit normalement faire l'objet de grands soins : ceux-ci sont entourés d’étoffe, attachés à l’aide d’une cordelette et protégés par des plaques de bois, de métal, d’ivoire ou d’autres matériaux plus solides que les feuilles elles-mêmes. En Thaïlande96 comme au Laos, les ôles sont conservées dans les temples et déposées dans de petites bibliothèques appelées « autels du palais » (l. HOwt /gN;9s`i/, avec

HO /gN;9/ « autel » et wt /s`i/ abrev. tipiÊaka) ou des armoires spécifiques (vYgEkWv /ui`MjDÂv/) (id.).

Enfin, il est connu que dans les pays theravŒda, et le Laos ne fait pas exception, le fait de faire acte de copier, faire recopier ou de faire don au monastère d’un manuscrit est un acte pieux qui procure des mérites. Les mérites acquis sont plus ou moins importants en fonction de l’acte : celui de faire recopier le manuscrit est le plus méritoire suivi, en ordre décroissant, par les actes de copier, d’améliorer, de lire et enfin d’écouter le texte qui y est inscrit (IRC, op. cit.).

Loin donc d’être de simples supports et « avant d'être un recueil de textes explicatifs et doctrinaux, le manuscrit est un objet sacré, corps vivant de l'essence suprême du Dhamma »97

(BECCHETTI, 1994, p. 54).

Il existe enfin une symbolique mystique mettant en relation le manuscrit en tant qu’objet et le corps du méditant : « les différentes parties du manuscrit (caractères, feuillets, cordelettes, 98 étoffes) sont comparées aux organes du fœtus » (BIZOT, 2001, p. 151) . Ce processus d’analogie répond à celui qui lie les lettres et les parties du corps. Le manuscrit et les caractères tham sont donc liés par une relation d’ordre spirituel, l’action de graver un texte bouddhique sur ôle étant considéré comme « donnant corps au dhamma » (id).

96 Cf. FELS, 1993, p. 27-32. 97 Cette assertion, qui concerne les manuscrits bouddhiques du Cambodge, est valable pour le Laos. 98 « Les attaches et les étoles qui entourent le texte sont tenues pour le cordon placentaire et les enveloppes qui protègent l’embryon dans la matrice où il doit renaître » (BECCHETTI, 1994, p. 58). 48 La fonction religieuse du tham

49 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM

CONCLUSION À LA PREMIÈRE PARTIE ET NOUVELLES HYPOTHÈSES

Nous avons montré que l’écriture tham était une écriture répandue tant dans le temps que dans l’espace, et que son emploi était toujours d’actualité, non seulement dans les pratiques religieuses mais aussi, phénomène peut-être plus récent, dans les domaines plus larges de la recherche, de la conservation du patrimoine et des études universitaires. L’explication du caractère peu doté informatiquement de l’écriture tham par l’hypothèse d’un côté désuet ou inusité n’est donc pas pertinente.

L’importance d’ordre linguistique du tham a également été soulignée, cette écriture constituant aujourd’hui le seul outil de transcription rigoureux de la langue pali au Laos, langue des textes bouddhiques, canoniques ou extracanoniques, qui forment un pan fondamental de la culture lao. L’hypothèse de l’inutilité du tham au regard de l’écriture lao n’est donc pas plus valable que la précédente. De plus, les efforts entrepris par des organismes internationaux tels que l’Organisation des Nations Unies ou Unicode pour informatiser les langues et écritures du monde montrent que l’argument de « petite langue » ou de « petite écriture » n’est plus d’actualité99.

Enfin, nous avons insisté sur le caractère sacré de l’écriture tham, lié : − à la lecture et la prononciation correctes du pali, − à la diffusion et la préservation du bouddhisme (avec acquisition de mérites), − à l’efficacité magique des lettres et aux ôles : les lettres et les manuscrits sont des « corps de dhamma » chargés d’une forte symbolique religieuse. Ce caractère sacré induit le rôle prépondérant que joue le tham dans le bouddhisme au Laos.

Deux des hypothèses de départ (écriture peu répandue et faible utilité) ont donc été invalidées. Avant d’aborder le système d’écriture qui nous permettra d’évaluer les difficultés éventuelles pour la création d’outils pour informatiser le tham, nous pouvons déjà déduire des éléments évoqués quelques hypothèses d’ordre socio-religieux pour expliquer, du moins en partie, le retard anormal du traitement informatique de cette écriture.

99 Les états membres signataires de la Déclaration universelle de l’UNESCO sur la diversité culturelle (2001) se sont engagés à notamment « encourager l’« alphabétisation numérique » et accroître la maîtrise des nouvelles technologies de l’information et de la communication, qui doivent être considérées aussi bien comme des disciplines d’enseignement que comme des outils pédagogiques susceptibles de renforcer l’efficacité des services éducatifs », à « lutter contre la fracture numérique (...) en favorisant l’accès des pays en développement aux nouvelles technologies, en les aidant à maîtriser les technologies de l’information et en facilitant à la fois la circulation numérique des produits culturels et scientifiques, disponibles à l’échelle mondiale » (http://unesco.org/culture/pluralism/diversity/html_fr/decl_fr.shtml). 50 Conclusion à la première partie et nouvelles hypothèses

Nous avons mentionné le fait que le bouddhisme au Laos relève originellement d’un « bouddhisme theravŒda tantrique » d’inspiration môn (supra, 1.4.1), et qui aurait été introduit au Laos avec le tham Lanna. Ainsi l’écriture tham semble liée à un certain courant du bouddhisme venu des Môn dont la pratique a été condamnée en faveur du DhammayutikanikŒya (t. Tii,p69bdobdkp), l’orthodoxie basée sur un modèle cinghalais imposée par le Siam au XIXe siècle dans certaines zones de la région100. Ce courant môn a cependant continué à être pratiqué dans les campagnes longtemps après l’imposition de la nouvelle orthodoxie. Les plus grandes réformes imposées par le DhammayutikanikŒya furent développées dans les deux premières décennies du e XX siècle, comme en témoigne le nouvel énoncé d’ordination (BIZOT, 1993, p. 67), et parmi elles l’usage intense de la langue pali.

Il est permis de supposer que S. Viravongs, né en pays Isan101 en 1905, s’il ne se plaçait peut-être pas dans la lignée directe de l’orthodoxie Dhammayut, fut certainement au moins influencé par celle-ci. Il entra enfant à la pagode et commença à étudier le pali, avant de poursuivre ses études à Bangkok. Ce n’est qu’en 1930 qu’il partira à Vientiane pour jouer un rôle prépondérant dans le milieu culturel lao (IRC, 1990). S. Viravongs suivit un enseignement bouddhique à une époque où les idées du DhammayutikanikŒya étaient en pleine activité et il est à envisager que la dimension mystique et symbolique des lettres lui soit demeurée sinon inconnue, du moins non- conforme à l’orthodoxie102. S’il ne montra pas d’hostilité particulière au tham, puisqu’il écrivit la préface du deuxième tome du manuel de Phouy103, c’est visiblement dans un état d’esprit d’attachement au contenu des textes canoniques et à la langue pali que des lettrés aussi influents que S. Viravongs ont dû puiser la volonté de réformer l’alphabet lao (supra, 1.3.2) afin d’offrir au plus grand nombre la possibilité de lire les textes dans la langue du dhamma, l’écriture étant alors reléguée au simple rôle de transcription. Dans ce cas, l’écriture lao « laïque » réformée faisait tout aussi bien l’affaire. Ces lettrés ont certainement dû jouer un rôle, plus ou moins conscient, dans le fait que le tham ait perdu de son influence au cours du XXe siècle, siècle qui fut aussi celui de l’essor de la typographie moderne.

Depuis, les controverses qui ont pu enflammer les débats linguistiques au Laos se sont davantage attachées à l’écriture lao « laïque » (supra, note 66) dans un vent de revendication

100 Thaïlande, Cambodge, et dans une moindre mesure au Laos. Cf. note n° 74. 101 Plus précisément dans la province de Roy Et. 102 Ces hypothèses pourront être soumises à évaluation dans des recherches ultérieures. De même, le rôle de S. Viravongs dans le bouddhisme lao reste à être étudié. 103 Cf. PHOUY, 1943b. La préface en question est d’ailleurs notée en écriture lao agrémentée des nouvelles lettres « pali ». 51 DE LA NÉCESSITÉ D’UN TRAITEMENT INFORMATIQUE DU THAM nationaliste, plutôt qu’à l’écriture tham qui n’était pas au centre des intérêts politiques, d’autant que celle-ci n’était pas vraiment représentative d’une culture de masse.

Ces deux facteurs (proscription d’une mystique des lettres et débat national focalisé sur l’écriture lao « laïque ») ont contribué à faire tomber le tham en désuétude. Ces débats étant de surcroît l’apanage des villes, les Vénérables des campagnes n’ont pas pris part aux discussions pour intégrer l’écriture sacrée au cœur de la polémique.

Un troisième facteur, lié aux deux premiers, a certainement contribué au délaissement du traitement typographique du tham : le fait que les Lao qui étaient et sont encore en mesure d’accéder à la technologie, a fortiori informatique, sont avant tout les citadins ayant reçu une éducation « moderne » et par conséquent peu portés sur la dimension mystique du tham. Les bouddhistes des campagnes, si certains ont pu préserver les pratiques bouddhiques plus anciennes à caractère mystique ou tantrisant, vivent dans des zones où la technologie (et parfois même l’électricité) fait défaut. En raison aussi de cette carence purement technique, l’usage que ces religieux ont du tham est resté traditionnel.

Mais la question reste ouverte : si le tham est une écriture sacrée et si sa diffusion procure des mérites, cela sera-t-il encore vrai avec une police informatique tham ? La « mystique des lettres » sera-t-elle encore d’actualité sur un écran ou sur un livre imprimé ? Il est permis d’en douter et d’affirmer que « dans les monastères et les villages, le livre ne remplacera pas le manuscrit gravé sur feuille de latanier sans perturber des croyances anciennes » (BIZOT, 1992, p. 21).

De plus, l’idée de l’informatisation d’une écriture véhicule trop souvent la notion unique de transcription d’une langue, en mettant de côté d’autres aspects liés à l’écriture104 (et particulièrement aux écritures bouddhiques d’Asie du Sud-Est), tels la disposition des mots, les combinaisons savantes, le choix des graphies, qui donne à l’écriture « toute une dimension paralittéraire à la conscience du lecteur » (ibid., p. 18). La peur de sacrifier cette dimension paralittéraire a peut-être été l’une des raisons des réticences des Laotiens à employer les moyens de typographie modernes pour écrire le tham. On sait par exemple que la plupart des pays bouddhistes de courant theravŒda ont édité un canon pali dans leur écriture (notamment le Sri Lanka, la Thaïlande, le Cambodge105, etc.), mais le Laos n’a publié (en caractères tham manuscrits) qu’une

104 Sur les différentes fonctions de l’écriture, voir notamment CALVET, 1996. 105 Le Canon est même intégralement traduit en khmer. Il faut préciser néanmoins que ce projet fut le fait de l’Institut Bouddhique à Phnom-Penh, et donc vraisemblablement émanant d’une initiative française. 52 Conclusion à la première partie et nouvelles hypothèses infime partie des textes canoniques106 disponibles au Laos, sachant que le canon lao était déjà très incomplet. Alors que d’aucuns y voient un signe de la « paresse » légendaire laotienne, ne peut-on pas plutôt aller chercher l’explication du côté de ce caractère efficace du tham, auquel les Lao, vivant dans une région moins urbanisée que leurs voisins, parfois même dans des zones difficilement accessibles, et ainsi préservés des influences modernistes, seraient attachés ? Le fait que presque aucun Laotien, à notre connaissance, n’ait entreprit la réalisation d’une police tham, s’éclaire peut-être en grande partie par ce phénomène socio-religieux.

Enfin une autre explication, d’ordre plus technique, du caractère peu doté de l’écriture tham vient à l’esprit : le tham, qui permet de transcrire tout aussi bien le pali que le lao, est d’une nature complexe. Les souscriptions et suscriptions des signes vocaliques et consonantiques suivent des règles parfois ardues et pas toujours rigoureuses (infra, 2). Un traitement informatique impose non seulement une maîtrise de ces règles mais aussi des contraintes techniques bien plus nombreuses et plus contraignantes que pour l’écriture lao « laïque ». La défection informatique dont souffre l’écriture tham pourrait-elle alors être aussi imputable à des difficultés d’ordre graphotaxique rencontrées par les concepteurs de polices informatiques, ou inversement à des difficultés d’ordre technique rencontrées par les lettrés qui maîtrisent le tham ?

Il nous reste donc maintenant à explorer la troisième hypothèse de départ : l’évaluation des difficultés relatives à un traitement informatique de l’écriture tham. Pour cela, une étude rigoureuse du système (ou, nous le verrons, des systèmes) d’écriture s’impose.

106 Ces publications, éditées par l’Institut Bouddhique, tiennent en trois volumes de chacun 300 pages environ. 53

54

2 SYSTÈMES D'ÉCRITURE

Le tham est une écriture qui permet de transcrire deux langues, le pali et le lao (supra, 1.4.2). Nous verrons que les règles et propriétés du système d'écriture tham varient amplement selon que celui-ci note l’une ou l’autre107. Cela n’a rien de surprenant au regard des différences entre ces deux langues que tout oppose : le pali est une langue indienne, flexionnelle, atonale et polysyllabique, tandis que le lao est une langue tai-kadai, isolante, polytonale et à tendance monosyllabique. Il arrive d’ailleurs qu’un même mot s’écrive différemment en tham en fonction de la langue transcrite (par exemple pour un mot pali passé dans la langue lao).

Exemple : tƒA, taöhŒ, « désir » (notation du pali),

tà*HA, [tànHA] /s`mg`;9/, « désir » (notation du lao).

Pour cette raison, nous avons choisi de traiter séparément les propriétés du système d'écriture tham notant le pali d'une part, notant le lao d'autre part. Nous emploierons la terminologie suivante : − P-tham : système d’écriture tham pour la notation de la langue pali, − L-tham : système d’écriture tham pour la notation de la langue lao.

Nous précisons que cette terminologie est employée ici pour des besoins de rédaction et est inconnue au Laos.

2.1 PRÉCISIONS SUR LES GRAPHIES ADOPTÉES

Même s’il est vrai que, globalement, « l’écriture dham [tham] n’a pas varié depuis un demi- 108 millénaire » (PELTIER, 2000, p.35), celle-ci n’a été vraiment codifiée qu’en 1943 par l’Institut Bouddhique (supra, 1.2.4) et le lettré Phouy a fixé cet alphabet tham codifié dans ses deux manuels109. Auparavant, l’ensemble des caractères avait suivi une évolution depuis la première inscription connue110 jusqu’au XIXe siècle, en fonction de l’époque111 et de la situation géographique. De même, en synchronie, les signes de même valeur pouvaient varier d'un scribe à

107 Sans parler des différences de la lecture même des caractères (infra, 2.7). 108 Nous avons mentionné la publication antérieure (1936) de l’alphabet tham illustré par Thit Phou (supra, 1.2.4.). On ne peut cependant pas parler de cette publication comme d’une codification de l’alphabet tham. 109 PHOUY, 1943a et 1943b. 110 Voir supra, 1.2.2. 111 Pour un aperçu de l'évolution des caractères tham selon l'épigraphie de la région de Vientiane, voir GAGNEUX, 1983, tableaux 1-9. 55 SYSTÈMES D’ÉCRITURE l'autre, ce phénomène étant particulièrement visible dans la notation des consonnes souscrites qu'on trouve parfois sous jusqu'à quatre formes différentes selon les textes112. Or, tout travail typographique implique une codification à respecter. Pour cette raison, il a été nécessaire d'effectuer un choix quant à la graphie des caractères tham utilisés dans ces pages et figurant dans nos différentes polices de caractères. Nous avons opté pour les graphies codifiées par l’Institut Bouddhique et employées par Phouy dans ses manuels, celles-ci étant inspirées de l’alphabet tham épigraphique de 1819 (GAGNEUX, 1983, p.77). Pour cette raison, certains caractères peuvent présenter des graphies différentes de celles que l'on trouve dans d'autres ouvrages.

Pour ne citer que quelques exemples, la consonne Êh est notée Q, alors qu'on la trouve sous

113 la forme æ dans certaines publications européennes , de même que le signe Ÿreprésentera une forme souscrite de S r+ alors que ce même signe pourra représenter la forme souscrite de C bg chez d'autres auteurs114.

Il est remarquable qu’à un niveau plus global, des contraintes typographiques ont parfois entraîné des changements, plus ou moins profonds, dans une écriture. Pour prendre un exemple européen, l’Allemagne a abandonné l’obligation d’utiliser son « scharfes s », sous le prétexte que sa graphie ß n’était pas toujours facile d’emploi en typographie115. Depuis la réforme de l’orthographe allemande en 2002, ce signe est aujourd’hui souvent remplacé par le double s, qui a une valeur phonétique identique mais qui constituait jadis une faute dans les mots normalement orthographiés avec le ß. Au Laos, l’apparition de la machine à écrire dans les années quarante a également provoqué des changements. Par exemple la syllabe Cj /N9i/ était notée dans les manuscrits sous la forme Ö peut-être empruntée au tham. Mais cette graphie a été remplacée bien avant la deuxième guerre 116 mondiale par = pour être à son tour renouvelée en Cj par commodité typographique (PHINITH, 1987, p. 84). Mais l’écriture tham n’ayant été que très sommairement traitée en typographie117, les formes graphiques de ses caractères n’ont jamais fait l’objet de modification officielle hormis la « codification » de l’Institut Bouddhique.

112 L. Gabaude dénombre pas moins de trois cents variantes entre deux copies d'un manuscrit de moins de dix pages (GABAUDE, 1979, p. 93). 113 Notamment BIZOT, LAGIRARDE (1996), et HUNDIUS (1990). Il s'agit d'une graphie que l'on trouve dans certains textes épigraphiques (voir LIMSAMPHAN, p. 179 et GAGNEUX, 1983, tableau récapitulatif n° 2) et aussi en écriture yuon. 114 Cf. GABAUDE, 1979. 115 On pourra trouver cet argument singulier au regard de l’évolution des technologies informatiques ces dernières années. Mais ceci est un autre débat. 116 En réalité on trouve encore la graphie = (ou Y) pour noter la syllabe /Ni/ même si celle-ci est parfois jugée archaïsante. Cette graphie reste en revanche employée pour noter la voyelle /i`/. Ex : KYn /jçi`;m/ « écrire ». 117 Voir infra, 3.1.2. 56 Liste des caractères

2.2 LISTE DES CARACTÈRES

Afin d’obtenir d’abord une vue d’ensemble, nous avons choisi de ne présenter en premier lieu qu'une simple liste des caractères tham, tandis que nous déclinerons les propriétés du système d’écriture aux paragraphes 2.3 à 2.4, assorties de précisions et de commentaires.

Dans le tableau ci-après, le signe marque la place de la lettre à laquelle soit un signe vocalique (parfois constitué de plusieurs graphèmes), soit une consonne de forme souscrite ou suscrite, soit un accent tonal, soit un signe diacritique de l’alphabet phonétique international (API), est associé. Les signes vocaliques interconsonatiques mentionnés ne sont valables que pour le l- tham.

Les valeurs phonétiques des consonnes correspondent à leur prononciation théorique118 en position initiale d’une syllabe (sauf pour le nikkhahit qui est toujours en finale). Les valeurs distinctes que peuvent prendre ces mêmes consonnes en position finale (notamment en l-tham) seront mentionnées au chapitre 2.4.3. Ces valeurs sont basées sur l’API. Le lecteur pourra remarquer que certaines lettres ont des valeurs différentes selon que celles-ci sont employées en p- tham ou en l-tham. Ces distinctions seront décrites au chapitre 2.7.

Le signe ; indique que la syllabe incluant cette consonne à l’initiale doit être lue avec un ton descendant-montant ou modulé (INTHAMONE, 1987, p. 77) : c’est le cas des consonnes lao dites « hautes ».

Enfin, les formes subjointes119 des consonnes (souscrites et suscrites) sont données à titre indicatif, et nous n’avons pas toujours précisé si celles-ci étaient employées en p-tham ou en l-tham, cela étant expliqué aux chapitres 2.3.5 et 2.4.3. Dans ces chapitres seront également mentionnées diverses variantes graphiques de ces formes subjointes.

118 La prononciation du pali au Laos est souvent corrompue (malgré les recommandations du saddavimala...). 119 Cf. note 138 et glossaire. 57 SYSTÈMES D’ÉCRITURE

Consonnes tham et leurs valeurs phonétiques

Signe tham Valeur Signe tham Valeur nominal subjoint p-tham l-tham nominal subjoint p-tham l-tham

k Ë j j P Ü oç oç;

à _ j F _ _ e;

K © jç jç; b ® a oç

g ( f jç f _ _ e

G @ fç _ B ÿ aç _

x ’ M M m ; l l

~ _ M y = i I

c | b b Y _ _ i

C / R _ rÔ ≤ ≤

j O Y r l ¤ k k

J ] Yç _ € _ k

X } I _ v + u u

q ö ¥ _ S Ÿ r r;

Q ` ¥ç _ H Ç g g;

z Ù Ö c L _ ™ û _ Z [ Öç _ ç _ _ >

N Â ® _ h _ _ g

t Ê s s $ _ _ M;

T ë sç sç; £ _ _ m;

d Î c sç W _ _ I;

D Ï cç _ M _ _ l;

n * m m R _ _ k;

w Û _ a V _ _ u;

p Û o o.a ° _ M _

58 Liste des caractères

Voyelles tham et leurs valeurs phonétiques

Signe tham Valeur Signe tham Valeur à l'initiale interconson. p-tham l-tham à l'initiale interconson. p-tham l-tham

Á _ ` _ oa è _ n

ä _ `9 _ oo _ n9

î _ h _ eAa ç _ N

ï _ h9 _ O _ N

û _ t _ ° ç _ N9

ü _ t9 _ O _ N9 é _ d.d9 _ eiei _ ?

ô _ n.n9 _ eIeI _ ?9

` _ eà=a = _ i` a à _ ` eà= = _ i`9

A A `9 `9 è+a + _ v`

Ä Ä `9 `9 èva v _ v`

i i h h è+ + _ v`9

I I h9 h9 èv v _ v`9

ù ù _ L eùOeùO _ L`

% % _ L9 eùçeùç _ L`

u u t t e%Oe%O _ L`9

U U t9 t9 e%çe%ç _ L`9

eaeà _ d < _ _ `i

eeà d.d9 d9 > _ _ `i.`d

Ea _ _ D eèA _ _ `n

E E _ D9 ^ _ _ `n

ê _ _ D.D9 \ _ _ `l

eA n.n9 _ Ö _ _ n9i

59 SYSTÈMES D’ÉCRITURE

Ligatures Chiffres

signe tham valeur 00

p-tham l-tham 11

楥ç _ 2 2

µll ll 3 3

œaa ooç 4 4

)m`9 m`9 5 5

À_ qL9 6 6

È_ kD 7 7

88

99

Marques tonales Ponctuation

& §

²

# -

{ _

60 Propriétés de l’écriture tham pour la notation du pali (p-tham)

2.3 PROPRIÉTÉS DE L’ÉCRITURE THAM POUR LA NOTATION DU PALI (P-THAM)

2.3.1 Consonnes p-tham et classement consonantique

L’alphabet consonantique p-tham comprend trente-trois caractères pour noter les trente-deux consonnes de la langue pali et la consonne subsidiaire120 nasale pali appelée en lao nikkhahit [nikxaHid] (p. niggah´ta)121. Notons que certains caractères de l’écriture pallava, qui au départ n’était utilisée que pour écrire le sanskrit, notent des phonèmes inexistants en pali. C’est le cas notamment des phonèmes · et § qui par conséquent n’ont pas de représentation dans l’alphabet tham122. En dehors du nikkhahit qui est toujours en position finale, les trente-deux consonnes sont lues avec la voyelle inhérente a123, à l’instar de toutes les écritures du Nord de l’Inde124. De cette manière, « chaque signe graphique simple représente une syllabe : soit un segment vocalique (voyelle seule ou diphtongue), soit une ou plusieurs consonne(s) suivie(s) de la voyelle /a/ (brève) »

(PINAULT, 2002, p. 106). On parle alors parfois d’alphasyllabaire. Ainsi :

g se lit ga,

B se lit bha,

BgvA se lit bhagavŒ, etc.

Le classement consonantique du p-tham est identique à celui des langues indiennes, tout comme pour certaines langues d’Asie du sud-est : « En premier lieu, les vingt-cinq occlusives, classées par « 5 groupes de 5 », chaque groupe [p. vagga, sk. varga] correspondant à un point d’articulation, depuis l’arrière jusqu’à l’avant du canal pharyngo-buccal : gutturales, palatales, cérébrales, dentales, labiales ; l’énumération de chaque groupe suit la distinction de mode d’articulation, selon les corrélations phonologiques : sourde simple (...), sourde aspirée (...), sonore simple (...), sonore aspirée (...), terminée par la nasale, à laquelle s’opposent négativement les quatre phonèmes précédents. La liste est donc : ka, kha, ga, gha, ºa ; ca, cha, ja, jha, —a ; Êa, Êha, ¶a,

120 Nous avons emprunté ce terme à C. Duroiselle (DUROISELLE, 1997, p. 4). 121 Ce caractère est parfois appelé au Laos CanuSAra /`mtr`9q`/ du caractère équivalent sanskrit anusvŒra. 122 La lettre tham Š § est cependant mentionnée dans BIZOT, LAGIRARDE, 1996, p. 272. Cette lettre est employée en yuon avec la même graphie. 123 Cf. note 63. 124 « [Les écritures du sud de l’Inde] semblent avoir abandonné le principe de notation implicite de la voyelle /a/ après chaque consonne. Cette innovation, qui évitait les ligatures et tendait vers une écriture strictement alphabétique, n’a pas eu de continuation dans les développements de la brahmi méridionale. » (PINAULT, 2001, p.103). 61 SYSTÈMES D’ÉCRITURE

¶ha, öa ; ta, tha, da, dha, na ; pa, pha, ba, bha, ma. » (PINAULT, 2001, p. 108). Les consonnes de rang a (p. sesŒvagga) sont les autres consonnes : cinq semi-voyelles, une spirante, une sifflante et le niggah´ta. Ce classement remonterait aussi loin que la période védique, où des traités de phonétique et de phonologie avaient été établis pour fixer la prononciation correcte des Veda (id.).

Rang k k K g G x Gutturales [kavàk] [ ] k kh g gh º ekIdqnxO

Rang c c C j J X Palatales [ ] [ ] cavàk c ch j jh — ekIdEt&BidAn

Rang Ê q Q z Z N Cérébrales [ _ ] [ ] tavàk Ê Êh ¶ ¶h ö ekIdEt&pUmeH%Ck

Rang t t T d D n Dentales [ ] [ ] tavàk t th d dh n ekIdEt&EKWv

Rang p p P b B m Labiales [ ] [ ] pavàk p ph b bh m ekIdEt&hImSzb

y r l v S H L ° Rang a [Cavàk] y r l v s h  ×

Palatale Cérébrale Dentale Dentale et Dentale Gutturale Cérébrale Nasale labiale

(D’après PHETMYANGSWA, THAMMAPHINIT, p. °)

Un caractère particulier : le nikkhahit :

En écriture tham, le graphème °représente le caractère nikkhahit. Ce graphème est suscrit à la consonne initiale de la syllabe, comme le montrent les exemples suivants :

”[kàg] ka×

• [kig] ki×

– [kug] ku×

Le nikkhahit est une finale nasalisée translittérée ×. La façon de prononcer ce signe dépend, dans la péninsule indochinoise, des pays et surtout de la secte (p. nikŒya), allant même jusqu’à devenir « un repère autant qu’une semence de division entre les sectes » (BIZOT, 1988, p. 22)

62 Propriétés de l’écriture tham pour la notation du pali (p-tham) puisqu’une prononciation non conforme à l’un ou l’autre nikŒya peut invalider une ordination (supra, 1.4.3). Sans rentrer dans les détails de ce sujet complexe125, nous relèverons simplement

126 qu’au Laos le nikkhahit (×) a la même valeur phonétique que la consonne xº, à savoir /M/ . La différence est d’ordre étymologique.

Exemples : (1) evy=AkrN°[evyjAkaranàg] veyyŒkarana×

(2) jymg’l°[sajamàgxalàg] jayamaºgala×

Signalons qu’en écriture du pali la consonne º (caractère tham x ou sa forme subjointe ’) ne se trouve jamais en position finale d’un mot contrairement au nikkhahit qui occupe souvent cette position. Il en est autrement en sanskrit noté en devanagari où la consonne º est utilisée en finale 127 (MASONS, 1984, p. 16) sous la forme ;(™ (donc différent de l’anusvara ).

2.3.2 Voyelles indépendantes p-tham

Comme dans les écritures indiennes où les consonnes sont lues avec une voyelle inhérente, il est fait usage en écriture p-tham de caractères spéciaux pour noter les voyelles à l’initiale d’un mot.

On appelle voyelles indépendantes [SalaCCkSYgcZeBAatzveCg] /r`k`>N9jri`;9Mb`loçN>sv`>d9M/ ces caractères car ceux-ci ne sont pas considérés comme associés à une consonne selon la structure syllabique pali (i.e. CV, CCV, CVC ou CCVC). Ces voyelles indépendantes sont au nombre de huit.

Voyelles indépendantes p-tham

Áäîïûüeô

a Œ i ´ u è e o

Exemple : ÁH°[CaHàg] aha× ; äyS;A[CAyàSmA] ŒjasmŒ ; îti[Citi] iti ;

_ ïeSA[CIoS] ´so ; ûpj]AeyA[CupàssAoy] upajjhŒyo ; üru[CUru] èru ;

_ év°[eCvàg] eva× ; ôG[oCxa] ogha.

125 Sur ce sujet, voir BIZOT, 1988. 126 Cette prononciation du nikkhahit lao est celle du niggah´ta de Ceylan. En Birmanie, cette consonne nasale finale est prononcée /m/ (DUROISELLE, 1997, p. 6) ou /n/ (MASONS, 1984, p. 2). 127 Cf. note 121. 63 SYSTÈMES D’ÉCRITURE

Nous croyons nécessaire de bien souligner que, dans la plupart des écritures dérivées de la brahmi, a fortiori les écritures transcrivant le pali comme le p-tham, les voyelles indépendantes sont considérées comme étant des lettres distinctes des autres voyelles. Il ne s’agit donc en aucun cas de variantes graphiques des voyelles dépendantes128 mais bien de lettres différentes. Les voyelles indépendantes apparaissent également dans les écritures devanagari, gurmukhi, gujarati, oriya, tamoule, telugu, kannada, malayalam, singhalaise, birmane, khmère, etc., mais pas en écriture lao.

2.3.3 Voyelles dépendantes p-tham

L’alphabet p-tham comporte huit voyelles dépendantes129. Ces huit voyelles, contrairement aux voyelles indépendantes mentionnées ci-dessus, sont toujours associées à une consonne initiale (ou à un groupe consonantique). L’une de ces voyelles, le a bref, est inhérent aux consonnes et n’est donc pas représentée par un graphème. Il est important de comprendre que, comme dans les alphasyllabaires indiens ou en dérivant, « les voyelles à proprement parler n’existent pas (à l’exception des initiales) ; il n’y a que des signes-voyelles venant s’appuyer sur un support consonantique » (BIZOT, 2001, p.149).

Voyelles dépendantes p-tham

µ A130 i I u U e eA

a Œ i ´ u è e o

On remarque une hétérogénéité dans la disposition de ces signes-voyelles par rapport à la consonne associée : à la suite de la consonne (a, Œ), antéposée (ã), souscrite (u, è), suscrite (i, ´), voire de part et d’autre (circonscrite) de la consonne (¯).

La diphtongue ay est notée avec la consonne finale y y et le signe-voyelle e de cette manière : ey(PHOUY, 1943b, p. 41).

Remarques :

128 Cf. chapitre suivant. 129 Les voyelles « dépendantes » d’une consonne sont appelées matra en Inde, mais ce terme semble inusité pour le tham. 130 Voir également la forme allongée Ä de cette voyelle infra, 2.4.6.

64 Propriétés de l’écriture tham pour la notation du pali (p-tham)

− En pali, les voyelles brèves a, i et u (dépendantes et indépendantes) deviennent longues

lorsqu’elles sont suivies d’un niggah´ta (DUROISELLE, 1997, p.4),

− Les phonèmes vocaliquese et o sont grammaticalement considérés comme des diphtongues (id.) : Œ + ´ = e Œ + è = o − Ces deux voyelles e et o sont toujours longues, excepté lorsque celles-ci se trouvent devant 131 deux consonnes (PHETMYANGSWA, p. 3, et NARADA, 1952, p. 11) .

Exemples : étëettha se lit /dssç`/ et non /d9ssç`/

2.3.4 Système de conjonction des consonnes p-tham

Nous appelerons conjonction la juxtaposition, dans un même mot, d’une consonne dévoyellée et d’une consonne avec voyelle (inhérente ou non). La représentation en est la suivante :

CdCv avec Cd : consonne dévoyellée,

Cv : consonne avec voyelle.

Par exemple le mot r—A raksŒ comporte la conjonction /jr/, avec Cd = kk et Cv = úA sŒ. On parlera particulièrement de groupe consonantique quand la conjonction apparaît en début de mot. La première consonne du groupe est alors dévoyellée. Ainsi la séquence Ôbbra comporte la conjonction /a≤/ (groupe consonantique) avec Cd = bb et Cv = Ô ra.

Nous n’évoquerons que les règles traitant de l’aspect graphique de la conjonction des consonnes et laisserons de côté les conséquences d’ordre phonétique132. De plus, les règles exposées dans ce paragraphe sont valables exclusivement pour le p-tham.

L’écriture p-tham est soumise à une règle de conjonction inspirée du système des écritures indiennes, où les consonnes peuvent changer de forme, de place, ou les deux selon les cas. Le système p-tham est cependant plus simple que celui, par exemple, de la devanagari (écriture

131 Raison pour laquelle la longueur vocalique de ces phonèmes n’est pas apparente dans les translittérations du pali en Occident. On note ainsi e et o quelle que soit la longueur qui se manifeste en lecture. En Asie cependant, il est d’usage de noter la distinction entre une lecture courte (e, o) et longue (ã, ¯) de ces voyelles. 132 Ces règles sont détaillées dans PHOUY, 1943b, p. 35-36. 65 SYSTÈMES D’ÉCRITURE dérivant également de la brahmi et utilisée essentiellement, à l’origine, pour noter le sanskrit). En écriture devanagari, plusieurs manifestations graphiques indiquent qu’une consonne a perdu sa voyelle inhérente (i.e. que cette consonne est l’initiale d’un groupe consonantique ou la finale d’une syllabe). On dit alors que cette consonne est dévoyellée ou morte133.

Sans rentrer dans les détails d’une explication du système d’écriture de la devanagari, nous nous contenterons d’indiquer que le dévoyellement est marqué soit par une modification de la graphie de la consonne dévoyellée, soit par une ligature, soit par la présence du signe ( nommé virama (sk. virŒma)134, signe de quiescence ou de dévoyellement, souscrit à la consonne à laquelle il est associé135.

Exemples : k → consonne k de forme nominale (se lit ka, avec sa voyelle inhérente),

k( → virama souscrit à la forme nominale de la consonne k, indiquant que celle-ci

est dévoyellée (se lit k),

Ky → le signe K est la « demi-forme » de la consonne k k indiquant que celle-ci

est dévoyellée ; y est la consonne y. Cette séquence se lit kya,

´ → ligature pour noter la forme conjointe d’un k dévoyellé associé à un k qui a gardé sa voyelle inhérente. Cette ligature se lit donc kka.

Ces formes graphiques permettent notamment au lecteur de distinguer dans un texte les consonnes à voyelle inhérente de celles qui l’ont perdue (consonnes dévoyellées). Dans beaucoup d'écritures dérivées de la brahmi (tamoule, telugu, malayalam, tibétaine, birmane, ahom, khamti, tagalog, etc.), il existe un système pour noter le dévoyellement. Ce n'est cependant pas le cas de l’écriture lao136 dont les consonnes n’ont pas de voyelle inhérente137.

Pour indiquer le dévoyellement des consonnes, les Khmers, dans leur écriture, utilisent un système de souscription qui, on le verra, présente de fortes similitudes avec le système p-tham. Les

133 Nous préfèrerons le premier terme au second, afin d'éviter la confusion avec les syllabes mortes (i.e. qui n’admettent pas de marques tonales) du laotien. 134 On rencontre aussi l’appellation halanta, terme plus courant en et employé aussi notamment en tibétain. 135 Cf. BERGAIGNE, 1984, p. 239-241. 136 Le caractère ç appelé thanthakhat en lao [DànDaxAd] (et en thaï), bien que parfois appelé à tort virama, a une autre fonction, qui est celle de condamner la prononciation de la lettre (parfois de la syllabe entière) à laquelle il est associé. Sa fonction originelle est d’indiquer les étymologies pali-sanskrites. Aujourd’hui les Laotiens l’utilisent également pour indiquer les étymologies des langues occidentales. 137 Cf. note 151. 66 Propriétés de l’écriture tham pour la notation du pali (p-tham) consonnes khmères ont aussi une voyelle inhérente (dite « enterrée ») qui peut être /@9/ (consonnes ère e de 1 série) ou /N9/ (consonnes de 2 série). De cette manière, l'écriture d'une consonne dénuée de signe-voyelle sera donc lue comme une syllabe.

Exemple : ksa (k /j@9/ + s /r/ + a /`9/) sera lu /j@9r`9/ et non /jr`9/, car la consonne k porte la voyelle inhérente /@9/.

Pour écrire le mot /jr`9/, on recourt au système de souscription des consonnes : une consonne souscrite (k. eCIg, /b?fl9M/) annule la prononciation de la voyelle inhérente de la consonne qui la précède (DANIEL, 1992, p. 46). C’est en somme l’inverse du système devanagari où la consonne dévoyellée est transformée : en écriture khmère, c’est la consonne suivant la consonne dévoyellée qui voit sa graphie modifiée. Ainsi on écrira :

kSa (k /j/ + S /r@9/ + a /`9/) /jr`9/ avec S, forme souscrite de s /r@9/.

En écriture khmère, les consonnes souscrites ont une manifestation graphique différente de leur forme nominale138 : − soit la consonne souscrite garde une graphie similaire, de taille légèrement inférieure, et prend place juste en-dessous de la consonne précédente,

Exemple : ¬ forme souscrite de B /oN9/,

− soit la consonne souscrite adopte une graphie différente de sa forme nominale, et prend place en dessous de la consonne précédente, avec parfois une hampe ascendante remontant à gauche ou à droite de la consonne précédente,

Exemple : æ forme souscrite de z /sç@9/

Exemple : Ä forme souscrite de Q /bgN9/

Exemple : R forme souscrite de r /rN9/

L'écriture khmère comporte également un signe diacritique appelé viriam, équivalent du virama indien, mais dont il n'a plus été fait usage dès l'époque angkorienne. Le viriam est cependant à nouveau utilisé depuis quelques années pour translittérer des textes de l'époque pré- angkorienne139.

138 Pour des nécessités de rédaction, nous emploierons le terme de forme subjointe pour désigner toute graphie d’une consonne qui diffère de sa forme nominale (cf. glossaire). 139 Nous remercions M. Antelme pour ces informations. 67 SYSTÈMES D’ÉCRITURE

Le système d’écriture p-tham recourt à un système de conjonction des consonnes similaire à celui de l'écriture khmère que nous avons sommairement décrit140. Il n’existe pas non plus en tham de caractère correspondant au virama141. En présence d’une consonne de forme subjointe, le lecteur déduit que la consonne précédente a perdu sa voyelle inhérente. Quant à la voyelle suivant en lecture142 une consonne de forme subjointe, elle est associée à cette dernière et non à la consonne de forme nominale placée sur la ligne d’écriture, comme le montrent les exemples qui vont suivre. Les formes subjointes de l’ensemble des consonnes p-tham seront exposées au chapitre suivant.

Exemples de consonnes de forme subjointe à graphie similaire :

(1) çtÊ atta {Ê ta forme subjointe de t, souscrite à t t},

(2) ebAnÎi bondi { Î d forme subjointe de, souscrite à  n}.

Dans l’exemple (2) ci-dessus, on voit que la voyelle i /h/ est associée à la forme subjointe ( Î da) et non à la finale (n). Il en est de même pour tous les exemples suivants. (3)zimÿ ¶imbha {ÿ bha forme subjointe de, souscrite à  m}.

Exemples de consonnes de forme subjointe à graphie modifiée :

(4)ûpj]A upajjhŒ {] jh forme subjointe deJ, souscrite à j j},

(5) ÔbM brahma {Ô ra forme subjointe der, souscrite à b /a/ ; ; ma forme

subjointe dem, souscrite à H h}.

L’exemple (5) ci-dessus illustre le seul cas de consonne de forme subjointe antéposée : la forme subjointe Ô de  r. Cette forme antéposée est appelée au Laos º²ù½ /n9oç≤`/ (PHOUY,

1943a, p. 10). Le phonème /≤/ doit donc être lu après le phonème /a/. Un mot comme ÔbM brahma incite donc à nuancer l’affirmation que l’écriture tham s’exécute de gauche à droite.

140 Avec cette particularité que la forme subjointe peut être parfois suscrite. 141 On notera cependant la présence, en écritures yuon et khün, très proches du tham, du signe N indiquant la perte du /`/ inhérent de la consonne à laquelle il est associé (et parfois la suppression en lecture de la syllabe entière). 142 Nous précisons « en lecture » puisque, graphiquement, certaines voyelles sont antéposées à la consonne à laquelle elles sont associées (supra, 2.3.3). 68 Propriétés de l’écriture tham pour la notation du pali (p-tham)

Une attention toute particulière doit être consacrée au placement de certaines graphies vocaliques lorsque celles-ci tendent vers une forme circonscrite :

(6) Áeg@Aaggho {e@A gho : voyelle ¯ associée à la forme subjointe deGgh,

elle-même souscrite à g g}.

Dans l’exemple (6) ci-dessus, la voyelle digramme eA o est, suivant la règle précédemment énoncée, associée à la consonne de forme subjointe @ gh et non à la consonne g g qui est la finale de la syllabe précédente. L’idiographème A, composante de la représentation graphique du phonème vocalique /n9/, doit être placé impérativement après la consonne de forme subjointe (et non entre celle-ci et la consonne de forme nominale sans voyelle inhérente) : on doit donc bien écrire Áeg@A et non Áge@A ni ÁegA@, soulignant ainsi que la voyelle ¯ doit être lue associée à @ gh et non à g g.

2.3.5 Un cas particulier : la forme subjointe de la consonne xººº

Contrairement aux autres consonnes p-tham, c’est lorsque le x º a perdu sa voyelle inhérente (i.e. en finale d’une syllabe) que ce caractère prend sa forme subjointe. De plus (et peut- être pour souligner sa particularité), la forme subjointe ’du x º est suscrite et non souscrite à la consonne à laquelle elle est associée143.

La consonne de forme nominale qui se trouve en-dessous du ’(º suscrit) est donc l’initiale de la syllabe suivante, et non la finale de la précédente comme dans les autres cas144 (voir exemples au chapitre précédent). Exemples :

(1) Sk’Ase lit saºkŒ et non sakºŒ,

(2) iºga s’écrit îg’ et non îx(,

(3) saºgh¯ s’écrit SeG’A et non Sex@A, etc.

143 La forme suscrite àde la consonne kk ne se rencontrant qu’en l-tham (infra, 2.4.3), nous ne la prendrons pas en considération dans ce chapitre. 144 La consonne birmane i º possède également une forme subjointe suscrite, appelée en birman kinzi et notée f. Ainsi le groupe consonantique ºka se note uf. 69 SYSTÈMES D’ÉCRITURE

Néanmoins, lorsque la syllabe comporte les voyelles i i et I ´, la finale º garde sa forme nominale x sur la ligne d’écriture (PHOUY, 1943b, p. 5). Ainsi note-t-on -xiË -xI(-xI@, etc. Dans ces derniers cas la consonne suivante est souscrite, comme il est d’usage avec les autres consonnes. On lira donc -ºki, -ºg´, -ºgh´, etc. La raison de cette exception est d’ordre esthétique145 puisque la 146 forme suscrite ’occuperait la même place que les signes vocaliques i i et I . Par exemple aÊÊhaºgikŒ est plus harmonieux sous la forme çæxi(kA que Áægi ’kA.

2.3.6 Consonnes de forme subjointe (et leurs graphies)

Rang k © [kavàk] Ë ( @ ’ Rang c / [cavàk] | O ] } Rang Ê [tavàk] ö ` Ù [ Â Rang t ë [tavàk] Ê Î Ï * Rang p [pavàk] Û Ü ® ÿ ;

Rang a 147 = Ô ¤ + ú Ç ™ [Cavàk]

Ces graphies sont fidèles à celles figurant dans le manuel de Phouy consacré à la notation du pali, exceptée la forme souscrite de ch que l’auteur note curieusement ú, autrement dit comme un S s souscrit, tandis que la forme subjointe de cette dernière consonne n’est pas mentionnée (elle l’est par contre dans le tome consacrée à la notation du lao, sous la forme Ÿ). Dans la plupart des

145 Nous ne considérons pas ici les idiographèmes ùet ,% ceux-ci étant uniquement employés en l-tham (infra, 2.4.2). 146 Nous verrons qu’en l-tham, la présence du x souscrit ~ résout ce problème esthétique. Mais d’après le manuel de Phouy, le signe ~ ne se rencontre pas en notation du pali.

147 Dans le manuel de Phouy, la consonne L n’a pas de forme souscrite. La forme ™ apparaît néanmoins dans certains textes. Il est également intéressant de remarquer que dans son manuel A. Daniel précise que la consonne équivalente khmère L n'a pas non plus de forme souscrite (DANIEL, 1992, p. 46). Cependant, on trouve la forme souscrite de L dans des textes écrits en khom de Thaïlande (cf. note 82). 70 Propriétés de l’écriture tham pour la notation du pali (p-tham) autres ouvrages, nous avons bien la forme /. On trouvera dans les textes de nombreuses variantes graphiques des formes subjointes, dont nous parlerons au chapitre 3.5.7.4.

2.3.7 Consonnes à l'initiale et en finale

À l’exception du nikkhahit, toutes les consonnes p-tham peuvent être placées à l’initiale d’une syllabe. Par contre, seules certaines consonnes peuvent se trouver en position finale d’une syllabe (i.e. dévoyellée). Dans le tableau ci-dessous, les consonnes surlignées en gris ne sont jamais en position finale.

1 2 3 4 5

Rang k k Kg Gx [kavàk]

Rang c c Cj JX [cavàk] Rang Ê q Qz ZN [tavàk_ ]

Rang t t Td Dn [tavàk]

Rang p p Pb Bm [pavàk]

Rang a yrlvSHL ° [Cavàk]

(D’après PHOUY, 1943b, p 30)

On remarquera que les consonnes interdites en finale (colonnes 2 et 4) sont les aspirées, à l’exception de la consonne H h qui peut être en position finale. De plus, seules les consonnes d’un même rang peuvent être conjointes, à l’exception des consonnes du « rang a » qui peuvent se conjuguer avec n’importe quelle consonne. Cependant dans ce rang seules les consonnes yy, l

148 l et S s ont la possibilité de se conjuguer avec elles-mêmes .

148 Les règles détaillées de conjonction des consonnes sont décrites dans PHOUY, 1943b, p. 30-36. 71 SYSTÈMES D’ÉCRITURE

2.3.8 Géminées

L’écriture tham fait grand usage des géminées, et certaines d’entre elles sont représentées par des ligatures harmonieuses :

− La géminée µ mm correspond à la consonne  m redoublée, dont la première a perdu sa voyelle inhérente.

Exemple : kµ kamma

− La géminée œ bb correspond à la consonne  b redoublée, dont la première a perdu sa voyelle inhérente.

Exemple : dœ dubbŒ

− La géminée  ss correspond à la consonne  s redoublée dont la première a perdu sa voyelle inhérente. La graphie  aurait été rajoutée tardivement dans l’alphabet tham (FERLUS, 1988, p. 9).

Exemple : misk missaka

− La géminée ÊÊh correspond à la consonne rétroflexe  Ê qui a perdu sa voyelle inhérente,

149 suivie de la consonne rétroflexe  Êh .

Exemple : ûæn uÊÊhŒna

2.3.9 Glyphe syllabique p-tham

En écriture tham, il existe des cas particuliers où un signe unique représente une consonne associée à une voyelle autre que le a inhérent. Nous emploierons le terme de glyphe syllabique pour les désigner.

149 On pourrait relever que æ ÊÊh n’est pas réellement une géminée puisque la distinction entre les phonèmes /¥/ et /¥ç/ est pertinente en pali. Cela dit, ces phonèmes nous ont paru suffisamment proches l’un de l’autre de par leur lieu d’articulation pour que nous ayons jugé bon de considérer leur association comme géminée. 72 Propriétés de l’écriture tham pour la notation du pali (p-tham)

En p-tham, nous n’avons relevé qu’un seul cas de glyphe syllabique. Il s’agit du signe )qui correspond à la consonne n n associée à l’idiographème vocalique A. Ainsi, la syllabe nŒ s’écrit- elle toujours )et non nA.

Exemple : Á)gtA anŒgatŒ

Il est très important de préciser que cette ligature intervient en présence de l’idiographème A et non obligatoirement de la voyelle A Œ. En effet, la graphie particulière  apparaît également lorsque la consonne n n est associée à la voyelle pali o représentée par les deux idiographèmes e et A circonscrits à la consonne. La syllabe no s’écrit donc sous la forme e) et non enA. De même, lorsqu’une consonne subjointe est souscrite à la consonne n (celle-ci étant donc dévoyellée), et que cette subjointe est associée à la voyelle A Œ oueAo, on fait aussi intervenir le glyphe syllabique .

Exemple : eBAe)ÊA bhonto Dans l’exemple ci-dessus, la ligature  intervient, alors que structurellement la voyelle o est associée à la consonne t et non à n. Il s’agit donc là d’un procédé qui suit des règles strictement graphiques.

Nous verrons que d’autres glyphes syllabiques apparaissent en l-tham (infra, 2.4.5).

73 SYSTÈMES D’ÉCRITURE

2.4 PROPRIÉTÉS DE L'ÉCRITURE THAM POUR LA NOTATION DU LAO (L-THAM)

S’il est vrai que « l’écriture lao officielle [laïque] n’a gardé du système indien que les lettres qui transcrivent les sons de la langue [lao] » (REINHORN, 1980, p. 17) et que par conséquent le système consonantique lao présente des carences pour la notation du pali (supra, 1.3.1), un système de transcription du pali reste à l’inverse insuffisant pour transcrire la langue lao. En effet, celle-ci inclut dans son répertoire de nombreux phonèmes, tant consonantiques que vocaliques, inexistants en pali. Ce fait ne doit pas nous étonner si l’on considère que le pali et le lao présentent des différences importantes, tant au niveau de leurs répertoires phonologiques que des règles grammaticales auxquelles elles sont soumises.

Le tham étant également employé pour noter la langue lao, cette écriture dispose donc de caractères et règles spécifiques pour la notation de cette langue150. Nous avons appelé l-tham l’ensemble des caractères et des règles d’écriture tham pour noter le lao.

Au cours des siècles, la valeur phonétique de certains signes consonantiques s’est modifiée avec le temps, et ce alors que l’écriture tham était déjà connue au Laos (supra, 1.1.2). Par conséquent, certains signes consonantiques ont une valeur différente selon que les caractères tham notent le lao ou le pali, ce qui rend les transcriptions dépendantes de la langue notée. Par exemple la syllabe gAse lira /f`9/ en pali mais /jç`9/ en lao. Lorsque nous parlerons des valeurs phonétiques des phonèmes du l-tham, il s’agira des valeurs phonétiques actuelles au Laos. Le lecteur ne devra donc pas s’étonner si des mots ou syllabes transcrits précédemment selon les valeurs étymologiques pali pourront être transcrits différemment selon les valeurs lao. Nous expliquerons plus en détail ces divergences au chapitre 2.7.

De plus, tandis que la transcription en lao suivra celle de Phouy, la transcription en phonétique internationale sera conforme à la prononciation réelle en langue lao.

2.4.1 Consonnes l-tham

Contrairement aux consonnes p-tham, les consonnes l-tham ne sont pas lues avec une voyelle inhérente151. Tout comme en écriture lao, chaque signe consonantique est donc lu comme un phonème unique.

150 Les Thaï du Lanna n’ont pas procédé autrement, par « la création de symboles additionnels pour rendre les sons ou les formes spécifiques du thaï » (FERLUS, 1995a, p.102). 74 Propriétés de l’écriture tham pour la notation du lao (l-tham)

De plus, le système consonantique du lao ne correspond pas à celui du pali (supra, 1.3.1). Par conséquent, certains caractères tham ne seront pas employés en l-tham. Parmi les consonnes tham que nous avons mentionnées pour noter le pali, seules les suivantes seront utilisées :

Rang k k K g x Gutturales _ [kavàk] [ekIdqnxO] .j. .jç;. .jç. .M. Rang c c j Palatales _ _ _ [cavàk] [ekIdEt&BidAn] .b. .r.

Rang Ê z Cérébrales _ _ _ _ [tavàk_ ] [ekIdEtpUmeH%Ck] .c.

Rang t t T d n Dentales _ [tavàk] [ekIdEt&EKWv] .s. .sç;. .sç. .m.

Rang p p P b m Labiales _ [pavàk] [ekIdEt&hImSzb] .o.+.a. .oç;. .oç. .l.

y r l v S H _ _ Rang a [Cavàk] .I. .≤. .k. .u. .r;. .g;.

Palatale Cérébrale Dentale Dentale et Dentale Gutturale Cérébrale Nasale labiale

Inversement, des signes spécifiques ont été ajoutés pour noter les consonnes lao manquantes au répertoire pali.

Consonnes spécifiques au l-tham152

wFfYhç

.a. .e;. .e. .i. .g. .>.

$£MWRV

.M;. .n;. .m;. .I;. .l;. .v;.

151 La « voyelle inhérente » /N9/ attribuée aux consonnes lao n’est effective que pour la désignation de ces consonnes (comme en français où on prononce /ad9/ pour désigner la lettre B), ce qui est différent des voyelles inhérentes (réelles) des consonnes indiennes. 152 Le .I;.est classé après le .n;.et le .m;.car la composante = représente la forme souscrite de la consonne y y et non de la consonne X— employée en p-tham. Sur les valeurs de ces deux consonnes, cf. page suivante.

75 SYSTÈMES D’ÉCRITURE

Remarques :

− La consonne w /a/ (modification de p /o/) a été introduite à l’alphabet tham afin de remédier à une confusion qui peut survenir en lecture. En effet, dans un texte l-tham, la consonne p peut prendre la valeur /o/ ou /a/, « la lecture devant alors s’exécuter conformément au sens du mot [qui sera révélé par le contexte] » (PHOUY, 1943a, p. 7-8).

Exemple : p°& /aNÁ/ (p a pour valeur /a/),

Cette ambiguïté peut étonner puisque le phonème /a/ existe dans l’alphabet p-tham, sous la

forme b b. Nous avons mentionné que cette confusion était liée à une évolution dans la prononciation des anciennes occlusives sonores lao devenues des sourdes aspirées (supra, 1.3.1). En l’occurrence, b b a pris la valeur /oç/ en l-tham et il n’existait alors plus de signe pour noter /a/. Pour écrire ce phonème, les Lao ont donc pris la consonne la plus proche tant phonétiquement que graphiquement de la consonne lao b /a/, à savoir p p. Nous noterons que cette confusion se manifeste également dans l’écriture yuon (tham Lanna) où l’on décèle « une ambivalence de p /b/ qui a deux valeurs p ou b selon qu’il note du pali ou du thaï153 »

(FERLUS, 1995, p.103). Quoiqu’il en soit, le caractère tham w /a/a été ajouté pour faciliter la

lecture au débutant. Sa forme est volontairement proche du caractère p-tham p /o/ puisque seule la barbe a été enlevée. Un caractère équivalent a été adopté en tham Lanna pour rendre la consonne siamoise [ /a/ (id.).

− La consonne ç />/ correspond à la consonne lao C, occlusive articulée au niveau de la glotte (INTHAMONE, 1987, p. 30). Il ne s’agit donc pas simplement d’un support théorique pour écrire les voyelles seules, mais relève d’un phénomène d’accumulation de l’air « sous la 154 glotte fermée et libérée brusquement » (REINHORN, 1980, p.12) .

− On remarquera la présence des digrammes associatifs « obtenus par l’association de la

consonne H /g;/ [H] servant de support de niveau de ton, et des consonnes basses servant de point d’articulation » (INTHAMONE, 1987, p. 159). On notera l’absence de correspondance en

153 Cette confusion entre les bilabiales simples sourde et sonore dans la région est fréquente et ne se limite pas aux langues tai-kaday : le khmer a connu un changement phonétique important vers fin du 1er millénaire « avec la glottalisation des occlusives sourdes p t en b d devant une voyelle pleine » (Cf. FERLUS, 1988, p. 3). Le phonème /p/ a par la suite été rétabli devant les voyelles pleines (id.). 154 On remarquera que la graphie de la consonne />/ est identique à celle de la voyelle indépendante p-tham /`/. Ceci n'est pas sans logique : par exemple le phonème /`9/ s'écrira pareillement en p-tham et l-tham (çA).

76 Propriétés de l’écriture tham pour la notation du lao (l-tham)

l-tham de la consonne digramme R /≤;/, sans doute parce que celle-ci est purement 155 théorique (REINHORN, 2001, p. XIII).

− Comme le relève L. Finot, le phonème /i/ est représenté par deux signes (FINOT, 1917, p. 38) : y (en p-tham) et Y (en l-tham). Cependant, la consonne y a curieusement pris la valeur /I/

156 en l-tham tandis que la consonne p-tham X /I/ est restée sans emploi. Pour noter le phonème /i/, il a donc été nécessaire d'ajouter une consonne supplémentaire, en l'occurrence le signe Y, dont la graphie est proche de la consonne lao y de même valeur phonétique /i/.

2.4.2 Voyelles l-tham

Les phonèmes vocaliques p-tham (supra, 2.3.3) sont tous employés en l-tham. Mais des voyelles exclusivement l-tham ont été ajoutées afin de noter la langue vernaculaire. Parmi les phonèmes vocaliques présents dans les deux langues (/`/ /`9/ /h/ /h9/ /t/ /t9/ /d/ /d9/ /n/ /n9/), seules les 157 graphies des voyelles /`/ (inhérente à la consonne en p-tham), /n/ et /n9/ subissent une variation en l-tham.

Exemples : La syllabe /j`/ s’écrira k en p-tham et ka en l-tham,

La syllabe /jn9/ s’écrira ekA en p-tham et ok en l-tham,

La syllabe /jn/ s’écrira ekA devant deux consonnes en p-tham et oka en l-tham.

Le tableau ci-dessous présente les voyelles l-tham et leurs valeurs phonétiques. Les voyelles figurées par deux graphies sont soit celles dont la forme interconsonantique est spécifique, soit celles dont la représentation varie en fonction de la ou des consonne(s) à laquelle elles sont associées (seule ou groupe consonantique). Certaines graphies vocaliques particulières seront exposées au chapitre 2.4.6. Enfin, pour une comparaison entre les signes vocaliques l-tham et lao « laïcs », cf. infra, 2.7.

155 Dans le dictionnaire de M. Reinhorn (2002), on ne trouve d’ailleurs aucune entrée à la lettre R. Cependant le même auteur signale ailleurs le mot RYn /≤h;`m/, « piastre » du portugais real (REINHORN, 1980, p.13). 156 De même qu'en écriture lao laïque j a pour valeur /I/ tandis que son équivalent étymologique siamois p a pour valeur /j/. 157 Cf. note 63. 77 SYSTÈMES D’ÉCRITURE

Voyelles l-tham

l-tham aà A i I ù %

IPA /`/ /`9/ /h/ /h9/ /L/ /L9/

l-tham u U eaeà e eà Ea E

IPA /t/ /t9/ /d/ /d9/ /D/ /D9/

eAa ç °ç l-tham oaè o ei eI O O

IPA /n/ /o9/ /N/ /N9/ /?/ /?9/

èva è+a èv è+ l-tham eà=a= eà== eùOeùç e%Oe%ç v + v +

IPA /i`/ /ja9/ /v`/ /v`9/ /L`/ /L`9/

l-tham < > eèA ^ \ Ö

IPA /`i/ /aj/ (/a?/)158 /`n/ /`l/ /ni/

On voit que la plupart des signes vocaliques l-tham sont très voisins de leurs équivalents en écriture lao. Quelques variations notables apparaissent cependant :

− Dans la représentation de la paire de diphtongues /v`/ [zva] - /v`9/ [zv] dans laquelle l’idiographème v retrouve sa correspondance tham v et qui est disposé soit en position souscrite (associé à une consonne seule159) soit sur la ligne d’écriture (associé à un groupe consonantique160).

Exemple :cè+ [czv] /bv`/ ; Mèva[Mzva] /lv`/.

158 Cf. note n°183. 159 l. tzvoDn /sv`sçn9m/. 160 Phouy appelle « consonne composée » (l. tzvpaSzm /sv`o`rnl/) les groupes consonantiques associatifs (PHOUY, 1943a). 78 Propriétés de l’écriture tham pour la notation du lao (l-tham)

− Dans la représentation de la paire de diphtongues /L`/ [eùC] - /L`9/ [e%C] où l’idiographème lao C trouve son équivalent tham ç (placé sur la ligne d’écriture associé à un groupe

consonantique) ou O en position souscrite (associé à une consonne seule).

Exemple : eKùO[eKùC] /jçL`/ ; eR%ç[eL%C] /kL;9`/.

− Dans le digramme \ /`l/ : l’idiographème °, placé au-dessus de la consonne en écriture

lao, est immédiatement suscrit à l’idiographème A en écriture tham.

Exemple : kA° (l-tham) / kZ (lao). − En position interconsonantique, l’écriture l-tham ne distingue pas le /d/ (bref) du /d9/ (long), alors que la longueur de ces segments vocaliques est pertinente en langue lao. Par exemple /jdm/ et /jd9m/ s’écrivent de la même manière en tham ekà* (avec le mai kan à qui normalement devrait ici noter la brièveté de la voyelle), et la lecture devra se faire conformément au contexte. En revanche, la chaîne ek*se lira /j`md9/ (PHOUY, 1943a, p. 25).

− La voyelle /D/ (brève) interconsonantique n’est pas mentionnée par Phouy, sans doute en raison de l’usage très peu fréquent en langue lao de cette voyelle en position interconsonantique, réservée aux onomatopées et aux mots d’origine étrangère.

Exemple : Ekà"b /jDÂo/ « casquette » (angl. cap). Employé aussi comme onomatopée pour désigner une explosion.

− En écriture lao laïque, les voyelles interconsonantiques brèves /N/, /ja/ et /wa/ sont notées respectivement àC, àY et àv, le mai kan à indiquant ici la brièveté de la voyelle. On pourrait supposer que les voyelles l-tham équivalentes s’écriraient àç (ou Oà ), à= et àv (ou +à). Or, peut-être dans le but d’éviter la confusion avec la forme suscrite à de la

consonne k /j/ (cf. chapitre suivant), on omet volontairement le signe mai kan pour indiquer la brièveté de ces trois voyelles. Comme pour les voyelles /d/ et /d9/ mentionnées ci-dessus, le lecteur devra déduire du contexte la longueur vocalique.

2.4.3 Consonnes l-tham de forme subjointe et leurs graphies

Placées en position finale d’une syllabe ou en deuxième position dans un groupe consonantique guidant ou englobant, les consonnes figurant dans le tableau ci-dessous peuvent s’écrire avec leur forme subjointe.

79 SYSTÈMES D’ÉCRITURE

Nous rappelons que les graphies présentées ici correspondent, sauf mention contraire, à celles employées par Phouy dans son manuel, et que de nombreuses variantes apparaissent selon les textes (supra, 2.1).

Consonnes l-tham ayant une forme subjointe

Forme nominale Forme subjointe Notes

k à Forme suscrite, uniquement rencontrée en l-tham.

Ë Forme souscrite, identique à sa forme en p-tham.

Forme suscrite, identique à sa forme en p-tham. x ’

~ Forme souscrite, uniquement rencontrée en l-tham.

n * Graphie identique en p-tham.

p,w Û Graphie utilisée en p-tham pour noter la forme subjointe de p /p/.

En l-tham, comme w a pour valeur /p/ lorsqu'elle est en finale

(supra, 2.4.1), nous considérons w et p comme équivalentes en

finale. Dans le manuel de Phouy, c'est surtout w qui est

employée, mais la théorie n'oppose pas l'utilisation de p en position finale.

m ; Graphie identique en p-tham.

y = Graphie également identique en p-tham. Notons cependant que cette graphie note aussi une diphtongue interconsonantique, et rappelle la similitude qu’il peut exister en lao entre certaines consonnes (semi-voyelles) et les diphtongues (similitude que l’on retrouve au niveau des représentations graphiques).

v + Idem ci-dessus 3vr^t rÔ « » /noç≤`/. Graphie identique en p-tham.

l € Graphie différente du /k/ souscrit p-tham. Employé en deuxième position dans un groupe consonantique guidant, plus rarement associatif161 (voir exemples au chapitre suivant).

161 Le groupe consonantique associatif lao L est en effet presque toujours noté en l-tham R. Ici le signe ¤n’est pas une forme subjointe de la consonne l mais constitue simplement un élément graphémique du signe R.

80 Propriétés de l’écriture tham pour la notation du lao (l-tham)

S Ÿ Très rarement utilisé en notation du lao (CHANTHAPHAYBOUN, p. 91). On le trouve surtout dans les mots d'origine sanskrite ou pali.

Exemple : hàkŸA /g`jr`;9/, « préserver ».

162 ç O Bien que ce signe soit considéré dans les manuels comme la consonne ç />/ souscrite, il s’agit en réalité de la voyelle /N9/ souscrite notée par le même signe. Ce double emploi graphémique se retrouve en écriture lao avec la consonne C />/ dont le graphème est employé également pour noter la voyelle interconsonantique /N9/. Exemple : kOr[kCn] /jN9m/.

2.4.4 Règle de souscription et suscription des consonnes l-tham

La règle de souscription et suscription des consonnes tham dans la notation du lao est différente de ce que nous avons vu pour le pali. Cela a pu parfois mener à des confusions parmi certains observateurs occidentaux163. En l-tham, la consonne subjointe est presque toujours la consonne finale ou la deuxième consonne d’un groupe consonantique. Par contre, cette souscription-suscription n’est pas systématique mais intervient en fonction de contextes graphotaxiques.

Nous donnons ici quelques exemples qui permettront au lecteur de comprendre le système de souscription-suscription des consonnes en l-tham. L’ensemble des combinaisons syllabiques sera présenté en fin d’ouvrage (A.2).

Exemples avec la consonne n /m/ en position finale :

kA*[kAn] /j`9m/ ; vi* [vin] /uhm/ ; Rç* [LCn] /kN;9m/ {la consonne /m/ prend sa

forme subjointe souscrite * }.

162 Tant dans PHOUY (1943a, p.10) que dans CHANTHAPHAYBOUN (p. 91). 163 Ainsi, P.B. Lafont note que « Les consonnes finales sont en règle générale souscrites » (LAFONT, 1961, p. 401), alors même qu’il parle de l’écriture du pali, où nous avons vu que ce n’était pas le cas (supra, 2.3.4). 81 SYSTÈMES D’ÉCRITURE

Mùr[Mùn] /lLm/ ; ‘r[xUn] /jçt9m/ ; bOr [BCn] /ogN9m/ r[Jun] /Itm/ {la

164 consonne /m/ prend sa forme subjointe r sur la ligne d’écriture}.

Exemples avec la consonne k /j/ en position finale :

dàË [Dàk] /sg`j/ ; EFË [EFk] /eDÌ9j/ ; xiË [gik] /Mhj/ {la consonne /j/ prend sa forme

subjointe souscrite Ë}.

pUà[pUk] /otÌ9j/ ; à [LUk]/ktÌ9j/ ; Mçà[MCk]/lNÌ9j/ ; ocà[ock] /bnÌ9j/ {la consonne

/j/ prend sa forme subjointe suscrite }.à

Mèk [Mzk] /lnj/ ; RIk[LIk] /khÌ9j/ ; ep%Ok[ep%Ck] /oLÌ9`j/ ; eWik[eJik] /I?j/

{la consonne /j/ garde sa forme nominale k sur la ligne d’écriture}.

Exemples avec la consonne x /M/ en position finale :

mè~ [mzg] /lnM/ ; eli~ [elig] /k?M/ ; £ç~ [NCg] /mN;M/ {la consonne /M/ prend la forme

subjointe souscrite ~ }.

cU’ [cUg] /bt9M/ ; p+’ [pvg] /ov`9M/ ; M=’ [MYg] /li`;9M/ {la consonne /M/ prend sa

forme subjointe suscrite ’ }.

eg%Ox[ex%Cg] /jçL`9M / ; o£x [oNg] /mn;9M/ ; eMIx[eMIg] /l?;9M/ ; x [VUg] /ut;9M/ ; {la consonne /M/ garde sa forme nominale sur la ligne d’écriture}.

NB : Les consonnes /j/ et /M/ sont les seules consonnes à avoir une forme subjointe suscrite.

Exemples avec des consonnes en deuxième position au sein d’un groupe consonantique - guidant :

b€àr[Blàn] /oçk`m/ ; ÔpaMA* [praMAn] /o≤`l`;9m/

164 On remarque que la graphie du /m/ en finale sur la ligne d’écriture est similaire à la graphie de la consonne /≤/ de forme nominale. Cela vient du fait que les Lao prononcent le r r final comme un /m/ et raccourcissent presque systématiquement les mots polysyllabiques d’origine pali-sanskrite. La syllabe finale des mots pali-sanskrits se terminant en /≤`/ est ainsi transformée en /m/ (par exemple vessandara devient udsr`mcN9m). Les Lao ont gardé cette habitude orthographique en adaptant le tham à leur langue. Le /m/ final ne se note d'ailleurs a priori jamais n en l-tham.

82 Propriétés de l’écriture tham pour la notation du lao (l-tham)

- associatif :

dà~H€A= [DàgLAj] /sç`Mk`;9i/ - englobant :

l+A [lvA] /kv`9/ ; k=r [kYn] /ji`m/

En fait, il n’existe pas de règle vraiment stricte de souscription-suscription en l-tham, contrairement au p-tham. L’important semble être le respect d’une harmonie esthétique, variant souvent au gré des copistes. D’autant plus que, contrairement au p-tham qui voit son emploi des subjointes justifié par une raison linguistique (dévoyellement de la consonne précédente), l’emploi des formes subjointes en l-tham n’a de raison d’être qu’esthétique. En effet, la présence de nombreux signes vocaliques souscrits (,u ,U ,O )+ et des signes consonantiques descendant sous la ligne décriture ($, £, W, M, R, V) rend parfois malaisé l'ajout d'un caractère souscrit. Par conséquent, les copistes semblent en général adopter la règle « d’empilement minimal », qui consiste à éviter de dépasser trois niveaux (un signe sur la ligne d’écriture, un signe suscrit maximum, un signe souscrit maximum) tout en gardant un certain équilibre visuel dans la notation des mots165. On relève cependant des exceptions dans certains mots que des copistes n'ont pas hésité à orthographier en accumulant les superpositions :

HõOr/lN;9m/ au lieu deMç*,

£ór/mN;9m/ au lieu de£ç*,

Rór/kN;9m/ au lieu deRç*, etc.

De cette manière, on trouve des mots écrits avec des orthographes différentes selon les textes :

NCk /mNÌ9j/ MCk /lNÌ9j/ LCk /kNÌ9j/ Nvk /mv`Ì9j/ Mvk /lv`Ì9j/

£çà Mçà Rçà £và Mvà

£çË MçË RçË £vË MvË

£àó HõOà Róà £àì Võà

(D'après PHOUY, 1943a, p. 45)

165 Dans les mots comportant la voyelle u /t/ ou U /t9/, le signe vocalique souscrit est généralement légèrement décalé vers la droite afin d'éviter une superposition supplémentaire (ex :  /kt/).

83 SYSTÈMES D’ÉCRITURE

On relèvera enfin certaines ambiguïtés de lecture qui peuvent apparaître en l-tham :

− Ni /mh/ et Hin /ghm/ s'écrivent de la même manière : £i,

− NI /mh;9/ et HIn /gh;9m/ s'écrivent de la même manière : £I,

− EN /mD;/ et EHn /gD;9m/ s'écrivent de la même manière : E£,

− MI /lh;9/ et HIm /gh;9l/ s'écrivent de la même manière : M,I etc. Ces ambiguïtés existent aussi en écriture lao « laïque », et c’est pour cette raison qu’on été créées les ligatures N /m;/et M /l;/.

2.4.5 Contractions et glyphes syllabiques l-tham

L’écriture tham (p-tham et l-tham) n’a été codifiée que très tardivement (supra, 2.1). C’est la raison pour laquelle « il n’est pas rare de trouver un mot orthographié différemment d’un texte à l’autre. En fait, il est pratiquement impossible de trouver deux manuscrits identiques, car chaque nouvelle copie subit des modifications ou des corrections effectuées par un lettré qui estime, à tort 166 ou à raison, être dans son bon droit » (PELTIER, 2000a, p. 35). Ainsi, les copistes usent à l’envi d’innovations orthographiques ou de simplifications qui ont pour objectif de réduire le nombre d’idiographèmes dans l’écriture de certains mots ou syllabes. On appelle ces formes simplifiées des contractions (l. xZJWO /jç`lINÌ9/). Ces dernières, contrairement aux mots lao qui suivent normalement l’orthographe phonétique, ne sont pas toujours aisément déchiffrables et il est souvent nécessaire de les connaître par cœur pour saisir de quel mot il s’agit. Il faut également souligner que, pour encore compliquer les choses, les contractions peuvent varier d’un texte à l’autre.

Nous mentionnons ci-dessous quelques exemples de contractions. Cette liste n’est pas exhaustive.

166 On peut en outre penser que le copiste souhaitait bénéficier de l’acquisition de mérites découlant de l’amélioration d’un manuscrit (supra, 1.4.3). Ce phénomène s’explique aussi par le fait que la copie des manuscrits est souvent confiée à des novices ou des jeunes moines qui n'ont pas forcément une maîtrise parfaite de l’écriture tham. 84 Propriétés de l’écriture tham pour la notation du lao (l-tham)

Contraction Lecture Contraction Lecture Contraction Lecture [xZJWO] [qHWC&Anv&A] [xZJWO] [qHWC&Anv&A] [xZJWO] [qHWC&Anv&A]

k°Ù k°zI [kO&dI] w°; w&°mI[b&OmI] z€I zIRI[dILI]

kÎA° kad\ [kaDZ] w;I w&°mI[b&OmI] eSI; SaeMI[SaeMI]

g%+A g%v&Ä [x%v&A]

k;I k&°mI [kO&mI] Em+A Em*v&Ä [Em&nv&A] gà+Ä gà*&vÄ [xànv&A]

TI* TanI&[Tan&I] jê€ jaEl[saEl] ûèA eçèA [eCzA]

dà€A dà~H€A=[DàgLAj] ÔzUA zUrA[dUrA] rI Áà*v&Ä [Cànv&A]

(D’après PHOUY, 1943a, p. 18-19 et PELTIER, 2000a, p. 364)

L’aspect ultime de ces contractions se trouve dans le phénomène que nous avons appelé glyphe syllabique (supra, 2.3.7), où un signe graphique unique note une syllabe (autre que le cas p- tham « consonne + /`/ bref inhérent »). En écriture l-tham, nous avons relevé trois glyphes syllabiques.

− Le glyphe syllabique , contraction de  associé à , employé tant en l-tham qu’en p-tham et déjà évoqué (id.).

− Le glyphe syllabique È, contraction de Ela /kD/, vraisemblablement employé pour une

exécution plus rapide (FINOT, 1956, p. 997). Contrairement à la graphie  /m`9/ qui semble

systématiquement s’imposer, le choix d’utilisation de la graphie È plutôt que Ela semble dépendre du goût du scribe, puisque cette syllabe se trouve écrite sous les deux formes dans

les textes. On trouve également la graphie È dans l’écriture du mot El+ /kDÂv/ [ElWv] qui

est alors orthographié È+ (GAGNEUX, 1983, p. 83).

− Le glyphe syllabique À que l’on retrouve fréquemment en épigraphie, est une contraction de

r% /qL9/ (PHOUY, 1943a, p. 19). Ce glyphe syllabique est également employé pour composer

le motÀà, contraction de r%k /qLj/ (GAGNEUX, 1983, p. 83 ; THEPSIMUANG, 2001, p. 39).

85 SYSTÈMES D’ÉCRITURE

2.4.6 Graphies vocaliques particulières

En l-tham, il est également fait usage de voyelles notées par des graphies modifiées ou simplifiées (dans ce dernier cas également appelées xZJWO « contractions »).

167 − Le graphème ,ê suscrit à une consonne, remplace parfois la graphie E/D9/ .

Exemple : lê /kD9/, équivalent de El (PELTIER, 2000b, p. 364).

− Le graphème ^ /`n/ est équivalent à eèA(PHOUY, 1957, p. 18).

168 Exemple : c^/b`Ân/ [ecWzA].

− En écriture l-tham, le signe  associée à la consonne  /u/ peut prendre la forme , celle-ci étant appelée CALvg /`9kv`;9M/ (littéralement « grand a »). Ainsi on écrit souvent : vÄ* [vAn] /u`9m/ au lieu de vA*

H²AvÄ [HWAvA] /g`Ì9u`9/ au lieu de H²AvA,

etc. On observe également cette graphie à hampe allongée du signe vocalique /`9/ en écritures yuon, khün et lü. Dans ces écritures, un « grand a » apparaît lorsque la voyelle /`9/ est associée aux consonnes g /jç/, d /sç/, D /sç/, p /o/ (ou /a/) et v /u/ (PELTIER, 2000a, p. 370). On écrit ainsi en yuon :

rgÄpĹ/k`9jç`9a`9m/ pour rgp¹

‰pDĹsdËÄ/o≤`sç`9mr`ssç`9/ pour ‰pD¹sdË, etc.

Selon Phouy, la graphie Äest à l’origine employée dans l’écriture birmane pour contrecarrer les éventuelles confusions qui pourraien survenir entre des combinaisons de certains caractères (PHOUY, 1943b, p. 49). Par exemple om (/r/ + /`9/) peut être confondu avec \ (/r/ souscrit à /r/, équivalent au s tham). Ainsi, lorsque la consonne birmane o est associée à la voyelle /`9/, cette dernière est représentée par une graphie à hampe ascendante plus prononcée, g. En réalité ce « grand a » était déjà employé en écriture môn dont l’écriture birmane dérive, et ce pour les mêmes raisons. En ce qui concerne l’écriture tham, les lettrés ont dû considérer que le seul cas de confusion possible avec le signe A /`9/ était lorsque celui-ci était associé avec la

167 Cette graphie peut aussi noter le /D/ bref. 168 Dans cet exemple, la marque tonale n’est pas notée. 86 Propriétés de l’écriture tham pour la notation du lao (l-tham)

consonne v /u/. En effet les graphies vA /u`9/ et t /s/ peuvent être confondues. Par conséquent on ne trouve en écriture tham le « grand a » qu’en présence de la consonne v /u/. La graphie Ä n’a donc pas de raison d’apparaître dans les textes l-tham en dehors de ce cas particulier169.

Si on se réfère aux manuels de Phouy et aux divers textes que nous avons pu examiner, on trouve un usage systématique du CALvg /`9kv`;M/ dans les textes l-tham, tandis que cette graphie semble plus aléatoire dans les textes p-tham où on trouvera aussi bien la voyelle /`9/ sous sa forme

« classique » A que le « grand a ». Ainsi Phouy écrit le mot pali bhagavŒ BgvA (ibid., p. 39) et non BgvÄ. Par contre, on trouve systématiquement cette graphie dans THAMMACHAK,

OUTTHOUMPHONE, y compris dans l’écriture de la voyelle o dont l’une des composantes est, en p- tham, le signe A :

îdvmevÄ idavamav¯ au lieu de îdvmevA, etc.

En conclusion, on admettra que l’emploi de la graphie CALvg /`9kv`;M/ relève de l’absence de codification de l'écriture tham, laissant au choix du copiste la liberté d'adopter l'une ou l'autre des deux graphies.

2.4.7 Accents tonals

En écritures lao et siamoise, des signes diacritiques sont utilisés pour noter des tons. Ces signes s’inspirent des chiffres utilisés en écriture brahmi, mais que les Thaï et les Lao ont suscrits. Ils portent le même nom dans les deux langues :

170 & mai ek, ²mai tho, # mai tri, {mai cattava .

D’après Phouy, « l’écriture tham écrite en langue vernaculaire figurant sur les manuscrits divers n’emploie pas les accents ‘mai ek’ et ‘mai tho’ » (PHOUY, 1943a, p.13) et a fortiori encore moins mai tri et mai cattava. Cela n’a rien d’étonnant puisque les manuscrits sont, soit très anciens,

169 On peut considérer un autre cas de confusion possible : celui de la consonne g /jç/ associée à la voyelle A/`9/, la syllabe gA ainsi formée présentant une graphie proche de la consonne p-tham N /®/. Cette confusion n’a pas été relevée en écriture tham et la consonne g /jç/ est donc, sauf exceptions possibles, associée au A /`9/ normal et non au CALvg /`9lwa;M/. 170 sk. ek « chiffre 1 », tho « chiffre 2 », etc. wmW /l`Âi/ est le classificateur lao pour les signes diacritiques. 87 SYSTÈMES D’ÉCRITURE soit des copies plus ou moins conformes de manuscrits antérieurs. C’est-à-dire que les habitudes scripturales illustrées sur les bailaan reflètent d’avantage des habitudes anciennes qu’une écriture normée et récente. Or, « dans la pratique ancienne, la notation des tons était souvent omise »

(PHINITH, 1987, p.75) et n’a été appliquée de façon systématique par l’usage de signes diacritiques qu’à partir des années 1930 (REINHORN, 1980, p. 10). Il n’est donc pas étonnant que les accents soient la plupart du temps absents des manuscrits écrits en l-tham171. La lecture des manuscrits est donc parfois difficile, puisque le lecteur doit alors effectuer « une analyse et une profonde étude du texte pour en saisir le contenu » (PHOUY, op. cit.), c’est-à-dire qu’il doit saisir le contexte préalablement à la lecture.

Cependant, on retrouve dans les rares éditions modernes172 publiées en l-tham la présence des accents tonals, soit que ceux-ci aient été ajoutés au texte original afin de rétablir une orthographe conforme aux normes modernes, soit que ces éditions aient pris pour modèle des manuscrits récents dont le copiste avait rétabli les accents. Par conséquent, il est nécessaire de considérer que l’écriture l-tham, en tant que système d’écriture transcrivant le lao, intègre dans son alphabet les signes diacritiques mai ek, mai tho, mai tri et mai cattava. Ces signes diacritiques ont une graphie identique à leurs équivalents en écriture lao « laïque ».

171 Il en est évidemment de même dans l'épigraphie. Notons cependant la stèle de l'ancien Vat Vixun, datée de 1836 et mentionnée en 1.2.2. 172 C’est le cas du roman nAgPzmHCm, « La femme aux cheveux parfumés », édité par A.R. Peltier (cf. références bibliographiques). 88 Autres caractères tham

2.5 AUTRES CARACTÈRES THAM

2.5.1 Cardinaux

Nous reprendrons ici la graphie des cardinaux du manuel de Phouy (PHOUY, 1943a, p.12), qui sont en réalité les formes anciennes des chiffres lao. P.B. Lafont infirme par ailleurs l’indication de L. Finot dans ses « Recherches sur la littérature laotienne » (FINOT, 1917, pl. VIII) concernant les chiffres tham et précise que ceux-ci sont en réalité des chiffres lao « un peu modifiés » (LAFONT, 1961, p. 401). L’épigraphie semble confirmer ce fait puisque P.M. Gagneux remarque que « dans les deux écritures, les chiffres sont rigoureusement les mêmes et dès le milieu du XVIIe siècle, ils ont déjà pratiquement la forme qu’ils revêtent aujourd’hui » (GAGNEUX, 1983, p. 80).

Indiquons également l'utilisation dans certains textes des cardinaux birmans (PHOUY, 1943b, p. 60) :

Chiffres employés en tham

0 1 2 3 4 5 6 7 8 9

tham 0123456789 lao Ø ° ë “ ‘ { ¶ « ¡ Ç birman 0 1 2 3 4 5 6 7 8 9

2.5.2 Ponctuation

Dans les manuscrits tham, on trouve régulièrement le signe de ponctuation qui indique la fin de phrase (LAFONT, 1961, p. 401) ou de paragraphe. Ce signe est l'équivalent du signe lao | appelé FznDCgxZ /en;msçNMjç`l/. Le signe de répétition, connu en lao sous le nom wmWjamakAn /l`ÂiI`l`j`9m/ et sous la forme }, existe en tham sous la forme -. Enfin nous avons pu observer dans les manuscrits les signes de ponctuation employés habituellement en écriture lao :

173 − § tAwk& /s`9j`Áh9/, signe de commencement de texte (équivalent du caractère latin §),

− _ oxmUd /jçn9ltÌ9s/, signe de fin du texte (équivalent du caractère latin ./.). Ce signe figure également dans des textes lü174.

173 Un signe équivalent existe dans les écritures indiennes : « Au début d’un texte épigraphique ou manuscrit, figure souvent un symbole en boucle de forme variable, à lire siddham « réussi », comme dans la récitation d’un texte. »

(PINAULT, 2001, p. 117). 174 Voir notamment SALAR, non daté. 89 SYSTÈMES D’ÉCRITURE

2.6 PARENTÉS SCRIPTURALES

Le tableau comparatif ci-dessous présente les graphies notant les signes consonantiques de l’alphabet brahmi et de différentes écritures de la péninsule indochinoise qui dérivent de celle-ci (supra, 1.1.2). On remarquera l’aspect hiératique et anguleux de la brahmi, tandis que les lettres des écritures d’Asie du Sud-Est sont plus arrondies du fait que celles-ci proviennent de la pallava, variante méridionale de la brahmi (et non directement de celle-ci). On explique parfois l’aspect plus sinueux des écritures de l’Inde méridionale par le fait que les copistes écrivaient sur des feuilles de palmier175 à l’aide d’un poinçon de métal et, afin d’éviter de suivre les veines des feuilles, avaient adopté des courbes arrondies.

N.B. : les listes des caractères consonantiques sont basées sur le système consonantique pali- sanskrit. Nous n'avons pas mentionné les consonnes spécifiques à des langues particulières. Autrement dit, les consonnes qui n'ont pas de correspondance en écriture brahmi ne figurent pas dans ce tableau. Nous insistons aussi sur le fait que ces correspondances reposent sur des critères étymologiques et n'impliquent pas nécessairement une équivalence, en pratique, quant aux valeurs phonétiques. On sait en effet que les populations ont adopté les systèmes d'écriture en fonction de leurs répertoires, qui ne correspondaient pas toujours à celui des langues indiennes176 et qui de plus ont évolué avec le temps (supra, 1.3.1).

175 Tradition qui s’est répétée jusque dans l’Asie du Sud-Est. Cf. supra, 1.2.3. 176 Voir à ce sujet FERLUS, 1988. 90 Parentés scripturales

91 SYSTÈMES D’ÉCRITURE

92 Parentés scripturales

93 SYSTÈMES D’ÉCRITURE

94 Transcriptions

2.7 TRANSCRIPTIONS

La transcription du tham pose plusieurs difficultés. La première est que cette écriture note deux langues, le pali et le lao, qui ont chacune leur système de transcription en usage177 ainsi que des caractères spécifiques à l’une ou l’autre langue. La seconde est le manque de correspondance phonétique entre les alphabets p-tham et l-tham. On a vu que plusieurs phonèmes du pali étaient absents du répertoire lao (supra, 1.3.1) et vice-versa (supra, 2.4.1). Il a aussi été mentionné que les Lao s'étaient inspirés de l'alphabet khmer pour créer l’alphabet lao « laïque » ; quant à l'alphabet tham, il a été adopté vraisemblablement plus tard pour combler les manques phonétiques de l'écriture lao pour la lecture correcte du pali (supra, 1.1.3), puis on lui a ajouté des lettres correspondant aux phonèmes lao absents de l'alphabet pali. Tous ces ajouts et adaptations, de pair avec l’évolution des valeurs phonétiques de certaines consonnes (supra, 1.3.1) ont fait que le système de correspondance entre les écritures p-tham, l-tham et lao n’est pas toujours lisible.

2.7.1 Transcription en alphabet phonétique international et en caractères romanisés

Les tableaux ci-dessous présentent les correspondances entre les lettres tham et leurs valeurs en lecture du pali et en lecture du lao. Le tableau se décompose en cinq lignes : 1. Les caractères tham, 2. La translittération du p-tham, qui suit le système de translittération du pali en usage dans les ouvrages publiés en Occident. Selon les auteurs, la translittération

du niggah´ta est notée tantôt µ (F. Bizot, T. Narada, etc.), tantôt × (C. Duroiselle, etc.). C'est cette dernière notation que nous avons adoptée, préférant réserver le point souscrit pour la translittération des consonnes rétroflexes. Les caractères spécifiquement l-tham ne sont pas transcrits en ligne 2 (mais le sont en ligne 4), 3. La transcription phonétique du p-tham, d’après les versions récentes178 de l’alphabet phonétique international (API), 4. La translittération du l-tham, suivant le système que L. Inthamone utilise pour

transcrire le lao en caractères latin (INTHAMONE, 1987, p. 13-14). Les phonèmes p- tham absents du l-tham ne sont pas transcrits en ligne 4 (mais le sont en ligne 2), 5. La transcription phonétique du l-tham, d’après les versions récentes de l’alphabet phonétique international (API).

177 Évoqué supra, 2.4. Des caractères ont cependant été ajoutés au système de transcription du pali-sanskrit pour noter les phonèmes, les tons et les registres de certaines langues asiatiques. Cependant les linguistes travaillant sur ces langues leur préfèrent souvent l’API. 178 Ainsi le k aspiré est noté /jç. et non plus /w.+dsb- 95 SYSTÈMES D’ÉCRITURE

2.7.1.1 Transcription des consonnes Remarques : − Les consonnes dites « hautes » du lao se prononcent, en l’absence d’accent tonal, avec un ton

descendant-montant ou modulé (supra, 2.2) que nous avons indiqué par le signe API ; placé

à droite de la consonne, le signe représentant un signe vocalique API. − Les valeurs phonétiques sont celles des consonnes lorsque celles-ci sont placées à l'initiale de la syllabe, certaines consonnes ayant une lecture différente en position finale179.

179 Pour la lecture des consonnes finales, voir PHOUY, 1943b, p. 14-23. 96 Transcriptions

Transcription des consonnes tham

Consonne tham kËà K© g( G@ x’~ Translit. pali k kh g gh º

IPA pali j jç f fç M Translit. lao k 'kh kh - ng

IPA lao j jç; jç , M

Consonne tham c| C/jO J] X} Translit. pali c ch j jh —

IPA pali b R Y Yç I

Translit. lao c - s - ,

IPA lao b , r , ,

Consonne tham qö Q` zÙ Z[ NÂ Translit. pali Ê Êh ¶ ¶h ö

IPA pali ¥ ¥ç Ö Öç ®

Translit. lao - - d - -

IPA lao , , c , ,

Consonne tham tÊ Të dÎ DÏ n* Translit. pali t th d dh n

IPA pali s sç c cç m

Translit. lao t 'th th - n

IPA lao s sç; sç , m

Consonne tham pÛ PÜ b® Bÿ m; Translit. pali p ph b bh m

IPA pali o oç a aç l Translit. lao p/b 'ph ph - m

IPA lao o.a oç; oç , l

Consonne tham y= rÔ l¤€ v+ SúŸ Translit. pali y r l v s

IPA pali i ≤ k u r

Translit. lao gn r l v 's

IPA lao I ≤ k u r;

97 SYSTÈMES D’ÉCRITURE

Consonne tham HÇ L™ ° Translit. pali h  ×

IPA pali g û M

Translit. lao 'h - -

IPA lao g; , ,

Transcription des consonnes spécifiques l-tham

Consonne tham wFf Yhç Translit. lao b 'f f y h > IPA lao a e; e i g >

Consonne tham $W£MRV

Translit. lao 'º '— 'n 'm 'l 'v

IPA lao M; I; m; l; k; u;

Remarques : − Toutes les transcriptions IPA du p-tham correspondent à une lecture académique du pali. Cependant au Laos, la lecture de certaines lettres pali est souvent corrompue en raison des habitudes phonétiques de la langue lao moderne. C'est le cas notamment des occlusives sonores gg, Ggh, D dh et B bh (prononcées respectivement /jç/, /jç/, /sç/ et /oç/) et des rétroflexes (prononcées comme des dentales180). Ainsi, c'est bien de transcriptions théoriques et étymologiques du pali dont il s'agit ici, et la manière dont les lettres sont effectivement prononcées au Laos dépend de la maîtrise que le lecteur a du pali et de ses habitudes.

− Le nikkhahit est translittéré ×. Au Laos, sa valeur phonétique est /M/, c’est-à-dire que le nikkhahit se prononce comme un x º /M/ final (supra, 2.3.1).

− La consonneHprend la valeur phonétique /g. (translit. h) en pali, cependant qu'elle prendra

la valeur /g;. (translit. ‘h) dans un texte écrit en langue lao. Ainsi HAsera transcrit /g`9. en

p-tham, mais /g`;9. en l-tham. En l-tham, la valeur /g. sera réservée à la consonne basse h.

180 Les yuon de l’actuel Nord de la Thaïlande emploient un procédé particulier pour lire la série des consonnes rétroflexes : celles-ci sont lues avec le préfixe /q`/ (ou /k`/) (FERLUS, 1995, p. 105 ; RUNGRUANGSRI, 2004, p. RRR). Ainsi q Ê se lit /k`s`/, Q Êh se lit /k`sç`/, etc. (mais z se lit bien /c`/, tout comme la consonne équivalente en tham). 98 Transcriptions

Même remarque pour la consonne S transcrite /r/ en p-tham mais /r;/ en l-tham où cette consonne équivaut à la consonne lao haute S, donc lue avec un ton modulé.

2.7.1.2 Transcription des voyelles

Les transcriptions des voyelles p-tham et l-tham sont présentées dans deux tableaux distincts du fait de la présence de formes propres à la langue pour transcrire le même phonème vocalique (par exemple le phonème /n9/ est noté en eA p-tham mais o en l-tham). Nous rappelons que nous n’indiquons pas l’arrêt glottal des voyelles lao brèves.

Transcription des voyelles p-tham

Voyelle tham Áäîïû

Translit. pali a Œ i ´ u

IPA pali ` `9 h h9 t

Voyelle tham üéô A i Translit. pali è e o Œ i

IPA pali t9 d.d9 n.n9 `9 h

Voyelle tham I u U e eA Translit. pali ´ u è e o

IPA pali h9 t t9 d.d9 n.n9

99 SYSTÈMES D’ÉCRITURE

Transcription des voyelles l-tham

Voyelle tham aà A Ä i I ù Translit. lao a Œ i ´ ù

IPA lao ` `9 h h9 L

181 Voyelle tham % u U eaeà eeà Translit. lao ù & u è e ã

IPA lao L9 t t9 d d9

e Aa ç 182 Voyelle tham Ea E ê oaè o O Translit. lao D D& o ¯ N IPA lao D D9 n n9 N

°ç Voyelle tham eieIeà=a=eà== O

Translit. lao N&&& & Ï Ï&&& & ia ia&&& &

IPA lao N9 ? ?9 i` i`9

èva è+a èv è+ Voyelle tham eùOeùç e%Oe%ç < v + v +

Translit. lao ùa ùŒ wa wŒ ai

IPA lao L` L`9 v` v`9 `i

Voyelle tham > eèA^ \ Ö 183 Translit. lao ai/ae ao am oy

IPA lao `i.`? `n `l N9i

181 Le /d9/ (long) interconsonantique l-tham se note avec le mai kan (supra, 2.4.2). 182 Rappelons qu’il n’existe pas en lao, en dehors des onomatopées et mots étrangers, de mot avec la voyelle /D/ (brève) interconsonantique (supra, 2.4.2). 183 Cette voyelle se prononce ai /`i/ au centre et au sud du Laos tandis que les Lao du nord la prononcent ae /`?/ (INTHAMONE, 1987, p. 38). 100 Transcriptions

2.7.2 Transcriptions en caractères lao

2.7.2.1 Transcription des consonnes

Le tableau ci-dessous indique : − Les consonnes tham, − La translittération en caractères lao du p-tham suivant le système de translittération de Phouy184, − La translittération du p-tham en lao suivant le système instauré par l'Institut Bouddhique et adopté par S. Viravongs dans sa Grammaire pali185, − La transcription du l-tham en caractères lao.

184 Cf. PHOUY, 1943b, p. 40-45. 185 Voir VIRAVONGS, 1938 et 1939, et supra 1.3.2. 101 SYSTÈMES D’ÉCRITURE

Transcription en écriture lao des consonnes tham

Consonne tham kËà K© g( G@ x’~ Translit. du pali k K c c C (Phouy) fl Translit. du pali k K c % C (Viravongs) Transcrip. du lao k K c _ C

Consonne tham c| C/jO J] X} Translit. du pali j s z z y (Phouy) fl fl fl Translit. du pali j ` z * ' (Viravongs)

Transcrip. du lao j _ z _ _

Consonne tham qö Q` zÙ Z[ NÂ Translit. du pali t D d V d n (Phouy) fl fl ( fl) fl Translit. du pali @ 7 V & + (Viravongs)

Transcrip. du lao _ _ d _ _

Consonne tham tÊ Të dÎ DÏ n* Translit. du pali t D T T n (Phouy) flfl Translit. du pali t D T $ n (Viravongs)

Transcrip. du lao t D T _ n

Consonne tham pÛ PÜ b® Bÿ m; Translit. du pali b p B P P m (Phouy) . flfl Translit. du pali b p B P | m (Viravongs) . b p B P m Transcrip. du lao . _ Consonne tham y= rÔ l¤€ v+ SúŸ Translit. du pali Y r l v s (Phouy) Translit. du pali r l v s (Viravongs) j

Transcrip. du lao j r l v s

102 Transcriptions

Consonne tham HÇ L™ ° Translit. du pali h l GC (Phouy) fl Translit. du pali h # ° (Viravongs)

Transcrip. du lao h _ _

Transcription en écriture lao des consonnes spécifiques l-tham

Consonne tham wFfYh

Transcrip. lao b F f Y H

Consonne tham ç$W£M R hC hy N M Transcrip. lao

Consonne tham RV

Transcrip. lao L hv

Remarques : − Les occlusives sonores sont transcrites en écriture lao par des occlusives sourdes de série basse, la vocalisation ayant été interprétée en lao moderne par un ton haut égal186 : « La lecture actuelle de l’alphabet montre que l’ancienne opposition entre les occlusives sourdes et

sonores est devenue une opposition tonale » (FERLUS, 1995, p.104). Ainsi les consonnes g,

j,d, etbprononcées en pali /f/, /Y/, /c/ et /a/ sont transcrites en écriture lao par les

consonnes sourdes de série basse x /jç/, s /s/, D /sç/ et B /oç/. En effet ces signes étaient

certainement lus à une époque ancienne /f/, /Y/, /c/ et /a/ et se sont transformés avec le temps en sourdes aspirées de série basse187. Pour une prononciation correcte du pali, il conviendra au locuteur laophone de lire ces occlusives selon ces dernières valeurs.

− Les occlusives sonores aspirées (G /fç/,J /iç/,Z /Öç/, D /cç/ et B /aç/) sont absentes du

186 Voir FERLUS, 1995, et supra, 1.3.1. 187 On observe ce phénomène dans d'autres langues de la région qui ont ainsi dévoisé leurs occlusives sonores. C'est le cas notamment du khmer (Cf. FERLUS, 1988) et même du tibétain : « au moment où la langue tibétaine a été transcrite dans cet alphabet [...], elle ne possédait pas de tons. Au cours de son évolution, la convergence des consonnes sonores et des sourdes a contribué à créer des oppositions tonales. » (DORJE, TOURNADRE, 2002, p. 31). 103 SYSTÈMES D’ÉCRITURE

système consonantique lao (supra, 1.3.1). Par conséquent, « les lettres manquantes sont tout

simplement remplacées par celles qui leur sont le plus proches phonétiquement » (REINHORN, 1980, p. 19), à savoir la translittération lao de la consonne non aspirée de la même série, dotée d'un point souscrit,

− X est translittéré (p-tham) jfl par Phouy. Le point souscrit peut sembler superflu puisque cette consonne a pour valeur attestée /I/ dont la représentation en lao est simplement j. En

fait cette confusion est due au fait qu’en l-tham, c'est le y (en p-tham /j/) qui a pris la

valeur /I/ (supra, 2.4.1). Par conséquent la consonne X se retrouve sans emploi en l-tham

et Phouy lui a attribuée la valeur jfl (avec un point souscrit) pour la différencier de y.

− La consonne z, étymologiquement rétroflexe, est translittérée d /c/ en écriture lao (i.e. comme une dentale) mais ¶ /Ö/ en écriture romanisée (i.e. comme une rétroflexe), tandis que des mots lao n'étant pas d’origine pali-sanskrite comme wdW /c`Âi/ ou ed%Cn /cL`9m/ sont 188 écrits respectivement

/c/ (en p-tham d) était écrite D en lao, lettre dont la valeur s'est transformée en /sç/ (supra).

On a donc pris la valeur la plus proche pour transcrire la valeur /c/, à savoir z /Ö/. V − La consonne rétroflexe aspirée Z /Öç/ est transcrite par Phouy par la consonne . Cette consonne, absente de l'alphabet lao traditionnel, a été instaurée par l'Institut Bouddhique pour la notation du pali (supra, 1.3.2) mais pour noter la valeur phonétique de la consonne tham rétroflexe sonore simple z /Ö/. Cette confusion est peut-être due à une ressemblance V graphique au niveau de la boucle initiale des deux graphèmes Z et . Nous suggérons plutôt la translittération dfl.

2.7.2.2 Transcription des voyelles

Tout comme pour les transcriptions des voyelles en caractères romanisés et IPA, nous avons fait figurer les transcriptions lao des voyelles p-tham et l-tham dans deux tableaux distincts du fait de formes propres à la langue pour transcrire le même phonème vocalique.

Les tableaux ci-dessous indiquent respectivement les translittérations du p-tham et du l-tham en écriture lao, suivant le système de Phouy.

188 En pali noté en tham, « il y a souvent équivalence entre cérébrales et dentales » (GABAUDE, 1979, p. 93). 104 Transcriptions

Translittération en écriture lao des voyelles p-tham

Voyelle tham Áäîïû

Tanslit. du pali Ca CA Ci CI Cu

Voyelle tham üéô A Ä i Tanslit. du pali CU eC oC A i

Voyelle tham I u U e eA

Tanslit. du pali I u U e o

Translittération en écriture lao des voyelles l-tham

Voyelle tham a à A Ä i I ù

Tanslit. du lao a à A i I ù

Voyelle tham % u U eaeà eeà

Tanslit. du lao % u U ea eà e

eAa ç Voyelle tham Ea E ê oa è o O

Tanslit. du lao Ea E oa z o eAa àC

° ç Voyelle tham ei eI eà=a = eà= = O

Tanslit. du lao O C ei eI eàj àY ej Y

èvaè+a èvè+ Voyelle tham eùçeùO e%çe%O < v + v +

Tanslit. du lao eùC e%C zva àv zv v w

Voyelle tham > eèA^ \ Ö S Tanslit. du lao q ezA Z Cj

105 SYSTÈMES D’ÉCRITURE

CONCLUSION À LA DEUXIÈME PARTIE ET PERSPECTIVES

Après avoir passé en revue le système d’écriture du tham, nous pouvons retenir trois points importants : − Le terme écriture tham désigne deux « sous-systèmes » d’écriture (alphabet et graphotaxe) distincts correspondant aux deux langues que transcrit cette écriture, le pali et le lao. Ce phénomène nous a conduit à déterminer une terminologie distinguant le système d’écriture tham pour transcrire la langue pali (p-tham) du système d’écriture tham pour transcrire le lao (l-tham). − Le p-tham présente des similitudes avec le système d’écriture khmère, notamment par l’emploi de consonnes de forme(s) subjointe(s) indiquant que la consonne précédente est dévoyellée. − Malgré la codification émanant de l’Institut Bouddhique, les règles d’écriture du tham (surtout du l-tham) ne sont pas fixées et l’emploi de certaines graphies est laissé au libre choix du copiste.

Ces trois points constituent autant de difficultés qui viennent s’imposer à celui qui souhaiterait entreprendre la réalisation d’une police informatique tham189. Premier point : le fait que le tham désigne en réalité deux « sous-systèmes » d’écriture rend les choses difficiles. Le nombre de caractères en est augmenté et la logique de saisie ou d’encodage devient problématique. Deuxième point : on constate que les polices khmères souffrent d’un manque d’ergonomie, en raison du nombre très important de caractères nécessaires à la saisie de l’alphabet ; en effet les claviers n’ont pas suffisamment de touches pour accéder à l’ensemble des consonnes, des souscrites, des signes vocaliques, des ligatures et des signes divers (ponctuation, etc.). Les polices khmères OpenType, spécifiquement employées pour un encodage Unicode, sont rares et plutôt difficiles d’emploi (infra, 3.3.3.6). Enfin troisième point : on peut penser que l’absence de codification de l’écriture tham s’harmonise mal a priori avec un traitement informatique qui, fonctionnant en « binaire », demande l'application de règles strictes.

Dans le chapitre qui va suivre, nous allons tenter d’explorer le champ des possibilités pour remédier, du moins en partie, au caractère peu doté informatiquement de l’écriture tham.

189 Les notions d’ordre informatique évoquées brièvement dans cette conclusion seront expliquées plus en détail au chapitre suivant. 106

3 VERS UN TRAITEMENT INFORMATIQUE DE L'ÉCRITURE THAM

3.1 GÉNÉRALITÉS

3.1.1 Données techniques

Bien qu'il soit hors de notre propos de définir techniquement les différents formats de polices informatiques, rappelons cependant brièvement certains traits essentiels à la compréhension des chapitres suivants.

Une police190 informatique est un fichier contenant les formes à afficher (des « glyphes ») en fonction des codes caractères.

On peut distinguer deux types de polices : − les polices bitmap (ou « plan de bit ») : les caractères sont dessinés point par point. Ces points s’appellent des « pixels191 ». L'inconvénient est qu'un seul fichier ne correspond qu’à un style et à une taille. Lorsque l'on tente d'afficher une police bitmap dans un corps différent de celui qui est prévu, on voit apparaître un crénelage, notamment dans les diagonales192. − Les polices vectorielles : celles-ci permettent de représenter des caractères de n'importe quel corps à partir d'un fichier unique. Des « mouvements » à opérer pour réaliser le dessin des caractères sont décrits par des courbes de troisième degré (cubique) dont le type le plus connu est la courbe de Bézier. Les formats TrueType et PostScript sont les plus utilisés aujourd'hui. Les polices OpenType, spécifiques au standard Unicode, commencent à être répandues. Nous en reparlerons.

190 Pour un historique des significations des mots police et font, voir ANDRÉ, 1997, p. 35. 191 Contraction de Picture Element. 192 Phénomène qu'on appelle aliasing (ANDRÉ, 1997, p. 16). 107 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.1.2 Polices existantes

Comme nous l’avons évoqué, l’écriture lao a fait l’objet de nombreux travaux pour une adaptation aux moyens graphiques modernes193. Les premières traces de travaux en lao e typographiés apparaissent au début du 20 siècle aux éditions de Hong-Kong (BERMENT, 1998, p. 30) et dès 1925, le premier jeu de caractères typographiques laotiens est créé par l’Imprimerie

Nationale française pour des besoins administratifs (REINHORN, 1980, p. 7). Ces premiers poinçons gravés par Lek étaient de corps 20, et furent complétés en 1937 par Gauthier. Un deuxième jeu, de corps 40, fut réalisé par Malin en 1947 (TOMBEUR, p. 12). Un premier prototype de machine à écrire le laotien a ensuite été créé à Paris par M. Reinhorn à la fin des années 1940. D’autres machines virent le jour par la suite (ibid., p. 8).

Pour ce qui est des caractères informatiques, l’écriture lao en bénéficia quasiment dès l’arrivée des micro-ordinateurs sur le marché grand-public, avec notamment la police bitmap LaoFrance (pour Apple Macintosh) mise au point par L. Inthamone vers 1985. En 1992, la technologie TrueType apparaît, et les premières polices lao TrueType sont disponibles la même année avec la Laolium et la famille Alice. En 2004, plus d’une centaine de polices lao sont disponibles dans le monde. Citons notamment les Saysettha lao, Lao France, Lao light, ou encore la KhampaSidavong, cette dernière ayant l'intérêt de comporter les caractères lao supplémentaires pour la notation du pali194.

Quant à l’écriture tham, il n’est pas exagéré de dire qu’elle a été délaissée. Mis à part les quelques lettres tham figurant dans le jeu de caractères lao195 réalisé par l’Imprimerie Nationale et mentionné ci-dessus, il n’a jamais existé, à notre connaissance, de jeu de caractères d’imprimerie ni de machine à écrire tham. Le fait que toutes les publications en caractères tham non informatisés que nous ayons pu observer soient manuscrites semble confirmer cette affirmation.

Au niveau informatique, on peut citer tout d’abord une police bitmap pour Macintosh, créée par L. Inthamone vers 1990. Il s’agit à notre connaissance de la première police tham ayant existé, bien que le jeu de caractères soit incomplet. Signalons également la police tham de T.L. Nguyen Tan également au format bitmap dont le jeu de caractère est complet.

193 Pour un aperçu de l’historique de la typographie laotienne, voir BERMENT, 1998, p. 30-32 et 2004, p. 81-82. 194 Cf. supra, 1.3.2. 195 Ce phénomène est dû au fait que l’alphabet lao avait emprunté des lettres tham dans l’écriture courante (voir supra, 1.3.3). 108 Généralités

Il n’existe à notre connaissance que trois polices vectorielles tham (en dehors de la ThamStandard réalisée par nos soins et employée pour la rédaction de ces pages196). La première est la Lao dhamma créée par S. Morey et utilisée notamment par A.R. Peltier dans ses publications en tham. Le jeu de caractères est richement fourni puisqu’en plus de comporter l'ensemble des signes nécessaires à la notation en tham des phonèmes pali et lao, la police Lao dhamma comprend de nombreuses variantes graphiques dont nous donnerons ici un bref aperçu :

− La forme souscrite de c est représentée par deux signes, | et Ú,

− La forme souscrite de j est représentée par deux signes, O et Ã,

− La forme souscrite de b est représentée par deux signes, ® et Å,

− La forme souscrite de m est représentée par deux signes, ; et Æ,

La forme ,â variante graphique du signe vocalique souscrit .O

Bien que cette police ait le mérite d’être complète et esthétiquement satisfaisante, elle présente l'inconvénient de n'être utilisable que sur plateforme Macintosh, pour laquelle un clavier virtuel a été réalisé. Certes les lettres s'affichent correctement sous Windows, mais l’absence de clavier virtuel implique que la plupart des caractères ne sont accessibles qu'en saisissant les codes [ALT + xxxx] (où xxxx sont les numéros de code 8 bits) ou, avec le logiciel Word, en insérant un par un les caractères (« insertion »/ « caractères spéciaux »). Sur Macintosh, les signes tham qui ne sont pas directement accessibles au clavier sont saisis par l'intermédiaire des touches shift et option qui, combinées avec les touches du clavier, démultiplient le nombre de signes saisissables. La touche shift est effectivement présente sur tous les claviers PC, mais l'absence de la touche option empêchera toute tentative d'application bijective d'un clavier virtuel Macintosh à un équivalent Windows197. Bref, il ne semble pas envisageable d'utiliser la police Lao Dhamma sur un PC. De toute manière, on le verra, ce type de police souffre d’un manque d’ergonomie en raison du grand nombre de caractères nécessaires pour noter les multiples signes des écritures sud-est asiatiques (infra, 3.2.3), même avec le système Macintosh.

La seconde police tham TrueType est celle créée pour la Bibliothèque nationale du Laos et le Projet de Préservation des Manuscrits sur feuilles de lataniers198. Le seul texte tham que nous

196 Cf. infra, 3.2. 197 Nous remercions A.R. Peltier d'avoir bien voulu nous communiquer ces informations. 198 Cf. supra, 1.2.3, note 39. 109 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM ayions pu observer édité avec cette police199 est composé entièrement en pali (si l’on excepte le titre) et nous ne pouvons donc pas déterminer dans quelle proportion les caractères spécifiquement l-tham sont inclus dans cette police. Quoiqu’il en soit, le rendu est correct bien que les formes souscrites aient été limitées à leur graphie la plus courante à l’exclusion de toute variante.

Tout en constatant le manque d’efforts en faveur d’un traitement informatique du tham, on pourra s’étonner du manque de diffusion des travaux informatiques réalisés au sein de l’École française d’Extrême-Orient (EFEO) qui ont abouti à la création de polices de caractères de plusieurs écritures (tham, mul, yuon, etc.) et permis plusieurs publications200. Il existe en effet une troisième police vectorielle tham, la Vat sene, élégante et très complète, de format PostScript et qui fonctionne sur Macintosh. Cependant, celle-ci ne paraît stable que sur des logiciels professionnels tels que In-design ou X-Press201. On signalera, sans jugement de valeur, certaines particularités de cette police tham « EFEO » dont nous avons pu observer le jeu de caractères dans BIZOT,

LAGIRARDE, 1996 :

− Le glyphe syllabique Àest absent,

j T Ã ã O ë − Les formes souscrites de et de sont notées respectivement et au lieu de et comme chez Phouy, − La souscrite Ü est absente, comme si la consonne P /oç/ n'avait pas de forme subjointe,

202 − La présence du caractère Š §, consonne inexistante en pali, mais employée en sanskrit ,

− Les marques tonales ne sont indiquées que par l’unique signe diacritique  qui est normalement une caractèristique yuon-khün, − Les graphies des voyelles indépendantes semblent influencées par le yuon et sont un peu différentes des graphies employées par Phouy et l'Institut Bouddhique.

199 B. Thammacak, T. Outthoumphone, p;%SUzmè*nÖmè*kA~lêSdÏASg’H, pW%mSUdmznnWCj mznkAg Ela SàdDASàgxaHa, Vientiane, Bibliothèque nationale, 73 p. (bilingue lao-pali), 2004. Nous adressons nos sincères remerciements à D. Wharton qui nous a révélé l’existence de cet ouvrage et eu l’extrême amabilité de nous offrir son exemplaire. 200 « Un aspect important de ce travail [l’édition d’une collection intitulée Textes bouddhiques (du Cambodge/ de Thaïlande /du Laos)] repose sur la création de polices de caractères spécialisés dans les graphies locales, permettant la publication d'ouvrages de très grande qualité pour lesquels la France n'a pas, jusqu'à présent, trouvé son égal. Cet effort typographique, outre qu'il donne à notre programme une image de compétence technologique reconnue, permet aussi un redéploiement de nos travaux en dehors des pays strictement concernés » (http://perso.wanadoo.fr/bouddhisme.ase/fem1.html). 201 Nous remercions tout particulèrement M. Lorrillard de nous avoir fourni ces éléments d'information concernant cette « police secrète ». 202 Cf note 122. 110 Généralités

Quant à l’écriture yuon, celle-ci semble avoir bénéficié de très légèrement plus de considération que le tham puisque l’on trouve plusieurs polices TrueType yuon (dont la famille CR). On peut également mentionner la police khün utilisée par A.R. Peltier dans ses publications, mais il ne semble pas que cette dernière soit accessible au public.

Nous souhaitons enfin souligner, quitte à extrapoler par rapport au tham, le peu de cas qu’ont fait les concepteurs de police lao des caractères dits « archaïques » de l’écriture lao, notamment les graphies particulières des consonnes finales, des consonnes médianes où des graphies influencées par le tham (supra, 1.3.3). Nous en reparlerons (infra, 3.3.4).

Concernant le traitement informatique du tham, nous sommes donc en terrain relativement vierge. Nous allons donc envisager plusieurs types de traitements, en partant du plus simple pour aller vers le plus complexe, en essayant de distinguer les avantages et inconvénients de chacun.

111 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.2 RÉALISATION INFORMATIQUE 1 : LA POLICE THAMSTANDARD

3.2.1 Détermination des éléments minima de saisie

La plupart des écritures d'Asie du Sud-Est, ou du moins celles qui transcrivent les langues officielles des états centralisés, bénéficient d’un nombre important de polices, notamment au format TrueType. Ces écritures ont chacune leur système bien à elles mais ont ceci en commun qu'elles dérivent toutes plus ou moins directement de la brahmi, comme décrit au chapitre 1.1.2. Cette grande « famille » d'écriture a donc pu faire l'objet d'un traitement de saisie informatique similaire qui a abouti à ces polices vectorielles (TrueType, PostScript, etc.) utilisables sur les systèmes d’exploitation Windows, Macintosh, voire Linux. Il est par conséquent permis d’envisager qu’en premier lieu ce système de saisie pourrrait s'appliquer au tham.

Une police TrueType fonctionne de la manière suivante : à chaque signe est attribué un code- caractère qui contient les indications permettant au système d’exploitation d’afficher ce signe à l'écran. La difficulté étant, dans le cas de ces écritures qui utilisent des lettres constituées de plusieurs graphèmes (signes non connexes), de décider quels seront les signes qui figureront dans la police.

En lao par exemple, la voyelle brève /i`/ s'écrit avec les trois signes, ou idiographèmes, e, Y, 203 et à, placés de part et d'autres de la consonne : eàY . Exemple : ebàY /bi`/

Sachant que ces idiographèmes, seuls ou associés à d'autres, peuvent représenter d'autres voyelles :

eb /ad9/, bàb /a`o/, bYb /ai`Ì9o/.

Pour noter le mot ebàY /bi`/, on aura donc besoin des trois idiographèmes vocaliques mentionnés ci-dessus et du signe consonantique b /a/. Pour des raisons pratiques, on saisira les caractères dans l'ordre graphique (comme on le fait d’ordinaire en écriture manuscrite) et non dans l'ordre de lecture. En considérant notre exemple ebàY nous saisirons ainsi :

203 Aujourd’hui on écrirait plutôt ebàj, mais l’orthographe choisie illustrera mieux notre exemple. 112 Réalisation informatique 1 : la police ThamStandard

e b à Y

{rendu : ebàY}

Dans certains cas, un caractère est composé de deux idiographèmes très proches (dans l'espace) l'un de l'autre, au point qu'ils peuvent être considérés comme un caractère unique. C'est le cas de la voyelle digramme Z /`l/ qui, dans la police LaoFrance par exemple, est saisie par l'intermédiaire de la seule touche [Z] du clavier (ou par le code qui correspond au code ASCII du caractère Z). Exemple : k Z

{rendu : kZ}

On peut choisir de créer une police qui comprendrait tous les signes nécessaires à la transcription des deux langues que le tham code (pali et lao), ou alors de créer deux polices distinctes (une police p-tham et une police l-tham). Quelle que soit l’option choisie, l’ensemble des polices tham devra donc contenir tous les signes nécessaires à son écriture, de manière à ce que tous les mots sans exception puissent être saisis, quelle que soit leur orthographe. Nous avons vu en effet que les consonnes comme les voyelles pouvaient prendre des formes différentes selon le contexte (supra, 2)204. Comme nous avons mentionné que le p-tham et le l-tham étaient régulièrement employés conjointement dans un même texte, tels les nissaya (supra, 1.1.1), nous considérerons plutôt une police tham qui permettrait de noter à la fois le p-tham et le l-tham. D’après la liste des caractères établie plus haut (infra, 2.2), nous pouvons déterminer quels sont les signes minima nécessaires à la notation du tham.

− Signes minima pour la notation des voyelles indépendantes (5 signes) :

Áîûüé

− Signes minima pour la notation des consonnes de forme nominale (39 signes) : kKgGxcCjJXqQzZNtTdDnwpPFbfBm yYrlvSHLçh°

204 Il s'agit de représenter tous les signes nécessaires à la notation du tham, mais pas toutes les graphies rencontrées dans les textes divers. Nous rappelons que nous nous limiterons dans cette étude, sauf mention contraire, aux graphies retenues par Phouy dans ses manuels (PHOUY, 1943a et 1943b). 113 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

− Signes minima pour la notation de consonnes de forme subjointe (35 signes) :

ÉË ©(@’~|/O]}ö`Ù[ÂÊëÎ Ï *ÛÜ®

ÿ;=Ô ¤€+ úŸÇ − Signes minima pour la notation des voyelles (idiographèmes vocaliques) (23 signes) : aAÄiIù%uUeo<>°çO=+^Öàè ê − Signes minima pour la notation des ligatures et des glyphes syllabiques (7 signes) :

æsœµ)ÈÀ

− Signes minima pour la notation de la ponctuation (4 signes) :

- _§

− Signes minima pour la notation des accents tonals lao (4 signes) :

&²#{ − Signes minima cardinaux (10 signes) :

0123456789

D'après la liste ci-dessus, on compte 127 signes minima. Cependant on s'aperçoit que certains signes sont employés plusieurs fois :

− Le signe çest employé (1) comme consonne, (2) comme idiographème vocalique et (3) se

retrouve dans la notation de trois voyelles indépendantes (Á,äetô).

− Les signes É, ,+ =, et O notent à la fois des consonnes de forme subjointe et des idiographèmes vocaliques.

− Le signe suscrit ° sert à noter la consonne nikkhahit ainsi qu'une voyelle.

Un clavier appliqué aux polices TrueType considérera donc chacun de ces glyphes « multi- -usage » comme un signe unique à coder. Ainsi en saisie, on n'utilisera qu'une seule touche (ou combinaison de touches) pour afficher le glyphe °, que ce soit pour saisir le nikkhahit ou la voyelle

/N9/. De même, la voyelle indépendante Á /`/, la voyelle interconsonantique ç/N9/, l’idiographème constituant la voyelle eùçet la consonne l-tham ç />/ seront saisis à l'aide de la même touche, etc.

114 Réalisation informatique 1 : la police ThamStandard

Cette ambivalence de certains glyphes pourra certes poser des problèmes éventuels au niveau du tri alphabétique automatique ou de la reconnaissance informatique de caractères. Cependant, au niveau du clavier, la simplification que ces ambivalences implique nous a semblé être d'une plus grande importance ; d'autant qu'en pratique il ne serait pas surprenant que les utilisateurs ne respectent pas toujours les attributions correctes : si trois touches distinctes permettent d’afficher le signe ç (avec les valeurs /`/, />/ et /N9/), nul doute que des confusions surgiront.

Inversement, on peut choisir de considérer, pour des raisons pratiques et aussi esthétiques, certains signes comme étant éléments minima alors même qu'ils sont composés de plusieurs éléments :

− Equi est un dédoublement dee,

− \, adjonction de A et de ° (cf. page précédente),

− les voyelles indépendantes äet ô, adjonctions de Áet de respectivement Aet Ô ,

− la voyelle indépendante ï, adjonction deîet de Ö,

− les groupes consonantiques associatifs $,£,W,M,R etV, adjonctions de H

avec respectivement ~, *, =, ,; ¤, .+

En tenant compte des signes multi-usages et des signes non connexes que nous avons décidé de considérer comme signes unitaires, nous avons besoin de 132 signes minima accessibles au clavier. Ces signes sont alors appelés, dans la terminologie informatique, des caractères (i.e. à chacun d’entre eux correspond un code).

La police ThamStandard, réalisée dans le cadre de cette étude, comporte les 132 caractères définis ci-dessus. Nous ne décrirons pas les procédés de fabrication de cette police, cela relevant de données purement techniques sortant du domaine de notre étude. Le lecteur qui souhaite s’informer sur les méthodes de conception des polices informatiques pourra se reporter aux manuels des logiciels ScanFont et Fontlab205, logiciels avec lesquels a été créée la police ThamStandard.

205 Disponible gratuitement en ligne à l’adresse http://www.fontlab.com. 115 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.2.2 Constitution d’un clavier virtuel

Nous proposons ici un clavier virtuel que nous appellerons ThamFrance, pour une utilisation sur les claviers « azerty » (claviers informatiques en usage chez les utilisateurs francophones). Il s’agit d’un premier essai et il sera posible d’entreprendre ultérieurement des travaux pour la réalisation d’un clavier ThamUS pour les claviers « qwerty » (utilisés dans les pays anglo-saxons) et ThamLao pour les claviers laotiens. Nous pensons qu’une fois établis les principes de base pour le clavier ThamFrance, la mise au point des deux autres claviers se fera sans difficulté. Afin de faciliter la mémorisation de la distribution des lettres sur le clavier, nous avons tenté de nous rapprocher du clavier LaoFrance mis au point par L. Inthamone, qui a l'avantage d'établir un maximum de correspondances phonétiques entre les caractères latins figurant sur les touches du clavier et les caractères lao que ces touches permettent de saisir (par exemple le k /j/ lao est saisi par l'intermédiaire de la touche [k], le a /`/ par la touche [a], etc.). Bien sûr cela n'est pas toujours possible en raison des spécificités phonologiques propre à chacune des deux langues. Quoiqu’il en soit, les utilisateurs familarisés avec le clavier LaoFrance pourront adopter sans trop de difficultés le clavier ThamFrance. Dans certains cas où la correspondance phonétique n'était pas possible, des correspondances graphiques ont parfois été tentées (par exemple le signe tham ^ /`n/ correspond au caractère latin (ASCII) Ô ; la consonne souscrite ~correspond à la touche ~, etc.). Nous nous sommes également inspirés du clavier qu’A. Daniel avait mis au point pour la saisie du khmer : les consonnes non aspirées sont accessibles par l'intermédiaire d’une touche unique, tandis que les consonnes aspirées sont saisies par la combinaison des touches shift et de la consonne non aspirée correspondante (DANIEL, 1992, p. 74-75). Par exemple la consonne non aspirée d d est saisie par la touche [d] tandis que la consonne aspirée D dh est saisie par la combinaison de shift et [d], soit le caractère D. Nous obtenons alors la correspondance suivante :

« Minuscules latines » = « Consonnes tham non aspirées », « Majuscules latines » = « Consonnes tham aspirées ».

En règle générale, les touches les plus accessibles du clavier ont été réservées aux signes les plus fréquemment employés en écriture tham. D'autres signes plus rarement utilisés sont accessibles par des combinaisons de plusieurs touches. Ainsi la graphie Àcorrespond au caractère latin À qui est difficilement accessible depuis le clavier. Sur le logiciel Word par exemple, on le saisit de la manière suivante :

116 Réalisation informatique 1 : la police ThamStandard

[Alt] [Ctrl] 7 A

{rendu :À}

Certaines ligatures tham peuvent être saisies de deux manières : soit par l'adjonction des deux signes la constituant graphiquement (auquel cas deux codes sont nécessaires pour l’afficher), soit par la saisie d'un seul caractère (un code unique) dont la graphie a été ajustée. Par exemple les géminées µ et œ peuvent être affichées des deux manières suivantes :

2 codes 1 code

m ; µ

m ; µ

{rendu : m;} {rendu : µ}

2 codes 1 code

b ® œ

b ® œ

{rendu : b®} {rendu : œ}

Dans les deux exemples ci-dessus, on observe que le mode de saisie (2) offre des graphies plus harmonieuses. On notera cependant que si le caractère µ est directement accessible au clavier, le caractère œ est saisi par ma combinaison ([Ctrl] [1] + [o]), ce qui rend la saisie moins ergonomique.

Nous avons inclu également dans le jeu de caractères de la police ThamStandard un certain nombre de variantes, notamment des consonnes subjointes qui peuvent prendre plusieurs formes selon les textes (supra, 2.1). Sans prétendre intégrer l’ensemble des variantes rencontrées dans les textes tham, nous avons voulu mettre à disposition de l’utilisateur un nombre maximum de graphies. Ces variantes sont souvent difficilement accessibles au clavier et ne doivent être employées qu’avec la volonté de respecter rigoureusement les graphies d’un texte en particulier. L’accès à ces caractères pourra aussi se faire dans Word par le menu « insérer »/ « caractères spéciaux ». Ces variantes sont les suivantes :

117 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

− Ú(variante de ),|

− Ã(variante de ),O

− ñ(variante de ),}

− Ý(variante de Ù),

− ã(variante de ë),

− Þ(variante de ),Ï

− Å(variante de ),®

− ,Æ õ etá(variantes de ),;

− ß(variante de ),+

206 − ™(forme souscrite de L mentionnée par L. Gabaude ),

207 − â(variante du signe vocalique O mentionné par A.R. Peltier ),

− ÷et þ(variantes deï),

− øet ý(variantes deô).

Nous présentons ci-dessous : − Le schéma du clavier virtuel ThamFrance, − La table de correspondances caractères-touches. Les variantes graphiques décrites ci-dessus ne figurent pas sur le schéma du clavier virtuel mais la plupart sont mentionnées dans les correspondances caractères-touches.

N.B. : Avant toute utilisation de la police ThamStandard, l’utilisateur devra désactiver les corrections automatiques éventuellement paramétrées dans le logiciel de traitement de texte pour la saisie des écritures latines (dans Word : menu « outils »/ « corrections automatiques »). Par exemple l’insertion automatique des majuscules en début de phrase provoquera une substitution de glyphes tham (k en K, etc.). De même, Word active par défaut la transformation automatique dans certains mots de oe en œ, ae en æ, et parfois de mots entiers (bientot en bientôt, etc.). Notons qu’un logiciel comme LaoWord208 gère très bien ce type de problème pour la saisie du laotien en désactivant automatiquement ces transformations.

206 Supra, 2.3.6. 207 Supra, 3.1.2. 208 LaoWord, mis au point par V. Berment, est téléchargeable sur le site http://www.laosoftware.com. 118 Réalisation informatique 1 : la police ThamStandard

119 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Clavier ThamFrance : correspondances caractères-touches

Consonnes (formes nominales) Consonnes (formes subjointes)

k k B B & Ë (¨ + E) $ ÿ (¨ + y) © (Alt+ Crtl+ K K m m ' ; ; c)

g g y y ( ( ^ = É (Ctrl + G G r r ) @ Ô 4, E)

x x l l + ~ ¤ ¤

c c v v * { ú ?

C C s S − | ÿ +

j j H H / : ú \

J J L L \ ] Ÿ !

X X ° ° } } ç ^ ™ (Alt +Crtl + q q w w _ Variantes t) Ú (Ctrl Q Q f F ` ` Ú + 4, U) à (Alt + z z F f Ù Ö (¨ + O) à Ctrl +2,A) ñ (Alt + Z Z Y F [ [ ñ Ctrl +2,n) À (Alt+Ctrl+7, Ý (Ctrl N N h h ] Ý A) + 4, Y) È (Alt+Ctrl+7, ã (Alt + t t @ ç Ê ã E) Ctrl +2, a) Í (Ctrl T T > $ Ë . Þ +4, I) Å(Alt+C d d < £ Î Î (^ + I) Å trl + 0, A) Æ (Ctrl D D M M Ï Ï (¨ + I) Æ + 1) Ð (Ctrl n n W W ~ # á +4, D) ß (Ctrl + p p R R Û Û (^ + U) ß 1, 5) Œ (Ctrl P P V V Ü Ü (¨ + U) ™ + 1, O) ® (Alt +Crtl + Á (Ctrl b b £ â r) + 4, A)

Glyphes Ponctuation Accents Ligatures syllabiques

- - & S s ² )

_ ™ ² À ë ( ¨ + e) œ Ê (^ + E)

_ / ® “ µ ö Ó Â (^ + A)

# § § © ‘ ,

120 Réalisation informatique 1 : la police ThamStandard

Voyelles indépendantes Signes vocaliques

â â (^ + a) a a U U ë >

ä ä (¨ + a) A A e e Ô Ô (^ + O)

î î (^ + i) Ä Ä (¨ + A) E E Â *

ï ï (¨ + a) i i o o Ö µ

û û (^ + u) I I { O à à = ü ü (¨ + a) ù ù ^ è è

é é % % ÿ + ê ê (^ + e)

ô ô (^ + o) u u ê <

3.2.3 Inconvénients d'ordre ergonomique

On voit qu'avec le système de saisie ThamFrance l'ensemble des signes minima tham est accessible par l'intermédiaire d'une ou plusieurs touches d'un clavier « azerty » standard. Si un tel système a l'avantage de ne nécessiter que la seule installation de la police ThamStandard et est donc utilisable sur n'importe quel ordinateur PC ou compatible, l'accès à certains signes manque d'ergonomie. En effet, les 105 caractères directement accessibles à partir du clavier « azerty » sont insuffisants pour saisir les 132 signes minima nécessaires pour représenter l'intégralité des lettres tham (supra, 3.2.1) et il faut alors recourir à des combinaisons de touches parfois tortueuses pour afficher certains signes (sans parler des variantes). Notons que pour un clavier « qwerty », le problème sera aggravé par le fait que les lettres accentuées ne sont pas accessibles au clavier.

A. Daniel avait rencontré le même problème lors la création de son système de saisie informatique du khmer. L'écriture khmère, avec ses 33 signes consonantiques, ses 31 signes souscrits, ses 16 idiographèmes vocaliques, ses voyelles indépendantes, ses deux ligatures, ses 209 cardinaux et symboles divers, nécessite au moins 116 signes (DANIEL, 1992, p. 74). A. Daniel a créé une police pour Macintosh en mettant en place un clavier intuitif reposant sur un maximum de correspondances mnémotechniques phonétiques. Ce clavier répond à un principe de l’utilisation des quatre « sous-claviers » que comporte le système Macintosh : − Le « sous-clavier ordinaire » (i.e. caractères accessibles par la saisie d'une touche unique)

209 La police khmère Kdol, mise au point par l’EFEO et qui intègre un grand nombre de ligatures respectant les graphies e e de l’écriture khmère employées dans les manuscrits des XVII -XIX siècle, comporte 438 signes (BIZOT, 1992, p. 19). 121 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

comporte les consonnes non-aspirées et les voyelles. Par exemple la consonne k /j@9/ est

placée sur la touche [k] du clavier, la voyelle a /`9/ sur la touche [a], etc. − Le « sous-clavier majuscule » (i.e. caractères accessibles par la combinaison de la touche [shift] et d'une touche unique) comporte les consonnes aspirées correspondant aux consonnes non aspirées accessibles par le « clavier ordinaire ». Par exemple la consonne x /jç@9/ est accessible en combinant la touche shift avec la touche [k] du clavier (autrement dit correspondant au K). − Le « sous-clavier optionnel » (i.e. caractères accessibles par la combinaison de la touche [option]210 et d'une touche unique) comporte les formes souscrites des consonnes correspondant aux consonnes placées sur le « sous-clavier ordinaire ». La forme souscrite ,

de la voyelle k /j@9/ est donc saisie par la combinaison des touches [option] et [k]. − Le « sous-clavier majuscule + option » (i.e. caractères accessibles par la combinaison des touches [option], [shift] et d'une touche unique) comporte les formes souscrites des correspondant aux consonnes placées sur le « sous-clavier majuscule ». Ainsi la forme souscrite ¡ de la consonne aspirée x /jç@9/ est saisie par la combinaison des touches [option], [shift] et [k].

Ce clavier virtuel organisé logiquement en quatre « sous-claviers » permet certes la saisie intuitive de tous les caractères khmers, mais présente l'inconvénient de comporter quelques contraintes d'ordre ergonomique, la saisie étant ralentie par l'obligation de maintenir l'appui des touches [shift] et [option], parfois simultanément. De surcroît, la saisie des ligatures ne semble pas avoir été définie. Cela dit, ces inconvénients ne doivent pas faire oublier que ce clavier est selon nous la méthode de saisie la plus satisfaisante que nous ayons pu expérimenter pour la saisie du khmer, y compris le mode de saisie Unicode KhmerOS (cf. infra, 3.3.3.6).

La police LaoDhamma déjà évoquée (supra, 3.1.2) pour Macintosh recourt également à ces touches [shift] et [option], permettant ainsi de quadrupler le nombre de caractères accessibles au clavier. Malheureusement, comme il n'existe pas de touche [option] sur les ordinateurs configurés sous Windows, il nous sera impossible d'appliquer ce système à la police ThamStandard. Les polices khmères TrueType pour PC sont d’ailleurs d’un emploi difficile en raison de l’absence de cette touche [option]. L’accès aux consonnes de forme souscrite nécessite notamment l’insertion manuelle de caractères (« insertion »/ « caractères spéciaux »), tandis que d’autres systèmes obligent de passer d’une police à l’autre (par exemple une police contenant exclusivement les formes nominales des consonnes, une autre comportant uniquement les formes souscrites).

210 Touche inexistante sur les claviers Windows. 122 Principes du Standard Unicode

3.3 PRINCIPES DU STANDARD UNICODE

3.3.1 Introduction au standard Unicode et à la norme ISO 10646211

Le standard Unicode et la norme ISO/CEI 10646 ont pour objectif de normaliser les codages des caractères du monde entier afin de permettre une compatibilité entre les différentes polices et plateformes, quels que soient le pays ou la langue utilisée.

Alors qu’Unicode est un consortium de géants de l’industrie informatique (dont Xerox, Apple, Adobe, IBM, et surtout Microsoft qui en est le « leader » officieux), la norme ISO/CEI 10646 est issue d’une organisation internationale (Organisation Internationale de Normalisation). Pour des raisons pratiques, le standard Unicode et la norme ISO/CEI 10646 ont attribué aux caractères les mêmes noms et les mêmes valeurs de code, mais Unicode enregistre des données supplémentaires, dont des algorithmes de mise en œuvre. Mais généralement, toutes les données formulées ici relatives au standard Unicode sont valables pour la norme ISO/CEI 10646. Nous avons d’ailleurs utilisé ici les noms officiels de la version française de l’ISO/CEI 10646 et non les terminologies en anglais d’Unicode.

« Le standard Unicode est un mécanisme universel de codage de caractères. Il définit une manière cohérente de coder des textes multilingues et facilite l’échange des données textuelles »

(ANDRIES, 2002, p. 53). Par exemple au caractère a latin est attribué le code U+ 0041 et le nom

LETTRE LATINE A, tandis que la consonne lao k /k/ est enregistrée sous les code et nom U+0E81

LETTRE LAO KO.

Outre les caractères des langues alphabétiques, Unicode code les caractères syllabaires (par exemple le hangûl), les idéogrammes (le chinois, le japonais, etc.), les formes de présentation arabes, les signes de ponctuation, les symboles alphanumériques mathématiques, les symboles musicaux (occidentaux et byzantins), les combinaisons braille, des symboles divers, etc. De cette manière, chaque caractère d’un texte quel qu’il soit devra être reconnu par n’importe quel système d’exploitation informatique.

211 Notre propos n’étant pas d’établir une description complète du fonctionnement d’Unicode, nous ne dresserons ici qu’une description succincte permettant de saisir globalement l’utilité de ce standard et d’en présenter sommairement le fonctionnement. Pour plus d’informations sur le standard Unicode, nous recommandons le site http://www.unicode.org ou le site canadien http://hapax.iquebec.com qui propose une version française d’Unicode 3.1. 123 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Tout concepteur de police souhaitant conformer ses travaux au Standard Unicode se doit donc de respecter ce codage. À terme, toutes les écritures du monde devraient être intégrées au Standard. L’intérêt d’un tel codage « universel » est une simplification considérable dans l’échange des documents textuels numériques, dont Internet constitue le meilleur exemple.

Sans rentrer dans les détails techniques, précisons que les polices Unicode doivent, pour fonctionner, être prises en charge par le système d’exploitation (Windows, MacOS, Linux, ou autres). Le système Windows, par exemple, fonctionne avec un moteur d’affichage nommé Uniscribe. Ce moteur d’affichage prend en compte le fonctionnement établi par Unicode pour chacune des écritures intégrées au Standard. Les polices au format OpenType sont reconnues par Uniscribe. Dans ces polices OpenType figurent les caractères codés (codes attribués par Unicode) et une table de glyphes212 (signes) appelée GSUB. Lorsque l’utilisateur appuie sur une touche, un code-caractère est envoyé à Uniscribe qui affiche à l’écran le glyphe (signe) adéquat d’après des règles de graphotaxe implémentées pour chaque écriture. Ce qui signifie que si Uniscribe ne reconnaît pas une écriture, la police OpenType ne pourra fonctionner correctement. Uniscribe étant un produit émanant de la société Microsoft qui diffuse également le système Windows, l’implémentation « Unicode » des écritures devient donc en quelque sorte tributaire de cette entreprise multinationale.

Actuellement, l’écriture tham ne figure pas dans le standard Unicode. Les retombées commerciales d'un traitement informatique de cette écriture étant pour le moins limitées, on pourrait douter de son incorporation prochaine dans Windows. Mais l'intégration dans le Standard de certaines écritures « minoritaires » comme les écritures tai le (tai neua ou dehong dai) (infra, 3.3.3.8) ou tagalog par exemple, nous permet d’être optimiste sur l’incorporation d’un codage tham Unicode dans un proche avenir.

Nous utiliserons la terminologie employée par le Standard Unicode dans les publications. − La présentation des caractères sous la forme :

xxxx NOM DU CARACTÈRE où xxxx est le code hexadécimal du caractère codé et , l'image de glyphe nominal du caractère.

212 Pour de plus amples explications sur les caractères et les glyphes, cf. infra, 3.3.2.1. 124 Principes du Standard Unicode

− Le NOM DU CARACTÈRE, en petites capitales, suit la transcription en usage dans les publications émanant d'Unicode :

/t/ est noté U, /d/ est noté E, /L/ est noté Y, /N/ est noté AU, etc., Les voyelles de durée longue sont souvent figurées par un dédoublement de la lettre qui transcrit la même voyelle de durée brève, du moins lorsque la différence brève-longue est pertinente dans la langue en question.

Exemple : /`/ est noté A, /`9/ est noté AA.

Cependant, des divergences d’appellation peuvent se présenter selon les écritures. Ainsi le phonème vocalique /D9/ est noté EI pour le lao, mais AE pour le thaï. De même la consonne lao C />/ est transcrite O tandis que la consonne équivalente khmère G />/ est transcrite QA. Dans les chapitres suivants, les noms des caractères tham se conformeront aux dénominations « Unicode » des caractères devanagari (pour les caractères p-tham) et lao (pour les caractères spécifiques au l-tham). Exemples :

F00E N LETTRE THAM NNA

F024 Y LETTRE L-THAM YO

Nous emploierons les abréviations suivantes : C : consonne,

Ci : consonne placée (en lecture) à l’initiale d’un mot,

Cf : consonne placée (en lecture) en finale d’un mot,

Cn : consonne de forme nominale,

Cs : consonne de forme subjointe, V : idiographème vocalique, A : accent tonal.

125 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.3.2 Considérations générales sur Unicode

Nous indiquons dans ce chapitre quelques principes importants qui régient l’ensemble des codages Unicode.

3.3.2.1 Caractères abstraits et glyphes

« Un des défis les plus redoutables dans la conception d’un jeu de caractères universel réside dans la conception souvent différente que se fait chaque langue de ce qui constitue un élément textuel fondamental (une lettre dans le cas des écritures alphabétiques) » (ANDRIES, 2002, p. 60). En effet, Unicode prétend ne coder que les caractères abstraits (unités fondamentales de codage) et non les glyphes213, ces derniers étant les représentations (parfois sous plusieurs formes) de ces caractères abstraits. Pour résumer, nous dirons qu’à un caractère abstrait correspond un ou plusieurs glyphes, et inversement plusieurs caractères abstraits peuvent être représentés par un glyphe identique. Le tableau suivant indique quelques exemples (adapté de ANDRIES, 2002, p. 61) :

Glyphes Caractères Unicode/ ISO 10646

A A A AAA A A U+0041 LETTRE MAJUSCULE LATINE A k k , U+1780 LETTRE KHMÈRE KA

U+0066 LETTRE MINUSCULE LATINE F + fi fi fi U+0069 LETTRE MINUSCULE LATINE I e x ¿ ZZZ U+0EB3 VOYELLE LAO AM

En ce qui concerne l'écriture tham, cette distinction entre caractère et glyphe est essentielle en raison de la multitude de formes que peut prendre un caractère (voir supra, 2.3. et 2.4).

Glyphes Caractères abstraits

kËà CONSONNE THAM KA

x’~ CONSONNE THAM NGA

°çO VOYELLE L-THAM AU

AÄ VOYELLE THAM AA

213 Le terme glyphe, désignant étymologiquement un signe gravé, était traditionnellement employé pour désigner les caractères maya (CALVET, 1996, p. 279), avant d'être repris par les concepteurs d'Unicode. 126 Principes du Standard Unicode

Inversement, en tham (et dans bien d'autres écritures, telle l'écriture khmère), des caractères distincts peuvent dans certains contextes s'écrire à l'aide de glyphes identiques :

Glyphes Caractères abstraits

à CONSONNE THAM KA SIGNE VOCALIQUE L-THAM MAI KAN

ç CONSONNE L-THAM O

VOYELLE L-THAM AU

VOYELLE INDÉPENDANTE THAM A

SIGNE THAM NIKKHAHIT ° VOYELLE L-THAM AU

On voit donc qu'un glyphe peut représenter plusieurs caractères, qui eux-mêmes peuvent être représentés par plusieurs glyphes. C'est le cas du glyphe à(voir les deux tableaux précédents) qui représente aussi bien les caractères désignant les phonèmes /j/ que /`/, ces derniers caractères se trouvant également sous d'autres formes selon les contextes.

En suivant ce principe du codage des caractères, le choix de la forme à afficher de celui-ci (graphie souscrite, suscrite, ligature, etc.) est donc du ressort du système d'exploitation et de la police. Reprenons notre exemple devanagari présenté au chapitre 2.3.4 :

k consonne k de forme nominale,

k( virŒma souscrit à la forme nominale de la consonne k, indiquant que celle-ci est dévoyellée, K « demi-forme » de la consonne k employée dans certains contextes, indiquant que

cette consonne est dévoyellée (Exemple : Ky kya),

´ Forme conjointe d’un k dévoyellé associée à un k qui a gardé sa voyelle inhérente.

Tous ces glyphes représentent le caractère devanagari KA. C'est le contexte qui va permettre au système de choisir d’afficher k, k(, K, ou ´ (ou d’autres formes). Il en sera généralement de même214 pour les écritures dont la forme des lettres varie en fonction du contexte.

214 Nous verrons qu’en pratique, ce n'est pas toujours le cas. Par exemple les formes subjointes de l’écriture tibétaine sont codées (mais pas les variantes de ces formes subjointes) (infra, 3.3.3.7). 127 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Dans Unicode, les lettres qui s'écrivent à l'aide de plusieurs signes (par exemple la lettre latine â) devraient être considérées comme des caractères codés de manière indépendante. Les écritures dérivant de la brahmi sont des exemples typiques de systèmes contenant de telles lettres non connexes, comme l'illustrent les exemples ci-dessous :

eA Voyelle tamoule /n/,

su Voyelle malayalam /N/,

eàY Voyelle lao /i`/,

e] Voyelle khmère /L?/,

  Voyelle tibétaine /h9/. Nous verrons que ces voyelles non connexes ont fait l'objet de traitements différents selon les systèmes d’écriture (infra, 3.3.3) : considérés tantôt comme des caractères à part entière (respectant ainsi l'idéal du standard Unicode), tantôt comme l’agglutinement de plusieurs caractères (ces derniers faisant alors office d’idiographèmes vocaliques permettant de composer graphiquement les voyelles).

3.3.2.2 Caractères combinatoires et diacritiques

Selon le Standard Unicode, les caractères combinatoires sont des caractères qui sont

« destinés à s’afficher en association avec un caractère de base » (ANDRIES, 2002, p. 61). Ainsi, un é est la résultante d’un accent aigu (caractère combinatoire) et d’un e (caractère de base)215. En ce qui concerne les alphabets indiens et dérivés de celui-ci (à l’exception des écritures tai le, thaï et lao), on considère que les voyelles216 sont des caractères combinatoires qui doivent s’adjoindre à une consonne de base. En effet, les consonnes possèdent une voyelle inhérente (par exemple a en devanagari, /@9/ et /N9/ en khmer, etc.) et la présence d’un signe-voyelle dépendant indique la disparition de la voyelle inhérente alors remplacée par le signe-voyelle en question. Ces voyelles dépendantes peuvent apparaître souscrites au caractère de base, suscrites, positionnées à droite, à gauche (on parle alors de voyelle antéposée) voire de part et d’autre du signe consonantique. Exemple en devanagari :

p + a = pa pŒ, avec p p et a Œ

215 En pratique, pour faciliter la compatibilité entre les systèmes déjà existants, Unicode code également le é de manière indépendante, de même que les caractères composés les plus usités (tels à, ù, ö, etc.). 216 Nous ne parlons pas des voyelles indépendantes, présentes dans les écritures indiennes et certaines écritures d’Asie du Sud-est, celles-ci étant considérées comme caractères abstraits de base. 128 Principes du Standard Unicode

3.3.2.3 Ordre logique

Dans Unicode, les caractères sont stockés en mémoire en « ordre logique », c’est-à-dire dans l’ordre phonétique. Les écritures thaï et lao font exception en étant stockées dans l’ordre visuel

(UNICODE, 2003, p. 17 et infra, 3.3.3.3 et 3.3.3.4).

Exemple en écriture latine :

S A I S I E

{Rendu : SAISIE} Exemple en khmer :

B a n

{Rendu : Ban } /oh?m/

Exemple en devanagari :

p i

{Rendu : ip } pi

Dans l’exemple ci-dessus figure un caractère antéposé (le i i) qui est stocké après la consonne p p bien que positionné graphiquement à la gauche de celle-ci. C’est bien le système de rendu (le moteur d’affichage Uniscribe dans le cas de Windows) qui doit réorganiser les éléments et

« assurer la correspondance entre l’ordre logique (caractère) et l’ordre visuel (glyphe) » (UNICODE, 2003, p. 260).

Certains cas peuvent s'avérer très complexes, car l’ordre des caractères en mémoire est parfois très différent de l'ordre des signes disposés à l'écran, en raison des signes antéposés, des voyelles non connexes ou des formes consonantiques subjointes217. Ainsi le mot khmer ke®nIÞg /j@msq?fl9M/ est stocké en mémoire de la manière suivante :

217 Pour le principe de rendu des consonnes souscrites en khmer, voir infra, 3.3.3.6. 129 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

k n ‹‹‹ ‹ T ‹‹‹ ‹ r eI g U+1780 U+1793 U+17D2 U+1791 U+17D2 U+179A U+17BE U+1784

k n Þ ® e I g

k e ® n Þ I g

(d'après BAUHAHN, 2002, p. 16)

{rendu : ke®nIÞg}

Certains des caractères sont donc substitués puis repositionnés par le système d'exploitation. Nous débattrons un peu plus loin de la pertinence d'un tel principe. L’intérêt de ce système est, selon Unicode, de pouvoir simplifier considérablement les fonctions complexes tels le tri ou la reconnaissance vocale (SOLÁ, 2004, p. 3).

D’autre part, cet ordre logique « correspond grosso modo à l’ordre dans lequel le texte est 218 saisi au clavier » (ANDRIES, 2002, p. 68). Si le mode de saisie correspond à cet ordre considéré comme « logique », on pourrait néanmoins envisager un ordre de stockage en mémoire qui ne correspondrait pas à l’ordre de saisie afin de simplifier la tâche à l’utilisateur qui ne demande pas forcément à savoir comment se passe les réorganisations internes des codes.

Si nous reprenons par exemple le cas très simple de la syllabe devanagari ip pi, on pourrait imaginer le schéma suivant :

Saisie Stockage Affichage → → i + p p + i ip

218 Les écritures bidirectionnelles (arabe, hébreu) fonctionnent cependant différemment. 130 Principes du Standard Unicode

Bien que techniquement possible, il est permis de constater une certaine aberration dans ce système « d’aller-retour » et on peut essayer d’imaginer la somme de traitements supplémentaires nécessaire pour la saisie d’un mot comme ke®nIÞg qui ne serait pas saisi conformément à l’ordre de stockage (cf. ci-dessus).

L’ordre dans lequel les caractères sont stockés doit donc dénoter d’une réflexion au préalable sur le mode de saisie de ces caractères et, pour cette raison, nous assimilerons par la suite et sauf mention contraire, l’ordre logique (le stockage en mémoire) à l’ordre de saisie.

3.3.2.4 Séquences équivalentes

Pour des raisons de compatibilité, certains caractères sont considérés comme équivalents à la combinaison de plusieurs autres caractères (UNICODE, 2003, p. 19 et ANDRIES, 2002, p. 69-70). C’est le cas de beaucoup de signes non connexes, dont des nombreux signes vocaliques des écritures indiennes et du Sud-Est asiatiques composés d’éléments graphémiques séparés :

0BCA eA SIGNE VOCALIQUE TAMOULE O

≡ 0BC6 e 0BBE A

0EB3 Z SIGNE VOCALIQUE LAO AM

≡ 0ECD O 0EB2 A

3.3.3 Cas de codage Unicode pour des écritures de l’Inde et de l’Asie du Sud-Est

Dans notre perspective de proposer un codage du tham, nous allons analyser les traitements déjà adoptés pour des écritures dérivant de la brahmi. Cette analyse n’est pas exhaustive et nous renvoyons le lecteur qui souhaiterait connaître en détail le traitement de chacune de ces écritures par Unicode à la dernière version du Standard (Unicode 4.0) et aux tables de codes correspondant à ces écritures figurant en annexe219.

219 Disponibles en libre accès à l'adresse http://www.unicode.org/charts/. 131 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.3.3.1 Devanagari (0900-097F)

La devanagari est une des écritures les plus célèbres des écritures indiennes, si bien que « les autres écritures du sous-continent indien agencent leurs caractères de la même manière » (UNICODE, 2003, p. 251). Le traitement des écritures dérivant de la brahmi a donc été inspiré par celui de la devanagari, notamment en ce qui concerne l’agencement des caractères codés qui suit la norme ISCII 1988 (Indian Standard Code for Information Interchange) (id.) : en premier sont codés les signes divers (CANDRABINDU, ANUSVARA, VISARGA), suivis des voyelles indépendantes, puis des consonnes, des voyelles dépendantes, des signes et consonnes additionnels, et enfin des cardinaux.

L’ordre de codage des consonnes suit le classement consonantique indien (supra, 2.3.1) :

0915 k LETTRE DEVANAGARI KA

0916 % LETTRE DEVANAGARI KHA

0917 g LETTRE DEVANAGARI GA

0918 ` LETTRE DEVANAGARI GHA

0919 ; LETTRE DEVANAGARI NGA etc. Toutes les consonnes des écritures de l’Inde traitées par Unicode suivent cet ordre de codage. D’autre part, le traitement par Unicode de la devanagari est intéressant puisque cette écriture cumule presque toutes les difficultés que l'on peut rencontrer dans un traitement informatique : présence d'un virŒma, nombreuses formes subjointes (souscrites, suscrites), ligatures, signes antéposés, etc. Nous relèverons notamment :

− La voyelle antéposée 093F i DEVANAGARI VOWEL SIGN I. Nous avons vu que ce signe, bien que placé graphiquement avant le signe consonantique à laquelle il est associé, est stocké en mémoire après celui-ci, c’est-à-dire dans l’ordre logique (supra, 3.3.2.3).

Exemple : saisie du mot ip pi.

p i 092A 093F

i p

{Rendu : ip }

132 Principes du Standard Unicode

− Le caractère 0902 ' SIGNE DEVANAGARI ANUSVARA, qui comme en tham indique une

nasalisation d’une consonne finale et sert ainsi à créer de nouvelles lettres à partir du jeu de lettres-consonnes de base.

− Le caractère 094D ( SIGNE DEVANAGARI VIRAMA, employé de manière explicite ou pour rendre les multiples formes subjointes des consonnes, celles-ci prenant alors des formes différentes selon le contexte. − La devanagari fait également un grand usage de ligatures : « Tout groupe de consonne est représenté graphiquement par une ligature ; dans ce signe, les éléments consonantiques étaient à l’origine simplement superposés ou juxtaposés, sans altération de leurs formes indépendantes. Avec le temps, ils ont subi des modifications plus ou moins importantes, ce qui a imposé un apprentissage des ligatures spéciales, très fréquentes dans les écritures

descendant de la brahmi » (PINAULT, 2001, p. 106). Ces formes subjointes et ces ligatures ne sont pas, rappelons-le, considérées dans Unicode comme des caractères et ne sont donc pas codées. C’est le moteur d’affichage qui se charge d’afficher les glyphes adéquats (ces derniers figurant par exemple dans la GSUB d’une police OpenType).

Exemple : Rendu de la syllabe ´ kka

k ( k U+0915 U+094D U+0915

´

Exemple : Rendu de la syllabe âk rka

r ( k U+0930 U+094D U+0915

âk

En raison du nombre très important de ligatures et de formes subjointes en écriture devanagari, « une police capable d’afficher la dévanagari comporte plus de glyphes qu’Unicode ne propose de caractères dévanagari » (UNICODE, 2003, p. 256).

133 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.3.3.2 Tamoul (0B80-0BFF)

En plus de signes vocaliques antéposés, on trouve en écriture tamoule des voyelles non connexes :

0BCA eA SIGNE VOCALIQUE TAMOUL O 0BCB EA SIGNE VOCALIQUE TAMOUL OO 0BCC eL SIGNE VOCALIQUE TAMOUL AU

Comme dans la plupart des cas de voyelles non connexes dans Unicode, les idiographèmes placés à droite et à gauche de la consonne sont également codés pour résoudre des problèmes de compatibilité et des équivalences sont admises :

0BCA eA SIGNE VOCALIQUE TAMOUL O ≡ 0BC6 e 0BBE A

0BCB EA SIGNE VOCALIQUE TAMOUL OO ≡ 0BC7 E 0BBE A

0BCC eL SIGNE VOCALIQUE TAMOUL AU ≡ 0BC6 e 0BD7 L

3.3.3.3 Thaï (0E00-0E7F)

Alors que la plupart des écritures dérivant de la brahmi se réfèrent à la norme ISCII :1988 (supra, 3.3.3.1), l’écriture thaï suit les principes de codage régi par la norme TIS 620 2529 (et sa mise à jour TIS 620 2533) conçue par le Thaï Industrial Standards Institute (BERMENT, 1998, p. 42). Unicode s’est basé sur cette norme plus ancienne et déjà en vigueur pour le codage des caractères thaï qui se distingue du codage devanagari par notamment trois aspects. − L’ordre de codage : consonnes, puis signes vocaliques, symboles divers (dont les marques tonales) et enfin les cardinaux. Traditionnellement, le classement consonantique thaï suit la logique indienne, c'est-à-dire selon le point d’articulation (supra, 2.3.1). − Les voyelles thaï ne sont pas considérées par Unicode comme des caractères combinatoires, mais comme des caractères à part entière (ou caractères de base). Cette distinction se

reflète dans la notation des signes-voyelles dans les publications où le signe figurant la place de la consonne est omis pour le thaï.

Exemples :

U+0D46 s SIGNE VOCALIQUE MALAYALAM E U+0E40 g CARACTÈRE THAÏ SARA E

134 Principes du Standard Unicode

Par ailleurs, et cela répondant au fait que les voyelles ne sont pas des caractères combinatoires, le traitement des signes vocaliques antéposés thaï se distingue du modèle « Unicode » indien : en mémoire, les signes thaï suivent l’ordre graphique et non l’ordre phonétique (logique).

Exemple : Rendu du mot c[ /aD9/ (avec [/a/ et c/D9/) c [ 0E41 0E1A

{Rendu : c[}

Dans l’exemple ci-dessus, le signe vocalique c /D9/, tout comme le i i devanagari (supra, 3.3.3.1) est placé à gauche du signe consonantique auquel il est associé. En lecture, la voyelle est lue après la consonne. Mais à la différence de la devanagari Unicode, le caractère 0E41 c est stocké en mémoire avant le signe consonantique (i.e. dans l’ordre graphique) et ne nécessite donc pas de traitement pour le positionnement du glyphe c. Les autres voyelles thaï antéposées (U+0E40 g, U+0E42 F, U+0E43 . et U+0E44 w) répondent du même principe.

− Le traitement des signes vocaliques non connexes : chaque idiographème vocalique est codé séparément. Par conséquent, les voyelles non connexes se saississent par l’adjonction des caractères nécessaires au rendu visuel de ces voyelles.

Exemple : saisie du mot g,njv /lLÁ`/ (avec , /l/, gnv /L`/, et j marque tonale)

g , n j v 0E40 0E21 0E37 0E48 0E2D

{Rendu : g,njv} La voyelle diphtongue tripartite n’est donc pas codée de manière indépendante, mais se saisit avec les 3 caractères U+0E40 g, U+0E21 n et U+0E2D v qui sont des idiographèmes vocaliques codés. On remarque que la marque tonale j (caractère U+0E48) s’insère librement en saisie entre deux idiographèmes vocaliques ; ce glyphe étant sans châsse, on peut saisir celui-ci avant ou après la voyelle n sans avoir recours à un traitement particulier.

Outre le siamois, l’écriture thaï sert à transcrire d’autres langues de Thaïlande comme le kuy (kuoy), le lawa, le phu tai, etc.

135 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Cette écriture est également employée pour noter le sanskrit et le pali (dans un but 220 religieux) et des caractères spécifiques ont été ajoutés à cet effet, notamment 0E3A B CARACTÈRE THAÏ PHINTHU, deux voyelles indépendantes (0E24 A LETTRE THAÏE ROU, 0E26 ? LETTRE THAÏE LOU) et le 0E4D Y LETTRE THAÏE NIKHAHIT. Ce dernier caractère est employé également pour écrire la voyelle digramme e /`l/ qui est par ailleurs codée. Il s’agit d’un cas d’équivalence (voir supra, 3.3.2.4) : 0E33 e THAÏ CHARACTER SARA AM ≡ 0E4D Y THAÏ CHARACTER NIKHAHIT 0E32 k THAÏ CHARACTER SARA AA

Nous noterons la présence du caractère U+0E45 | LETTRE THAÏE LAKKHANGYAO rappelant la lettre tham Ä (CALvg /`9kv`;9M/) (supra, 2.4.6) mais dont le rôle est différent. Ce signe n’est employé qu’associé aux lettres A /≤L/ et ? /kL/ afin d’allonger la longueur vocalique de ces segments.

Le traitement du thaï par Unicode retient donc plus l’attention par ses « transgressions » aux principes théoriques du Standard que par ses conformités, montrant ainsi qu’un groupe de travail national peut imposer des règles qui semblent axées sur des préoccupations pratiques d’implémentation. Selon Unicode, ce système particulier a été accepté dans le Standard uniquement pour des raisons de compatibilité avec les polices antérieures dont l’encodage est basé sur la norme TIS 620.

3.3.3.4 Lao (0E80-0EFF)

Cette écriture nous intéresse particulièrement puisque le tham permet de transcrire la langue lao. Nous rappelons que la langue lao est transcrite indifféremment (techniquement parlant) dans deux écritures, le tham et le lao « laïque ». C’est bien sûr de cette dernière dont il est question dans ce chapitre.

Si on examine la zone lao Unicode, on trouve une liste discontinue en raison du fait que les codes de l’écriture lao sont une « translation du code Unicode pour le thaï (donc basé sur la norme TIS 620 2529), de laquelle ont simplement été supprimés les codes de caractères n’ayant pas de

220 Rappelons que les caractères khom notaient jadis le sanskrit et le pali (supra, 1.4.2). 136 Principes du Standard Unicode

221 correspondance en laotien, ce qui donne une liste ‘trouée’ » (BERMENT, 1998, p. 42) avec des ajouts de caractères qui ne trouvent pas de correspondance en écriture thaï.

À la différence des écritures indiennes qui sont « alphasyllabiques » (consonnes à voyelle inhérente), l’écriture lao est purement alphabétique, c’est-à-dire qu’à chaque consonne correspond un phonème unique (et non à une séquence). Autrement dit les consonnes lao n’ont pas de voyelle inhérente222. Tout comme en thaï, ce sont les idiographèmes vocaliques (i.e. les éléments graphémiques qui permettent de composer les voyelles) et non les voyelles, qui sont codés.

Exemple : saisie du mot eb%C .aL`9.

e b % C 0EC0 0E9A 0EB7 0EAD

{Rendu : eb%C} On comprend que le codage des caractères lao a été pensé selon une logique graphémique en observant par exemple que le caractère U+0EAD C LETTRE LAO O sera employé aussi bien pour saisir la consonne C />/ que l’idiographème vocalique C, ce dernier étant utilisé pour écrire les voyelles

àC /N/ et C /N9/ interconsonatiques, eùC /L`/ et e%C /L9`/. De même les caractères U+0EB1 à

223 SIGNE VOCALIQUE LAO MAI KAN et U+0EBB z SIGNE VOCALIQUE LAO MAI KONG sont employés pour noter les formes interconsantiques respectives des voyelles /`/ et /n/ (dans ce cas il s’agirait en théorie de glyphes contextuels des caractères A et O) et également les voyelles non connexes eà /d/,

Eà /D/, àC /N/, eàY /h`/, àY /h`/, àv, zva et zv.

Quelques lacunes ou erreurs dont souffre la zone du lao méritent d’être relevées. − Absence des caractères pali instaurés par l’Institut Bouddhique224 (supra, 1.3.2),

− Présence d’un niggah´ta (0ECD O NIGGAHITA LAO) pourtant inconnu en écriture lao (sauf dans la réforme de l’Institut Bouddhique, cf. supra, 1.3.2) et dont la graphie indiquée par le Standard Unicode est identique à celle de la voyelle lao /N9/ lorsque la syllabe est ouverte (i.e.

221 V. Berment relève de surcroît des erreurs dans cette correspondance : « au fo fa thaï (0E1D) correspond fautivement le fo tam laotien (0E9D), de même qu’au fo fan thaï (0E1F) correspond fautivement le fo sung laotien (0E9F) » (BERMENT, 1998, p. 42). 222 Voir note 151. 223 Unicode 4.0 attribue fautivement le nom de « mai ong » à ce caractère. Nous corrigeons ici cette appellation. 224 C’est peut-être d’ailleurs la raison pour laquelle la liste est « trouée » : afin de laisser la place libre à ces caractères complémentaires pour la notation du pali. 137 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

sans consonne finale). Nous pensons qu’il s’agit là d’une confusion dans l’appellation, d’autant que le signe vocalique /N9/ n’est pas codé.

225 − Les formes archaïques médianes ou finales ÂÂÂ d, ÏÏÏ n, ÛÛÛ b, ÄÄÄ m, €€€ l, µµµ·ds²²² § ne sont jamais mentionnées, ni comme caractères (ce qui est logique dans la théorie des caractères d’Unicode, s’agissant de glyphes contextuels) ni en tant que glyphes226. Ces graphies ne peuvent donc pas être rendues actuellement en technologie Unicode. Même si ces lettres ne sont plus utilisées dans l’écriture courante, elles sont nécessaires pour les orthographes étymologiques ou anciennes (on pense notamment aux rééditions de textes

anciens ou aux publications à usage universitaire ou de recherche).

− Absence des signes de ponctuation (archaïques) § tAwk& /s`9j`Ái/, _ oxmUd /jçn9ltÌ9s/ et | FznDCgxZ /enmsçNMjç`l/ (supra, 2.5.2),

− Inversion entre le FO SUNG (noté f au lieu de F) et le FO TAM (noté F au lieu de f),

− Dénominations « siamisantes » des caractères 0EA7 LETTRE LAO WO (au lieu de VO) et 0ECB

MARQUE TONALE LAO MAI CATTAWA (au lieu de CATTAVA).

Le fait que l'intégration du lao à Unicode n'émane pas d'une instance nationale lao n'est sans doute pas étranger à ces confusion et lacunes.

On notera cependant quelques caractères spécifiques à l’écriture lao :

227 − U+0EBB z VOYELLE DIACRITIQUE LAOTIENNE MAÏ KONG . ^ − U+0EBC DEMI-VOYELLE DIACRITIQUE LAOTIENNE LO (l'appellation au Laos est lOséCn /kN9rNÂ9m/ ou lOnéCj /kN9mNÂ9i/). Cette variante graphique de la consonne l /k/ est codée car son ^ utilisation est optionnelle (dans l’orthographe archaïque de certains mots comme Ba /ok`/ ou

dans l’écriture de la consonne haute /k;/ qui peut s’écrire L ou Hl). Le fait que ce signe soit considéré comme caractère dénote bien de la logique graphémique du lao Unicode.

− U+0EBD Y DEMI-VOYELLE DIACRITIQUE LAOTIENNE NYO (l'appellation au Laos est jOefWCg /IN9eLÂ9`M/). Notons que le caractère Y est multi-usage. Celui-ci peut être employé comme voyelle en position interconsonantique (ex : k&Yv .jhÁ`n/), comme idiographème vocalique (ex ebàY .ai`/), ou encore pour écrire la consonne haute J /I;/, cette dernière n’étant d’ailleurs pas codée indépendamment.

225 ^ Bien que la graphie /k/ soit codée (voir plus bas). 226 Microsoft n’en fait pas mention. Cf. MICROSOFT CORPORATION, 2004c. 227 Cf. note 223. 138 Principes du Standard Unicode

En effet, en écriture lao, certaines consonnes hautes sont notées par des digrammes : G 228 /M;/, N /m;/, J (ou Hj) /I;/, M /l;/, R /≤;/ , L (ou Hl) /k;/ et V /u;/. Parmi ces dernières, Unicode ne code que U+0EDC N et U+0EDD N, caractères assimilés à des ligatures. Ces deux exceptions s’expliquent par le fait qu’aucune règle n’oblige à employer les ligatures N et M plutôt que des chaînes équivalentes Hn et Hm qui ne sont pas ligaturées. Par conséquent, on ne peut procéder à un rendu automatique de type : H + n → N H + m → M Ainsi, dans Unicode, sont équivalentes les séquences suivantes :

U+0EDC N ≡ U+0EAB H + U+0E99 n

U+0EDD M ≡ U+0EAB H + U+0EA1 m

Par contre, les digrammes G, J, Hj, R, Hl, L et V ne sont pas codés en tant que caractères indépendants, et doivent être saisis de la manière suivante :

H g U+0EAB U+0E87 {Rendu : G}

H j U+0EAB U+0E8D {Rendu : Hj}

H Y U+0EAB U+0EBD {Rendu : J}

H r U+0EAB U+0EA3 {Rendu : R} (théorique) ^ H U+0EAB U+0EBC {Rendu : L}

228 Consonne théorique (Cf. note 155). 139 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

H l U+0EAB U+0EA5 {Rendu : Hl}

H v U+0EAB U+0EA7 {Rendu : V} Là encore, contrairement aux recommandations d’Unicode, ce codage a été établi en fonction de données graphiques et non phonologiques. En effet il n’existe pas d’autre raison de coder les consonnes hautes N et M à l’exclusion des cinq autres digrammes en dehors de considérations d’ordre graphique. Il est vrai que dans les règles descriptives de l’écriture lao, ces consonnes hautes digrammes sont aussi considérées comme des groupes consonantiques associatifs

(INTHAMONE, 1987, p. 159).

À la suite du thaï, le lao prend donc ses distances par rapport aux principes de codage d’Unicode. Il semble se profiler deux modèles de codage pour les écritures d’Inde et d’Asie du Sud- Est : un « modèle indien » qui privilégie la distinction entre caractères et glyphes avec un codage en ordre logique, et un « modèle thaï-lao » axé sur un codage obéissant à des critères graphémiques.

3.3.3.5 Birman (Myanmar) (1000-109F)

e Les birmans, lors de la conquête de Thatön au XI siècle (COEDÈS, 2001, p. 111) ont adopté l’écriture môn qu’ils ont très peu modifiée (cf. supra, 2.6). Le Myanmar n’ayant pas constitué de norme nationale officielle équivalente à l’ISCII indienne ou à la TIS 620 thaïlandaise, le consortium Unicode s’est entendu avec la Myanmar Information Technology Standardisation Commitee229 (MITSC) de Yangon pour constituer une norme pour le codage de l’écriture birmane. Ce consortium élargi n’a codé que les caractères de base, les formes contextuelles particulières devant être affichées par le système de mise en œuvre.

Les principes de base Unicode de l’écriture birmane suivent en partie ceux de la devanagari, notamment en ce qui concerne les signes vocaliques antéposés, stockés en mémoire après la consonne. Par contre le birman diffère de la devanagari dans l’ordre de codage : en premier lieu

229 « Le MITSC, créé par le gouvernement en 1997, est constitué d'experts de l'Association des Scientifiques de l'Informatique, de la Commission Linguistique du Myanmar, et de la Commission Historique du Myanmar » (UNICODE, 2004). 140 Principes du Standard Unicode sont codées les consonnes birmanes, puis les voyelles indépendantes, ensuite les signes vocaliques, signes divers, cardinaux et enfin les signes de ponctuation. En fin de bloc (U+1050-U+1059) figure le sous-répertoire des variations et extensions pour noter le sanskrit et le pali.

Mais le birman Unicode s'éloigne surtout du « modèle indien » dans le traitement de ses voyelles non connexes. En effet, tout en respecant un stockage en mémoire en ordre logique, les voyelles birmanes non connexes sont considérées par Unicode comme la composition de deux ou plusieurs caractères, et ne sont par conséquent pas codées séparément. Par exemple, la voyelle /NÁ/ se note en birman à l'aide des deux idiographèmes a et m placés de part et d'autre de la consonne, ces deux idiographèmes servant, pris séparément, à noter respectivement les voyelles /d9/ et /`9/. La voyelle /NÁ/ est donc notée à partir de la suite des caractères combinatoires a et m.

Exemple : saisie du mot aum /jNÁ/

u a m U+1000 U+1031 U+102C

a u m {rendu : aum }

On remarque la position antéposée de la voyelle a /d9/ qui est stockée en mémoire après la consonne (ordre logique). Le traitement des voyelles birmanes non connexes se situe donc dans un « entre-deux » des deux modèles « indien » et « thaï-lao » : encodage en ordre logique mais logique graphémique pour les signes-voyelles non connexes.

Quelques détails particuliers méritent également d’être relevés :

− Présence du virŒma (U+1039 f SYMBOLE BIRMAN VIRAMA). En écriture birmane ce virama 230 apparaît parfois sous la forme f (par exemple dans le mot =refrm /li`ml`9/). Mais en général le virama est invisible et provoque, tout comme en devanagari, la modification de la forme de la consonne qui suit une consonne dévoyellée.

230 Auquel cas il est qualifié de « signe qui tue ». 141 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : Rendu de la forme subjointe du caractère U+101B & LETTRE BIRMANE RA (ici dans le mot jum /j≤`9/)

u f & m

u j m

j u m

{rendu : jum /jq`9/}

On remarquera dans l’exemple ci-dessus la position antéposée de la forme subjointe j /≤/ qui, à l'instar de la voyelle a /d9/, est stockée après la consonne qui la précède visuellement. Dans ce cas, le cararactère VIRAMA birman se manifeste par une modification de la graphie du caractère suivant. Pour rendre ce caractère explicitement visible (il prend alors la forme f), il convient de faire suivre le caractère U+1039 SYMBOLE BIRMAN VIRAMA par le caractère U+200C ANTI-LIANT SANS CHÂSSE (UNICODE, 2003, p. 292). Cette manipulation est par exemple nécessaire pour l’affichage de certaines voyelles dont le signe f est l’une des composantes graphémiques, telles ,f /D/ et amf /N/, ou de mots comme =refrm /li`ml`9/ évoqué plus haut.

Exemple : Saisie du mot aumf /jN/

231 ZWNJ u a m f U+1000 U+1031 U+102C U+1039 U+200C

ZWNJ a u m f {rendu : aumf}

− L’écriture birmane fait usage, tout comme le tham, d’une forme plus allongée de la voyelle 1 /`9/ lorsque celle-ci est associée à certaines consonnes. Unicode a considéré, dans le cas de l’écriture birmane, que cette forme allongée g était un glyphe du caractère U+102C 1 VOYELLE BIRMANE A, et que par conséquent ce signe n’est pas codé. C’est le système qui doit afficher cette forme le cas échéant :

231 Zero Width Non-Joiner (« anti-liant sans châsse »). 142 Principes du Standard Unicode

o 1 101E 102C

o g {Rendu : og }

3.3.3.6 Khmer (1780-17FF)

L’écriture khmère a été traitée très fidèlement à « l’idéal » d’Unicode car « chaque signe- voyelle dépendant se représente à l’aide d’un seul caractère codé à la suite du signe de la consonne de base. Dans cette optique, chaque signe-voyelle possède une identité propre, quel que soit le nombre et l’emplacement de fragments de glyphes utilisés pour rendre ce signe ou son interprétation phonétique contextuelle » (UNICODE, 2003, p. 295). Mais à la différence de la devanagari, l’écriture khmère fait usage d’un grand nombre de voyelles non connexes et antéposées. Unicode les a toutes codées indépendamment :

17C1 e VOYELLE KHMÈRE E, 17C2 E VOYELLE KHMÈRE AE, 17C3 é VOYELLE KHMÈRE AI, 17BE eI VOYELLE KHMÈRE OE, 17BF e] VOYELLE KHMÈRE YA, 17C0 e[ VOYELLE KHMÈRE IE, 17C4 ea VOYELLE KHMÈRE OO, 17C5 eA VOYELLE KHMÈRE AU.

D’autre part, ces voyelles khmères non connexes ne sont pas reconnues comme équivalentes à la séquence des caractères représentant les composantes graphiques séparées comme c’est le cas dans les écritures indiennes (supra, 3.3.2.4). Ainsi 17BE eI n’est pas équivalent à 17C1 e 17B8 I.

Chacune de ces voyelles sera stockée en mémoire après la consonne qui la précède phonétiquement. Bien qu’au niveau du système d’écriture des voyelles le khmer se rapproche du thaï, leur principe de codage diffère.

143 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : Saisie du mot eQI /bg?fl9/

Q eI U+1788 U+17BE

Q e I

e Q I

{Rendu : eQI }

Consonnes souscrites : Nous avons vu que, tout comme en tham, le khmer faisait usage de consonnes souscrites232 appelées coeng (k. eCIg /b?9Mfl / « pied », et par extension « consonne souscrite ») employées dans les groupes consonantiques et, plus rarement, en position finale (supra, 2.3.4). Dans un groupe consonantique, la première consonne garde sa forme nominale tandis que la ou les consonnes suivantes prennent leur forme souscrite (subjointe) :

lá /kMN9/ avec á forme souscrite de g /MN9/,

ek|}g /jçaL9`M/ avec | forme souscrite de b /a@9/.

Exemple avec une consonne souscrite en position finale :

ehIü /g`?i/ avec ü forme souscrite de y /iN9/.

Conformément aux principes d’Unicode, seules les consonnes de forme nominale sont codées. Les formes subjointes sont obtenues par la combinaison du caractère U+17D2 ‹ SIGNE KHMER COENG suivi de la consonne (ou de la voyelle indépendante). Le Standard Unicode 4.0 précise que ce caractère coeng est un caractère de contrôle de rendu des formes subjointes et que 233 par conséquent celui-ci n’a pas de forme visible (MICROSOFT, 2004b, p. 2). Le signe coeng n’est

232 L'écriture khmère fait également usage de voyelles indépendantes souscrites. Ce phénomène n'existant pas en tham, nous n’insisterons pas dessus sur ce sujet. 233 La graphie ‹ qui représente le caractère U+17D2 SIGNE KHMER COENG dans les publications d’Unicode est une forme arbitraire employée uniquement pour des besoins de rédaction. 144 Principes du Standard Unicode donc pas un signe appartenant à l’alphabet khmer234. Mais on peut en théorie lui trouver une justification linguistique puisqu’il joue pour les consonnes un rôle comparable à celui du virŒma rencontré dans les écritures de l'Inde, puisqu’il indique le dévoyellement de la consonne qui le précède. Rappelons que le caractère khmer viriam qui indique également le dévoyellement d’une consonne, est obsolète (supra, 2.3.4) et n’est pas utilisé pour le rendu des subjointes dans le système Unicode235.

Exemple : Rendu du mot Rc /bq@9/

c ‹ r 1785 17D2 179A

c R

R c

{Rendu : Rc}

Exemple : Rendu du mot s

s ‹ K a r 179F 17D2 1782 17B6 179A

s < a r

{Rendu : s

234 La nature non canonique du caractère coeng a amené certains experts à vouloir décourager l’utilisation de ce caractère au profit d’un encodage des formes souscrites des consonnes et des voyelles indépendantes (voir CHEA, LAO, HARADA, KLEIN, 2002b). Cette proposition ne semble pas avoir été retenue par Unicode pour le moment. 235 Pour plus de précision sur le traitement informatique du khmer et sur la création des polices OpenType khmères, voir MICROSOFT, 2004b). 145 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : Rendu du mot k|al /jça`9k/

k ‹ b a l 1780 17D2 1794 17B6 179B

k | a l

{Rendu : k|al }

On notera le cas du caractère U+1789 j LETTRE KHMÈRE NYO qui peut prendre deux formes souscrites différentes : (1) \ lorsque j est souscrite à toute autre consonne qu'elle même ou (2) ¦ lorsque j est souscrite à elle-même (auquel cas j devient J). Les souscrites n'étant pas directement accessibles au clavier (puisque non codées), le système doit reconnaître la forme sous laquelle celles-ci doivent être affichées.

Exemple (1) : Saisie du mot x\Mú /jçInl/

(1) x ‹‹‹ ‹ j ú M

x \ ú M

{Rendu : x\Mú }236

Exemple (2) : Saisie du mot rC¢úsJ¦a /q`bbtr`II`9/

(2) r C ‹‹‹ ‹ C ú s j ‹‹‹ ‹ j a 179A 1787 17D2 1787 17BB 179F 1789 17D2 1789

r C ¢ ú s J¦ a

{Rendu : rC¢úsJ¦a}

236 Ce rendu implique également un abaissement du graphème u afin de ne pas empiéter sur la souscrite. Nous n’avons pas indiqué la substitution du glyphe u en ú afin de ne pas alourdir la lecture du tableau. 146 Principes du Standard Unicode

On mentionnera également le procédé permettant de rendre la ligature : /a`9/

b a 1794 17B6

:

{Rendu : :}

Le seul système qui permette de saisir du khmer Unicode actuellement est constitué de la police OpenType KhmerOS et du clavier Khmer Unicode237. Avec ce système, l’ordre de saisie clavier correspond à l’ordre de stockage en mémoire. Or, la présence de signes sans châsse peut interférer dans les informations que reçoit le système et la saisie de mots complexes peut paraître alambiquée.

Si nous reprenons l'exemple ke®nIÞg /j@msq?fl9M/ mentionné en 3.3.2.3, un utilisateur non familiarisé à Unicode voudra saisir (dans l'ordre graphique) :

k e ‹‹‹ ‹ r n I ‹‹‹ ‹ T g

U+1780 U+17C1 U+17D2 U+179A U+1793 U+17B8 U+17D2 U+1791 U+1784

{rendu : ek‹‹‹rn‹ ITg‹‹‹‹ }

Le résultat est très différent de ke®nIÞg que l’on souhaitait obtenir. En effet, le e antéposé sera associé au k et donc positionné à la gauche de celui-ci, tandis que les formes souscrites ne pourront s’afficher, le caractère coeng étant saisi après des voyelles (le caractère ‹‹‹ ‹ apparaît pour indiquer l’erreur). Comme nous l’avons mentionné (id.), la saisie correcte est la suivante :

237 Téléchargeables à l’adresse http://www.khmeros.info. De nombreuses informations et documents concernant le khmer Unicode sont disponibles sur ce site très complet. 147 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

k n ‹‹‹ ‹ T ‹‹‹ ‹ r eI g U+1780 U+1793 U+17D2 U+1791 U+17D2 U+179A U+17BE U+1784

k n Þ ® e I g

k e ® n Þ I g

(d'après BAUHAHN, 2002, p. 16)

{rendu : ke®nIÞg}

On voit l'extrême complexité de l'ensemble des opérations que le système doit réaliser238 :

239 − Transformation des consonnes de forme nominale r et T en formes souscrites ® et Þ,

− Repositionnement du glyphe ®,

− Décomposition de eI en e et I,

− Repositionnement de e (immédiatement à la gauche de ® ).

On notera notamment l'opération pour le moins déroutante qui consiste à devoir décomposer eI en e et I, alors même que les concepteurs d'Unicode insistent pour coder le caractère eI séparément. D’autant que cette voyelle n’est pas, rappelons-le, équivalente à la somme de ses composantes graphémiques e et I (supra).

D'une manière générale, on ne peut que constater le manque d'intuitivité du mode de saisie KhmerOS qui est en totale contradiction avec la façon d’écrire manuscrite. Pour cette raison, les concepteurs d'Unicode précisent que le système de saisie de l'écriture khmère doit faire l'objet d'une formation (UNICODE, 2004, p. 277). Nous avons mentionné le fait que les arguments avancés par certains experts pour cet encodage en ordre logique étaient de faciliter le tri, la recherche

238 Opérations auxquelles peuvent s’ajouter le rejet des saisies incorrectes, la correction automatique, etc. 239 Dans ce contexte, la consonne r souscrite prend la forme ®, à hampe plus allongée que le glyphe R habituellement employé. 148 Principes du Standard Unicode lexicographique et la reconnaissance vocale (supra, 3.3.2.3). On peut s’interroger sur la pertinence de ces priorités, dont l’une des contreparties est la nécessité d’un apprentissage complexe, au regard d’une population en lutte contre un illettrisme conséquent causé par les évènements tragiques de ces dernières décennies. Il est d’un autre côté possible qu’avec le temps les avantages techniques d’un tel système apparaîtront comme plus évidents. Il est néanmoins encore trop tôt aujourd’hui pour déterminer si ce système sera adopté ou rejeté par les utilisateurs khmérophones, ni combien de temps prendra une éventuelle assimilation qui demandera une remise en cause totale des habitudes acquises.

Nous mentionnerons la présence de consonnes utilisées uniquement pour la translittération du pali et du sanskrit. Ces consonnes sont mélangées aux autres dans la zone khmère, suivant l’ordre phonologique indien classique (179D LETTRE KHMÈRE SHA; 179E LETTRE KHMÈRE SSO ; 17A3 VOYELLE INDÉPENDANTE KHMÈRE QAQ; 17A4 VOYELLE INDÉPENDANTE KHMÈRE QAA).

Il est également prévu le rendu des ligatures spécifiques à l’écriture en lettres mèl.240 Des glyphes particuliers devront donc être intégrés dans les polices mèl.. Ainsi en est-il de la syllabe /uh/ à vi écrite vi en style jrieº mais (au lieu de ) en style mèl (UNICODE, 2004, p. 283). àTU Exemple : Saisie du mot /uhst9/ en caractères mèl.

v i T U U+179C U+17B7 U+1792 U+17BC

à T U àTU {Rendu : }241

Il convient de souligner que la spécificité des rendus relatifs à la notation en styles jrieº ou mèl se fait au niveau de la police et non du codage.

240 Sur le style d’écriture mèl, voir supra, 1.4.2. 241 Si l’utilisateur souhaite, pour un raison ou pour une autre, éviter la ligature, il saisira le caractère U+200C ZERO ANTI- v i LIANT SANS CHÂSSE entre le caractère et le caractère (UNICODE, 2004, p. 282). 149 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.3.3.7 Tibétain (0F00-0FFF)

L’écriture tibétaine a ce point commun avec l’écriture tham qu’elle transcrit tant la langue vernaculaire (en l’occurrence le tibétain) que la langue des textes religieux (le sanskrit).

Pour noter le sanskrit, l’écriture tibétaine a recours à des signes complémentaires pour transcrire les phonèmes inexistants en tibétain : les consonnes rétroflexes, intercalées parmi les autres consonnes, et des signes supplémentaires tels que les équivalents des caractères indiens visarga (U+0F7F  SIGNE TIBÉTAIN RNAM BCAD), candrabindu (U+0F83 : SIGNE TIBÉTAIN SNA LDAN), virama (U+0F84 : MARQUE TIBÉTAINE HALANTA), avagraha (U+0F85 : MARQUE TIBÉTAINE PALUTA), et anusvara (U+0F7E SIGNE TIBÉTAIN RJES SO NGA RO), équivalent du nikkhahit tham (supra, 2.3.1).

Il est intéressant de remarquer que, comme pour le tham mais cependant dans une moindre mesure, le système d’écriture tibétain (notamment le système de conjonction des consonnes) diffère selon que cette écriture note le vernaculaire ou le sanskrit. La spécificité de la notation du sanskrit réside dans la possibilité de combinaisons interdites en tibétain242.

On notera aussi la particularité des consonnes sanskrites composées gha, ¶ha, dha, bha, dzha : ces consonnes aspirées ne sont pas employées en tibétain mais sont affichables en subjoignant le caractère HA aux consonnes non aspirées correspondantes (un peu comme en lao où la consonne haute composée Hj /I;/ s’affiche avec la séquence U+0EAB H /g;/ U+0E8D j /I/, etc.). Cependant, Unicode préconise l’utilisation des caractères précomposés U+0F93 GHA SUBJOINT,

U+0F9D DDHA SUBJOINT, U+0FA2 DHA SUBJOINT, U+0FA7 BHA SUBJOINT, U+0FAC DZHA SUBJOINT,

U+0FB9 KSSA SUBJOINT, uniquement employés pour la notation du sanskrit « afin de réserver la cohérence des textes translittérés et de faciliter la transmission et la recherche » (UNICODE, 2003, p.

288). Les systèmes de mise en œuvre reconnaîtront les équivalences (U+0F43 LETTRE TIBÉTAINE

GHA ≡ U+0F42 LETTRE TIBÉTAINE GA U+0FB7 LETTRE TIBÉTAINE SUBJOINTE HA, etc.).

Règle d'empilement : Le système de souscription et de suscription de l'écriture tibétaine est assez particulier puisque, étant donné un caractère de base (« racine »), toute consonne de forme suscrite à ce caractère de base verra les lettres suivantes s'aligner à la suscrite. On parle alors de caractères empilés. Ainsi, le caractère « racine » se trouve en-dessous des autres consonnes.

242 En tibétain notant le vernaculaire, seules les consonnes ya, ra, la et wa peuvent être souscrites, et encore ne peuvent- elles l’être qu’en présence de certaines consonnes. Seules les consonnes ra, la et sa peuvent être suscrites (voir DORJE, TOURNADRE, 2002, p. 37-38). 150 Principes du Standard Unicode

Exemple : 

 consonne préfixe ba  consonne suscrite sa  consonne de base (« racine ») ga  signe voyelle suscrit i  forme souscrite de  ra  consonne suffixe ba  consonne post-suffixe sa (D'après UNICODE, 2003, p. 281)

On voit donc que, contrairement au tham ou au khmer, la consonne « racine »  devient souscrite à la ligne d'écriture, celle-ci étant alignée sur la consonne suscrite . Dans l'exemple ci- dessus, Unicode considérera la position géométrique des glyphes et non leur position structurelle (UNICODE, 2003, p. 282), ce qui implique que  qui doit alors s'afficher , est considérée comme forme subjointe alors que les autres lettres, suscrites structurellement (i.e. au regard des principes de l'écriture tibétaine), seront considérées comme des caractères de forme nominale. Mais le plus important est que « Unicode code deux formes des lettres-consonnes tibétaines : une forme de référence (pour les contextes de « tête » ou simples) et une forme subjointe (placée sous une forme de tête). Un caractère-racine peut donc être subjoint » (id., note 23). Ainsi les consonnes souscrites sont toutes codées (U+0F90 - U+0FBC). Cette méthode se substitue à l’emploi du caractère VIRAMA (ou à son équivalent théorique) habituellement adopté dans les écritures indiennes.

Deux raisons sont avancées dans les publications d'Unicode pour justifier ce codage des formes subjointes tibétaines, alors que celles-ci sont clairement des glyphes : d'une part le tibétain n’utilise pas de virŒma243, d'autre part la nécessité de réduire les besoins en mémoire, l’empilement des consonnes étant la règle fréquente244 (ibid., p 284). On notera d’ailleurs que ces formes subjointes ne sont codées chacune qu'une seule fois et que les formes différentes que peuvent prendre celles-ci en fonction du contexte relèvent de la police et du système d’exploitation. Par

243 On peut rétorquer que le khmer non plus. Précisons que le caractère rok-mé, équivalent tibétain du virama, n'est employé que pour la représentation du sanskrit. 244 On pourrait dire la même chose du tham (pas de virama, emploi systématique de formes subjointes). 151 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

245 exemple le caractère RA suscrit est codé sous la forme U+0F62  LETTRE TIBÉTAINE RA , alors même que ce caractère peut adopter différentes graphies en position suscrite.

3.3.3.8 Tai le (Dehong dai) (1950-197F)

L’écriture tai le, connue aussi sous l’appelation dehong dai ou tai neua, proviendrait d’un

« prototype originaire d’une forme ancienne de l’écriture birmane » (FERLUS, 1988, p. 10) qui a également donné les écritures shan (Birmanie), tai mau (Chine), ahom246 (région indienne de l’Assam) et khamti (région de l’Assam et Birmanie). Le tai le se distingue de ces dernières par des graphies plus anguleuses.

En écriture tai le, les signes-voyelles sont toujours positionnés à droite du signe consonantique, c’est-à-dire dans le sens de la lecture. Le tai le a fait l’objet d’une normalisation en 1954 qui a notamment ajouté des signes diacritiques pour la notation des tons (UNICODE, 2004, p. 284). Cette écriture a subi une nouvelle réforme en 1988 qui a ramené les tons sur la ligne d’écriture (id.).

− Avant la réforme de 1988, les 5 marques tonales étaient notées : ̈ ̌ ̀ ̇ ́ − Après la réforme de 1988, les 5 marques tonales sont notées : Exemple : u ku² (nouvelle écriture) 247, ǔ ku² (« ancienne » écriture). Associées aux voyelles a, i, , , et e, les marques tonales diacritiques d’avant la réforme viennent se placer à droite du signe vocalique.

Exemple : a ̌ ka² (la marque tonale ̌ est placée à droite de la voyelle a a).

Nous relèverons les points suivants : − En saisie, la consonne initiale précède la voyelle, la voyelle précède l’éventuelle consonne finale, et la marque tonale, le cas échant, est en fin de syllabe248. Il n’y a pas de signe-voyelle antéposé en tai le. − Les marques tonales ne sont codées qu’une seule fois. L’emploi du système d’écriture nouvellement réformé (tons notés sur la ligne d’écriture) ou anciennement réformé (tons

245 Rappelons que les consonnes tibétaines structurellement suscrites sont considérées par Unicode comme placées géométriquement sur la ligne d'écriture, adoptant donc leur forme « nominale ». 246 « Cette langue, disparue en tant que langue vivante depuis le XVIIe siècle, a été préservée dans la lecture des textes religieux » (FERLUS, 1988, p. 11). 247 Le signe diacritique ² indique la marque tonale. 248 « Initial consonants precede vowels, vowels precede final consonants, and tone marks, if any, follow the entire syllable » (UNICODE, 2004, p. 284). 152 Principes du Standard Unicode

notés par des signes diacritiques) dépend de la police. Dans le cas d’une police en « ancienne écriture » (i.e. le système en usage entre 1954 et 1988), le système de mise en œuvre devra réajuster les signes diacritiques en présence des voyelles a, i, , , et e (voir ci-dessus).

Exemple : Saisie du mot e tai²le6 (nouvelle écriture)

e

U+1956 U+196D U+1970 U+1958 196B U+1974

{Rendu : e}

Exemple : Saisie du mot ̈e ́ tai²le6 (« ancienne » écriture)

̈ e ́

U+1956 U+196D U+1970 U+1958 196B U+1974

̈ e ́

{Rendu : ̈e ́}

− La plupart du temps, les nombres tai le sont notés avec les cardinaux européens (chiffres arabes). Cependant les cardinaux birmans sont également employés, avec de légères variantes graphiques249(id.). Malgré ces différences spécifiques, les cardinaux dérivés des cardinaux birmans employés en tai le ne sont pas codés. Une police tai le Unicode devra donc intégrer les cardinaux birmans (U+1040-U+1049) et/ou arabes (U+0030-U+0039).

3.3.3.9 Quelques écritures proposées

M. Everson a soumis au consortium Unicode plusieurs écritures dérivant de la brahmi, dont certaines sont en cours d’examen250. Le tham ne fait pas partie de ces propositions mais des écritures très proches comme le tham Lanna ou le tai lü ont été soumises. En attente d’une approbation éventuelle du consortium pour l’intégration de ces écritures dans la prochaine version d’Unicode, nous pouvons déjà faire quelques observations relatives à ces propositions.

− Proposition de codage du « Lanna » : ce que M. Everson appelle « Lanna » est en réalité l’ancien tai lü (Chine, région des Sipsongpanna)251. Il est vrai que ces deux écritures sont

249 Dans une mesure comparable aux différences entre les cardinaux tham et lao (supra, 2.5.1). 250 Voir http://www.unicode.org/pending/pending.html. 251 L’analyse de M. Everson a en effet pour titre « Motion on the coding of the Old Xishuang Banna Dai Writing Entering into BMP of ISO/IEC 10646 ». 153 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

issues d’un même prototype et les différences qui les séparent relèvent davantage d’un style graphique que de structure (supra, 1.1.2). Nous ne débattrons pas ici la pertinence de l’assimilation de ces deux écritures à un codage unique, cela sortant du cadre de notre étude. M. Everson suggère de faire correspondre le « Lanna » avec l’encodage du birman, bien que les systèmes d’écriture et les répertoires phonologiques des deux langues soient distincts.

− Proposition de codage du « tai lue »252 (1980-19DF) Il s’agit ici de l’écriture tai lü réformée (réforme de 1986)253. L’idée était de préserver tous les caractères sur la ligne d’écriture, notamment les idiographèmes vocaliques et marques tonales qui auparavant pouvaient être souscrits ou suscrits254. Les consonnes finales ont également été ramenées sur la ligne d’écriture, mais voient leurs graphies modifiées en position finale. On sera surpris de constater que M. Everson propose de coder ces consonnes finales, arguant que celles-ci sont peu nombreuses et que le virŒma est inconnu dans cette écriture. Il s’agit pourtant bien de glyphes contextuels et non de caractères, et pour cette raison on pourrait sans doute imaginer un système de rendu motivé linguistiquement (par exemple l’utilisation d’une espace, avec ou sans châsse, à la suite de la consonne afin d’indiquer que celle-ci est finale).

Consonnes tai lü pouvant être en position finale

Consonnes initiales Consonnes finales

199D ! LETTRE TAI LUE VA 19B0 " LETTRE FINALE TAI LUE V

1987 # LETTRE TAI LUE NGA 19B1 $ LETTRE FINALE TAI LUE NG

1993 % LETTRE TAI LUE NA 19B2 & LETTRE FINALE TAI LUE N

1999 ' LETTRE TAI LUE MA 19B3 ( LETTRE FINALE TAI LUE M

1982 ) LETTRE TAI LUE KA 19B4 * LETTRE FINALE TAI LUE K

19A2 + LETTRE TAI LUE DA 19B5 , LETTRE FINALE TAI LUE D

19A4 - LETTRE TAI LUE BA 19B6 . LETTRE FINALE TAI LUE B

252 Orthographe anglo-saxonne pour « tai lü ». 253 « In order to hamper the cultural exchanges with the Dai abroad, the People’s Congress of the Xishuanbanna Dai A.P. decided to resume using the Old Dai Script on May 25th, 1986. Both the old and the New Dai Scripts are used now » (EVERSON, 1994). 254 Processus similaire à la réforme du tai le (supra, 3.3.3.8). Cette réforme n’est pas sans rappeler « l’invention » de l’écriture par Ramkhamheng qui visait à donner à Sukhothai une écriture propre en l’éloignant de son modèle indien, par la suppression notamment de tous les signes souscrits ou suscrits. Si la typographie n’était pas vraiment le souci à l’époque de Sukhothai, c’est la même idée de simplification de l’écriture que l’on retrouve dans la réforme de l’écriture tai lü. 154 Principes du Standard Unicode

− Les écritures brahmi, ahom, viet tai255, phake et khamti ont également été soumises, ces deux dernières étant traitées avec le codage de l’écriture birmane (U+1000-U+109F)256. Autrement dit, selon cette proposition, les caractères phake et khamti ne seraient pas codés indépendamment mais seraient assimilés aux caractères birmans équivalents. Les différences se feraient donc au niveau de la police qui afficherait des glyphes khamti ou phake à la place des glyphes birmans. Le système de mise en œuvre devra considérer cette police comme du birman puisque qu’il recevra les codes attribués aux caractères de cette écriture.

3.3.3.10 Bilan sur Unicode

Après avoir sommairement décrit un certain nombre d’écritures dérivant de la brahmi et leur traitement par Unicode, nous pouvons relever entre celles-ci des points communs et des divergences :

- Les consonnes, sauf pour le tibétain, ne sont codées qu’une seule fois et sont des caractères. Les formes dérivées de la forme de base que celles-ci peuvent prendre (souscrite, suscrite, etc.) sont affichées par des correspondances glyphe-contexte prises en compte par le système de mise en œuvre. - Dans presque toutes ces écritures, l’ordre de codage des caractères consonantiques suit l’ordre alphabétique indien, en procédant à des réaménagements pour les consonnes indiennes absentes des répertoires vernaculaires ou au contraire spécifiques à ces répertoires. - Le traitement des signes-voyelles divergent : le « modèle indien » (devanagari, tamoul, khmer, etc.) suit à la lettre les principes d’Unicode en codant les voyelles en tant que phonèmes, ou reconnus comme tels dans les règles descriptives de ces langues. C’est ainsi que les voyelles composées de plusieurs idiographèmes (et quelles que soient leurs positions par rapport au signe consonantique) sont codées indépendamment, chacune d’entre elles représentant un caractère unique (avec, sauf pour le khmer, des équivalences). Nous avons vu que ce système respectait les principes d’Unicode mais pouvait présenter des difficultés de mise en œuvre et d’utilisation (le khmer en particulier). À l’inverse, le « modèle thaï- lao », mis sur pied avant l’intégration de ces écritures dans Unicode, suit un système local (norme TIS 620) qui code les idiographèmes vocaliques (en tant que caractères de base) et

255 Ce que M. Everson appelle viet tai est une unification des écritures tai dam, tai don, tai deng et tai song dont les locuteurs sont répartis majoritairement au nord du Laos, au Nord-ouest du Vietnam et dans quelques régions de la Thaïlande. 256 Cf. http://www.unicode.org/pending/pending.html. 155 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

non les signes-voyelles dans leur intégralité. Les caractères vocaliques sont donc des signes visibles et non plus des sons, et par conséquent les voyelles composées de plusieurs idiographèmes sont rendues par l’intermédiaire de plusieurs caractères. Ce système déroge aux principes d’Unicode, mais offre des avantages pratiques. - L’ordre de stockage en mémoire diverge également. La plupart des écritures décrites codent en mémoire les caractères vocaliques après la consonne, y compris les signes antéposés. Le thaï et le lao font exception, puisque les idiographèmes vocaliques sont saisis dans un ordre purement graphique.

Tableau récapitulatif

Classement des Consonnes Stockage en Voyelles non Caractères Écriture Cardinaux consonnes subjointes mémoire connexes équivalents devanagari indien non codées phonétique _ _ codés tamoule indien non codées phonétique codées oui codés

indien thaï non codées graphique non codées _ codés aménagé

indien lao non codées graphique non codées _ codés aménagé

257 birmane indien non codées phonétique non codées _ codés khmère indien non codées phonétique codées non codés

indien tibétaine codées phonétique codées oui codés aménagé

graphique = tai le spécifique non codées _ _ non codés phonétique

257 Le birman Unicode reconnaît en fait un cas d’équivalence, celui de la voyelle indépendante /u:/ : 1026 ÈDLETTRE BIRMANE UU ≡ 1025 È LETTRE BIRMANE U + D 102E VOYELLE BIRMANE II. Mais comme ce cas est isolé et que les voyelles non connexes birmanes ne sont pas codées, nous n’en avons pas tenu compte dans ce tableau récapitulatif. 156 Principes du Standard Unicode

On ne peut donc que constater l’hétérogénéité du traitement « Unicode » des écritures dérivant de la brahmi. Certaines particularités sont propres à chaque écriture : par exemple le fait que les souscrites tibétaines soient codées est motivé par la structure originale de l’écriture tibétaine et de ses lettres empilées. L’aspect le plus important de cette hétérogénéité réside dans le traitement des voyelles, avec un « modèle indien » (stockage en mémoire selon l’ordre phonétique et codage des voyelles non connexes) et un « modèle thaï-lao » (stockage selon l’ordre graphique et codage des seuls idiographèmes vocaliques). L’écriture birmane est à cheval entre ces deux modèles car les signes antéposés birmans sont stockés en ordre logique (« modèle indien ») mais les voyelles non connexes birmanes ne sont pas codées (« modèle thaï-lao »).

L’un ou l’autre de ces deux modèles pourrait a priori convenir pour le tham puisque d’une part cette écriture note le pali qui est une langue indienne, et d’autre part note la langue lao. Il n’apparaît alors pas évident de choisir sans hésitation l’un ou l’autre des deux modèles décrits précédemment qui, rappelons-le, offrent chacun des avantages et inconvénients au regard notamment de la stucture des langues qu’ils traitent.

Nous avons pu aussi remarquer la complexité pratique relatives à l’application des principes théoriques d’Unicode : à notre connaissance, et après des années de travaux impliquant des dizaines de linguistes et d’informaticiens, il n’existe aujourd’hui comme polices khmères Unicode que celles émanant de KhmerOS. Et encore, cette famille de polices ne marche correctement qu’avec certains systèmes (Windows XP) et certaines versions d’Uniscribe (1.473 4067) tandis qu’une utilisation avec Word 2003, pourtant la dernière version de ce traitement de texte à l’heure de l’écriture de ces lignes, est problématique du fait que Word 2003 intègre son propore moteur d’affichage qui court- circuite l’Uniscribe du sytème258. Que se passera-t-il si le tibétain Unicode par exemple, ne fonctionne qu’avec une autre version d’Uniscribe et le birman avec une troisième ? Faudra-t-il plusieurs ordinateurs, chacun configuré spécifiquement, pour saisir des textes multilingues ? Enfin, et ceci n’est pas le moindre des problèmes, KhmerOS n’est utilisable qu’avec certains logiciels (dont Word) à l’exclusion de certains autres (Excel, Xpress, etc.).

Quant à la « voie moyenne » empruntée par le birman Unicode, elle ne semble guère pour le moment donner plus de satisfaction que le khmer259, puisqu’à ce jour aucun système complet de

258 Il est donc nécessaire de remplacer le fichier Uniscribe du système par la version compatible KhmerOS. 259 « Although character codes for Myanmar Languages has been allocated in UCS/Unicode (U+1000-U+109F), lack of implementation makes unavailable to local end users. Much effort had been made to develop Myanmar character codes and fonts by many international experts and local experts » (KO KO, YOSHIKI, 2005, p. 9).

157 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM saisie du birman Unicode pour Windows n’est disponible. En revanche, les polices Unicode thaï et lao, traitées plus simplement, donnent satisfaction (même si le fait que les systèmes d’écritures de ces deux langues soient moins complexes que celui du khmer explique en partie ce phénomène). Cependant ces exceptions, encore aujourd’hui, n’ont guère les faveurs d’Unicode, pour les raisons déjà évoquées que des fonctions complexes telles le tri, la recherche lexicographique ou la reconnaissance vocale sont considérablement facilitées par un traitement en ordre logique.

Considérant les différentes options qui viennent d’être passées en revue, nous allons donc tenter de proposer un codage de l’écriture tham, en argumentant au fur et à mesure en faveur des choix que nous avons choisis de privilégier.

158 Proposition de codage de l’écriture tham

3.4 PROPOSITION DE CODAGE DE L’ÉCRITURE THAM

3.4.1 Pour un codage Unicode de l’écriture tham

En envisageant un traitement de l’écriture tham selon les règles d’Unicode, la première question qui vient à l’esprit est : est-il nécessaire d’intégrer le tham à Unicode ? Autrement dit, doit- on créer une « zone tham » ? Ne pourrait-on pas plutôt utiliser une zone déjà attribuée, comme par exemple celle du lao, ou d’une écriture indienne comme la devanagari ? Nous avons vu par exemple que M. Everson avait proposé que des écritures comme le phake ou le khamti soient considérées, techniquement parlant, comme du birman (supra, 3.3.3.9), le codage des caractères se faisant selon celui des caractères birmans équivalents. Seuls les glyphes présents dans la police feraient la différence.

Le système de rendu du khmer pourrait en effet, en premier analyse, convenir au tham : d’une part le répertoire consonantique du khmer, basé sur une classification indienne en cinq vagga (supra, 2.3.1), trouve une correspondance en tham260, d’autre part les deux écritures font usage de consonnes subjointes lorsque la précédente est dévoyellée. Enfn, l’absence de virama explicite les distingue des écritures de l’Inde. L’idée serait alors de « faire passer » une police tham pour une police khmère. Les glyphes tham remplaceraient simplement les glyphes khmers équivalents :

1780 k LETTRE KHMÈRE KA

1781 K LETTRE KHMÈRE KHA

1782 g LETTRE KHMÈRE KO

1783 G LETTRE KHMÈRE KHO

1784 x LETTRE KHMÈRE NGO

1785 c LETTRE KHMÈRE CA

1786 C LETTRE KHMÈRE CHA

1787 j LETTRE KHMÈRE CO

1788 J LETTRE KHMÈRE CHO

1789 X LETTRE KHMÈRE NYO etc.

260 Nous parlons bien d’une correpondance étymologique entre les consonnes des deux écritures et leur classement, et non de correspondance de valeurs phonétiques. 159 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

L’ensemble des caractères tham étant en nombre inférieur aux caractères khmers, la totalité des signes tham pourrait aisément tenir dans la zone Unicode du khmer. Les caractères khmers qui n’ont pas d’équivalence en tham ne seraient tout simplement pas intégrés dans la police. En ce qui concerne le rendu des formes subjointes, on procèderait de même en « faisant croire » au système de mise en œuvre que c’est du khmer qui est saisi.

Exemple : rendu en khmer du groupe consonantique bø /ok@9/

b ‹ l 1794 17D2 179B

b ø

{Rendu : bø }

Si, dans la police, nous remplaçons les glyphes khmers b /o/, l /k/ et ø /k/ par les glyphes tham étymologiquement équivalent p, l et ¤, nous obtiendrons :

p ‹ l

1785 17D2 179A

p ¤

{Rendu : p¤} pla

Le caractère 17D2 SIGNE KHMER COENG serait donc employé, à l’instar du khmer, pour rendre les formes subjointes.

Cette option de ne pas coder le tham et de l’assimiler à une autre écriture Unicode ne nous semble néanmoins pas satisfaisante, et ce pour plusieurs raisons. − Un certain nombre d’écritures (notamment les écritures d’origine indienne) présentant beaucoup de points communs entre elles sont traitées indépendamment (tamoul, malayalam, bengali, gourmoukhi, etc.). De plus, des écritures tout aussi peu répandues quantitativement ont une zone Unicode (le tai le par exemple, mais aussi le tagalog ou le buhid). De toute manière, il ne nous semble pas tolérable de faire des compromis dans le traitement d’une écriture sous prétexte que celle-ci est « minoritaire ». Il n’y a pas de

160 Proposition de codage de l’écriture tham

raison de priver le tham d’une zone qui lui soit propre, si ce n’est de façon temporaire pour pallier les carences actuelles des systèmes d’exploitation (dont Windows) pour supporter le tham (supra, 3.3.1). − L’écriture tham possède des propriétés propres qui la distinguent des autres écritures. Si des similitudes apparaissent comme évidentes entre le tham et des écritures ayant leur propre zone Unicode (par exemple les consonnes pour le khmer, comme nous venons de le voir), il sera impossible de trouver une écriture correspondant à tous niveaux au tham (des divergences importantes sont manifestes en ce qui concerne les voyelles khmères et tham261, et aussi dans les ligatures). − L’écriture tham fonctionne avec deux systèmes d’écriture qui présentent de fortes divergences : écriture « alphasyllabique » pour le p-tham, alphabétique pour le l-tham, caractères spécifiques à chacun des systèmes, etc. (supra, 2). Il n’est donc pas envisageable de se baser sur une écriture figurant déjà dans Unicode, puisque quand bien même le système de rendu d’une écriture « Unicode » pourrait afficher correctement le tham, il ne pourrait le faire que pour l’un des deux sous-systèmes (p-tham ou l-tham). Ainsi l’exemple du groupe consonantique pla ci-dessus fonctionnerait pour le p-tham mais pas pour le l-

tham : la syllabe pla effectivement écrite p¤ en p-tham, s’écrit p€aen l-tham. Avec le système de rendu du khmer, il sera impossible de faire la distinction entre les deux systèmes, à moins de réaliser deux polices comportant des glyphes distincts (voir les graphies particulières des consonnes finales l-tham au chapitre 2.4.3). Nous verrons que cette option n’est pas satisfaisante. − Les règles de graphotaxe p-tham et l-tham divergent. Il apparaîtra alors un problème de logique purement linguistique : le caractère coeng indique une dévoyellement de la consonne précédente. Or en l-tham, c’est la finale (donc « dévoyellée ») qui est subjointe (supra, 2.4.4). L’utilisation du caractère coeng perd donc sa logique linguistique. Cet aspect pourra sembler mineur pour les utilisateurs peu soucieux de logique linguistique mais mérite d’être souligné.

Pour ces raisons, et en rappelant l’importance de la place que tient l’écriture tham dans la culture du Laos, nous pensons nécessaire d’envisager la pleine intégration du tham à Unicode. La zone tham Unicode devra s’inspirer de celle des écritures indiennes (puisque le tham en dérive) et d’Asie du Sud-Est (puisque cette écriture transcrit aussi le lao). Un système de rendu spécifique à la notation des deux langues que transcrit le tham doit également être étudié.

261 Inversement, une écriture ayant un système de notation des voyelles applicable au tham (le lao par exemple) divergera sur d’autres points (dans le cas du lao, le système de conjonction de consonnes). 161 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.4.2 Zone d’usage privé (E000-F8FF)

Si à chaque écriture prise en compte par Unicode une zone de codes spécifique est attribuée, « le standard prévoit cependant entre E000 et F8FF une zone de 6400 codes destinés à l’usage privé. Cette réservation est définitive et la zone d’usage privé peut être utilisée de façon durable pour les systèmes d’écriture mal ou non pris en compte par Unicode. Un mécanisme d’intégration au Standard est d’ailleurs possible lorsque l’usage d’un code privé est devenu suffisamment répandu »

(BERMENT, 2004, p. 47). Il est donc possible de placer les caractères tham dans cette zone d’usage privé et d’en proposer l’intégration au Consortium Unicode.

Nous reprendrons la proposition d’affectation déjà imaginée par V. Berment (ibid., p. 153) qui attribue aux caractères tham la plage F000-F0FF. Nous réduirons cependant l’étendue de cette plage à F000-F07F, qui correspond davantage au nombre de caractères nécessaire au codage de l’écriture tham. Une grande partie des caractères tham étant communs au p-tham et au l-tham, et par le fait de l’utilisation conjointe des deux langues (pali et lao) dans un même texte (dont les nissaya évoqués au chapitre 1.1), nous avons envisagé une zone de code commune pour les deux écritures p-tham et l-tham. Par contre, des registres séparent les signes spécifiquement l-tham des autres caractères.

Lorsqu’un caractère est employé dans les deux langues, le nom de ce caractère suit la prononciation du pali. Nous écrirons par exemple kLETTRE THAM KA et non k LETTRE THAM KO. En revanche, les caractères spécifiquement l-tham seront nommés suivant la terminologie Unicode pour les caractères de la zone lao (par exemple çLETTRE THAM O).

3.4.3 Consonnes (F000-F01F)

Le premier registre comprend l'ensemble des consonnes tham pour la notation du pali, sachant qu'un grand nombre d'entre elles est également employé pour la notation du lao (infra, 2.4). Les consonnes sont ordonnées selon l’ordre le système de classement indien (infra, 2.3.1).

162 Proposition de codage de l’écriture tham

Consonnes tham

F000 k LETTRE THAM KA

F001 K LETTRE THAM KHA

F002 g LETTRE THAM GA

F003 G LETTRE THAM GHA

F004 x LETTRE THAM NGA

F005 c LETTRE THAM CA

F006 C LETTRE THAM CHA

F007 j LETTRE THAM JA

F008 J LETTRE THAM JHA

F009 X LETTRE THAM NYA

262 F00A q LETTRE THAM TTA

F00B Q LETTRE THAM TTHA

F00C z LETTRE THAM DDA

F00D Z LETTRE THAM DDHA

F00E N LETTRE THAM NNA

F00F t LETTRE THAM TA

F010 T LETTRE THAM THA

F011 d LETTRE THAM DA

F012 D LETTRE THAM DHA

F013 n LETTRE THAM NA

F014 p LETTRE THAM PA

F015 P LETTRE THAM PHA

F016 b LETTRE THAM BA

262 Dans la terminologie Unicode, les rétroflexes sont notées par un dédoublement de la consonne notant la dentale correspondante. 163 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

F017 B LETTRE THAM BHA

F018 m LETTRE THAM MA

F019 y LETTRE THAM YA

F01A r LETTRE THAM RA

F01B l LETTRE THAM LA

F01C v LETTRE THAM VA

F01D S LETTRE THAM SA

F01E H LETTRE THAM HA

F01F L LETTRE THAM LLA

Conformément aux principes d’Unicode, seuls les caractères abstraits sont codés, à l’exclusion des formes subjointes des consonnes qui sont réalisées à l’affichage par des glyphes (supra, 3.3.2.1) calculés à partir des caractères abstraits et du contexte. Nous verrons ultérieurement comment ces glyphes pourront être affichés (infra, 3.5).

3.4.4 Signe divers (F020)

En tant que signe diacritique, le nikkhahit est placé dans un registre particulier. Considéré comme consonne (supra, 2.3.1), il est naturel qu'il apparaisse à la suite des précédentes.

F020 ° SIGNE THAM NIKKHAHIT

3.4.5 Consonnes seules spécifiques à la notation du lao (F021-F026)

Ce registre comprend les caractères consonnantiques non composés spécifiques au l-tham (infra, 2.4.1).

164 Proposition de codage de l’écriture tham

Consonnes spécifiques l-tham

F021 w LETTRE L-THAM BO

F022 F LETTRE L-THAM FO SUNG

F023 f LETTRE L-THAM FO TAM

F024 Y LETTRE L-THAM YO

F025 h LETTRE L-THAM HO TAM

F026 ç LETTRE L-THAM O

3.4.6 Consonnes composées spécifiques à la notation du lao

Nous avons vu (supra, 2.4.1) que l’écriture l-tham comportait six consonnes composées, celles-ci faisant parties des consonnes hautes lao :

$£MW RV

M; m; l; I; k; u;

Pour ce qui est de l'écriture lao, Unicode ne retient comme caractère parmi les consonnes composées que les consonnes N (U+0EDC) et M (U+0EDD) nommées alors ligatures (supra, 3.3.3.4.). Le signe diacritique ຼ est également codé (U+0EBC) indépendamment.

Les consonnes composées sont, dans les théories descriptives de la langue lao, ambivalentes, puisque celles-ci sont considérées d’une part comme consonnes hautes à part entière (ce qui tendrait à les considérer comme caractères), et d’autre part comme groupes consonantiques associatifs (ce qui impliquerait de les voir davantage comme séquences de caractères).

Nous pouvons par exemple considérer la consonne l-tham M /l;/ sous deux angles :

F0XX M LETTRE L-THAM HO MO

ou

M ≡ F01E H(LETTRE THAM HA) + ; (forme subjointe de la F018 LETTRE THAM MA)

165 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Dans la première option, M est considérée comme consonne à part entière et est codée indépendamment (F0XX). Dans la seconde, elle est considérée comme équivalente à la juxtaposition 263 des deux caractères H et ; (forme subjointe de m /l/). La première option aurait cependant l’inconvénient de provoquer une confusion entre la consonne haute l-tham M /l;/ et la séquence H /g/ + ; /l`/, car rien n’empêcherait un utilisateur de saisir [H+ ]; plutôt que [M]. On aurait ainsi deux manière possibles de saisir cette consonne et cela conduirait à des confusions, non seulement à la saisie mais aussi dans la reconnaissance automatique de caractères ou de syllabes. Inversement, les mots p-tham composés de [H + ]; pourraient être saisis avec [M] ce qui serait incorrect puisque la consonne haute composée M /l;/ n’existe pas en p-tham. Ainsi le mot ÔbM brahma est composé des deux syllabes ÔbH brah et ;ma. Si on saisit M au lieu de [H + ],; il sera impossible de séparer correctement le mot en ses deux syllabes. On aurait au lieu de cela les deux syllabes Ôb bra et M hma, ce qui est incorrect.

Pour éviter ces confusions, nous préférons la deuxième option où les consonnes l-tham hautes composées seront donc considérées comme groupes consonantiques associatifs et seront saisies par l’intermédiaire des séquences de caractères graphiquement équivalentes :

F01E H+ ~ → $

F01E H+ * → £

F01E H+ ; → M

F01E H+ = → W

F01E H+ ¤ → R

F01E H+ + → V

263 Nous verrons (infra, 3.5) comment afficher les formes subjointes. 166 Proposition de codage de l’écriture tham

3.4.7 Voyelles indépendantes pali (F027-F02C)

À l'instar des écritures qui possèdent des voyelles indépendantes (devanagari, khmère, birmane, etc.), nous proposons de coder les voyelles indépendantes p-tham dans un registre particulier (F027-F02C).

Cependant, afin d’éviter des redondances, nous n’avons pas codé les voyelles indépendantes dont les glyphes étaient identiques à la forme nominale de caractères déjà codés. Ainsi la voyelle p- tham indépendante a est notée avec un glyphe identique à la consonne l-tham />/ (F026 LETTRE L- THAM O), à savoir Á. De même, la voyelle indépendante p-tham ä Œ est graphiquement

264 équivalente à Á + A (F020 LETTRE L-THAM O + F02D SIGNE VOCALIQUE THAM AA ). Ces deux voyelles indépendantes ne seront donc pas codées. Ce parti pris déroge aux recommandations d’Unicode qui stipule que plusieurs caractères codés peuvent avoir des glyphes équivalents (supra, 3.3.2.1). Mais l’expérience d’utilisation de la police ThamStandard et du clavier ThamFrance a montré qu’un utilisateur raisonne plutôt en terme de graphie et non de « caractère abstrait ». Si plusieurs touches permettent de saisir le signe Á, des confusions sont inévitables car l’utilisateur ne pensera pas forcément à distinguer la consonne l-tham Á />/ de la voyelle indépendante Á /`/ (ou de la voyelle l-thamÁ /N9/) mais voudra simplement afficher le glyphe Á.

Par contre, la voyelle indépendante ï ´ est codée car si sa représentation graphique est similaire dans le manuel de Phouy à la juxtaposition de la voyelle indépendante î i et de la voyelle l-tham Ö /ni/, la voyelle ´ peut prendre d’autres formes selon les textes (par exemple þou encore

265 ÷ ). Cette voyelle doit donc pouvoir être perçue comme caractère séparé.

Nous avons également pris le parti de coder la voyelle indépendante ¯ dont la graphie ô correspond certes graphiquement à la juxtaposition des glyphes Ô (r r subjoint) et ç. Mais là 266 aussi cette voyelle peut prendre d’autres formes telles ø ou ý .

Les voyelles indépendantes tham codées sont donc les suivantes :

264 Cf. chapitre suivant. 265 Cf. IRC, 1990b, p.150 et GABAUDE, 1979, p.[89]. 266 Cf. note précédente. 167 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Voyelles indépendantes p-tham

F027 î VOYELLE INDÉPENDANTE THAM I

F028 ïVOYELLE INDÉPENDANTE THAM II

F029 û VOYELLE INDÉPENDANTE THAM U

F02A ü VOYELLE INDÉPENDANTE THAM UU

F02B é VOYELLE INDÉPENDANTE THAM E

F02C ôTHAM INDÉPENDANT VOWEL O

3.4.8 Idiographèmes vocaliques (F02D-F041)

Les signes vocaliques communs au p-tham et au l-tham figurent dans le registre Idiographèmes vocaliques, tandis que les signes vocaliques spécifiques au l-tham sont regroupés dans un autre registre que nous appelerons Idiographèmes vocaliques spécifiques l-tham.

La variante Ä (CALvg /`9kv`;M/) du signe A, commune au p-tham et au l-tham, est codée à la suite des autres signes vocaliques.

Idiographèmes vocaliques

F02D A SIGNE VOCALIQUE THAM AA

F02E i SIGNE VOCALIQUE THAM I

F02F I SIGNE VOCALIQUE THAM II

F030 u SIGNE VOCALIQUE THAM U

F031 U SIGNE VOCALIQUE THAM UU

F032 e SIGNE VOCALIQUE THAM E

168 Proposition de codage de l’écriture tham

Idiographèmes vocaliques spécifiques l-tham

F033 a SIGNE VOCALIQUE L-THAM A

F034 ù SIGNE VOCALIQUE L-THAM Y

F035 % SIGNE VOCALIQUE L-THAM YY

F036 E SIGNE VOCALIQUE L-THAM EI

F037 o SIGNE VOCALIQUE L-THAM O

F038 O SIGNE VOCALIQUE L-THAM AU

F039 < SIGNE VOCALIQUE L-THAM AI

F03A > SIGNE VOCALIQUE L-THAM AE

F03B ^ SIGNE VOCALIQUE L-THAM AO

F03C \ SIGNE VOCALIQUE L-THAM AM

F03D Ö SIGNE VOCALIQUE L-THAM OY

F03E à SIGNE VOCALIQUE L-THAM MAI KAN

F03F è SIGNE VOCALIQUE L-THAM MAI KONG

F040 ê SIGNE VOCALIQUE L-THAM MAI EI

Idiographème vocalique

F041 Ä SIGNE VOCALIQUE THAM AA LOUANG

Les voyelles tham se composent d'un ou plusieurs idiographèmes qui, placés au-dessus, en dessous, à droite, à gauche ou de part et d'autre de la consonne, forment la voyelle (supra 2.3.3 et 2.4.2). Pour le codage des voyelles, nous avons donc à notre disposition un « modèle indien » qui code les voyelles en tant qu’unités phonologiques, et un « modèle thaï-lao » qui code non les voyelles mais les idiographèmes vocaliques permettant de les composer graphiquement (supra, 3.3.3.10).

Considérons pour le moment ce que donnerait l’application du « modèle indien » à l’écriture tham. Si l’on prend par exemple la disyllabe p-tham nieÔgA nigro, qui comprend une consonne

169 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM subjointe antéposée (Ô r) et une voyelle non connexe (eA o), on constate que la disposition des lettres ne correspond pas à l’ordre de lecture :

1ère syllabe, nig

2e syllabe, ro

i Représentation en translittération : n (o) r g (o)

Dans cet exemple, le premier idiographème vocalique (e, ici partie de la voyelle eA o) de la deuxième syllabe (ro) est placé avant la consonne finale (g g) de la première syllabe (nig).

Visuellement, les deux syllabes sont par conséquent entrevêchées et chacune d’elle ne forme pas un groupement connexe. Pour rendre cette disyllabe selon le « modèle indien », il s’agit de déterminer comment positionner les idiographèmes qui composent la voyelle eA o par rapport à la forme subjointe Ô r (par exemple en évitant d’avoir niÔegAou niegÔA).

En ordre logique, les caractères seront stockés en mémoire de la manière suivante :

n i g TTV r eA

n i g Ô e A

n i e Ô g A

{Rendu : nieÔgA}

170 Proposition de codage de l’écriture tham

Les opérations qui devront être réalisées par le système sont :

! Transformation de TTV + r en Ô, ! Permutation de gÔen Ôg, ! Décomposition de eA en e et A, ! Placement de e avant Ô.

L’ordre logique demande donc, tout comme en khmer, une implémentation complexe prévoyant tous les cas nécessaires de repositionnement.

Si l’ordre de saisie suit l’ordre de stockage en mémoire, ce qui sera vraisemblablement le cas si l’on ne veut pas aboutir à un système d’une lourdeur démesurée (cf. supra, 3.3.2.3), on peut souligner là encore le manque d’intuitivité de ce mode de saisie, puisque l’utilisateur aura à penser à comment le mot est prononcé et non à comment il est écrit. Les utilisateurs non familiers de cette écriture mais qui souhaiteraient néanmoins saisir du tham (étudiants, novices, copistes pour des publications, etc.) auront bien des difficultés à saisir du texte tham en ordre logique.

Pour cette raison, nous pensons préférable que le principe de codage des voyelles tham suive le « modèle thaï-lao » plutôt que le « modèle indien ». D’autres arguments peuvent également être avancés :

− Le système adopté pour le khmer, qui code effectivement toutes les voyelles, y compris les voyelles non connexes, n’a pu aboutir qu’après des années de travail effectué par des dizaines de linguistes et d’informaticiens. Mais l’écriture tham, qui n’est pas l’écriture de l’administration ni celle de la vie quotidienne, ne bénéficiera pas des moyens humains ni financiers mis à disposition pour mettre en place le « khmer Unicode »,

− Ce système répond grosso modo à la méthode d’écriture manuscrite,

− Les problèmes de tri et de reconnaissance vocale, arguments-phares d’Unicode en faveur de l’ordre logique (supra, 3.3.2.3), sont a priori à mille lieues des préoccupations des utilisateurs potentiels des polices tham qui seront majoritairement des moines, étudiants et éditeurs, le tham n’étant pas une écriture de communication,

− Le système d’écriture l-tham est proche du système d’écriture lao (les deux systèmes notent de plus la même langue), et les graphies des voyelles tham (tant p-tham que l-tham) et lao sont pour la plupart similaires. Avec un système de codage de type « thaï-lao », les

171 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

utilisateurs familiarisés avec le « lao Unicode » n’auront pas de difficulté à passer au « tham Unicode ».

− Les Laotiens et les Thaïlandais267 ont déjà leur système de codage en usage pour leurs écritures courantes (supra, 3.3.3.3 et 3.3.3.4). Il ne semblerait pas très cohérent d’adopter un système radicalement différent (et plus complexe) pour une écriture dite secondaire.

Ainsi par exemple la voyelle brève l-tham ea /d/, dont la graphie est circonscrite à la consonne, ne sera pas codée indépendamment mais devra être stockée en mémoire de la manière suivante (et comme en « lao Unicode ») :

e C a et non

C ea

Autres exemples : eyAa /iN/ sera saisi

eyAa

et non

y eAa

ehI/g?9/ sera saisi

e h I et non

h e I

267 Rappelons que le tham est également employé dans le Nord-Est de la Thaïlande (supra, 1.2.1). 172 Proposition de codage de l’écriture tham

De la même manière, les signes à (mai kan) et è (mai kong) seront codés, à l'instar de ce qui a été fait pour l'écriture lao (supra, 3.3.3.4). En effet, ces idiographèmes ont plusieurs fonctions

: ils notent respectivement les voyelles /`/ et /n/ interconsonantiques et, associés à d'autres idiographèmes, permettent de représenter d’autres voyelles. Exemples : kà* /j`m/ ebà=a /ai`/

gè* /jçnm/ ekèA /j`n/

Quelques cas méritent une attention particulière :

− La voyelle \ /`l/, bien que non connexe, se voit attribuée un code (F03C). La raison de cette exception se trouve dans la volonté d'une correspondance avec le lao qui code la voyelle lao équivalente Z /`l/ (U+0EB3). La voyelle tham \ /`l/ est composée

graphiquement des idiographèmes A (qui note par ailleurs le phonème vocalique /`9/) et ° (qui, associé seul à une consonne, note soit le nikkhahit soit la voyelle /N9/). Il est donc indispensable, pour la reconnaissance ou le tri lexicographique, de reconnaître l’équivalence suivante268 :

F02D + F020 ° ≡ F03C \ Pour noter le phonème vocalique /n/ (bref et long)

en l-tham, on emploie l'idiographème o:

oa/n/ Exemple : ota/sn/ o /n9/ Exemple : ok/jn9/

Par contre en p-tham (où la voyelle ¯ est toujours longue269), on emploie les deux

idiographèmes eet Acirconscrits à la consonne :

eA/n9/ Exemple :eSA/rn9/

268 Pour le cas du lao Unicode, la voyelle ຳ /am/ est automatiquement décomposée en les deux caractères ໍ et າ /`9/ afin notamment de repositionner de manière plus harmonieuse le nikkhahit ໍ en présence d’un accent. Ainsi on obtient k&Z et non k&OA. Mais en tham le problème ne se pose pas puisque le signe ໍ de la voyelle /am/ se place juste au-dessus du signe A /`9/ de cette manière : , évitant ainsi les problèmes d’ordre dans le rendu.

269 Sauf devant deux consonnes (supra, 2.3.3). 173 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

− La voyelle l-tham /N9/ est représentée de trois manières différentes, à savoir °, O ou Á selon le contexte : (1) Y° /iN9/

(2) nOz /mNÌ9s/

(3) Rç~ /kN;9M/

Si l’on suivait le « modèle indien », la voyelle /N9/, malgré ces trois formes possibles, ne devrait être codée qu’une seule fois et le moteur d’affichage devrait afficher le glyphe adéquat selon le contexte ; cela nécessiterait une implémentation d’algorithmes complexes. Mais raisonnant avec une logique graphique, on observe que les glyphes employés pour noter ces graphies se retrouvent pour transcrire d’autres phonèmes. Ainsi le signe ° est

employé en p-tham pour noter le nikkhahit (F020) tandis qu’on retrouve le glyphe ç pour noter la voyelle indépendante a et la consonne l-tham />/ (F026). Nous choisissons alors de 270 coder le signe vocalique O qui permet d’afficher la variante (2) tandis que pour saisir les variantes (1) et (3), nous utiliserons respectivement les caractères F020 ° SIGNE THAM

NIKKHAHIT et F026 ç LETTRE THAM LAO O. Ainsi en saisie :

(1) Y ° F024 F020

{Rendu : Y°} (2) n O z F013 F038 F00C

{Rendu : nOz} (3) 271 R ç ~272 F026

{Rendu : Rç~}

270 On remarquera que ce glyphe est aussi employé pour noter la forme subjointe de la consonne j j. Le cas des consonnes subjointes sera néanmoins traité séparément (cf. infra, 3.5). 271 Pour le rendu des consonnes composées (groupes consonantiques associatifs), cf. supra, 3.4.6. 272 Forme subjointe de x º . Pour le rendu des subjointes, cf. infra, 3.5.3.

174 Proposition de codage de l’écriture tham

Bien entendu, un problème pourra de nouveau se poser lors d'un tri, d’une selection ou d’une reconnaissance lexicographique (dans l'exemple (1) le système reconnaîtra un nikkhahit et non la voyelle /N9/, et dans l’exemple (3) la consonne l-tham />/ au lieu de /N9/). Cependant ce système permet un rendu correct de ces voyelles, et c'est ce qui nous importe pour l'instant (un système de mise en œuvre basé sur un dictionnaire électronique pourra par exemple être réalisé ultérieurement). On notera que ce signe vocalique permet également, par association

à d'autres idiographèmes, de noter les diphtongues /L`/ et /L`9/. Nous emploierons la même méthode de saisie pour rendre convenablement les différentes formes graphiques (i.e.

glyphes) que peut prendre cette paire de diphtongues : eùç /eùO pour /L`/ et e%ç /e%O

pour /L`9/.

273 − La voyelle /v`/ peut prendre deux formes, (1) è+ ou (2) èvselon le type de consonne à laquelle elle est associée :

(1) è+/v`9/ Exemple : n+è /mv`9/

(2) èv /v`9/ Exemple : Rèv /kv`;9/

Pour la notation de la forme (1) de cette voyelle non connexe, nous emploierons les 274 caractères F03F è SIGNE VOCALIQUE THAM MAI KONG et la forme subjointe + du caractère F01C LETTRE THAM VA (logique graphémique) : (1) n è + F013 F03F

{Rendu : n+è}

Quant à la forme (2) èv, elle s’affichera par l'intermédiaire du caractère F03F è SIGNE

VOCALIQUE THAM MAI KONG et du caractère consonantique F01C v LETTRE THAM VA (logique graphémique) :

273 e Nous rappelons qu'en lao la voyelle /v`/ (ex. kzv /jv`/) est distinguée de la consonne /u/ qui, en finale ou en 2 position d'un groupe consonantique englobant, prend la même valeur phonétique /v/ (ex. kvA /jv`9/). 274 Pour l’affichage des formes subjointes, cf. infra, 3.5. 175 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

(2) H ¤275 è v F03F F01C

{Rendu : Rèv}

− Enfin, nous avons vu (supra, 2.4.6) que la voyelle /`9/, notée habituellement A, prenait parfois

la forme allongée Ä (CALvg /`9kv`;M/) en présence de la consonne v.

Exemple : vÄ*/u`9m/

Nous avons mentionné également le fait qu’en tham l'emploi de cette graphie n'était pas systématique, notamment en notation du pali où l'on trouve régulièrement la forme A.

Exemple : BgvA bhagavŒ

Ainsi le choix de l'une ou l'autre graphie relève davantage d'un choix esthétique que d'une convention orthographique codifiée (id.). Par conséquent, tout utilisateur d'une police tham doit pouvoir avoir le choix entre l'affichage du glyphe A ou du glypheÄ.

On ne peut donc pas programmer l'algorithme suivant :

[F01C v + F02DA → F01Cv + Ä].

Et même si nous prenions le parti très discutable de systématiser l'emploi de la graphie Äen présence de la consonne v et donc d’appliquer cet algorithme, il sera alors impossible d’afficher le glyphe Ä dans les cas, certes rares mais non moins corrects, où l'on souhaite l’afficher en présence des consonnes g,d,D, etw.

rAgAp²Ä* rŒgŒp²n

ÔpDÄ*SdÏÄ pradhŒnsaddhŒ

Afin de pouvoir disposer librement du glyphe Ä, et en suivant la logique « thaï-lao » de codage

276 « graphique », nous avons choisi de coder ce signe : F041 ÄSIGNE VOCALIQUE THAM AA LOUANG .

275 Cf. note précédente. 276 Rappelons que caractère birman équivalent n’est pas codé (supra, 3.3.3.5). 176 Proposition de codage de l’écriture tham

3.4.9 Signes de rendu (F042-F043)

Signes divers

F042 VTT VIRAMA THÉORIQUE THAM

F043 SRT SIGNE DE RENDU THAM

Ces deux caractères sont particuliers puisqu'ils sont absents de l'alphabet tham. Leur fonction est le rendu de glyphes contextuels.

Le caractère F042 VIRAMA THÉORIQUE THAM est l'équivalent, au niveau informatique, du caractère U+17D2 SIGNE KHMER COENG dont la fonction a été décrite au chapitre 3.3.3.6 : il indique au système de mise en œuvre que la consonne suivante doit être rendue dans une forme subjointe. Nous tenterons de démontrer la pertinence de la considération d'un virama « théorique », alors même que l'alphabet tham est dépourvu de ce caractère (cf. infra, 3.5.2).

Exemple de rendu d'une forme subjointe à l'aide du caractère F042 VIRAMA THÉORIQUE THAM :

VTT G F042 F003

@

Nous verrons plus en détail la méthode de rendu des formes subjointes au chapitre 3.5.

Le caractère F043 SIGNE DE RENDU THAM est spécifique à l’écriture tham. Sa fonction et son utilisation seront exposées au chapitre 3.5.7.

3.4.10 Accents tonals (F044-F047)

Accents tonals l-tham F044 & ACCENT TONAL THAM MAI EK

F045 ² ACCENT TONAL THAM MAI THO

F046 # ACCENT TONAL THAM MAI TRI

F047 { ACCENT TONAL THAM CATTAVA

177 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Nous avons vu que Phouy ne mentionnait que les seuls accents mai ek & et mai tho ² comme figurant dans l'alphabet tham (supra, 2.4.7). Cependant, dans la mesure où des textes très divers en l-tham, connus ou inconnus, doivent pouvoir être saisis, il convient de coder également les accents mai tri et mai cattava qui, bien que d'un emploi rare, n'en constituent pas moins des caractères indispensables à l’écriture l-tham.

3.4.11 Ponctuation (F048-F04B)

Ponctuation

F048 - SIGNE THAM NYAMAKAAN

F049 SIGNE THAM FIN

F04A _ SIGNE THAM KHOOMUUT

F04B § SIGNE THAM TA KAI

Les caractères F048 - SIGNE THAM NYAMAKAAN et F049 SIGNE THAM FIN sont spécifiquement tham (du moins dans leur graphie, puisque ces signes ont leur équivalent en écriture lao « laïque » (supra, 2.5.2) et leur codage ne doit donc pas être remis en question.

Quant aux caractères F04A _ SIGNE THAM KHOOMUUT et F04B § SIGNE THAM TA KAI, on les trouve dans les textes inscrits en écriture lao. Mais ces caractères apparaissent également dans certains textes tham (supra, 2.5.2) et ne figurent pas, au jour de la rédaction de ces lignes, dans Unicode, que ce soit dans la zone du lao (U+0E81-U+0EDD) ou dans celle des ponctuations (U+2000- U+206F)277. Par contre les signes équivalents figurent dans les zones thaï (0E00-0E7F) et khmère (1780- 17FF) :

0E46 q CARACTÈRE THAÏ MAIYAMOK 17D7 > SIGNE KHMER LEK TOO

0E2F O CARACTÈRE THAÏ PAIYANNOI 17D4 . SIGNE KHMER KHAN

0E5A \ CARACTÈRE THAÏ FONGMAN 17D9 \\\ SIGNE KHMER PHNAEK MUAN ŽŽŽ 0E5B CARACTÈRE THAÏ KHOMUT 17DA SIGNE KHMER KOOMUUT |

277 Cette plage comprend les signes de ponctuation des écritures latines. En règle générale, les ponctuations propres aux écritures asiatiques figurent à l'intérieur même de la zone de chacune de ces écritures. 178 Proposition de codage de l’écriture tham

Si ces signes équivalents en thaï et en khmer sont codés indépendamment dans les zones respectives de ces écritures, on peut s’étonner de constater que deux d’entre ces signes (TA KAI et

KHOOMUUT) ne figurent pas dans la zone lao, alors que ceux-ci trouvent leur correspondance en écriture lao « laïque ». Quoiqu’il en soit, si l’on souhaite ne pas voir reproduire cette omission dans la zone tham, il apparaît nécessaire de coder ces quatre caractères de ponctuation tham.

3.4.12 Chiffres tham (F04C-F055)

Cardinaux

F04C 0 CHIFFRE THAM 0

F04D 1 CHIFFRE THAM 1

F04E 2 CHIFFRE THAM 2

F04F 3 CHIFFRE THAM 3

F050 4 CHIFFRE THAM 4

F051 5 CHIFFRE THAM 5

F052 6 CHIFFRE THAM 6

F053 7 CHIFFRE THAM 7

F054 8 CHIFFRE THAM 8

F055 9 CHIFFRE THAM 9

Les chiffres tham ne se distinguent des chiffres lao que par leur forme « archaïsante » (supra, 2.5.1). On observe que la différence entre les cardinaux tai le et birmans sont du même ordre (supra, 3.3.3.8), et cette proximité dans les graphies a amené les concepteurs d’Unicode à ne pas coder les cardinaux tai le.

Nous avons pensé néanmoins qu’il était préférable de coder les cardinaux tham, leurs graphies présentant un caractère suffisamment original au regard des chiffres laotiens modernes. Les cardinaux thaï (siamois) par exemple, sont codés bien que les graphies soient identiques à celles des chiffres khmers. En allant plus loin dans ce sens, on pourrait même arguer que les cardinaux de toutes les écritures ne sont que des glyphes de dix caractères (« zéro », « un », « deux », « trois », etc.). Si la majeure partie des écritures ont leurs chiffres codés, il n’y a pas de raison que les cardinaux tham, même si leurs graphies sont similaires à celles des cardinaux lao, ne le soient pas. 179 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.4.13 Glyphes syllabiques (F056-F057)

Signes divers

F056 À SYLLABE THAM RYY

F057 È SYLLABE THAM LEI

Concernant les règles de codage, les concepteurs d’Unicode reconnaissent volontiers qu’« aucun codage ne peut prendre en charge tous les processus textuels de base de façon optimale.

Il faut donc faire des compromis » (UNICODE, 2003, p. 11) et de mentionner le codage séparé des minuscules et des capitales de la zone des caractères latins. Là réside toute l’ambiguïté des principes d’Unicode, notamment en ce qui concerne la distinction en théorie si nette entre caractère et glyphe. Si les caractères sont codés et si les glyphes apparaissent dans certains contextes imposés par une écriture, qu’en est-il de la liberté graphique du copiste ? Une écriture non fixée comme le tham ne peut que se confronter à une norme aussi figée qu’Unicode. Nous avons passé en revue (supra, 2.4.5) certaines ambiguïtés d’écriture qui laissent libre choix au scribe de l’emploi de telle ou telle notation d’une même syllabe.

Ainsi l’emploi de la graphie È/kD/, contraction deEla (employée également dans le mot

[ElWv] /kDÂv/, alors écrit È+) est laissé au choix du scribe (id.). Il s’agit bien d’un glyphe et non d’un caractère, mais comment implémenter une règle quelconque puisqu’aucun contexte ne semble l’imposer ? Outre la liberté de choix, ce cas relève également de la fidélité à un texte qu’on voudrait éditer conformément à un manuscrit original. Dans un tel manuscrit, on pourrait très bien trouver un endroit où /kD/ est orthographié Ela, et un autre où il s’écrirait avec le glyphe syllabique È, surtout qu’il est fréquent qu’un manuscrit soit achevé par un scribe différent de celui qui l’a entamé Cette graphie n’étant pas systématiquement employée, puisqu’on trouve les mots /kD/ et /kDÂv/ sous leur forme classique, nous pensons pertinent d’attribuer un code à ce signe (F057 È THAM

SYLLABE LEI). Il en est de même pour le glyphe syllabique À, contraction de r%. L'utilisation de cette contraction ne semble suivre aucune règle hormis celle d'un contexte textuel. Un utilisateur d'une police tham devra donc pouvoir disposer à loisir du glyphe À sans que celui-ci lui soit imposé par le système de rendu. Cette graphie doit donc être intégrée en tant que caractère Unicode

(F056 À THAM SYLLABE RYY).

Notons qu’on aurait pu imaginer une méthode de rendu à l’aide du caractère VIRAMA

THÉORIQUE THAM ou SIGNE DE RENDU THAM. Mais la méthode de saisie n’aurait pas été des plus

180 Proposition de codage de l’écriture tham ergonomique en raison de la nature syllabique de ces signes. Il aurait fallu par exemple implémenter des traitements de type :

VTT +E +l → È

VTT + r + % → À

Outre le fait qu’elle n’est pas justifiée linguistiquement, cette méthode nous a paru impliquer une utilisation moins intuitive que de considérer ces deux glyphes syllabiques comme des caractères codés.

3.4.14 Zone de code tham (proposition)

Nous présentons ici notre proposition de zone tham, placée provisoirement dans la zone d’usage privé (supra, 3.4.2) en respectant le système de présentation d’Unicode qui comprend :

− Une table de la zone tham (F000-F07F), − Une liste des caractères tham (code, forme nominale, nom du caractère). Cette liste est rédigée en anglais afin de respecter la présentation des publications d’Unicode, et de pouvoir être ainsi « prête à l’emploi ».

181 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Zone tham « Unicode »

F000 Tham F07F

F00 F01 F02 F03 F04 F05 F06 F07 0 kT ° u ê 4

1 Kdw U Ä5

2 gDFe VTT 6

3 Gn f a SRT 7

4 xpY ù & 8

5 cPh % ² 9

6 CbçE # À

7 jBîo { È

8 Jmï O -

9 Xyû<

A qrü>_

B Qlé ^ §

C zvô\0

D ZSAÖ1

E NH i à 2

F tL I è 3

182 Proposition de codage de l’écriture tham

F000 Tham F03A

Consonants Various Sign

F000 k THAM LETTER KA F020 ° THAM SIGN NIKKHAHIT

THAM LETTER KHA F001 K

F002 g THAM LETTER GA Specific L-Tham Consonants

F003 G THAM LETTER GHA F021 w L-THAM LETTER BO

F004 x THAM LETTER NGA F022 F L-THAM LETTER FO SUNG

E005 c THAM LETTER CA F023 f L-THAM LETTER FO TAM

F006 C THAM LETTER CHA F024 Y L-THAM LETTER YO

F007 j THAM LETTER JA F025 h L-THAM LETTER HO TAM

F008 J THAM LETTER JHA F026 ç L-THAM LETTER O

THAM LETTER NYA F009 X

F00A q THAM LETTER TTA Independent Vowels

F00B Q THAM LETTER TTHA F027 î THAM INDEPENDANT VOWEL I

F00C z THAM LETTER DDA F028 ï THAM INDEPENDANT VOWEL II

F00D Z THAM LETTER DDHA F029 û THAM INDEPENDANT VOWEL U

F00E N THAM LETTER NNA F02A ü THAM INDEPENDANT VOWEL UU

F00F t THAM LETTER TA F02B é THAM INDEPENDANT VOWEL E

F010 T THAM LETTER THA F02C ô THAM INDEPENDANT VOWEL O

THAM LETTER DA F011 d

F012 D THAM LETTER DHA Dependent Vowels Signs F013 n THAM LETTER NA F02D A THAM VOWEL SIGN AA

F014 p THAM LETTER PA F02E i THAM VOWEL SIGN I

F015 P THAM LETTER PHA F02F I THAM VOWEL SIGN II

F016 b THAM LETTER BA F030 u THAM VOWEL SIGN U

F017 B THAM LETTER BHA F031 U THAM VOWEL SIGN UU

F018 m THAM LETTER MA F032 e THAM VOWEL SIGN E

F019 y THAM LETTER YA

F01A r THAM LETTER RA Specific L-Tham Vowels Signs

F01B l THAM LETTER LA F033 a L-THAM VOWEL SIGN A

F01C v THAM LETTER VA F034 ù L-THAM VOWEL SIGN Y

F01D S THAM LETTER SA F035 % L-THAM VOWEL SIGN YY

F01E H THAM LETTER HA F036 E L-THAM VOWEL SIGN EI

F01F L THAM LETTER LLA F037 o L-THAM VOWEL SIGN O

F038 O L-THAM VOWEL SIGN AU

< L-THAM VOWEL SIGN AI F039

> L-THAM VOWEL SIGN AE F03A

183 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

F03B Tham F057

F03B ^ L-THAM VOWEL SIGN AO Digits

F03C \ L-THAM VOWEL SIGN AM F04C 0 THAM DIGIT ZERO

≈ F02D A F020 ° F04D 1 THAM DIGIT ONE

F03D Ö L-THAM VOWEL SIGN OY F04E 2 THAM DIGIT TWO

F03E à L-THAM VOWEL SIGN MAI KAN F04F 3 THAM DIGIT THREE

F03F è L-THAM VOWEL SIGN MAI KONG F050 4 THAM DIGIT FOUR

F040 ê L-THAM VOWEL SIGN MAI EI F051 5 THAM DIGIT FIVE

F052 6 THAM DIGIT SIX Dependent Vowels Signs F053 7 THAM DIGIT SEVEN F041 Ä THAM VOWEL SIGN AA LOUANG F054 8 THAM DIGIT EIGHT F055 9 THAM DIGIT NINE

Various Signs

F042 TTV THAM THEORIC VIRAMA Various Signs • sign that does not exist in the Tham alphabet but F056 THAM SYLLABE RYY has been encoded for rendering purpose. À • not visibly rendered but the next Tham letter is to F057 THAM SYLLABE LEI be rendered subjoined. È

F043 TSR THAM SIGN RENDERER • sign that does not exist in the Tham alphabet but

has been encoded for rendering purpose. • not visibly rendered but the next Tham letter is to

be rendered as a subjoined variant.

L-Tham tone marks & L-THAM TONE MAI EK F044 ² L-THAM TONE MAI THO F045 # L-THAM TONE MAI TRI F046 { L-THAM TONE MAI CATTAVA F047

Ponctuation

- F048 THAM SIGN NYAMAKAAN

F049 THAM SIGN END

_ F04A THAM SIGN KHOOMUUT

§ F04B THAM SIGN TA KAI

184 Rendu des consonnes de forme subjointe et des glyphes divers

3.5 RENDU DES CONSONNES DE FORME SUBJOINTE ET DES GLYPHES DIVERS

3.5.1 Problématique

Une des difficultés pour le rendu du tham est que les règles de graphotaxe de cette écriture divergent selon la langue qu’elle transcrit, le pali ou le lao. Cela est surtout manifeste pour la règle de souscription-suscription des consonnes : en p-tham, une consonne qui suit immédiatement une consonne dévoyellée devient subjointe (supra, 2.3.4), tandis qu’en l-tham la subjointe est généralement la finale d’une syllabe ou la deuxième consonne d’un groupe consonantique (supra, 2.4.4).

Exemple : tƒA, taöhŒ, « désir » (notation en p-tham),

tà*HA, [tànHA] /s`mg`;9/, « désir » (notation en l-tham).

Par conséquent, nous traiterons séparément les méthodes de rendu pour le p-tham et le l-tham.

3.5.2 Méthode de rendu des consonnes subjointes p-tham

En pali, nous pouvons appliquer un système relativement simple pour les transformations automatiques des consonnes seules en consonnes subjointes. En effet, « la consonne au niveau de la ligne d’écriture est la finale de la consonne qui la précède [i.e. dévoyellée], tandis que la consonne 278 placée au niveau inférieur est la consonne liée à la voyelle [qui suit] » (PHOUY, 1943b, p. 34). Si nous reprenons l’exemple du mot tƒA taöhŒ, la présence du  h souscrit indique que la consonne  ö qui le précède est dévoyellée. On lira alors taöhŒ et non taöahŒ.

Ainsi, il suffit de considérer la présence virtuelle d’un caractère équivalent au virama279 qui, associé à une consonne, indique que celle-ci perd sa voyelle inhérente.

Nous avons vu que le khmer Unicode usait d’un caractère particulier pour rendre les souscrites, appelé caractère coeng (U+17D2), bien que celui-ci ne fasse pas partie de l’écriture khmère (supra, 3.3.3.6). Ce signe coeng fonctionne en réalité à la manière d’un virama, c’est-à-dire

278 Sauf le cas particulier de la forme suscrite ’ de la consonne x /M/ (infra, 3.5.3). 279 Voir le paragraphe consacré au traitement par Unicode des différentes écritures dérivées de la devanagari (supra, 3.3.3). 185 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM qu’il « tue » la voyelle inhérente de la consonne qui le précède et indique aussi que la consonne suivante est souscrite :

‹ X

17D2 1783

{Rendu : ¹ }

Comme cette règle de conjonction est similaire à celle du p-tham (la finale est sur la ligne, la suivante est subjointe), nous pouvons donc procéder de même en ajoutant un virama « théorique », sans châsse et sans forme visible qui, associé à une consonne, affiche celle-ci dans sa forme subjointe. Nous avons appelé ce caractère VIRAMA THÉORIQUE THAM (VTT).

Exemple : Saisie du mot vuz@ivu¶ghi

v u z VTT G i

F01C F030 F00C F042 F003 F02E

v u z @ i

{Rendu :vuz@i}

Exemple : Saisie du mot ûpj]AupajjŒ :

û p j VTT J A

F029 F014 F007 F042 F008 F02D

û p j ] A

{ Rendu : ûpj]A}

186 Rendu des consonnes de forme subjointe et des glyphes divers

La règle générale est donc la suivante :

VTT C

F042 F0XX

Cs

Nous invitons le lecteur à consulter la table des substitutions en fin d’ouvrage (A.1) pour avoir un aperçu des rendus.

3.5.3 Cas particulier : forme subjointe du caractère F004 x LETTRE THAM NGA

3.5.3.1 Analyse du problème

Il est nécessaire de considérer la consonne x º d’une manière différente de celle que nous venons de décrire280. En effet, nous avons vu que cette lettre était la seule consonne281 de l’alphabet p-tham dont la forme subjointe soit suscrite, et que cette forme suscrite était employée pour noter le x en position finale et non en position de consonne suivant une consonne dévoyellée (supra, 2.3.5).

Le cas de la consonne x º dévoyellée pose alors un problème de rendu en saisie, si on applique notre règle algorithmique :

[F042 VTT + C → Cs]

En effet, si l’on veut saisir le mot pali SG’ saºgha, on voudra saisir (avec C =G) :

Sx VTT G

F01D F004 F042 F003 puisque structurellement c'est la consonne précédant le virama « théorique » qui est dévoyellée.

280 Comme nous l’avons mentionné note 144, la consonne birmane i /M/ possède également une forme subjointe suscrite appelée en birman kinzi. Celle-ci fait l'objet d'un traitement particulier pour l'affichage et est encodée en ordre logique, c’est-à-dire avant la consonne à laquelle elle est associée. Ainsi uf ºka est stocké en mémoire f º + u k. 281 La forme /k/ suscrite ne se rencontrant qu’en l-tham, nous ne la prendrons pas en considération dans ce paragraphe. 187 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Mais avec la méthode de saisie décrite pour rendre les formes subjointes, il se produira ceci :

Sx VTT G

Sx @

{Rendu : Sx@}

Le résultat, bien que correct en lecture, diffère de la forme souhaitée SG’puisque c’est le

G qui, associé au virama « théorique » qu’il suit, devient subjoint.

Nous avons envisagé deux méthodes pour remédier à ce problème.

3.5.3.2 Méthode manuelle

L'utilisateur affiche « manuellement » les glyphes dans l'ordre d’affichage, sans tenir compte de la structure du mot (i.e. application d'un « virama » impliquant la perte d’une voyelle inhérente) :

SG VTT x

F01D F003 F042 F004

SG ’

{Rendu : SG’}

On remarquera qu'il convient :

− De placer le virama « théorique » après le G gh bien que celui-ci n'ait pas perdu sa voyelle

inhérente (il n'y a donc plus de logique linguistique dans ce cas), et avant le x º, qui lui l'a

perdu, afin de transformer le x en ’,

− D’afficher le signe ’ º (i.e. [VTT + x) après le G gh bien que ce dernier le précède en

lecture (SG’se lit bien saºgha et non saghºa).

188 Rendu des consonnes de forme subjointe et des glyphes divers

Cette méthode de saisie à l'avantage d'être très intuitive (l'utilisateur se réfère à l'apparence visuelle) et l'inconvénient de ne pas illustrer la logique du système d'écriture p-tham (linguistiquement parlant, le virama « théorique » n'est pas placé correctement).

3.5.3.3 Méthode automatique

Si on choisit de conserver la méthode de rendu appliquée aux autres consonnes p-tham

(supra, 3.5.2), en considérant de nouveau notre exemple du motsaºgha, il faudra procéder en deux

étapes pour rendre SG’au lieu de Sx@.

− Étape 1 : Pour éviter la forme subjointe @de G et pour rendre la forme subjointe ’de x, on procédera à la substitution

[F004x+ F042 VTT → ]’

Ainsi, c’est le x qui, associé au VIRAMA THÉORIQUE THAM, subira la transformation et non la

consonne qui le suit (le VTT est « mangé » par le x et ne peut donc plus agir sur le G qui est saisi à la suite) :

Sx VTT G

S ’ G

{Rendu : S’G}

− Étape 2 : il reste le problème de la position du glyphe ’, puisque dans l’ordre présent ce signe sera suscrit à la consonne qui le précède et non à celle qui le suit. Ainsi nous obtenons

S’G au lieu de SG’. Nous devons donc ajuster l'algorithme de la manière suivante :

[F004x+ F042 VTT + C → C + ]’

189 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Dans l’exemple précédent, nous obtiendrons finalement (avec C =G) :

Sx VTT G

Étape 1

S ’G

Étape 2

SG ’

{Rendu : SG’}

L'algorithme est donc le suivant :

[F004 x+ F042 VTT + C → C + ]’

Cas où la consonne suivant le x º est associée à l'idiographème vocalique antéposé F032 e :

Si l'on veut saisir en ordre logique (excepté pour l'idiographème antéposé qui sera saisi avant la consonne à laquelle il est associé282) le mot SeG’A saºgh¯, on voudra effectuer l'opération de saisie suivante :

Sx VTT eGA

F01D F003 F042 F032 F004 F02D

S ’eGA

{rendu : S’eGA}

On constate que le caractère suscrit ’ sera associé au caractère S et non à G comme il se doit. En effet, l'algorithme que nous avons programmé

[F004 x+ F042 VTT + C → C + ]’

282 Cf. supra, 3.4.8. 190 Rendu des consonnes de forme subjointe et des glyphes divers

ne peut fonctionner (avec C =G), puisque le caractère F032 e vient s'interposer entre le caractère

F042 VIRAMA THÉORIQUE THAM et la consonne C (et quand bien même on admet C = e, on obtiendra e’, ce qui est incorrect). Il faut donc reprogrammer un algorithme qui intègre le caractère F03A e dans la saisie : [F004 x+ F042 VTT + F032 e + C → F032 e + C + ]’

En reprenant notre exemple, nous obtenons bien (avec C =G) :

Sx VTT eGA

F01D F003 F042 F032 F004 F02D

Se G ’A

{rendu : SeG’A}

Cas où la consonne x /M/ doit être affichée sur la ligne d’écriture :

En présence des voyelles i /h/ et I /h9/, la consonne x /M/ doit être affichée sur la ligne d'écriture, comme nous l'avons indiqué (supra, 2.3.5) : -xiË, -xi(, -xi@, etc.

Exemple : çæxi(kA aÊÊhaºgikŒ

Dans ce cas, la règle de souscription appliquée aux autres consonnes redevient de rigueur :

[F042 VTT + C → Cs]

Le problème est que nous avons déjà programmé l'algorithme

[F004 x+ F042 VTT + C → C + ]’

Il s'agit donc d'annuler cette substitution pour les cas où les caractères F02E i et F02F I sont associés à la consonne qui précède le F004 x dévoyellé (i.e. F004 x+ F042 VTT).

191 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

[F004 x+ F042 VTT + C + F02E i→ F004 x+ Cs + F02E ]i

[F004 x + F042 VTT + C + F02F I→ F004 x+ Cs + F02F ]I

Exemple : saisie du mot çæxi(kA aÊÊhaºgikŒ

Áq VTT Qx VTT g ikA

F026 F00A F042 F00B F004 F042 F002 F02E F000 F02D

Áq `x ( ikA

{rendu : çæxi(kA}

3.5.3.4 Comparaison des deux méthodes et choix effectué

Tableau comparatif des méthodes de rendu de la consonne º en finale

Méthode manuelle Méthode automatique

- Pas de mise en œuvre supplémentaire (+) - Logique linguistique (virama théorique appliqué - Intuitivité, facilité d’utilisation (+) à la consonne x effectivement dévoyellée) (+) - Conformité à l’ordre d’écriture manuscrite (+) - Affichage automatique de l’orthographe correcte - Pas de logique linguistique (le virama (en présence des voyelles i et )I (+) « théorique » n’indique plus le dévoyellement) (-) - Mise en œuvre complexe (-) - Saisie son intuitive (-)

Choix effectué : Nous choisissons d’adopter la méthode manuelle, préférant conserver une homogénéité du mode de saisie au regard notamment de la méthode choisie pour les voyelles (supra, 3.4.8). De plus, quatre algorithmes seraient nécessaires au fonctionnement de cette méthode automatique :

[F004 x+ F042 VTT + C → C + ],’

[F004 x+ F042 VTT + F032 e + C → F032 e + C + ],’

[F004 x+ F042 VTT + C + F02E i→ F004 x+ Cs + F02E ]i ,

[F004 x + F042 VTT + C + F02F I→ F004 x+ Cs + F02F ].I

192 Rendu des consonnes de forme subjointe et des glyphes divers

Il semble préférable d’envisager une mise en œuvre qui demande le moins d’opérations nécessaires ainsi qu’une méthode de saisie intuitive, donc suivant une logique graphémique283.

3.5.4 Cas de la forme subjointe de la consonne F01A r LETTRE THAM RA

3.5.4.1 Analyse du problème

Comme évoqué au chapitre 2.3.6, la forme subjointe Ô (appelée º²ù½ /n9oçq`/) de la consonne r r est placée, contrairement aux autres formes subjointes, avant la consonne qui la précède phonétiquement.

Exemples : ÔSsra ÔbMbrahma

Si on considère l’exemple ÔbMbrahma, deux méthodes de stockage peuvent s'envisager :

(1) ordre graphique : Ô+ b + H+ ;

(2) ordre logique (ou phonétique) : b+Ô+H+ ;

3.5.4.2 Ordre « graphique »

Cette option consiste à stocker en mémoire les caractères VIRAMA THÉORIQUE THAM et F01A r avant la consonne à laquelle le glyphe Ô doit être associé.

VTT r b H VTT m

F042 F01A F016 F01E F042 F01A

Ô b H ;

{rendu : ÔbH;}

283 Un autre argument de taille apparaît contre la saisie en ordre phonétique lorsque nous nous attaquons au l-tham : l’algorithme [F004 x+ F042 VTT + C → C + ’] rentre en conflit avec le mode d’écriture l-tham, où le signe ’est aussi final mais se place directement au-dessus de la consonne initiale : C’ (ex: t’u /stM/) et non au-dessus de la consonne suivante comme en p-tham : C + ’ (ex : SG’saºgha).

193 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

On constate néanmoins que la logique linguistique est invalidée puisque le TTV n’indique pas que la consonne b b est dévoyellée.

3.5.4.3 Ordre « logique » ou « phonétique »

La seconde option est légèrement plus complexe puisqu'elle nécessite l'intervention d'un traitement qui consiste à procéder à un repositionnement des glyphes. Si l’on veut saisir le mot brahma en suivant les règles de rendu des subjointes avec le caractère VIRAMA THÉORIQUE THAM, nous obtenons :

b VTT r H VTT m

F016 F042 F01A F01E F042 F01A

b Ô H ;

{rendu : bÔH;}

Le rendu indique que le glyphe Ô r est associé au caractère H h et non au caractère b b comme souhaité, impliquant une mauvaise lecture, en l'occurrence bahmra.

Il faut donc programmer un repositionnement des glyphes afin que le signe Ô r soit bien associé à la consonne b b :

[C + VTT + r → Ô + C]

De cette manière nous obtiendrons (avec C =b) :

b VTT r H VTT m

F016 F042 F01A F01E F042 F018

Ô b H ;

{rendu : ÔbH;}

194 Rendu des consonnes de forme subjointe et des glyphes divers

3.5.4.4 Comparaison des deux méthodes et choix effectué

Arguments en faveur du stockage en ordre graphique :

L'option « ordre graphique » est plus simple car elle ne nécessite pas de traitement supplémentaire. Un utilisateur qui saisit un texte à partir par exemple d’un manuscrit284 n’aura qu’à suivre simplement l’ordre des caractères inscrits. De plus, ce cas de consonne antéposée répond à celui des idiographèmes vocaliques antéposés de notre codage tham, qui sont toujours saisis avant la consonne à laquelle elles sont associées (contrairement à la devanagari Unicode ou au khmer Unicode par exemple)285. Certains utilisateurs pourront également trouver cette méthode de saisie plus intuitive.

Arguments en faveur du stockage en ordre phonétique :

Cette option est linguistiquement plus motivée puisque le VIRAMA THÉORIQUE THAM « tue » la voyelle inhérente de la consonne qui le précède. Ainsi dans le mot nieÔgAeDAnigrodho, le Ô r antéposé est bien la conséquence de l’absence de voyelle inhérente de la consonne g g. Mais en saisie en ordre graphique (1) cela donnerait :

n i e VTT r g AeDA F013 F02E F032 F042 F01A F002 F02D F032 F012 F02D

n i e Ô gAeDA

{rendu : nieÔgAeDA}

On voit que le VIRAMA THÉORIQUE THAM s'appliquerait structurellement à la voyelle e ã qui le précède, ce qui linguistiquement n’a pas de sens, tandis qu’avec la substitution opérée en saisie en ordre phonétique, on saisira :

284 Rappelons que l’écriture tham est plus utilisée dans la reproduction des textes existants que dans la rédaction de textes nouveaux. 285 Cf. supra, 3.3.3. 195 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

n i e g VTT r AeDA F013 F02E F032 F002 F042 F01A F02D F032 F012 F02D

n i e Ô gAeDA

{rendu : nieÔgAeDA}

Ici le VIRAMA THÉORIQUE THAM suit immédiatement la consonne g g à laquelle il est réellement associé (g g est finale et a perdu sa voyelle inhérente), ce qui suit la logique du système d’écriture p-tham.

En outre, en écriture manuscrite, le Ô r souscrit antéposé est normalement inscrit seulement après la consonne à laquelle il est associée. On écrit ainsi souvent le mot brahma en inscrivant d’abord la consonne b b puis le Ô r à gauche de cette dernière.

Tableau comparatif des méthodes de stockage du glyphe Ô

Ordre graphique Ordre phonétique

- Mise en œuvre simple, - Logique linguistique (virama théorique appliqué à - Intuitivité, facilité d’utilisation, la consonne précédente), - Correspond au mode de saisie des idiographèmes - Conformité à l’ordre d’écriture manuscrite, vocaliques antéposés en tham, en lao et en thaï. - Correspondance avec le khmer.

Choix effectué : Nous choisissons d’adopter la méthode de saisie en ordre graphique, en harmonie avec le mode de saisie du xsubjoint (supra, 3.5.3) et des voyelles. Nous souhaitons également réduire le nombre de traitements nécessaires à la saisie du tham, afin que son implémentation et son utilisation soient les plus simples possibles.

196 Rendu des consonnes de forme subjointe et des glyphes divers

3.5.5 Cas particuliers des géminées

En écriture tham, les géminées sont souvent écrites à l’aide de ligatures harmonieuses (supra, 2.3.8). Il nous a semblé important d’attribuer à ces ligatures des glyphes particuliers.

− La géminée µmm correspond à la consonne m m redoublée (m + m), dont la première a perdu sa voyelle inhérente. On la saisit de la manière suivante :

[F018 m + F042 VTT + F018 m→ µ]

Exemple : saisie du mot kµkamma

k m VTT m

F000 F018 F042 F018

k µ

{Rendu : kµ }

− La géminée œ bb correspond à la consonne b b redoublée, dont la première a perdu sa voyelle inhérente. On la saisit de la manière suivante :

[F016 b + F042 VTT + F016 b→ œ]]

Exemple : saisie du motSœdA sabbadŒ

Sb VTT bdA

F01D F016 F042 F016 F011 F02D

Sœ dA

{Rendu : SœdA}

− La géminée s ss correspond à la consonne S s redoublée dont la première a perdu sa voyelle inhérente. On la saisit de manière suivante :

[F01D S + F042 VTT + F01D S→ s]

197 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : saisie du motmisk missaka

m iS VTT Sk F018 F036 F01D F04B F01D F000

m isk

{Rendu : misk}

− La géminée æÊÊh 286 correspond à la consonne rétroflexe qÊ qui a perdu sa voyelle

inhérente, suivie de la consonne rétroflexe QÊh. On la saisit de la manière suivante :

[F00A q + F042 VTT + F00B Q → æ]-

Exemple : saisie du mot ûæAnuÊÊhŒna

ûq VTT QAn

F031 F00A F042 F00B F02D F013

mæAn

{Rendu : ûæAn}

3.5.6 Méthode de saisie et de rendu du glyphe syllabique )

Lorsque les signes n n et A Œ se suivent, leur association se note à l'aide du glyphe syllabique spécifique ) (supra, 2.3.9). L’usage de cette graphie étant systématique, il semble nécessaire d’intégrer une méthode de rendu automatique.

[F013 n + F02D A → )]5

286 Cf. note 149. 198 Rendu des consonnes de forme subjointe et des glyphes divers

Exemples : saisie du mot Á)gtA anŒgatŒ

Á nAgtA

F02D F013 F02D F002 F00F F02D

Á )gtA

{Rendu : Á)gtA}

Il convient de respecter un certain ordre de saisie pour que la substitution de [F013 n + F02D

A → )] soit effective. En effet, il faut veiller à ce qu'en saisie aucun caractère ne vienne interférer entre n et A comme le montre l’exemple suivant :

− Saisie du mot eBAenÊA bhonto dans un ordre non conforme :

e BAen VTT t A

f032 F017 F02D F032 F013 F042 F00F F02D

e BAen Ê A

{Rendu : eBAnÊA}

On voit bien que si le Ê (t subjoint) est saisi avant le A, l'opération [F013 n + F02D A →

)] ne peut être effectuée, puisque les caractères F042 VTT et F00F t interfèrent en saisie entre le

F013 n et le F02D A.

199 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

− Saisie du mot bhonto dans un ordre conforme :

e BAenA VTT t

F032 F017 F02D F032 F013 F02D F042 F00F

e BAe) Ê

{Rendu :eBAnÊA}

Dans ce cas, la ligature ) apparaît. On notera que ce mode de saisie est purement graphique, puisque les idiographèmes eet Aformant la voyelle eAosont saisis avant la consonne Ê t à laquelle ils sont associés en lecture. Des algorithmes pourront néanmoins être programmés pour un rendu du glyphe )même en ordre non conforme.

3.5.7 Méthode de saisie et de rendu des consonnes de forme subjointe l-tham

3.5.7.1 Analyse du problème

Pour rendre les formes subjointes des consonnes l-tham, le procédé que nous avons décrit pour le pali semble insuffisant, et ce pour trois raisons. − Les règles d’écriture des consonnes de forme subjointe du l-tham sont différentes de celles du p-tham (supra, 2.3.4 et 2.4.4.). Nous avons vu en effet qu’en pali, la consonne subjointe était celle qui suivait une consonne sans voyelle inhérente287, tandis qu’en lao la consonne subjointe est la finale d’une syllabe ou la deuxième consonne d'un groupe consonantique.

Pour la notation du l-tham, en usant du caractère F042 VIRAMA THÉORIQUE THAM, il faudrait procéder ainsi :

C V VTT C

C V Cs

{Rendu : CVCs}

287 A l’exception du caractère x º dont la forme subjointe suscrite intervient lorsque cette consonne est en finale d’une syllabe (supra, 2.3.5). 200 Rendu des consonnes de forme subjointe et des glyphes divers

Exemple : Saisie du mot zA* [dAn] /c`9m/

z A VTT n

F00C F02D F042 F013

z A *

{Rendu : zA*}

Au niveau de la saisie, cela ne pose pas de difficulté. Mais on pourrait estimer que cette méthode ne répond à aucune logique par rapport au système d'écriture tham : on ne voit pas bien comment un virama pourrait être associé à une voyelle, d'autant plus qu'il n'existe pas de virama en langue lao, même « théorique » puisque les consonnes lao n’ont pas de voyelle inhérente (supra, 2.4, note 151). − Les graphies de certaines consonnes subjointes employées en l-tham diffèrent des graphies de ces mêmes consonnes subjointes lorsqu’elles sont employées p-tham (supra, 2.4.3) :

Variations graphiques entre subjointes p-tham et l-tham

Forme nominale Forme subjointe p-tham Forme subjointe l-tham

Ë k Ë à

’ x ’ ~

* n * r288

S ú Ÿ

l ¤ €

288 Cf. note 164. 201 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Il s'agit donc, en saisie, de pouvoir rendre les glyphes spécifiques au l-tham. Cela sera impossible avec le procédé actuel, qui attribue déjà des glyphes particuliers aux caractères

lorsque ceux-ci sont précédés du caractère F042 VIRAMA THÉORIQUE THAM. Sans reconnaissance de la langue par le système, les glyphes spécifiquement l-tham ne peuvent être rendus. Ainsi [x + VTT → ’] et non [ ~], [l + VTT → ]¤ et non [€], etc.

− Enfin, le choix de l’un ou l'autre de ces glyphes ne répond pas toujours à une règle stricte mais peut dépendre du choix du copiste (supra, 2.4.4) :

NCk /mNÌ9j/ MCk /lNÌ9j/ LCk /kNÌ9j/ Nvk /mv`Ì9j/ Mvk /lv`Ì9j/

A £çà Mçà Rçà £và Mvà

B £çË MçË RçË £vË MvË

C £óà HOàõ Róà £àì Vàõ

(D'après PHOUY, 1943a, p. 45)

Si les orthographes de la ligne C peuvent être mises à part, en raison de leur rareté et de la difficulté de leur mise en œuvre au niveau informatique, les orthographes des lignes A et B sont aussi correctes l’une que l’autre et leur emploi semble être de fréquence égale. Par conséquent, il n’est pas pertinent d'implémenter des règles de graphotaxe imposant au système d'exploitation l'affichage de tel ou tel glyphe.

Considérant ces trois arguments, et toujours en demeurant, dans la mesure du possible, dans une optique « Unicode » de codage des caractères et non des glyphes, nous pouvons envisager trois méthodes de rendu.

3.5.7.2 Rendu des consonnes subjointes l-tham par deux polices distinctes

Si nous mettons de côté l’objection linguistique de la non pertinence d’un virama en langue lao, et que l’on choisit donc de considérer le caractère F042 VIRAMA THÉORIQUE THAM comme simple outil de rendu, on est tenté d’imaginer deux types de polices distincts : les polices « p-tham » afficheraient les glyphes de forme subjointe conformément à la notation de la langue pali, tandis que les polices « l-tham » afficheraient les glyphes correspondant aux spécificités graphiques de la notation du lao.

202 Rendu des consonnes de forme subjointe et des glyphes divers

Police p- tham :

VTT l

F042 F01B

¤

Police l-tham :

VTT l

F042 F01B

Le même traitement est appliqué aux deux types de polices, mais la forme affichée (le glyphe) dépend simplement de la graphie enregistrée dans la police (¤dans la police p-tham et € dans la police l-tham). Ainsi le système de rendu est le même pour les deux types de police puisque seuls les glyphes (présents dans la police289) changent.

Néanmoins il reste le problème des formes subjointes de k /j/ et de x /M/ qui, en l-tham, peuvent prendre chacune deux formes distinctes selon les contextes :

Ë et à pour k /j/ (ex : mùË /lLj/, muà /ltj/),

’ et ~pour x /M/ (ex : mu’ /ltM/, mù~ /lLM/).

L’existence de ces variations implique déjà à elle seule que la distinction de deux types de polices (« p-tham » et « l-tham ») reste a priori insuffisante pour un rendu correct290.

Et surtout, les recensements des manuscrits recueillis dans les pagodes montre que « très peu de textes sont rédigés en pali, par contre nombreux sont les textes glosés phrase par phrase (nissaya)

289 Par exemple dans la table GSUB des polices OpenType, dont la fonction est de stocker les glyphes à afficher par le moteur d’affichage (tel Uniscribe pour Windows) selon les contextes.

290 D’aucuns pourraient arguer qu’il suffirait de coder par exemple le glyphe ’,et que àest déjà codé en tant que mai kan. Mais dans la perspective « Unicode » de ne coder qu’une fois les consonnes, il ne semble pas rigoureux d’attribuer un code à une variante graphique d’une consonne particulière. Quant à la graphie du /k/ suscrit ,à il ne paraît pas prudent de l’assimiler à un signe vocalique, même si nous avons opté pour un « codage graphique » des voyelles. 203 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM en langue lao » (LAFONT, 1965, p. 429). Il sera par conséquent souvent nécessaire, dans l’édition de textes en tham, de passer d’un système d’écriture à l’autre (du p-tham au l-tham et vice-versa), contrainte que peut rendre fastidieuse l’obligation de changer en permanence de police.

3.5.7.3 Rendu des consonnes subjointes l-tham par une logique linguistique

On peut considérer une deuxième méthode qui consisterait à n’avoir qu’une police unique pour le p-tham et le l-tham, et qui serait rigoureuse d’un point de vue linguistique. Tout comme le rendu des formes subjointes en pali, qui gagne sa légitimité par la présence d’un virama « théorique » indiquant que la consonne a perdu sa voyelle inhérente, on peut chercher ce même type de légitimité pour le l-tham. On sait en effet que les formes subjointes en l-tham sont de rigueur lorsque la consonne est en position finale d’un mot lao ou en deuxième position d’un groupe consonantique (supra, 2.4.4).

Cas des consonnes en position finale Une première méthode de rendu spécifique est nécessaire pour l’affichage des glyphes adéquats lorsqu’une consonne est finale. Il convient alors d’indiquer au système de mise en œuvre qu’une consonne est effectivement en position finale. Pour cela, la saisie d'une espace est significative : si une consonne est suivie d'une espace, c'est qu'elle termine un mot. On peut donc imaginer le principe suivant :

[C + SP → Cs] Avec C : consonne,

SP : espace (caracère unicode U+0020),

Cs : consonne finale de forme subjointe.

Exemple : Saisie du mot ti*.shm.(avec C = net Cs = *)

t in SP F00F F02E F013 0020

t i *

{Rendu : ti*}

204 Rendu des consonnes de forme subjointe et des glyphes divers

On peut objecter, à raison d’ailleurs, qu'en écriture tham l'espace entre les mots n'est pas de rigueur291. Dans le cas où l’on souhaite saisir les mots les uns à la suite des autres sans les séparer par des espaces visibles, on pourra alors utiliser le caractère Unicode U+200B ESPACE SANS 292 CHÂSSE (ESC), espace purement théorique qui n’est pas visible mais indique simplement au système informatique la séparation d'un mot. Le mode de saisie serait le suivant :

[C + ESC → Cs] Avec C : consonne

ESC : espace sans châsse (caracère unicode U+200B)

Cs : consonne finale de forme subjointe

Exemple : saisie du mot EdÛ.sçD9o.(avec C = det Cs = Û)

293 Edw SP

F036 F00F F021 0020

E d Û

{Rendu : EdÛ}

Nous pouvons alors envisager de procéder à un mode de substitution similaire pour chaque 294 consonne pouvant être en finale, qui sont au nombre de neuf : k /j/ , x /M/, z /s/, n /m/, p /o/, w /o/, m /l/, y /i/ et v /v/.

Le problème restant que ces consonnes ne prennent pas systématiquement (loin de là) leur forme subjointe en position finale (supra, 2.4.4), sans parler du cas des consonnes k et x qui nécessitent chacune deux glyphes distincts pour leurs formes subjointes. Ainsi dans beaucoup de cas, le schéma [C + ESC → Cs ] ne peut s'appliquer.

Rappelons le cas éloquent de la consonne x /M/ en position finale (supra, 2.4.4) :

291 On nomme non segmentées ces écritures (BERMENT, 2004, p. 129, note 1). 292 C'est ce caractère qui permet notamment la justification pour les écritures non segmentées. 293 Pour rendre la forme Û, on emploiera indifféremment les caractères F014 p ou F021 w(supra, 2.4.3). 294 Valeurs phonétiques lorsque ces consonnes sont en position finale. 205 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

− eg%Ox /jçL`M/ ; o£x /mn;9M/ {la consonne /M/ garde sa forme nominale sur la ligne d’écriture},

− mè~ /lnM/ ; eli~ /k?M/ ; £ç~ /mN;M/ {la consonne /M/ prend sa forme souscrite ~},

− cU’ /bt9M/ ; ‹’ /ov`M/ ; M=’/li`;9M / {la consonne /M/ prend sa forme suscrite ’}.

On peut alors tenter, dans l’optique d’un système de rendu « intelligent », de repérer les éventuels contextes dans lesquels telle ou telle graphie s’impose en finale. On s’aperçoit alors que la présence de ces graphies relève de deux facteurs interdépendants : d'une part le type de consonne (seule ou composée), et d'autre part le type de voyelle (position des idiographèmes par rapport à la consonne initiale). L’idée serait donc de paramétrer les cas où la finale prend une forme subjointe (et si oui, laquelle), et les cas où elle garde sa forme nominale. Nous avons tenté d'établir une projection de ce paramétrage, pour chacune des consonnes finales l-tham.

Afin d’éviter de considérer les substitutions au cas par cas, il convient de constituer des groupes (anglais clusters) dont les constituants ont les mêmes propriétés.

Cn : Consonne seule de forme nominale (kKgxcjztTdnwpPfbF myYrlvHçh),

295 Cc : Consonne composée ($£WMRV), V : Idiographème vocalique (à déterminer selon les cas), Ø : Aucun caractère (« ensemble vide »),

SP : Caractère Unicode U+0020 (« espace »),

ESC : Caractère Unicode U+200B (« espace sans châsse »).

Souhaitant simplement illustrer l’idée générale de ce système, nous ne traiterons dans ce chapitre que les cas des consonnes z et x en position finale, suivi d’exemples de rendu. En annexe figure une table comportant toutes les substitutions nécessaires pour l’ensemble des consonnes finales.

295 c.a.d. groupe consonantique de type associatif. 206 Rendu des consonnes de forme subjointe et des glyphes divers

Consonne z/ccc/ en finale : V

à

è

A

i Cn + + z + SP/ESC = CsVÙ I

ù

% Ø

u U O Cc + + z + SP/ESC = CcVÙ +

ù + ç

%+ ç

Exemple : Saisie du mot m‰ /l`Ì9s/ (avec Cn = m,I = Aet Cs = Ù)

m A z ESC

m A Ù

{Rendu : m‰}

207 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : Saisie du mot eM%çÙ /lL`Ì9s/ (avec Cn = M,I = [%+ ç] et Cs = Ù)

eM % ç z ESC

eM %ç Ù

{Rendu : eM%çÙ}

Dans tous les contextes qui ne figurent pas dans le tableau, la consonne z en position finale garde sa forme nominale sur la ligne d'écriture. Dans ce cas aucun traitement n'est nécessaire :

Cn V z SP/ESC

{Rendu : CnVz}

Exemple : Saisie du mot g=z /jçi`Ì9s/ (avec Cn = g,I = =)

g = z SP/ESC

{Rendu : g=z}

208 Rendu des consonnes de forme subjointe et des glyphes divers

Consonne x/GGG/ en finale : V

à

è

A

i Cn + + x + SP/ESC = CsV~ I

ù

% Ø

u

U

O Cn + + x + SP/ESC = CcV’ +

ù + O

%+ O

A

ç

v Cc + + x + SP/ESC = CcV~ +

ù + ç

% + ç

Cc + = + x + SP/ESC = CcV’

209 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : Saisie du mot cù~/bLM/ (avec Cn = c,I = ùet Cs = ~)

c ù x SP/ESC

c ù ~

{Rendu : cù~}

Exemple : Saisie du mot ‘’ /jçt9M/ (avec Cn = g,I = Uet Cs = ’)

g U x SP/ESC

g U ’

{Rendu : ‘’}

Exemple : Saisie du mot eR%ç~ /kL`;9M/ (avec Cn = R,I = [%+ ç] et Cs = ~)

eH ¤ % ç x SP/ESC

eH ¤ %ç ~

{Rendu : eR%ç~}

Dans les contextes ne figurant pas dans le tableau, la consonne x en finale garde sa forme nominale sur la ligne d'écriture. Dans ce cas, aucun traitement n’est nécessaire :

Cn V x SP/ESC

{Rendu : CiVx}

Exemple : Saisie du mot Rèx/knM/ (avec Cn = R,I = )è

H ¤ è x SP/ESC

{Rendu : Rèx}

210 Rendu des consonnes de forme subjointe et des glyphes divers

Nous insistons bien sur le fait que le groupe V indique des idiographèmes vocaliques et non des voyelles. C'est bien en effet la présence et l’emplacement des idiographèmes par rapport à la consonne initiale qui déterminent la forme et la place de la consonne finale. Ainsi les signes mai kan àet mai kong è sont également employés pour noter d’autres voyelles (autres que le /`/ et le /n/ interconsonantiques) : età~ /sdM/,

lèÙ /kns/.

En raison de la position antéposée de certains idiographèmes vocaliques (e, E,o,<,et>), le cas où le signe consonantique final suit immédiatement le signe consonantique initial est pris en compte dans les tableaux (on a alors V = Ø, « ensemble vide »).

Exemple : Saisie du mot EŽ /cDÌ9s/ (avec Cn = z,I = Ø)

E z (Ø) z SP/ESC

E z (Ø) Ù

{Rendu : EŽ}

Exemple : Saisie du mot om~ /ln9M/ (avec Cn = m,I = Ø)

o m (Ø) x SP/ESC

o m (Ø) ~

{Rendu : om~}

On voit donc la complexité (mais pas l’impossibilité) de la mise en œuvre d’un tel système qui demande un paramétrage similaire pour chacune des neuf consonnes finales. On pourra également remarquer que cette option « deux langues, deux systèmes » implique que les utilisateurs devront bien maîtriser chacune des deux méthodes de saisie, et également posséder une certaine connaissance du système d'écriture tham pour la notation des deux langues, pali et lao. Il ne s’agit

211 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM pas en effet de saisir mécaniquement des glyphes les uns après les autres, mais de saisir les caractères en comprenant le mécanisme de rendu des formes subjointes.

Par contre, le problème que nous rencontrons avec ce système de rendu « intelligent » est que le tham n’est pas vraiment codifié, et que des mots peuvent s’écrire de multiples manières (supra, 2.4.4). Si nous prenons l’exemple du mot lao MCg /lNÌ9M/ écrit en tham, celui-ci peut s’écrire Mç~,Mç’ou Hõ’O.Dans un cas semblable, comment paramétrer l’affichage de glyphes particuliers alors que l’orthographe n’est pas fixée ?

Doit-on paramétrer :

Cc + ç + x + SP/ESC → Ccç’ ou bien

Cc + ç + x + SP/ESC → Ccç~?

Deux solutions sont envisagables. − (1) Une prise de parti orthographique : le système affichera une orthographe et pas

une autre. Dans le cas de MCg /lNÌ9M/, on décide par exemple :

H ; Á x SP/ESC

H ; Á ~

{Rendu : Mç~}

Les othographes Mç’et HõO’ ne pourront alors pas être affichées avec cette logique de saisie.

- (2) On peut aussi imaginer une mise en œuvre « à option » où le choix de l’orthographe serait proposé dans un menu contextuel affiché à l’écran. Plusieurs orthographes seraient présentées par le système et l’utilisateur pourra sélectionner avec la souris la forme qui lui convient. Un dictionnaire électronique est alors indispensable. La mise en œuvre d’un tel système étant assez complexe, nous en faisons simplement mention en laissant la réalisation informatique pour des travaux ultérieurs.

212 Rendu des consonnes de forme subjointe et des glyphes divers

Exemple :

M Á x SP/ESC

(Menu contextuel) Mç’ Mç’

HõO’

Cas des groupes consonantiques

Dans un groupe consonantique l-tham, l’utilisation du caractère F042 VIRAMA THÉORIQUE THAM remplira la même fonction qu’en pali, c’est-à-dire que celui-ci indique que la consonne le précédent doit être lue sans voyelle et que la suivante est subjointe. Les groupes consonantiques guidants sont souvent des emprunts au pali, ce qui est une raison supplémentaire pour y appliquer la méthode de rendu pour le p-tham (supra, 2.3), c’est-à-dire avec le caractère F042.

Exemple : Ôpa/oq`/ [pra]

VTT rpa F042 F01A F014 F033

Ô p a

{Rendu : Ôpa}

Pour rendre les groupes consonantiques englobant dont la deuxième consonne est y /i/ ou v/u/, on emploiera le caractère F042 VIRAMA THÉORIQUE THAM avec respectivement les caractères

F019 y LETTRE THAM YA et F01C v LETTRE THAM VA.

213 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple : Rendu du mot K+A/jçv`;9/ [KvA]

K VTT vA F001 F042 F01C F02D

K +A

{Rendu : K+A}

Mais il reste le problème de pouvoir afficher les glyphes spécifiques au l-tham.

Exemples : SùkŸA[SùkSA] /rLjr`;9/,

k€˜[klAv] /jk`9v/.

On sera alors dans l’obligation de recourir au caractère U+200D LIANT SANS CHÂSSE. Malgré un manque d’ergnomie, l’utilisation du LIANT SANS CHÂSSE reste néanmoins, avec ce système, le seul outil disponible pour afficher les glyphes spécifiquement l-tham (i.e. non rendus par le caractère F042).

Exemple : Rendu du mot k€˜ [klAv] /jk`9v/

296 k ZWJ lAv SP/ESC F000 200D F01B F02D F01C 0020

K €A +

{Rendu : k€˜}

Cas des contractions Les contractions posent des problèmes similaires. D’une part la souscription des consonnes ne répond pas à une logique linguistique (de type absence de voyelle, ou autre) mais à une logique graphique (supra, 2.4.5). Par conséquent l’intervention en saisie du caractère F042 VIRAMA

THÉORIQUE THAM ne répond à aucune logique linguistique. D’autre part l’usage de contractions dépend également, nous l’avons dit, de la volonté du copiste (id.).

296 Zero-width joiner, « liant sans châsse ». 214 Rendu des consonnes de forme subjointe et des glyphes divers

Comment alors rendre automatiquement un mot comme bO&mI /aNÁ9lh9/ alors que celui-ci peut s’écrire en thamp&°mI,w;I,ou p°; ?

Nous retrouvons alors nos deux options déjà envisagées pour le rendu des finales. − (1) L’affichage de la contraction se fera manuellement, contre toute logique

linguistique, à l’aide du caractère F042 VIRAMA THÉORIQUE THAM ou du caractère

U+200D LIANT SANS CHÂSSE.

Exemple : Saisie du motp°; [bO&mI] /aNÁ9lh9/ avec le F042 VIRAMA THÉORIQUE THAM

p ° VTT m I F014 F020 F042 F018 F02F

p ° ; I

{Rendu : p°;}

Le LIANT SANS CHÂSSE sera nécessaire pour afficher les glyphes spécifiquement l-tham (i.e. non- rendus par le caractère F042).

Exemple : saisie du motS€A[SAlA] /r`;9k`9/ avec le F200D LIANT SANS CHÂSSE

S l ZWJ A F01D F01B 200D F02D

S € A

{Rendu : S€A}

- (2) Mise en œuvre optionnelle avec menu contextuel affiché à l’écran. Les contractions devront être intégrées dans le dictionnaire électronique.

215 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

Exemple :

p & ° m I F014 F044 F020 F018 F02F

(Menu contextuel)

p&°mI

w;I

p°;

3.5.7.4 Rendu des consonnes subjointes l-tham par deux caractères de rendu

La troisième méthode que nous pouvons envisager consiste, tout en conservant la méthode de rendu des glyphes p-tham par l’intermédiaire du caractère F042 VIRAMA THÉORIQUE THAM, à considérer un outil supplémentaire de rendu de glyphes particuliers au l-tham, sans se soucier pour le moment de légitimité linguistique. Ce caractère supplémentaire, que nous appellerons SIGNE DE

RENDU THAM et codé F043 à la suite du « virama théorique », permettra d’afficher les variantes graphiques de certains caractères. Exemple :

SRT l

F043 F01B

De cette manière, selon le glyphe qu’il souhaite voir afficher, l’utilisateur choisira librement l’un des deux caractères F042 VIRAMA THÉORIQUE THAM ou F043 SIGNE DE RENDU THAM :

216 Rendu des consonnes de forme subjointe et des glyphes divers

F000 k F004 x F01Bl F01DS F009 X +

F042 VTT Ë ’ ¤ ú }

F043 SRT à ~ € Ÿ ñ

On remarquera que la consonne tham X figure au tableau, alors que cette consonne n’est normalement pas employée en l-tham. Nous avons en effet voulu montrer que le caractère F043

SIGNE DE RENDU THAM pouvait être également utilisé pour afficher des variantes graphiques dans la notation du tham, indépendamment de la langue transcrite. Avec ce système, tout caractère a, dans une même police, potentiellement deux variantes graphiques pour ses subjointes. Les formes nominales des consonnes varient peu dans les textes et les inscriptions, tandis que les formes subjointes connaissent de nombreuses variantes (supra, 2.1), y compris dans un même texte. Ainsi, il pourra être intéressant pour un utilisateur souhaitant respecter au mieux les graphies originales du texte qu’il saisit de disposer d’un éventail de choix dans une police unique, même si celui-ci ne saurait être exhaustif.

Nous donnons ci-dessous des exemples de saisie de différents glyphes297 rendus avec les caractères F042 VIRAMA THÉORIQUE THAM et F043 SIGNE DE RENDU THAM.

F006 F008 F00C F011 F012 F016 + C J z d D b

F042 VTT / ] Ù Î Ï ®

F043 SRT   Ý  Þ Å

Cette méthode permet donc de résoudre d’une part, ce qui était notre objectif premier, la problématique de glyphes multiples (contextuels ou optionnels) nécessaires à la notation du l-tham.

D’autre part, le caractère F043 SIGNE DE RENDU THAM peut permettre du même coup d’amoindrir les

297 Les glyphes figurant dans le tableau-ci-dessous ont été dessinés d’après GABAUDE, 1979, p. [83-90]. 217 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM conséquences de l’absence de réelle codification de l’écriture tham en proposant un choix plus large de graphies, sans avoir recours à de multiples polices298.

On notera enfin que ce système pourra être utilisé pour le rendu des écritures yuon (tham Lanna), khün et lü (ancien) dans la mesure où celles-ci ne font pas encore partie d’Unicode. Le yuon par exemple a des propriétés communes à la fois avec le p-tham et le l-tham : la subjointe est tantôt la consonne finale, tantôt la consonne suivant une consonne dévoyellée.

Exemples en yuon :

cnšG /b`msç`jç`9/ (n /m/ final sur la ligne d’écriture, š /sç/ initial souscrit),

e n聉kcÒ /mnjjq`b`Ì9o/ ( /j/ final souscrit, ‰ /≤/ souscrit en 2 position d’un groupe consonantique et Ò /o/ final souscrit).

Sans prétendre aborder le traitement informatique des écritures yuon, khün et lü, ces dernières sont suffisamment proches du tham pour pouvoir être rendues par un système de rendu équivalent à celui proposé pour celui-ci (ce qui n’implique pas forcément d’assimiler ces écritures dans une zone Unicode unique).

298 Précisons que la présence dans un texte d’une graphie particulière pour noter un caractère X n’implique pas l’emploi d’une graphie spécifique pour noter un caractère Y. Par exemple un texte peut faire usage de la graphie ;et Ù, un autre texte de ;et ,Ý un troisième de á et Ù, un quatrième á de Ý etc. Il n’est donc pas possible d’envisager des polices qui ne comporteraient que certaines graphies sélectionnées selon des critères d’époque, de zone géographique, etc. 218 Rendu des consonnes de forme subjointe et des glyphes divers

3.5.7.5 Comparatif des trois modes de rendu proposés et choix effectué

Rendu par 2 polices Rendu « intelligent » Rendu par le SRT

Mise en œuvre unique Logique linguistique pour les Possibilité d’afficher des pour les deux langues. finales. subjointes à glyphes multiples (/ /, / /, / /, / /) et de (sauf les polices elles- 1 seul caractère de j k r M mêmes). rendu (pour les groupes nombreuses variantes. consonantiques et les Intuitivité. Avantages contractions) : F042 VIRAMA Mise en œuvre relativement THÉORIQUE THAM. simple (substitutions uniquement). Choix d’orthographes multiples. Obligation de créer 2 Compléxité et nombre Pas de logique linguistique polices (une police p- important des traitements. pour le SRT. tham et une police l- Option (1) : tham). Pas de logique linguistique Nécessité de passer pour les contractions et d’une police à l’autre en certains groupes Inconvénients présence d’un texte consonantiques. bilingue (fréquent). Choix imposé des Problème (non résolu) orthographes. pour afficher les Option (2) : subjointes à glyphes Nécessité d’un dictionnaire multiples (/ / et / /). j M électronique.

Au regard du temps qui nous est imparti pour la mise en œuvre et surtout pour les avantages qu’il présente, nous optons pour le système de rendu avec le caractère F043 SIGNE DE RENDU THAM. Nous pensons aussi que cette méthode est celle dont l’utilisation est la plus intuitive, considérant que les utilisateurs ne sont pas forcément linguistes ou informaticiens. Rien n’interdit cependant, à l’avenir, de développer un système de rendu « intelligent », en gardant une nette préférence pour l’option (2) qui nécessite un dictionnaire électronique proposant les différentes orthographes possibles d’un mot. Le paramétrage de tous les cas de glyphes à afficher demandera certainement un laps plus long de reflexion et de mise au point. Quant à l’option « deux polices », nous la croyons définitivement inappropriée. Il sera également indispensable de soumettre ces différents systèmes à un échantillon d’utilisateurs d’horizons divers : éditeurs laotiens, chercheurs laotiens et occidentaux, étudiants, voire des moines bouddhistes. Peut-être qu’apparaîtront alors des options nouvelles. Mais cette évaluation « sur le terrain » devra être entreprise sur un moyen terme.

219 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

3.6 RÉALISATION INFORMATIQUE 2 : CONSTITUTION D’UN CLAVIER THAM « UNICODE »

Nous présentons ci-dessous un clavier virtuel correspondant à la proposition de codage Unicode des caractères tham (supra, 3.4.14). Sauf exceptions (voir ci-dessous), seules les formes nominales des caractères, auxquels on a attribué un code, sont accessibles depuis le clavier. Les divers glyphes relevant des contextes (formes subjointes, ligatures, etc.) seront affichés par le système de rendu.

Les attributions des touches ont été pensées selon une logique qui facilite la saisie sur un clavier « qwerty », c'est-à-dire les claviers anglo-saxons, qui sont non seulement plus répandus que les claviers français (« azerty »), mais surtout car ce sont les claviers « qwerty » qui sont majoritairement utilisés au Laos. Pour cette raison, certaines touches figurant sur les claviers français mais absents des claviers anglo-saxons sont inutilisées. On notera cependant que cela n'enlève rien à la simplicité d'usage du clavier « Tham Unicode » sur claviers « azerty » puisque les mêmes caractères y sont accessibles (avec néanmoins un recours parfois nécessaire à la touche système [Alt Gr]).

Le caractère F042 VTT VIRAMA THÉORIQUE THAM figure sur la touche [-] du clavier, tandis que le caractère F043 SRT SIGNE DE RENDU THAM sera saisi par l’intermédiaire de la touche [=], ces deux touches étant mitoyennes sur les claviers « qwerty » et positionnées à un endroit que nous avons cru le plus ergonomique. Cette ergonomie perd un peu de son évidence sur clavier « azerty » mais seulement (nous semble-t-il) dans une très faible mesure.

Nous avons enfin choisi, pour des raisons de commodité de saisie, d’attribuer à certaines touches des glyphes (non codés) qui correspondent à des combinaisons de caractères. Bien que non codés, certains glyphes parmi les plus utilisés seront ainsi directement accessibles au clavier (mais garderont aussi leur affichage possible par la chaîne des caractères correspondants). Ainsi, les six consonnes composées l-tham (groupes consonantiques associatifs $, £, M, etc.) dont l’usage est fréquent, sont accessibles au clavier, ainsi que la ligature s. Il s’agit là d’une simple particularité du clavier que nous proposons et qui ne doit pas être confondue avec le codage quant à lui immuable. Ainsi, tout utilisateur pourra à son gré créer son propre clavier, mais ne pourra déroger aux règles de codage.

220 Réalisation informatique 2 : Constitution d’un clavier tham « Unicode »

Combinaisons de caractères accessibles au clavier

TOUCHE GLYPHE CARACTÈRES

S s = F01D S + F042 TTV + F01DS

[ $ = F01EH + F043 TVS + F004x

{ £ = F01EH + F042 TTV + F013n

W W = F01EH + F042 TTV + F019y

M M = F01EH + F042 TTV + F018m

R R = F01EH + F042 TTV + F01Bl

V V = F01EH + F042 TTV + F01Cv

Nous noterons enfin deux cas particuliers :

- le caractère F028ï VOYELLE INDÉPENDANTE II n’est pas directement accessible sur le

clavier « qwerty » (mais l’est sur le clavier « azerty ») en raison du nombre insuffisant de touches disponibles. Comme la voyelle indépendante ï est équivalente graphiquement (mais

pas au niveau du codage) à la chaîne F027 î F03DÖ(supra, 3.4.7), l’utilisateur devra saisir à la suite ces deux derniers caractères qui seront automatiquement substitués par le caractère F028ï. Cela n’est envisageable que dans la mesure où la chaîne graphique î + Öne peut que correspondre à la voyelle indépendante p-tham ´, et non à la juxtaposition de la voyelle indépendante p-tham î i et de la voyelle l-tham Ö/ni/, qui est une chaîne invalide au niveau de la graphotaxe.

- le caractère F02Cô VOYELLE INDÉPENDANTE O est présent sur le clavier (touche [/]), mais

est équivalent graphiquement à la chaîne F042 TTV F01A r F026ç (id.). Afin d’éviter des

ambivalences en saisie, on substituera automatiquement la chaîne TTV + r + ç au caractère

F02C ô. De la même manière que dans le cas précédent, cette substitution n’est possible que

dans la mesure où la chaîne graphique Ô + çne peut que correspondre à la voyelle indépendante

¯, (et non à la consonne subjointe Ô r suivie de ç, qui est une chaîne invalide).

Nous insistons sur le fait que ces substitutions relèvent uniquement du clavier et n’illustrent en aucun cas des équivalences au niveau du codage.

221 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

On a ainsi :

Substitutions de caractères au clavier

TOUCHE CARACTÈRE TOUCHE CARACTÈRE TOUCHE CARACTÈRE CARACTÈRE

< î + | Ö → ï

- TTV + r r + , ç → ô

222 Réalisation informatique 2 : Constitution d’un clavier tham « Unicode »

223 VERS UN TRAITEMENT INFORMATIQUE DE L’ÉCRITURE THAM

224 Premier bilan sur un système tham « Unicode »

PREMIER BILAN SUR UN SYSTÈME THAM « UNICODE »

En résumé, la méthode d’encodage du tham que nous avons envisagée suit les principes suivants :

- Stockage en mémoire en ordre graphique (à l’opposé du stockage en ordre logique du « modèle indien » Unicode), - Codage des signes vocaliques en tant qu’idiographèmes et non en tant que phonèmes, suivant ainsi le « modèle thaï-lao » Unicode,

- Emploi de deux caractères de rendu : le F042 VTT VIRAMA THÉORIQUE THAM dont le fonctionnement repose sur une logique linguistique (du moins pour le p-tham) basée sur le

dévoyellement de la consonne précédente ; le F043 SRT SIGNE DE RENDU THAM qui fonctionne selon le même principe et est utilisé pour le rendu des subjointes spécifiques au l-tham et des variantes graphiques.

Les avantages que cette méthode présente sont notamment :

- L’absence de nécessité de traitements complexes pour le repositionnement des glyphes, si bien que dès l’instant où une zone tham sera incorporée dans Unicode, seul un court laps de temps sera nécessaire pour mettre au point un système de saisie et de rendu (et non plusieurs années comme pour le khmer ou le birman), - La possibilité de disposer d’un large éventail de logiciels capables de prendre en charge le tham. La complexité du khmer Unicode fait que celui-ci n’est pris en charge que par un nombre très limité de programmes (supra, 3.3.3.10), - Une harmonie avec le lao Unicode, de telle sorte que les concepteurs de polices et les utilisateurs du Laos habitués au lao Unicode s’y retrouveront sans mal, - Une harmonie avec le thaï Unicode, de telle sorte que les concepteurs de polices et les utilisateurs de Thaïlande299 habitués au thaï Unicode s’y retrouveront également, - Une facilité de saisie pour les utilisateurs et un emploi possible pour ceux qui ne connaissent pas le tham ou qui en ont une connaissance limitée (bonzes novices, étudiants, éditeurs, etc.), - Souplesse d’utilisation en autorisant la saisie de formes orthographiques non-canoniques, dans le respect de certains usages de la tradition manuscrite, - Possibilité, dans une police unique, de disposer de deux variantes graphiques pour les formes subjointes, permettant ainsi une meilleure fidélité aux textes originaux.

299 Cf. note 267. 225

226

CONCLUSION GÉNÉRALE

L’écriture tham du Laos est, et a toujours été depuis son apparition, une écriture réservée à un usage essentiellement bouddhique et par conséquent limité à un nombre restreint d’individus. De ce fait, elle est auréolée de mystère. Cependant, en déduire que le tham est une écriture marginale ou désuète serait erroné. Car non seulement celle-ci est répandue dans les pays voisins, soit de manière identique (tham Isan) soit sous forme d’écritures apparentées et similaires (yuon, khün et lü ancien), mais elle est surtout dotée de propriétés qui la rendent indispensable au regard de l’écriture lao « laïque ». Le fait que le tham permette de transcrire le pali, langue des textes bouddhiques de courant theravŒda, lui confère un caractère sacré, efficace au niveau religieux, voire magique.

Cette teinte « mystique » du tham est à double tranchant. D’un côté, sa haute fonction religieuse le rend irremplaçable dans l’accomplissement et la validité de certaines pratiques et son caractère sacré lui procure le respect. D’un autre côté, en raison de ce côté mystérieux et par conséquent peu accessible, l’écriture tham s’est vu laissée en marge des débats linguistiques et technologiques de la période moderne. L’évolution des idées et des mentalités dans le champ religieux au cours des XIX-XXe siècles a d’abord repoussé jusque dans les campagnes certains usages relatifs à l’utilisation des lettres. Puis les avancées technologiques, apanage des centres urbains, ont pris le relai du délaissement de l’écriture tham, et les concepteurs de polices informatiques se sont focalisés sur l’écriture administrative et populaire qu’est l’écriture lao « laïque ».

En pratique, il est possible que ces deux aspects aient opéré de concert dans les mentalités au Laos : on peut d’abord douter de l’efficacité religieuse d’une écriture lorsque celle-ci est saisie sur une machine, voire craindre de s’engager vers sa « désacralisation ». On a pu également reléguer au second plan l’informatisation d’une écriture archaïque confinée à l’intérieur des pagodes, des bibliothèques ou des centres de restauration des manuscrits sur feuilles de latanier.

Outre ces raisons socio-religieuses, la complexité d’un système (ou devrait-on dire des systèmes) d’écriture qui transcrit deux langues, avec ses 45 signes consonantiques, ses 60 signes- voyelles, ses caractères souscrits et suscrits, ses transformations, ses ligatures, ses graphies diverses et non fixées, peut aussi expliquer que les Laotiens tout comme les Occidentaux ne se sont pas précipités sur l’informatisation du tham qui n’a pas l’amplitude du khmer, écriture peut-être aussi complexe, mais qui est en revanche celle de l’administration et du peuple cambodgiens.

227 CONCLUSION GÉNÉRALE

Le présent travail a d’abord permis, après avoir dégagé un certain nombre d’éléments d’ordre historique, linguistique et socio-religieux, d’avancer d’un premier pas vers l’informatisation du tham avec la réalisation de la police ThamStandard au format TrueType pour système Windows. Malgré les inconvénients inhérents à la complexité de l’écriture traitée, cette police a l’avantage de permettre de saisir n’importe quel texte tham (dans la limite imposée par les variantes graphiques) à partir de n’importe quel ordinateur PC configuré sous Windows. Nous avons eu le loisir de la tester puisque la plupart des textes tham figurant dans ces pages ont été saisis avec la ThamStandard.

Mais au début du XXIe siècle, les avancées technologiques et le développement des échanges internationaux et interculturels ne permettent plus de s’arrêter à un simple mode de saisie ponctuel et isolé. Des nouvelles mesures comme celles proposées (imposées ?) par le Standard Unicode conduisent à s’interroger sur un traitement (relativement) universel des écritures et particulièrement sur leur informatisation. Dès lors, il ne s’agit plus d’imaginer des systèmes qui conviendraient le mieux à l’écriture que nous traitons, mais de réfléchir à comment se conformer, même si des détours doivent être empruntés, à la norme mondiale.

On pourra d’ailleurs trouver singulier qu’une écriture sacrée et à efficacité religieuse comme le tham doive se conformer aux principes d’un consortium de multinationales. Mais c’est pourtant cette partie-là qu’il faut jouer, quitte à manier l’ironie, pour sinon développer du moins préserver des éléments culturels qui donnent une autre dimension à un monde qui tend, malgré de beaux discours, à un mouvement unilatéral.

Nous envisageons deux perspectives. − Soumettre dans les normes une proposition de codage tham Unicode au consortium. Nous pensons avoir montré qu’un tel codage devait faire l’objet de nombreuses réflexions à plusieurs niveaux, et ne devait pas être laissé aux mains d’« experts » maîtrisant mal le système d’écriture et qui pourraient être tentés de faire rentrer le tham dans une case toute faite qui ne serait pas à sa mesure (pensons aux erreurs de la zone Unicode pour le lao). − En attendant l’intégration du tham à Unicode, mettre sur pieds un système provisoire qui devra suivre les principes établis dans ces pages afin de pouvoir être appliqué directement lors de l’intégration future du tham au Standard. Un complément pour Word de type LaoWord, qui intègrerait des fonctions spécifiques au tham, serait idéal. À l’image de son modèle, un « ThamWord » pourrait même intégrer des fonctions supplémentaires en plus des fonctions prévues pour Unicode (dictionnaire électronique, tri lexicographique, etc.).

228 CONCLUSION GÉNÉRALE

À l’heure où notre travail s’achève, « l’indice sigma » du tham remonte à 2,67/20 (contre 0,91 avant, cf. Introduction) grâce à l’existance de la police ThamStandard. Le système de saisie basique qu’implique une police TrueType sans traitement particulier explique que cette progression demeure faible. Seul un système de mise en œuvre spécifique au tham (par exemple ThamWord ou une version d’Uniscribe qui aurait intégré le tham) pourra relever l’indice sigma de manière significative.

Nouveau tableau d’évaluation du niveau d’informatisation du tham (« indice σ »)

Criticité C Note N Note pondérée Services/ ressources k k (0 à 10) (/20) (CkNk) Traitement du texte Saisie simple 4 11 44 Visualisation / impression 3 14 42 Recherche et replacement 3 0 0 Sélection du texte 3 0 0 Tri lexicographique 2 0 0 Correction orthographique 3 0 0 Correction gramaticale 1 0 0 Correction stylistique 2 0 0 Traitement de l'oral Synthèse vocale 1 0 0 Reconnaissance de la parole 1 0 0 Traduction Traduction automatisée 3 0 0 ROC Reconnaissance optique de 2 0 caractères Ressources Dictionnaire bilingue 3 0 Dictionnaire d'usage 1 0 Total 32 86 Moyenne (/20) 2,67

Dans les pays industrialisés, nous nous sommes habitués à ne plus considérer l’écriture que comme un outil de transcription d’une langue. Mais il est d’autres cultures, dont certaines sont dites « minoritaires », qui lui ont maintenue une dimension paralittéraire voire, pour le cas du tham, une haute valeur spirituelle. L’existence des richesses « immatérielles » dont sont dépositaires ces cultures minoritaires est aujourd’hui une évidence, et ne pas laisser éteindre leurs pensées et leurs pratiques sous un prétexte d’harmonisation technologique est le devoir de ceux qui ont apporté cette technologie. Dans le cas contraire, « monde » et « mondialisation » risquent de devenir des antonymes.

229

230

APPENDICES

A1. TABLE DES SUBSTITUTIONS

La table ci-dessous indique les glyphes que le système de mise en œuvre (Uniscribe, ou autre) doit afficher en fonction des contextes.

Dans la mesure où Uniscribe ne permet pas aujourd’hui de traiter l’écriture tham (donc une police OpenType tham ne serait d’aucune utilité aujourd’hui), nous avons attribué, à titre provisoire, des codes aux différents glyphes. Les glyphes dont la graphie est similaire à des caractères codés dans la zone tham se sont vus attribués un nouveau code pour ne pas les confondre, en tri ou en sélection lexicographique, avec les caractères en question. Exemples :

F03E àSIGNE VOCALIQUE THAM MAI KAN ≠ F079 à(forme subjointe du caractère F000 kLETTRE THAM KA)

F038 OSIGNE VOCALIQUE THAM LAO AU ≠ F05F O(forme subjointe du caractère F007 jLETTRE THAM JA)

Ces codes, dont les numéros héxadécimaux font suite aux caractères tham proprement dits (F000-F057) et sont compris dans la zone tham définie au chapitre 3.4.2 (F000-F00F), seront utiles dans la perspective de la création d’un complément tham pour Microsoft (un « ThamWord ») équivalent au LaoWord de V. Berment. Ce type de complément permettrait de s’interfacer avec le logiciel Microsoft Word et d’y intégrer des fonctions spécifiques au tham300.

Avec le système mis au point et décrit au long de ce chapitre, chaque consonne (caractère codé) a potentiellement deux formes subjointes possibles (une rendue à l’aide du VTT, l’autre avec le

SRT). Dans la police PhrasongLao que nous avons mise au point, certaines consonnes n’ont qu’une seule graphie pour leur forme subjointe, tout simplement parce que nous n’avons pas pour le moment trouvé de variante pour ces consonnes. Néanmoins, deux codes distincts restent disponibles au cas où un concepteur de police voudrait ajouter une forme supplémentaire. Par exemple, nous ne connaissons qu’une seule forme subjointe pour la consonne F001 K, qui est © ; cependant deux codes lui sont attribués pour les formes subjointes de cette consonne :

300 « ThamWord » devra simuler Uniscribe par l’intermédiaire de substitutions de caractères. Les caractères situés en dehors de la zone tham deviendront, dans une police OpenType, les glyphes non codés présents dans la table GSUB. 231 APPENDICES

F042 VTT + F001 K → F059 ©

F043 SRT + F001 K → F07A ©

Ainsi, dans la police PhrasongLao, les codes F059 et F07A sont représentés par le même glyphe ; mais rien n’empêche de créer une autre police (ou d’actualiser la PhrasongLao) dans laquelle par exemple F07A correspondra à un glyphe différent. En résumé, si dans la police PhrasongLao seules un certain nombre de consonnes ont réellement deux variantes graphiques disponibles pour leurs subjointes, chacune d’entre elles en dispose potentiellement de deux.

À l’heure actuelle, un outil de type ThamWord est la seule option envisageable pour saisir du tham « à la manière d’Unicode » en attendant l’intégration de cette écriture dans le Standard.

232 Table des substitutions

Code Touche Glyphe Code Touche Glyphe Code Glyphe

F042 - TTV + F000 k k F058 Ë →

F042 - TTV + F001 K K F059 © →

F042 - TTV + F002 g g F05A ( →

F042 - TTV + F003 G G F05B @ →

F042 - TTV + F004 x x F05C ’ →

F042 - TTV + F005 c c F05D | →

F042 - TTV + F006 C C F05E / →

F042 - TTV + F007 j j F05F O →

F042 - TTV + F008 J J F060 ] →

F042 - TTV + F009 X X F061 } →

F042 - TTV + F00A q q F062 ö →

F042 - TTV + F00B Q Q F063 ` →

F042 - TTV + F00C z z F064 Ù →

F042 - TTV + F00D Z Z F065 [ →

F042 - TTV + F00E N N F066 Â →

042 - TTV + F00F t t F067 Ê →

F042 - TTV + F010 T T F068 ë →

F042 - TTV + F011 d d F069 Î →

F042 - TTV + F012 D D F06A Ï →

F042 - TTV + F013 n n F06B * →

F042 - TTV + F014 p p F06C Û →

F042 - TTV + F015 P P F06D Ü →

F042 - TTV + F016 b b F06E ® →

F042 - TTV + F017 B B F06F ÿ →

F042 - TTV + F018 m m F070 ; →

F042 - TTV + F019 y y F071 = →

F042 - TTV + F01A r r F072 Ô →

F042 - TTV + F01B l l F073 ¤ →

F042 - TTV + F01C v v F074 + →

F042 - TTV + F01D s S F075 ú →

F042 - TTV + F01E H H F076 Ç →

F042 - TTV + F01F L L F077 ™ →

F042 - TTV + F021 w w F078 Û →

233 APPENDICES

Code Touche Glyphe Code Touche Glyphe Code Glyphe

F043 = TVS + F000 k k → F079 à

F043 = TVS + F001 K K → F07A ©

F043 = TVS + F002 g g → F07B (

F043 = TVS + F003 G G → F07C @

F043 = TVS + F004 x x → F07D ~

F043 = TVS + F005 c c → F07E Ú

F043 = TVS + F006 C C → F07F 

F043 = TVS + F007 j j → F080 Ã

F043 = TVS + F008 J J → F081 

F043 = TVS + F009 X X → F082 ñ

F043 = TVS + F00A q q → F803 ö

F043 = TVS + F00B Q Q → F084 

F043 = TVS + F00C z z → F085 Ý

F043 = TVS + F00D Z Z → F086 [

F043 = TVS + F00E N N → F087 Â

F043 = TVS + F00F t t → F088 Ê

F043 = TVS + F010 T T → F089 ã

F043 = TVS + F011 d d → F08A 

F043 = TVS + F012 D D → F08B Þ

F043 = TVS + F013 n n → F08C *

F043 = TVS + F014 p p → F08D 

F043 = TVS + F015 P P → F08E 

F043 = TVS + F016 b b → F08F Å

F043 = TVS + F017 B B → F090 ÿ

F043 = TVS + F018 m m → F091 Æ

F043 = TVS + F019 y y → F092 

F043 = TVS + F01A r r → F093 

F043 = TVS + F01B l l → F094 ú

F043 = TVS + F01C v v → F095 ß

F043 = TVS + F01D S S → F096 Ÿ

F043 = TVS + F01E H H → F097 Ç

F043 = TVS + F01F L L → F098 

F043 = TVS + F021 w w → F078 Û

234 Table des substitutions

Rendu des géminées

Code Touche Glyphe Code Touche Glyphe Code Touche Glyphe Code Glyphe

F018 m m + F042 - TTV + F018 m m → F099 µ

F016 b b + F042 - TTV + F016 b b → F09A œ

F01D s S + F042 - TTV + F01D S S → F09B s

F00A q q + F042 - TTV + F00B Q Q → F09C æ

Rendu des ligatures

Code Touche Glyphe Code Touche Glyphe Code Touche Glyphe Code Glyphe

F013 n n F02D A A F09D ) + →

F01E H H F042 - TTV F013 n n F09E £ + + →

F01E H F042 - F018 m F09F M H + TTV + m →

235 APPENDICES

A.2. MODÈLES SYLLABIQUES

Dans la perspective d’un développement de reconnaissance de syllabes ou de recherche lexicographique, la constitution d’un modèle syllabique s’impose. Nous nous proposons de réaliser ici les modèles syllabiques des systèmes d’écriture p-tham et l-tham. a) Syllabes du p-tham

La structure syllabique de la langue pali est la suivante301 :

Ci[C]V[Cf] ou VI[Cf]

Avec Ci : Consonne initiale

Cf : Consonne finale V : voyelle VI : Voyelle indépendante Les éléments placés entre crochets sont optionnels.

Ci = kKgGxcCjJXqQzDNtTdDnpPbBmyrlvS

HL

Cf = kgx’ cjXqzNtdnpbmyrlvSHL° V = AiIu U eeA

VI = Áäîïûüéô

Le tham comprend aussi un glyphe syllabique : ), ligature de n et A.

Toutes les consonnes p-tham, à l’exception bien sûr du nikkhahit °, peuvent être à l’initiale (supra, 2.3.7). D’autre part seules les consonnes non-aspirées peuvent être en finale d’une syllabe (id.). Rappelons que chaque consonne p-tham est lue, en l’absence de signe vocalique, avec la voyelle inhérente a (supra, 2.3.1). D’ailleurs pour cette raison, pour le tham tout comme pour la brahmi, « le terme aksara « syllabe » désigne à la fois le segment phonique de la chaîne parlée et le caractère correspondant » (PINAULT, 2001, p. 106). Ainsi, dans la structure Ci[C]V[Cf] ou VI[Cf], V représentera soit un signe vocalique diacritique, soit la voyelle inhérente de la consonne qui le précède, auquel cas V n’aura pas de réprésentation graphique visible.

Par exemple, dans le mot B° bha×, on a :

301 Rappelons que le pali ne fait pas usage de ton. 236 Modèles syllabiques

CiV = B bha

Cf = °×

Considérant les structures Ci[C]V[Cf] ou VI[Cf], nous pouvons observer plusieurs problèmes pour modéliser les syllabes tham :

− 2 signes-voyelles ne sont pas placés strictement à droite du signe consonantique : e e et

eAo

Par conséquent le modèle Ci[C]V[Cf] correspond bien à la lecture des syllabes mais pas à la position graphique des signes.

Exemples :

eSA so, ed de,

Ci = S s Ci = d d

V = eAo V = ee

Il sera donc nécessaire de distinguer les syllabes comportant les voyelles dépendantes e e et

eA o des autres syllabes. On considérera alors les voyelles au cas par cas.

− Dans les mots polysyllabiques, seule la consonne initiale de la première syllabe garde sa forme nominale sur la ligne d’écriture. Les consonnes initiales des syllabes suivantes prennent dans la plupart des cas leur forme subjointe (supra, 2.3.4). Il s’agira donc de

distinguer le cas des syllabes à consonnes initiales subjointes (Cis), dont le modèle est :

Cis[C]V[Cf] avec :

Cis = Ë ©(@|/O]}ö`Ù[ÂÊëÎ Ï *ÛÜ

®ÿ;=Ô ¤+ úÇ

Par exemple le mot kuXOku—ja est constitué de deux syllabes :

kuX ku—, O ja,

avec Ci = k k avec CiV= O ja

V = uu

Cf = X—

237 APPENDICES

Il existe des mots comprenant deux consonnes de forme subjointe. Par exemple dans le mot îÔnÎi indri, la deuxième syllabe dri est composée des deux subjointes Ô et Î de cette

manière : ÔÎi.

− En présence de la subjointe antéposée Ô on ne peut appliquer graphiquement ni le modèle

Ci[C]V[Cf], ni le modèle Cis[C]V[Cf], comme l’illustre l’exemple du mot indri :

i i r n dri e d (2 syllabe)

in (1ère syllabe)

Les syllabes comportant la forme Ô devront donc être considérées indépendamment.

− Quant aux syllabes comportant à la fois la consonne subjointe Ô et la voyelle e ou eA

(exemple : nieÔgA nigr¯), elles devront également faire l’objet d’un traitement particulier,

− Enfin, certaines syllabes se transforment en lecture en disyllabes. C’est le cas des syllabes

comportant les consonnes y, r, l et v souscrites, et lorsque la consonne H est souscrite

aux consonnes X, N, n, m, y, l, L et v(PHOUY, 1943b, p. 35).

Exemple : )q=se lit nŒttaja et non natja.

tum°Ç se lit tummaha× et non tumha×.

Dans ces cas, un prétraitement devra être réalisé pour reformer ces syllabes en disyllabes. Nous ne réaliserons pas ce prétraitement ici et nous considérerons que celui-ci existe lorsque nous établirons le modèle syllabique.

Un prétraitement de ce type devra également être réalisé :

(1) pour reformer les cas de dédoublement de consonnes non noté dans l’écriture,

Exemple : tÔtse transcrit tattra et non tatra (la consonne /s/ a été dédoublée).

238 Modèles syllabiques

(2) pour reformer les syllabes écrites avec des ligatures (œ, æ, µ, s).

Exemple : Ásuassu avec s = S s (finale) + S s (initiale)

À partir des éléments que nous venons d’exposer, nous pouvons établir l’ensemble des règles décrivant les syllabes p-tham : syllabes p-tham = C ({} + :A + : i + : I + : u + : )U OFC + e CC ({}+: A) OFC +

IndVowels OFC + : )

Avec

IndVowels = Áäîïûüéô

CC = IC + Ô IC + IC BC + Ô IC BC + BC + BC BC + Ô BC ;

OFC = kgx’cjXqzNtdnpbmyrlvSHL°

IC = kKgGxcCjJXqQzDNtTdDnpPbBmy rlvSHL

BC = Ë ©(@|/O]}ö`Ù[ÂÊëÎ Ï *ÛÜ®ÿ

;=Ô ¤+ úÇ

Parmi l’ensemble des syllabes possibles d’après ce modèle, beaucoup sont théoriques puisque toutes les consonnes ne peuvent se conjuguer (supra, 2.3.7). Cependant, les conjonctions interdites dans les règles de graphotaxe du pali n’en constituent pas moins des syllabes théoriques et doivent être prises en compte dans le modèle.

239 APPENDICES b) Syllabes du l-tham

Le modèle syllabique du l-tham diffère du modèle décrit ci-dessus en raison d’un système d’écriture distinct (supra, 2.4). Nous reprendrons ici le modèle syllabique de l’écriture lao établi par

V. Berment (BERMENT, 2004, p. 132-133) en l’adaptant lorsque des particularités se présenteront.

La structure des syllabes lao est la suivante : Ci [C] [A] V [Cf]

Avec Ci : Consonne initiale

Cf : Consonne finale A : Accent tonal

Ci peut être soit une consonne seule quelconque, soit un groupe consonantique (guidant, englobant ou associatif).

Consonnes l-tham (27) : kKgxcjztTdnwpPFbfmyYrlvSHçh

Groupes consonantiques associatifs l-tham (6) :

$£WMRV

Consonnes finales l-tham de forme nominale (9) : kz wpxnmvy

Consonnes finales l-tham de forme subjointe (10):

àË ÙÛ’~*;+ =

Consonnes l-tham en 2e position de groupe consonantique guidant ou englobant (8) :

~€Ô*=;v+

Consonne initiale l-tham de forme subjointe302 (1) Ÿ

302 Très rare en l-tham. Les quelques exemples donnés par Phouy nous ont cependant incités à faire figurer cette forme en initiale. 240 Modèles syllabiques

Voyelles l-tham (45) :

303 304 aà AÄiIù%u Uea eà e EaêE E oaè o 305 eàAa °ç O eieIeà=aeà== eùçeùOe%çe%Oèvaè+aèvè+v + < >eèA^ \Ö

Marques tonales l-tham (4) :

&²#{ Ce qui va poser problème pour l’analyse des syllabes, ce sont les signes-voyelles puisque ceux-ci peuvent être composés d’un ou plusieurs idiographème(s) positionné(s) à droite, à gauche, au-dessus, en-dessous, voire de part et d’autre du signe consonantique. On ne pourra pas alors se contenter du modèle Ci [C] [A] V [Cf] puisque si V occupe toujours cette position en lecture, cela est loin d’être toujours vrai à l’écriture.

Exemple : eR%&ç/kLÁ9`/ avec Ci = R

A = &

V = e%ç

D’autre part, des signes-voyelles distincts peuvent avoir la même valeur phonétique et l’emploi de tel ou tel de ces signes dépend de la présence à l’initiale d’une consonne seule ou d’un groupe consonantique (associatif, guidant ou englobant).

Exemples : eR%&ç/kLÁ9`/ avec V = e%ç/L9`/

el%&O/kLÁ9`/ avec V = e%O/L9`/

Pour cette raison, nous ferons la distinction entre les syllabes dont l’initiale est une consonne seule et celles dont l’initiale est un groupe consonantique.

303 La chaîne e (voyelle /d9/ interconsonantique) est absente car, comme mentionné précédemment (supra, 2.4.2), une consonne comportant cette voyelle ne sera jamais terminée par une consonne finale en tham (contrairement à l’écriture lao « laïque »). Nous avons vu en effet que par exemple ek* se lit /j`md9/ et non /jd9m/. 304 Cf. note 182. 305 Rappelons que les voyelles brèves /N/, /i`/ et /v`/ en position interconsonantique sont notées comme des longues, c’est-à-dire sans mai kan (supra, 2.4.2). 241 APPENDICES

Syllabes l-tham = Syllabe à consonne seule à l’initiale Syllabe à groupe consonantique à l’initiale

C :a + CA :àFC + CA :A OFC + GC :a + GCA : àFC + GCA :A OFC +

CA ( :i+ I + ù + % + u + )U OFC + GCA ( :i+ I + ù + % + u + )U OFC +

eC :a + eCA : à FC + eCA OFC + eGC :a + eGCA : à FC + eGCA OFC +

EC :a + ECA OFC + EGC :a + EGCA OFC +

oC :a + CA : èFC + oCA OFC + oGC :a + GCA : èFC + oGCA OFC+

eC :Aa + CA : çFC + CA : ° + eGC :Aa + GCA : OFC + GCA : ° +

eCA( : i + : )I OFC + eGCA ( : i + : )I OFC +

eCA : à=a + CA : =FC + eCA : à= eGCA : à=a + GCA : =FC + eGCA : à=

eCA :( ùO + : %O) OFC + eGCA : (ùç + %ç) OFC

CA : è+a + CA : +FC + eCA : è+ GCA : èva + CA : vFC + eGCA : èv

(< +<) CA + : eCA : èA + CA : ^ + (< +<) GCA + : eGCA : èA + GCA : ^ +

CA : \ + CA : Ö GCA : \ + GCA : Ö

[C : consonne ; A : accent tonal ; FC : consonne finale ; OFC : consonne finale optionnelle ; GC : groupe consonantique ; GCE : groupe consonantique englobant ; GCA : groupe consonantique associatif ; GCG : groupe consonantique guidant]

Avec

C = kKgxcjztTdnwpPFbfmyYrlvSŸHçh GC = GCE + GCA + GCG

GCA =$£WMRV

GCE = C ( : v+ : + : r+ : Ô + : l+ : €) 306 307 GCG = S (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + K (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + T (: x + : ~+ : y + : =+ : n + : *+ : m+ : ; + : S + : Ÿ) + P (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + F (: x + : ~+ :

306 D’après INTHAMONE, 1987, p. 162. 307 La deuxième consonne d’un groupe consonantique guidant peut être également r, l ou v. Ces trois consonnes étant celles retenues en position secondaire de groupe consonantique englobant (INTHAMONE, 1987, p. 159), les mentionner dans les GCG aurait été redondant. 242 Modèles syllabiques y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + c (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + t (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + p (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ) + b (: x + : ~+ : y + : =+ : n + : *+ : m+ : ;+ : S + : Ÿ)

FC = àËkÙz Ûwp’~x*r;m+v=y

Le modèle syllabique ci-dessus décrit l’ensemble des syllabes théoriques. Beaucoup de ces syllabes n’existent pas en pratique, notamment pour des raisons esthétiques. Par exemple, bien que les consonnes finales peuvent prendre deux formes (nominale sur la ligne d’écriture ou subjointe) voire trois pour les consonnes k /j/ et x /M/ (supra, 2.4.3), seule une de ces formes (parfois deux) est correcte dans chaque contexte particulier308.

Exemple : trois graphies contextuelles pour la consonne finale /M/

Syllabe C ou GC V Cf

mu’ /ltM/ m u ’

MA~/l`;9M/ M A ~

Mix/lhM/ M i x

Ce qui va déterminer la forme de la consonne finale est un ensemble d’éléments interdépendants : la composition graphique de la voyelle (nombre d’idiographèmes et leurs places par rapport au signe consonantique), le type de consonne initiale (seule ou groupe consonantique) et la consonne finale. Nous pensons néanmoins qu’il s’agit là de conventions orthographiques et que les orthographes non conformes à la règle (par exemple MA’ au lieu de

MA~) n’en sont pas moins des syllabes, d’autant que nous avons vu qu’en dehors de la codification établie par l’Institut Bouddhique, une certaine liberté était laissée au copiste (supra, 2.4.4). Nous avons donc choisi de ne pas limiter les syllabes aux orthographes conformes aux règles décrites par Phouy dans ses manuels.

308 Pour la forme des consonnes finales l-tham, voir supra, 2.4.3. 243

244

GLOSSAIRE

Caractère (ou caractère abstrait) : « Unité d’information utilisée pour organiser, commander ou représenter des données textuelles. Le caractère abstrait n’a pas de forme concrète (il ne faut pas le confondre avec ses glyphes) » (ANDRIES, 2002, p. 61).

Caractère combinatoire : Caractère destiné à s’afficher en association avec un caractère de base. Si l’on décide de représenter « ö » à l’aide d’un « o » (U+004F) suivi d’un caractère « ¨ » (U+0302), « o » est le caractère de base et « ¨ » est un caractère combinatoire » (ANDRIES, 2002, p. 61). On distingue les caractères combinatoire avec châsse (par exemple le caractère devanagari i) de ceux sans châsse (le caractère latin ^).

Conjonction : Juxtaposition dans un mot d’une consonne dévoyellée et d’une consonne avec voyelle (inhérente ou non). La représentation d’une conjonction est CdCv avec Cd, consonne dévoyellée et Cv, consonne avec voyelle.

Forme nominale : représentation graphique conventionnelle d’une consonne, par opposition à sa (ou ses) forme(s) subjointe(s).

Forme subjointe : Le tham fait un usage abondant de formes consonantiques souscrites et suscrites. Le terme lao pour désigner ces formes est tzv ef%WCg /sv`eLÂ9`M/, « caractère ou lettre géminée ou finale d’une forme différenciée de l’initiale similaire » (REINHORN, 2000) ou encore tzv séCn /sv`rNÂ9m/, avec séCn « être en dessous » ou « empilé », ce dernier terme rappelant les « lettres empilées » qui désignent, dans l’écriture tibétaine, les syllabes comportant à la fois un consonne souscrite et une consonne suscrite (DORJE, TOURNADRE, 2002, p. 42). Nous emploierons ici l’appellation « forme subjointe » en usage dans les publications d’Unicode (voir notamment UNICODE, 2003).

Glyphe : « Représente les différentes formes qu’un caractère abstrait peut prendre » (ANDRIES, 2002, p. 61).

Graphème : « Unité graphique minimale entrant dans la composition d’un système d’écriture (...). Il peut correspondre à un phonème, une syllabe ou un concept selon que l’écriture est phonétique, syllabique ou idéographique » (Dictionnaire de linguistique Larousse).

Graphie : « Représentation écrite d’un mot ou d’un énoncé » (Dictionnaire de linguistique Larousse).

Graphotaxe : Terme utilisé par le CERTAL (Centre de Recherches sur le Traitement Automatique des Langues, INALCO). V. Berment le définit ainsi309 : « [La graphotaxe] est à l'écriture ce que la syntaxe est aux phrases, donc l'ensemble des règles régissant l'arrangement possible des lettres ou des caractères pour une langue donnée ».

Idiographème : Toute variante individuelle ou stylistique d’un graphème dans une écriture.

309 Communication personnelle. 245 GLOSSAIRE

Lao/ laotien : On appelle généralement Laotien tout citoyen de la République Démocratique Populaire Lao ou de l’ancien Royaume du Laos sans distinction de son appartenance ethnique. Le terme Lao est réservé pour désigner les individus appartenant à l'ethnie lao, qui représente moins de 50% de la population totale (CHAZEE, 1995, p. 47). Pour ce qui est de la langue officielle utilisée au Laos par les Lao, les termes employés sont le lao ou le laotien.

Non connexe : Un signe non connexe est un signe constitué de plusieurs éléments graphémiques séparés (voir « Graphème »).

Phonème : « Le phonème est l’élément minimal, non segmenté, de la représentation phonologique d’un énoncé, dont la nature est déterminée par un ensemble de traits distinctifs » (Dictionnaire de linguistique Larousse).

Signe vocalique antéposé : Signe vocalique placé avant le signe consonantique qu’il suit en lecture. Par exemple la voyelle lao /d9/ est représentée par le signe vocalique antéposé e. Ex : ek /jd9/.

Syllabe : « Structure fondamentale qui est à la base de tout regroupement de phonèmes dans la chaîne parlée. Cette structure se fonde sur le contraste de phonèmes appelés traditionnellement voyelles et consonnes » (Dictionnaire de linguistique Larousse).

Système d’écriture : « Système de représentation de la parole et de la pensée par des signes conventionnels tracés et destinés à durer » (Grand Robert).

Tai/ Thaï : La transcription romanisée des termes relevant du groupe ethnolinguistique /sç`i/ pose certaines difficultés. Le lexème /sç`i/ ou /s`i/ est une grande source d’ambiguïté orthographique. Selon les auteurs et selon les époques, il désigne des langues ou des populations appartenant à des ensembles ethnolinguistiques variés puisque, le fait est bien connu en Asie du Sud-est, plusieurs variantes dialectales d’une même langue sont parlées par des locuteurs de pays différents ; d’autre part, au sein d’un même pays, plusieurs langues sont pratiquées, qu’il s’agisse de familles de langues différentes ou bien de variantes dialectales à l’intérieur d’une même famille. Les orthographes varient entre tai, thaï, tay, thaï, t'ai (Archaimbault), ‘tai (Lafont), dyai (Coedès), tày, ou encore tây (liste non-exhaustive). En ce qui concerne les populations, nous nous conformerons en général à la prononciation selon laquelle ces populations se désignent elles-mêmes. Par exemple, nous écrirons Thaï pour désigner les populations d’appartenance siamoise de Thaïlande, et Tai pour désigner les Lü du Sipsongpanna (Xishuanbanna) de Chine du sud. En ce qui concerne les langues (et les écritures) nous utiliserons la terminologie adoptée par M. Ferlus (1999, p. 2-3 ; 1994, p. 130), qui établit la distinction suivante : − thaï : vaste ensemble couvrant une partie de l’Asie du Sud-est comprenant les parlers siamois, lao, yuon, lü, khün, shan, ahom, tai noir, tai blanc, tai dèng, etc. − tai (thay-yay) : terminologie relevant du central tai de Li Fangkuei (tây, thô, nung, lungchow).

Theravada (p. theravŒda) : « Seul représentant actuellement vivant des dix-huit écoles anciennes du bouddhisme indien (...). Il se veut le représentant orthodoxe du bouddhisme des origines » (CORNU, 2001, p. 602).

246

RÉFÉRENCES BIBLIOGRAPHIQUES

ANDRÉ, J.

1997 « Caractères numériques : introduction », Rennes, Cahiers Gutemberg, Journées de Strasbourg, p. 5-44.

2002 « Caractères, codage et normalisation - de Chappe à Unicode », Document numérique, volume 6, p. 13-49.

ANDRIES, P.

2002 Introduction à Unicode et à l’ISO 10646, Québec, Document numérique, Volume 6, n° 3-4, p. 51-88.

BAUHAHN, M.

2002 « Rendering the World's Complex Scripts: A Case Study in Khmer », 21th International Unicode Conference, Dublin, 20 p.

BECCHETTI, C. 1991 Le mystère dans les lettres, xibLokTii,.ovydKi, Édition des Cahiers de France, Bangkok, 116 p.

1994 « Une ancienne tradition de manuscrits au Cambodge », in: Recherches nouvelles sur le Cambodge (dir. François Bizot), Paris, EFEO, Études thématiques, I, p. 47-62.

BERGAIGNE, A.

1984 Manuel pour étudier la langue sanscrite, Chrestomathie - Lexique - Principes de grammaire, Paris, Librairie Honoré Champion, 332 p. (1ère édition 1971)

BERMENT, V.

1998 Analyse automatique du laotien, « Prolégomènes graphotaxiques du laotien ». Paris, mémoire de DEA, INALCO, 160 p.

2004 Méthode pour informatiser des langues et des groupes de langues « peu dotés », Grenoble, Thèse de doctorat, Université Joseph Fourier, 277 p.

BIZOT, F.

1988 Les traditions de la pabbajjŒ en Asie du Sud-Est. Recherches sur le bouddhisme khmer, IV, Göttingen ,Vandenhoeck & Ruprecht, 149 p. pøÚvRB;Zmµlg,ar 1992 , Le Chemin de LaºkŒ, Paris, EFEO, Textes bouddhiques du Cambodge n° I, Paris, 352 p. 247 RÉFÉRENCES BIBLIOGRAPHIQUES

1993 Le bouddhisme des Thaïs, Brève histoire de ses mouvements et de ses idées des origines à nos jours, Bangkok, Édition des cahiers de France, 114 p.

1996 SdÎviml, La pureté par les mots, Paris, Phnom Penh, Chiang Mai, Vientiane, EFEO, Textes bouddhiques du Laos, III, 275 p. 2000 « La place des communautés du Nord-Laos dans l’histoire du bouddhisme d’Asie du Sud-Est », Paris, EFEO, BEFEO, LXXXVII, p. 511-528. 2001 « Écritures bouddhiques d’Asie du Sud-est » (avec C. Bizot), in: Histoire de l’écriture, de l’idéogramme au multimédia (dir. Anne-Marie Christin), Flammarion, p. 149-153.

BOUNYAVONG, O.

2003 Sin Xay, Vientiane, Dokked, 79 p.

CALVET, L.J.

1996 Histoire de l'écriture, Paris, Plon, 296 p.

CHAMBERLAIN, J.R.

2001 « An Overview of Tai-Kadai Languages Spoken in Southern China », Vientiane, Lan Xang Heritage, 5, juin-décembre 2001, p. 45-60.

CHANTHAPHAIBOUN, T.

Non daté BASAlAv, màDjzmpIDI ‘, [langue lao, classe de 4e année de cours élémentaire], Vientiane, Collège Fa Ngum, 131 p. (en lao)

CHAZEE, L.

1995 Atlas des ethnies et des sous-ethnies du Laos, Bangkok, L. Chazee, 220 p.

CHEA S. H., LAO, K.L., HARADA, S., KLEIN, N.

2002a « Proposal to Deprecate Khmer Characters », http://www.unicode.org.

2002b « Proposal to Encode Khmer Subscript Characters », http://www.unicode.org

CŒDÈS, G.

1966 Catalogue des manuscrits en pali, laotiens et siamois, provenant de la Thaïlande, Copenhague. 2001 Les peuples de la péninsule indochinoise, Phnom Penh, CEDORECK, 228 p. (1ère édition Paris, 1962)

248 RÉFÉRENCES BIBLIOGRAPHIQUES

CONDOMINAS, G.

1998 Le bouddhisme au village, Vientiane, Cahiers de France, 274 p.

DANIEL, A.

1992 Lire et écrire le cambodgien, Paris, Institut de l'Asie du Sud-Est, 79 p.

DORJE, S., TOURNADRE, N.

2002 Manuel de tibétain standard, Paris, l’Asiathèque, Langues & Mondes, 402 p.

DUROISELLE C.

1997 Practical Grammar of the Pali Language [édition numérique], Buddha Dharma Education Association Inc., www.buddhanet.net, 173 p. (1ère édition Rangoon, 1906)

ENFIELD, N.J.

1999 « Lao as a National Language », in: Laos, Culture ans Society (Ed. Grant Evans), Bangkok, Silkworm books, p. 258-290.

EVERSON, M.

1994 « Proposal for Encoding New Xishuangbanna Dai Script on BMP/IEC 10646 », http://www.evertype.com/standards/tai/n967.pdf, 5 p.

1998 « Proposal to Encode Brahmi in Plane 1 of ISO/IEC 10646-2 », ISO/IEC, http://std.dkuug.dk/JTC1/SC2/WG2/docs/ n1685/ n1685.htm.

2003 « Proposal to Encode the Tai lue Script in the BMP of the UCS », Organisation Internationale de Normalisation, http://std.dkuug.dk/ jtc1/sc2/ wg2/ docs/ n2634.pdf , 6 p.

FELS (DE), J.

1993 Promotion de la littérature en Thaïlande (2 tomes), Paris, INALCO, 336 p.

FERLUS, M.

1988 « Langues et écritures en Asie du Sud-Est (Les écritures d’origine indienne et leur adaptation aux langues de l’Asie du Sud-Est continentale : Les consonnes) », The 21st International Conference on Sino-Tibetan Languages and Linguistics, University of Lund, Sweden, 30 p. 1994 « L'évolution des fricatives vélaires *w et F* dans les langues thaï », Paris, CRLAO-EHESS, Cahiers de Linguistique Asie Orientale, 23, p. 129-139. 1995a « Les circonstances de l’introduction de l’alphabet tham lanna », in: La Thaïlande des débuts de son histoire jusqu’au XVe siècle, Premier Symposium 249 RÉFÉRENCES BIBLIOGRAPHIQUES

Franco-Thaï, 18-24 juillet 1988, Université Silpakorn, p. 101-109. 1995b « L’inscription rupestre de Nang An (Louang Prabang) », in: La Thaïlande des débuts de son histoire jusqu’au XVe siècle, Premier Symposium Franco-Thaï, 18-24 juillet 1988, Université Silpakorn, p. 110-114. 1999 « Les dialectes et les écritures des Tai (Thaï) du Nghê An (Vietnam) », Treizièmes journées de linguistique d’Asie orientale, Centre de Recherches Linguistiques sur l’Asie Orientale, Paris, 10-11 juin 1999, 21p.

FÉVRIER, J.G. 1984 Histoire de l’écriture, Paris, Payot, 616 p. (1ère édition 1948)

FILLIOZAT, JACQUELINE. 2000 « Pour mémoire d’un patrimoine sacré, les manuscrits pali du Cambodge », EFEO, BEFEO, LXXXVII, 2, p. 445-471.

FILLIOZAT, JEAN. 1948 « Les écritures du pali », in: Notice sur les caractères étrangers, Paris, Imprimerie nationale, p. 299-306.

FINOT, L. 1917 « Recherches sur la littérature laotienne », Hanoi, EFEO, BEFEO, XVII, 218 p., 12 planches. 1956 « Les écritures lao », in: Présence du royaume du Laos, Paris, France-Asie, p. 981-998 (réimpression d’un chapitre de FINOT, 1917)

GABAUDE, L.

1979 Les cetiya de sable au Laos et en Thaïlande. Les textes, Paris, EFEO, PEFEO CXVIII, 96 + 338 p. 1988 Une herméneutique bouddhique contemporaine de Thaïlande : buddhadasa bhikkhu, Paris, EFEO, PEFEO CL, 690 p.

GAGNEUX, P.M.

1976 Contribution à la connaissance de la civilisation laotienne d’après l’épigraphie du royaume de Vientiane (XVe-XIXe siècles), thèse pour le

doctorat de 3e cycle en histoire, Paris VII, 521 p. 1983 « Les écritures lao et leur évolution du XVe au XIXe siècles », ASEMI, vol. XIV, 1-2, p.75-95.

GALLAND, X.

1998 Histoire de la Thaïlande, Paris, PUF, collection « Que sais-je », 128 p.

250 RÉFÉRENCES BIBLIOGRAPHIQUES

GITEAU, M.

2001 Art et archéologie du Laos, Paris, A. et J. Picard, 208 p.

GUILLON, E.

1984 « Jalons pour une histoire du bouddhisme en Asie du Sud-Est », Péninsule, 8- 9, p. 113-136.

HERBERT, P., MILNER, A.

1989 South-East Asia Languages and Litteratures, a Select Guide, Écosse, Kiscadale publications.

HUNDIUS, H.

1990 Phonologie und Schrift des Nordthai, Stuttgart, Deutsche Morgenländische Gesellschaft, 264 p.

INTHAMONE, L.

1987 Je lis et j’écris lao, Paris, INALCO, 207 p.

IVARSSON, S.

1999 « Towards a New Laos, Lao Nhay and the Campain for a National "Reawakening" in Laos 1941-45 », in: Laos, Culture ans Society (Ed. Grant Evans), Bangkok, Silkworm books, p. 61-78.

KAROONBOONYANAN, T., KOANANATAKOOL, T.

2002 « Status of IT Standardization in Thailand », Bangkok, National Electronics and Computer Technology Center, 3 p.

KHIN, S.

2002 Manuel de khmer, volume I, Paris, Éditions You-Feng, 305 p.

KO KO, W., YOSHIKI, M.

2005 « Languages of Myanmar in Cyberspace », Dourdan (France), Conférence TALN, Juin 2005, 10 p.

LAFONT, P.B.

1961 « Les écritures du pali au Laos », Paris, EFEO, BEFEO, L, p. 395-405.

251 RÉFÉRENCES BIBLIOGRAPHIQUES

1965 « Inventaire des manuscrits des pagodes du Laos », Paris, EFEO, BEFEO LII, 2, p. 429-545.

1976 « Le bouddhisme vietnamien », in: Histoire des religions, volume III, Paris, Gallimard, Encyclopédie de la Pléiade, p. 353-370.

1987 « Le bouddhisme au Laos », in: Présence du bouddhisme (dir. René de Berval), Paris, Gallimard, coll. Bibliothèque illustrée des histoires, p. 515-533.

LAGIRARDE, F.

1994 « Textes bouddhiques du pays khmer et du Lanna: un exemple de parenté », in: Recherches nouvelles sur le Cambodge (dir. François Bizot), Paris, EFEO, Études thématiques, I, p. 63-77

LÉVY, P.

1952 « Les traces de l’introduction du Bouddhisme à Luang Prabang », Paris, BEFEO, XL, p. 411-424.

LIMSAMPHAN, N.

1983 vydKiTii, vulko [L’écriture tham Isan], Bangkok, Université de Silpakorn, 223 p. (en thaï)

LORRILLARD, M.

1995 Les chroniques royales du Laos, essai d’une chronologie des règnes des souverains lao (1316-1887), thèse de doctorat, EPHE, IVe section, 476 p.

2001 « D’Angkor au Lan Xang, une révision des jugements », Bangkok, Aséanie, 7, p. 19-33.

2004 « The Diffusion of Lao Scripts, The Literary Heritage of Laos » Vientiane, Actes de la conférence internationale The Literary Heritage of Laos: Preservation, Dissemination, Research Perspectives, (Vientiane, 8-10 January 2004), 6 p.

MASONS, F.

1984 Kachchayano’s Pali Grammar, with Chrestomathy & Vocabulary, Delhi, Sri Satguru Publications, 204 p. (1ère édition Toungoo, Birmanie,1898)

NARADA, T. (VEN.)

Non daté An Elementary Pali Course, [édition numérique] Buddha Dharma Education Association Inc., www.buddhanet.net, 234 p. (1ère édition 1952)

252 RÉFÉRENCES BIBLIOGRAPHIQUES

PELTIER, A.R.

1990 Sumangala Padumamukha [Jataka populaires lü et khün], Chiang Mai : EFEO & SRI, 380 p.

1996a aayÒr=rbmomc,¬á Khün Reader, Chiang Mai, A-R. Peltier, 127 p. (en khün) 1996b « Les littératures des groupes minoritaires lao et taï de la péninsule indochinoise », in: Cultures minoritaires du Laos : valorisation d’un patrimoine (Dir. Yves Goudineau), Paris, UNESCO-Mémoire des peuples, 311 p. 2000a )’Pè;HOm, nAgPzmHCm, La fille aux cheveux parfumés, Vientiane, Institut de Recherches sur la Culture, 490 p. 2000b « Regards sur la littérature classique khün de Birmanie », Paris, EFEO, BEFEO, LXXXVII, 1, p. 193-214.

PHETMYANGSWA, C. (MAHA), THAMMAPHINIT, T.

Non daté Ebb hYn bAli [apprendre le pali], Commission de l’école du pali, Université et école du dimanche de pali, 56 p. (en lao)

PHIMMASONE, P.

1956 « La littérature », in Présence du royaume lao, pays du million d’éléphants et du parasol blanc, France-Asie, Tome XII (10e année), p. 1006-1013. 1956 « L’Institut Bouddhique et l’Enseignement religieux », in Présence du royaume lao, pays du million d’éléphants et du parasol blanc, France-Asie, Tome XII (10e année), p. 1107-1109. 1971 « Cours de littérature lao », Vientiane, BARL, n°4 & 5 (1er semestre).

PHINITH, S.

1987 Contribution à l'histoire du royaume de Luang Prabang (BzgSAvadAn em%Cg LvgBlabAg), Paris, EFEO, PEFEO, CXLI, 477 p.

PHINITH, S., SOUK-ALOUN, P.N., THONGCHANH, V.

1998 Histoire du pays lao de la préhistoire à la république, Paris, Montréal, L’Harmattan, 280 p.

PHOUY (dit PHAYA LUANG MAHA SENA)

1943a EbÛhYnwv hYnC&AnNàgS%Dàm KYnepànBAµAlAv [Apprendre rapidement à lire les caractères tham dans les textes lao], Bangkok, Kramol Tirannasur, 80 p. (en lao)

253 RÉFÉRENCES BIBLIOGRAPHIQUES

1943b EbÛhYnwv hYnC&AnNàgS%Dàm KYnepànBAµAbAlI [Apprendre rapidement à lire les caractères tham dans les textes pali], Bangkok, Kramol Tirannasur, 51 p. (en lao)

PINAULT, G.J.

2001 « Les écritures de l’Inde continentale », in Histoire de l’écriture, de l’idéogramme au multimédia (dir. Anne-Marie Christin), Paris, Flammarion, p. 93-121.

PRONGTHURA, N.

1984 vydKiTii,]kook [L’écriture tham Lanna], Bangkok, Université de Silpakorn, 302 p. (en thaï)

REINHORN, M.

1980 Grammaire de la langue lao, Paris, Université Sorbonne nouvelle, 204 p. (1ère édition 1975)

SALAR (CAP.)

Non daté EbbS&CnC&AnBAS&AlW%ElaBAS&AjvnEp^CCkepànBAS&AlAvnZ (sic) [Apprendre les langues lü et yuon à partir de langue lao], 122 p. (en lao)

SOLÁ, J.

2004 « Displaying Khmer », KhmerOS Initiative, http ://www.khmeros.info, 4 p.

THAMMACHAK, B., OUTTHOUMPHONE, T.

2004 p;%SUzmè*nÖmè*kA~lêSdÏASg’H, pW%mSUdmznnWCj mznkAg Ela SàdDASàgxaHa [Livre de récitation de prières courtes, moyennes et de protection], Vientiane, Bibliothèque nationale, 73 p. (bilingue lao-pali)

THEPSIMEUANG, B. 2001 Sàglvmen%WCqn SIlAcAl%k KCgBraeczWACanuvzg k&Yvkàb kAnSWAg vàdSISaekd naxCnvYgcàn [Analyse de l’inscription de la stèle du roi Anouvong relatant l’érection de la pagode Sisaket de Vientiane], Vientiane, 60 p. (en lao)

TOMBEUR, J.

2004 « Les « exotiques trésors » du Cabinet des poinçons », http://www.garamonpatrimoine.org/technique_histoire/poincons_exo.html, 24 p.

254 RÉFÉRENCES BIBLIOGRAPHIQUES

VIRAVONGS, S. (dit MAHA SILA)

1973 pavàtNàgS%lAv [Histoire de l’écriture lao], Vientiane, Imprimerie Phai Nam, 53 p. (en lao)

1996 balegvy_yakr+ RGkKrAve$EkacT}EnqC sGm'_'ake$anXlAsn_$,e [Grammaire pali,

Akkharavidhi Sama——abhidŒna - Sandhi] , première partie, , Vientiane, Ministère de l’Information et de la culture lao, EFEO, 28 p. (en lao) (1ère édition : Vientiane, 1938) 1938 balegvy_yakr+ RGkKrAve$EkacT}EnqC sGm'_'ake$anXlAsn_$,e [Grammaire pali, Akkharavidhi, première partie, Sama——abhidŒna - Sandhi], Vientiane, Institut Bouddhique, 68 p. (en lao) 1939 balegvy_yakr+ vjeve|ac TEsRC RaKbat XlA ketk [Grammaire pali, deuxième partie, vacivibhŒkh, 2e partie, ŒkkhabŒt - kitaka], Vientiane, Institut Bouddhique, 164 p. (en lao)

Collectifs :

BIBLIOTHÈQUE NATIONALE DU LAOS

1999 « Manuscript Heritage », http://www.pnm.my/motw/ laos/manus.htm#com.

BIBLIOTHÈQUE ROYALE DU CAMBODGE

1937 Variétés calligraphiques de l’alphabet cambodgien en caractères Mûl et Chrieng par Seng, calligraphe à la Bibliothèque Royale du Cambodge, Phnom-Penh, ed. Bibliothèque royale du Cambodge, 50 p.

INSTITUT DE RECHERCHES SUR LA CULTURE (IRC) [SaTAbànxzWnxWvASIlapavànnaxadIEH&gsAd]

1988 SZmanAqblAn DzvpaeDd xWàgDI °, vànDI 10-13 mInA 1988, D&InaxCnLvgv Vgcàn, [1er séminaire sur les manuscrits sur feuilles de latanier, 10-13 mars 1988, Vientiane], Vientiane, IRC, 490 p. (en lao) 1990a maHASilA viravzgSç sivid Ela PzngAn [Maha Sila Viravongs, la vie et l’œuvre], Vientiane, Institut de Recherches en Sciences sociales, 261 p. (en lao) 1990b kCgpasumotamznviDajASAdk&YvkàbBASAlAv [Table ronde sur la langue lao], 8-10 novembre 1990, 187 p. (en lao)

255 RÉFÉRENCES BIBLIOGRAPHIQUES

KULTURHILFE-PROJEKT ERHALTUNG LAOTISHER HANDSCHRIFFTEN

2000 « Kulturhilfe-Projekt Erhaltung Laotisher Handschrifften », http://www.phil.uni-passau.de/thailao/Laoprojekt.htm.

MICROSOFT CORPORATION

2004a « Creating and Supporting OpenType Fonts for the Devanagari script », http://www.microsoft.com/typography/otfntdev/devanot/default.htm 2004b « Creating and Supporting OpenType Fonts for the Khmer script », http://www.microsoft.com/typography/otfntdev/khmerot/default.htm 2004c « Creating and Supporting OpenType Fonts for the Lao script », http://www.eu.microsoft.com/typography/otfntdev/laoot/default.htm

MONASTÈRE PHONE PHRA NAO [vàdoBnBraenzA]

1965 DàmmaxATA [dhammagŒthŒ], Vientiane, 88 p. (en lao)

THE PALI TEXT SOCIETY

2004 « List of Issues 2004 », Oxford, http://www.palitext.com, 39 p.

UNICODE

2004 The Unicode Standard 4.0, http://www.unicode.org. 2003 Unicode 3.1 annoté, http://iquebec.hapax.com.

Dictionnaires :

ANTELME, M., SUPYA BRU-NUT, H.

vcnanuRkm:raMg-Exµr 2001 Dictionnaire français-khmer, , Paris, L’Asiathèque, Langues & mondes, 911 p.

CORNU, P.

2001 Dictionnaire encyclopédique du Bouddhisme, Paris, Seuil, 843 p.

DANIEL, A.

vcnanuRkm Exµr-:raMg 1985 , Dictionnaire pratique cambodgien-français, Paris, Institut de l’Asie du Sud-Est, 630 p.

256 RÉFÉRENCES BIBLIOGRAPHIQUES

DUBOIS, J., GIACOMO, M., GUESPIN, L., MARCELLESI, C. & J-B., MEYEL, J-P.

2001 Dictionnaire de linguistique, Paris, Larousse, coll. Expression, 576 p.

REINHORN, M.

2002 Dictionnaire laotien-français, Paris, You-Feng, 2151 p. (1ère édition 1970)

RUNGRUANGSRI, O.

2004 - , - , [Dictionnaire Lanna- r0Oo6!dÁb]Hk¹O wm r0oko6di,]hkook wmp thaï], Chiang Mai, Université de Chiang Mai, Faculté des Sciences Humaines, 931 p.

SOUVANNI, S.

2004 ວັດຈະນານຸກົມ ພາສາປາລີ ລາວ (ສະບັບປະຖົມ) [Dictionnaire pali-lao (premier volume)], Vientiane, Projet de développement de dictionnaire pali-lao, 687 p.

257

258

ANNEXES

Ordonnance royale n° 10 (1949) ...... 260 « Tableau comparatif entre quelques caractères lao, sanskrits [devanagari] et pali [tham] » ...... 261 Généalogie des langues tai-kadai ...... 262 Police TrueType LaoDhamma de Steven Morey ...... 263-267 « Status of IT Standardization in Thailande (2000) » ...... 268-270 Police et clavier lao « Unicode » de Jason Glavy ...... 271-273 Unicode – Plan Multilingue de Base ...... 274-276 Zone Unicode devanagari (U+0900-U+097F) ...... 277-279 Zone Unicode tamoul (U+0B80-U+0BFF) ...... 280-282 Zone Unicode thaï (U+0E00-U+0E7F) ...... 283-285 Zone Unicode lao (U+0E80-U+0EFF) ...... 286-287 Zone Unicode tibétain (U+0F00-U+0FFF) ...... 288-291 Zone Unicode birman (Myanmar) (U+1000-U+109F) ...... 292-293 Zone Unicode khmer (U+1780-U+17FF) ...... 294-297 Zone Unicode tai le (U+1950-U+197F) ...... 298 Proposition de codage du tai lue [tai lü] par Michael Everson ...... 299-307 Proposition de codage du phake par Michael Everson ...... 308-309 Proposition de codage du khamti par Michael Everson ...... 310-311 Substitutions pour une méthode de saisie « intelligente » du l-tham (cf. 3.5.7.3) ...... 312-317 Courrier de Jacqueline Filliozat relatif aux « mérites de l’écriture »...... 318

259 ANNEXES

Ordonnance royale n°10, 1949

260 ANNEXES

« Tableau comparatif entre quelques caractères lao, sanskrits [devanagari] et pali [tham] » {Extrait de B. Thepsimeuang, 2001, p. 37-38}

261 ANNEXES

262 ANNEXES

Police TrueType LaoDhamma de Steven Morey

263 ANNEXES

264 ANNEXES

265 ANNEXES

266 ANNEXES

267 ANNEXES

268 ANNEXES

269 ANNEXES

270 ANNEXES

Police et clavier lao « Unicode » de Jason Glavy

271 ANNEXES

272 ANNEXES

273 ANNEXES

Unicode – Plan Multilingue de Base

Blocks-4.0.0.txt # Correlé avec Unicode 4.0 et l'ISO/CEI 10646 (F) # Remarque: la casse des noms de bloc n'est pas normative. # "Latin de base" et "LATIN DE BASE" sont donc équivalents. # # Les numéros de caractère qui ne sont pas repris explicitement dans cette liste ont comme valeur No_Block. # # Première position..Dernière position; Nom de bloc 0000..007F; Latin de base 0080..00FF; Supplément Latin-1 0100..017F; Latin étendu A 0180..024F; Latin étendu B 0250..02AF; Alphabet phonétique international 02B0..02FF; Lettres modificatives avec chasse 0300..036F; Diacritiques 0370..03FF; Grec et copte 0400..04FF; Cyrillique 0500..052F; Supplément cyrillique 0530..058F; Arménien 0590..05FF; Hébreu 0600..06FF; Arabe 0700..074F; Syriaque 0780..07BF; Thâna 0900..097F; Dévanâgarî 0980..09FF; Bengali 0A00..0A7F; Gourmoukhî 0A80..0AFF; Goudjarati 0B00..0B7F; Oriya 0B80..0BFF; Tamoul 0C00..0C7F; Télougou 0C80..0CFF; Kannara 0D00..0D7F; Malayalam 0D80..0DFF; Singhalais 0E00..0E7F; Thaï 0E80..0EFF; Lao 0F00..0FFF; Tibétain 1000..109F; Birman 10A0..10FF; Géorgien 1100..11FF; Jamos hangûl 1200..137F; Éthiopien 13A0..13FF; Chérokî 1400..167F; Syllabaires autochtones canadiens 1680..169F; Ogam 16A0..16FF; Runes 1700..171F; Tagal 1720..173F; Hanounóo 1740..175F; Bouhid 1760..177F; Tagbanoua

274 ANNEXES

1780..17FF; Khmer 1800..18AF; Mongol 1900..194F; Limbu 1950..197F; Taï-le 19E0..19FF; Symboles khmers 1D00..1D7F; Supplément phonétique 1E00..1EFF; Latin étendu additionnel 1F00..1FFF; Grec étendu 2000..206F; Ponctuation générale 2070..209F; Exposants et indices 20A0..20CF; Symboles monétaires 20D0..20FF; Signes combinatoires pour symboles 2100..214F; Symboles de type lettre 2150..218F; Formes numérales 2190..21FF; Flèches 2200..22FF; Opérateurs mathématiques 2300..23FF; Signes techniques divers 2400..243F; Pictogrammes de commande 2440..245F; Reconnaissance optique de caractères 2460..24FF; Alphanumériques cerclés 2500..257F; Filets 2580..259F; Pavés 25A0..25FF; Formes géométriques 2600..26FF; Symboles divers 2700..27BF; Casseau 27C0..27EF; Divers symboles mathématiques - A 27F0..27FF; Supplément A de flèches 2800..28FF; Combinaisons Braille 2900..297F; Supplément B de flèches 2980..29FF; Divers symboles mathématiques - B 2A00..2AFF; Opérateurs mathématiques supplémentaires 2B00..2BFF; Divers symboles et flèches 2E80..2EFF; Formes supplémentaires des clés CJC 2F00..2FDF; Clés chinoises K'ang-hsi 2FF0..2FFF; Description idéographique 3000..303F; Symboles et ponctuation CJC 3040..309F; Hiragana 30A0..30FF; Katakana 3100..312F; Bopomofo 3130..318F; Jamos de compatibilité hangûl 3190..319F; Kanboun 31A0..31BF; Bopomofo étendu 31F0..31FF; Supplément phonétique katakana 3200..32FF; Lettres et mois CJC cerclés 3300..33FF; Compatibilité CJC 3400..4DBF; Supplément A aux idéogrammes unifiés CJC 4DC0..4DFF; Hexagrammes du Classique des mutations ou Yi-king 4E00..9FFF; Idéogrammes unifiés CJC A000..A48F; Syllabaire yi des Monts frais A490..A4CF; Clés yi AC00..D7AF; Hangûl

275 ANNEXES

D800..DB7F; Demi-zone haute DB80..DBFF; Partie à usage privé de la demi-zone haute DC00..DFFF; Demi-zone basse E000..F8FF; Zone à usage privé F900..FAFF; Idéogrammes de compatibilité CJC FB00..FB4F; Formes de présentation alphabétiques FB50..FDFF; Formes A de présentation arabes FE00..FE0F; Sélecteurs de variante FE20..FE2F; Demi-signes combinatoires FE30..FE4F; Formes de compatibilité CJC FE50..FE6F; Petites variantes de forme FE70..FEFF; Formes B de présentation arabes FF00..FFEF; Formes de demi et pleine chasse FFF0..FFFF; Caractères spéciaux 10000..1007F; Syllabaire linéaire B 10080..100FF; Idéogrammes du linéaire B 10100..1013F; Nombres égéens 10300..1032F; Alphabet italique 10330..1034F; Gotique 10380..1039F; Ougaritique 10400..1044F; Déséret 10450..1047F; Shavien 10480..104AF; Osmanya 10800..1083F; Syllabaire chypriote 1D000..1D0FF; Symboles musicaux byzantins 1D100..1D1FF; Symboles musicaux occidentaux 1D300..1D35F; Symboles du Classique du mystère suprême 1D400..1D7FF; Symboles mathématiques alphanumériques 20000..2A6DF; Supplément B aux idéogrammes unifiés CJC 2F800..2FA1F; Supplément aux idéogrammes de compatibilité CJC E0000..E007F; Étiquettes E0100..E01EF; Supplément de sélecteurs de variante F0000..FFFFF; Zone supplémentaire A à usage privé 100000..10FFFF; Zone supplémentaire B à usage privé

276 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

277 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

278 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

279 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

280 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

281 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

282 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

283 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

284 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode, Inc.

285 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

286 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

287 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

288 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

289 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

290 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

291 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

292 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

293 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

294 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

295 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

296 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

297 ANNEXES

Copyright (c) 1991-2005 Unicode, Inc. All rights reserved. Reproduced with permission of Unicode,

298 ANNEXES

299 ANNEXES

300 ANNEXES

301 ANNEXES

302 ANNEXES

303 ANNEXES

304 ANNEXES

305 ANNEXES

306 ANNEXES

307 ANNEXES

308 ANNEXES

309 ANNEXES

310 ANNEXES

311 ANNEXES

312 ANNEXES

313 ANNEXES

314 ANNEXES

315 ANNEXES

316 ANNEXES

317 ANNEXES

Courrier de Jacqueline Filliozat à Michel Antelme relatif aux « mérites de l’écriture »

318